Wir suchen einen Site Reliability Engineer, der unser Team im Bereich Datenlagerung innerhalb der Plattform-Engineering-Domain verstärkt. Die Mission des Plattform-Engineerings besteht darin, vertrauenswürdige, leistungsstarke und selbstbedienbare Plattformen bereitzustellen, die es den Produktteams ermöglichen, "die Bank zu schaffen, die die Welt gerne nutzt." In dieser Rolle sind Sie verantwortlich für die Architektur und den Betrieb hoch skalierbarer, sicherer und konformer Infrastruktur-Lösungen, die unser zentrales Datenbankangebot und unsere Datenlagerfähigkeiten verwalten. Der ideale Kandidat ist ein erfahrener SRE und ein begeisterter Lerner, der bereit ist, innovative Plattformlösungen zu entwickeln und in einem Team zu wachsen, das Innovation und Mentorship schätzt. In dieser Position werden Sie Plattformlösungen entwickeln und implementieren, um die Zuverlässigkeit, Sicherheit und Skalierbarkeit unserer Datenbank-Plattform-Infrastruktur zu verbessern. Sie werden eng mit Produktteams zusammenarbeiten, um eine nahtlose Datenbankbereitstellung zu ermöglichen und die betriebliche Effizienz sicherzustellen. Darüber hinaus werden Sie an technischen Diskussionen teilnehmen, Dokumentationen erstellen und eine Kultur der Transparenz und des kontinuierlichen Lernens fördern. Ihre Rolle umfasst auch die Teilnahme an Bereitschaftsdiensten und die Unterstützung bei der Fehlersuche, um eine stabile und vorhersehbare Umgebung aufrechtzuerhalten. Sie werden die Beobachtbarkeit der Plattform verbessern, um sicherzustellen, dass die vereinbarten Service-Level-Ziele erreicht werden.
Site Reliability Engineer - Data Platform
Beschreibung
Anforderungen
Um in dieser Position erfolgreich zu sein, benötigen Sie praktische Erfahrung in der Wartung cloudbasierter Infrastruktur, insbesondere in AWS. Sie sollten Erfahrung mit operativen Datenlagerlösungen wie PostgreSQL, Amazon RDS oder S3 haben. Kenntnisse in Containertechnologien wie Docker und Orchestrierung mit Kubernetes/EKS sind ebenfalls erforderlich. Sie sollten in der Lage sein, Infrastruktur als Code zu implementieren, idealerweise mit Terraform oder CloudFormation. Ein gutes Verständnis einer Programmiersprache, vorzugsweise Python, ist von Vorteil. Erfahrung mit CI/CD-Pipelines wie GitHub Actions, ArgoCD oder Jenkins wird ebenfalls erwartet. Darüber hinaus sollten Sie mit den besten Praktiken für Netzwerke und Sicherheit in Cloud-Umgebungen vertraut sein. Kenntnisse in Beobachtbarkeitstools wie DataDog, Prometheus oder Grafana sind wünschenswert. Persönlich sollten Sie über ausgezeichnete Kommunikations- und Teamfähigkeiten verfügen, ein starkes Verantwortungsbewusstsein haben und proaktiv an Problemlösungen und Prozessverbesserungen arbeiten. Eine Leidenschaft für den Aufbau hochwertiger, skalierbarer und sicherer Infrastruktur ist ebenfalls von Bedeutung.