14.656 IT-Jobs

Machine Learning Operations Engineer (w/m/d)

Jobriver HR Service (14654 weitere Jobs)
Frankfurt am Main
Hybrid
Vollzeit
Mid-Level
Ab sofort
vor 5 Tagen
61.000 € – 83.000 € / Jahr
Jobriver schätzt: 44.612 € – 105.266 € / Jahr Machine Learning Engineer

Beschreibung

Das Unternehmen ist ein verantwortungsvolles, KI-zentriertes globales Unternehmen im Bereich der digitalen Transformation. Hier wird an fortschrittlichen Lösungen für die Daten- und KI-Transformation gearbeitet, Technologie-Infrastrukturen werden modernisiert und Kernsysteme der nächsten Generation für führende Banken, Versicherungen sowie Industrie- und Robotik-Unternehmen entwickelt. In enger Zusammenarbeit mit den Kunden werden Grenzen verschoben, um deren volles Potenzial auszuschöpfen. Das motivierte Team sucht einen Machine Learning Operations Engineer (w/m/d), der den Aufbau und Betrieb einer Model-Serving-Plattform, wie beispielsweise dem Triton Inference Server, übernimmt. Zu den Aufgaben gehören die Integration unterschiedlichster Modelltypen und Frameworks, die Entwicklung von Inference APIs für Batch- und Streaming-Anwendungen sowie das Design robuster Input- und Output-Schemata für ML-Modelle. Zudem wird die Performance-Optimierung hinsichtlich Latenz, Durchsatz und GPU-Auslastung erwartet. Der Umgang mit Containerisierung und Deployment von Modellen, insbesondere mit Docker und AWS, ist ebenfalls Teil der täglichen Arbeit. Das Unternehmen legt großen Wert auf eine offene Unternehmenskultur, in der Teamspirit und flache Hierarchien gelebt werden. Die Mitarbeiter haben die Möglichkeit, sich kontinuierlich weiterzubilden und an internationalen Projekten mit Experten aus über 20 Ländern zusammenzuarbeiten.

Anforderungen

Der ideale Kandidat bringt sehr gute Kenntnisse in Python mit, insbesondere im Backend und der ML Runtime. Erfahrung mit ML Inference und Serving, wie Triton oder TorchServe, ist erforderlich. Ein fundiertes Verständnis von Model-Inputs und -Outputs, Batching versus Streaming sowie FP32, FP16 und Quantisierung ist von Vorteil. Der sichere Umgang mit Docker und produktiven Deployments sowie starke Debugging-Fähigkeiten in verteilten ML-Systemen sind ebenfalls wichtig. Grundkenntnisse in CUDA und GPU-Computing werden erwartet. Darüber hinaus sind sehr gute Deutsch- und Englischkenntnisse erforderlich, um effektiv im internationalen Team arbeiten zu können. Persönliche Eigenschaften wie Teamfähigkeit, Kommunikationsstärke und analytisches Denken sind von großer Bedeutung, um in dieser Rolle erfolgreich zu sein.

Technologien

Python Docker AWS

Soft Skills

Teamfähigkeit Kommunikation Analytisches Denken

Erforderliche Sprachen

Deutsch Englisch

Jetzt bewerben

72.000 €
0 / 800 Zeichen

Lebenslauf, Zeugnisse, Anschreiben (PDF, max. 5MB pro Datei, max. 10 Dateien)

Dateien hier ablegen oder klicken
Weitere Informationen findest du in der Datenschutzerklärung. Du kannst deine Einwilligung jederzeit widerrufen.