14.656 IT-Jobs

Machine Learning Operations Engineer (w/m/d)

Jobriver HR Service (14654 weitere Jobs)
Frankfurt am Main
Hybrid
Vollzeit
Mid-Level
Ab sofort
vor 5 Tagen
Aktualisiert vor 2 Tagen
61.000 € – 83.000 € / Jahr
Jobriver schätzt: 44.612 € – 105.266 € / Jahr Machine Learning Engineer

Beschreibung

Das Unternehmen ist ein verantwortungsvolles, KI-zentriertes globales Unternehmen im Bereich der digitalen Transformation. In dieser Rolle als Machine Learning Operations Engineer sind Sie Teil eines dynamischen Teams, das fortschrittliche Lösungen für die Daten- und KI-Transformation konzipiert. Zu Ihren Hauptaufgaben gehört der Aufbau und Betrieb einer Model-Serving-Plattform, beispielsweise mit dem Triton Inference Server. Sie integrieren unterschiedlichste Modelltypen und Frameworks, darunter PyTorch und TensorFlow, und entwickeln Inference APIs sowohl für Batch- als auch für Streaming-Anwendungen. Darüber hinaus sind Sie für das Design robuster Input- und Output-Schemata für ML-Modelle verantwortlich und optimieren deren Performance hinsichtlich Latenz, Durchsatz und GPU-Auslastung. Die Containerisierung und das Deployment von Modellen unter Verwendung von Docker und AWS gehören ebenfalls zu Ihren Aufgaben. Das Arbeitsumfeld ist geprägt von einem offenen Mindset, Teamspirit und flachen Hierarchien. Das Unternehmen fördert die persönliche und berufliche Weiterentwicklung seiner Mitarbeiter und bietet zahlreiche Möglichkeiten zur Weiterbildung und Zertifizierung. Sie arbeiten in einem internationalen Team und profitieren von einem globalen Austausch mit Experten aus über 20 Ländern.

Anforderungen

Der ideale Kandidat bringt sehr gute Kenntnisse in Python mit, insbesondere im Backend und in der ML Runtime. Erfahrung mit ML Inference und Serving, beispielsweise mit Triton, TorchServe oder eigenen Runtimes, ist unerlässlich. Ein fundiertes Verständnis von Model-Inputs und -Outputs, Batching vs. Streaming sowie von FP32, FP16 und Quantisierung ist erforderlich. Zudem sollten Sie sicher im Umgang mit Docker und produktiven Deployments sein. Starke Debugging-Fähigkeiten in verteilten ML-Systemen sind von Vorteil, ebenso wie Grundkenntnisse in CUDA und GPU-Computing. Sehr gute Deutsch- und Englischkenntnisse sind notwendig, um in einem internationalen Umfeld erfolgreich kommunizieren zu können. Persönliche Eigenschaften wie Teamfähigkeit, analytisches Denken und eine proaktive Arbeitsweise runden Ihr Profil ab.

Technologien

Python Docker AWS TensorFlow PyTorch

Soft Skills

Teamfähigkeit Analytisches Denken Kommunikation

Erforderliche Sprachen

Deutsch Englisch

Jetzt bewerben

72.000 €
0 / 800 Zeichen

Lebenslauf, Zeugnisse, Anschreiben (PDF, max. 5MB pro Datei, max. 10 Dateien)

Dateien hier ablegen oder klicken
Weitere Informationen findest du in der Datenschutzerklärung. Du kannst deine Einwilligung jederzeit widerrufen.