Site Reliability Engineer Retail of the Future (d/m/w/x)

Mercedes-Benz AG

Job Description
Life is always about becoming… Im Leben geht es darum, sich auf eine Reise zu begeben, um die beste Version unseres zukünftigen Selbst zu werden. Während wir Neues entdecken, stellen wir uns Herausforderungen, meistern sie und wachsen über uns hinaus.

Bewerben Sie sich bei Mercedes-Benz und finden Sie den Aufgabenbereich, in dem Sie Ihre Talente individuell entfalten können. Dabei werden Sie von visionären Kolleginnen und Kollegen unterstützt, die Ihren Pioniergeist teilen. Bei uns einzusteigen bedeutet, Teil eines globalen Teams zu werden, dessen Ziel es ist, die begehrenswertesten Automobile der Welt zu bauen. Together for excellence.

Stellennummer: MER0003PSQ

Hast Du Lust die Transformation des Vertriebs von Mercedes-Benz mitzugestalten? Möchtest Du Teil eines strategisch wichtigen Vertriebsprojekts von Mercedes-Benz sein? Möchtest Du einem jungen und motivierten Team arbeiten und ein Vertriebsmodell in einem internationalen Umfeld einführen, in dem wir als Mercedes-Benz Vorreiter unter den klassischen Automobilherstellern sind? Begeistern Dich agile Methoden und ein innovatives Umfeld?

Dann freuen wir uns auf Deine Bewerbung! Werde Teil von Retail of the Future und gestalte mit uns die Zukunft des Mercedes-Benz Vertriebs.

Als Site Reliability Engineer (SRE) spielst Du eine zentrale Rolle bei der Sicherstellung der Zuverlässigkeit, Leistung und operativen Exzellenz unserer Retail of the Future IT-Landschaft. Du wirst branchenübliche SRE-Praktiken über mehrere Anwendungsprodukte und Produktfamilien hinweg überwachen und die Lücke zwischen Development und Operations schließen.

Diese Rolle kombiniert technisches Consulting und praktische Umsetzung – Du wirst verteilte Produktteams anleiten und gleichzeitig SRE-Best Practices auf verschiedenen Ebenen anwenden. Dies umfasst beispielsweise die Bereitstellung modernster und maßgeschneiderter Monitoring-Lösungen, die helfen, den Betrieb zu überwachen. Darüber hinaus trägst Du durch die Entwicklung und Durchführung von skalierbaren Load- und Performance-Tests sowie Recovery-Tests aktiv zur Sicherstellung der Skalierbarkeit und Widerstandsfähigkeit unserer Landschaft bei. Erkenntnisse und Incidents sind wertvolle Inputs für dich, um Post-Mortem-Analysen durchzuführen und mögliche Verbesserungen zu identifizieren.

Diese spannenden Aufgaben und Verantwortungen erwarten Dich bei uns:

  • Treibe das Reliability Engineering voran, indem du Monitoring, Incident Response und Automatisierung implementierst, um Systemverfügbarkeit, Leistung und Widerstandsfähigkeit sicherzustellen
  • Skaliere und entwickle Systeme nachhaltig weiter, indem du für Automatisierung und kontinuierliche Verbesserungen in Zuverlässigkeit und Leistung eintrittst
  • Standardisiere SRE- und Ops-Praktiken auf Programmebene, um einen konsistenten Ansatz über Teams hinweg zu gewährleisten
  • Verbessere die Observability, indem du Monitoring-, Alerting- und Logging-Standards durchsetzt, um die Systemleistung und Widerstandsfähigkeit zu verbessern
  • Automatisiere Systemoperationen durch Infrastructure as Code (IaC), um manuelle Fehler zu minimieren und die Effizienz zu steigern.
  • Koordiniere zwischen Stakeholdern (z.B. Produktteams, Architekturpraxis, Testteams), um reibungslose Abläufe und Abstimmung bei SRE-Initiativen sicherzustellen
  • Unterstütze Produktteams bei der Einführung von SRE-Prinzipien während des gesamten Service-Lebenszyklus – von Design und Deployment bis hin zu Betrieb und Stilllegung
  • Identifiziere Schwachstellen und Verbesserungspotenziale anhand verschiedener Datenquellen (z.B. Defect-Management, Deployment-Anfragen)
  • Unterstütze die Implementierung von Release- und Environment-Management-Strategien, um zuverlässige (Pre-)PROD-Environments zu gewährleisten, die erfolgreiche Deployments und mehrstufige Tests ermöglichen
  • Manage und verfolge SLOs (Service Level Objectives) auf Programmebene, um die Übereinstimmung mit den Zuverlässigkeitszielen auf Produktebene sicherzustellen
  • Unterstütze die Optimierung der Softwarearchitektur in Hinblick auf Performance und Zuverlässigkeit durch Zusammenarbeit mit Architektur- und Entwicklungsteams
  • Entdecke und wende branchenübliche Best Practices an und bringe sie in die Organisation ein, um unsere IT-Aktivitäten und SRE-Methoden an der Spitze der Innovation zu halten

Idealerweise qualifizierst Du Dich für diesen Job mit:

  • Bachelor- oder Master-Abschluss in Informatik, Software Engineering oder einem verwandten MINT-Fach
  • Mehrjährige Erfahrung in Site Reliability Engineering, IT-Operations oder Softwareentwicklung

  • Starke Cloud- und DevOps-Mentalität und Expertise in Cloud-Plattformen (AWS bevorzugt; Azure oder Google Cloud)
  • Kenntnisse in Kubernetes, Docker und Container-Orchestrierung
  • Erfahrung mit Observability-Tools (z.B. Datadog, Grafana, Prometheus)
  • Praktische Erfahrung mit CI/CD-Pipelines und Automatisierungstools (z.B. Jenkins, GitHub Actions, ArgoCD)
  • Expertise in Infrastructure as Code (IaC) (z.B. Terraform, Ansible, CloudFormation)
  • Starke Programmier-, Skript- und Automatisierungsfähigkeiten (Python, Bash oder Go)
  • Kenntnisse von Performance-Test-Tools (Gatling, JMeter, k6) und Disaster Recovery/Chaos Engineering-Praktiken
  • Erfahrung mit Git für Versionskontrolle und Kenntnisse moderner Branching-Strategien
  • Solide Erfahrung im Umgang mit Jira und Confluence
  • Nachgewiesene Fähigkeit zur Zusammenarbeit über funktionsübergreifende Teams in einer komplexen, vielschichtigen Umgebung
  • Fähigkeit, die technische Führung von Kolleg*innen zu übernehmen
  • Leidenschaft für kontinuierliche Verbesserung, Innovation und das Vorantreiben von Branchentrends
  • Agile und praxisorientierte Denkweise
  • Verhandlungssicher in Englisch (schriftlich und mündlich); Deutsch ist ein Plus

Nice to have:

  • Kenntnisse über das Mercedes-Benz Sales IT-Setup und dessen Architektur
  • Verständnis von FinOps und Erfahrung mit Cloud-Kostenoptimierung
  • Erfahrung mit Datenanalyse/Data Science/Machine Learning
  • Expertise in prädiktiver Analyse und Mustererkennung zur Antizipation von Problemen und Optimierung im Rahmen Monitoring
  • Erfahrung mit der Nutzung und Anwendung von GenAI-Lösungen
  • Vertrautheit mit SAFe (Scaled Agile Framework) und/oder anderen agilen Methoden
  • Zertifizierungen in AWS, Kubernetes (CKA/CKS) oder SRE-bezogenen Bereichen

Auf was Du Dich bei uns freuen kannst:

  • Flexible Arbeitszeitmodelle inkl. der Möglichkeit zum Mobilen Arbeiten

  • Übertarifliche Vergütung mit Urlaubsgeld und Sonderzahlungen sowie betriebliche Altersversorgung
  • Es handelt sich um eine unbefristete Stelle (optional)
  • Vielfältige Weiterbildungs- und Entwicklungsangebote

Zusätzliche Informationen:

Es handelt sich um eine unbefristete Stelle.

Ganz ohne Formalitäten geht es natürlich auch bei uns nicht. Daher bewirb Dich bitte ausschließlich online und füge Deiner Bewerbung einen Lebenslauf, Anschreiben und Zeugnisse bei (max. Gesamtgröße der Anhänge 5 MB) und markiere im Online-Formular Deine Bewerbungsunterlagen als "relevant für diese Bewerbung".

Wir freuen uns insbesondere über Onlinebewerbungen schwerbehinderter und ihnen gleichgestellter behinderter Menschen direkt auf diese Ausschreibung. Bei Fragen kannst Du Dich unter [email protected] zudem an die Schwerbehindertenvertretung des Standorts wenden, die Dich gerne nach Deiner Bewerbung im weiteren Bewerbungsprozess unterstützt.

Bitte habe Verständnis dafür, dass wir keine Papierbewerbungen mehr entgegennehmen und es keinen Anspruch auf Rückversand gibt.

Fragen zum Bewerbungsprozess beantwortet Dir gerne HR Services per Mail an [email protected] oder per Telefon: 0711/17-99000 (Montag bis Freitag zwischen 10-12 Uhr und 13-15 Uhr).


  • Essens­zulagen
  • Mit­arbeiter­handy möglich
  • Mit­arbeiter­rabatte möglich
  • Mit­arbeiter­beteili­gung möglich
  • Mit­arbeiter Events
  • Coaching
  • Flexible Arbeits­zeit möglich
  • Hybrides Arbeiten möglich
  • Gesund­heits­maß­nahmen
  • Betrieb­liche Alters­ver­sorgung
  • Mobilitäts­angebote
View More