(Senior) Site Reliability Engineer / Distributed Cloud – STACKIT (m/w/d)

STACKIT

Job Description
  • Du hast ein abgeschlossenes Studium in Informatik oder einem verwandten Fachgebiet.
  • Mindestens 2 Jahre aktive Erfahrung als SRE/DevOps Engineer, wo du gelernt hast, dass 'Works on my machine' keine Antwort ist.
  • Fundierte Erfahrung im Betrieb von Cloud-Infrastrukturen mit Kubernetes und/oder Virtualisierungstechnologien.
  • Du hast gute Kenntnisse in der Softwareentwicklung mit Golang oder einer vergleichbaren Systemsprache und nutzt diese, um Abläufe zu automatisieren und eigene Tools zu bauen.

Du willst mit uns STACKITEERs die Cloud-Welt im Sturm erobern und mit uns die Zukunft Europas gestalten? Prima! Dann bist du bei STACKIT genau richtig. Unsere Vision ist ambitioniert: Ein unabhängiges Europa - digital, führend. Als Cloud- und Colocation-Provider bauen wir die sichere Infrastruktur dafür. Mit unseren Serverstandorten ausschließlich in Deutschland und Österreich bieten wir sowohl der Schwarz Gruppe, zu der wir gehören, als auch externen Kunden eine europäische Alternative zu den internationalen Cloud-Anbietern und unterstützen unsere Kunden mit individuellen Lösungen ganzheitlich.

Als engagierter STACKITEER bist du Teil des Geschäftsbereichs STACKIT Products. Hier werden unsere Produkte und Services entwickelt, getestet und verbessert.


  • Du betreibst und optimierst unsere hochkomplexen Plattformen (Kubernetes, KubeVirt, Cilium, Ceph, Talos) sowie die zugrundeliegende Infrastruktur mit dem Fokus auf End-to-End-Stabilität, Skalierbarkeit und Kosten.
  • Du entwickelst und pflegst unsere Monitoring- und Logging-Systeme (Metrics, Logs, Traces), um jederzeit tiefgreifende Einblicke in den Systemzustand zu gewährleisten und proaktiv Engpässe zu erkennen.
  • Du implementierst konsequentes Synthetic Monitoring und Tracetests, um die End-to-End-Funktionalität kritischer Services kontinuierlich zu validieren.
  • Du definierst und überwachst klare Service Level Objectives (SLOs) und reduzierst 'Toil' konsequent durch Code. Runbooks sind für dich nur die letzte Verteidigungslinie.
  • Du dokumentierst deine Arbeit nachvollziehbar, denn das beste System ist wertlos ohne ein gutes Markdown.
View More