Site Reliability Engineer – Automatisierung / Python / Ansible (m/w/d)

IONOS SE

  • Berlin
  • Post Date: 1. November 2025
Job Description
Wir sind Europas führende Plattform für Cloud Services und Hosting-Dienstleistungen. Wir begleiten erfolgreich unsere Kund:innen bei ihrer Unternehmensentwicklung. Für unseren Unternehmenserfolg sind über 4000 Mitarbeitende in mehreren Ländern weltweit tätig, um die Anforderungen und Wünsche unserer 8,5 Millionen Kund:innen zu erfüllen.

Wir sind eine Marke der United Internet AG, einem börsennotierten Unternehmen mit rund 10.200 Mitarbeitenden.

Wir fördern die Entwicklung unserer Mitarbeitenden und deren unterschiedliche Talente, Interessen und Sprachen.
  • Du nimmst an Architektur-Reviews teil, um sicherzustellen, dass die Speicher-Infrastructure die Ziele für Leistung, Zuverlässigkeit und Skalierbarkeit erreicht
  • Du entwickelst Automatisierungen für die Speicher-Provisionierung, das Monitoring und die Skalierung – zum Beispiel mit Ansible, SaltStack, Terraform oder eigenen Python/Go-Skripten
  • Du richtest Self-Healing- und Alarmierungs-Mechanismen ein, die bei speicherbezogenen Problemen automatisch reagieren
  • Du implementierst Observability für die Speichersysteme (Metriken, Logs, Tracing)
  • Du analysierst und behebst komplexe Leistungs- oder Zuverlässigkeits-Probleme und unterstützt die On-Call-Rotation
  • Du führst Root-Cause-Analysen (RCA) für Vorfälle durch und entwickelst präventive Maßnahmen

  • Du hast mindestens 5 Jahre Erfahrung in Linux-Systemengineering, Speicher-Infrastructure oder SRE-Rollen
  • Du hast ein sehr gutes Verständnis der Protokolle RDMA, InfiniBand und RoCE
  • Du hast fundierte Praxis mit Linux MD-RAID (mdadm) und LVM
  • Du hast Erfahrung im Linux-Performance-Tuning und im Debuggen des Netzwerk-Stacks (ethtool, perf, tcpdump, ibstat, ibtop)
  • Du hast starke Scripting- und Automatisierungs-Skills in Python, Bash und Go
  • Du bist sicher im Umgang mit Konfigurations-Management-Tools wie SaltStack oder Ansible sowie mit Monitoring-Lösungen wie Prometheus, Loki und Grafana

  • Hybrides Arbeitsmodell mit Homeoffice-Möglichkeit
  • Flexible Arbeitszeiten durch Vertrauensarbeitszeit
  • An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke
  • Moderne Büroflächen mit sehr guter Verkehrsanbindung
  • Diverse Mitarbeiterrabatte für Aktivitäten und Produkte
  • Mitarbeiterevents wie Sommer- und Winterfeiern, sowie Workshops
  • Zahlreiche Weiterbildungs- und Entwicklungsmöglichkeiten
  • Verschiedene Gesundheitsangebote, wie Sport- und Gesundheitskurse
View More