Site Reliability Engineer (w/m/d) Application Hosting/TOSAAS

IONOS

Jobbeschreibung

Bei IONOS arbeitest Du bei dem führenden europäischen Anbieter von Cloud-Infrastruktur, Cloud-Services und Hosting-Dienstleistungen partnerschaftlich mit unterschiedlichen Teams zusammen. Wir bieten Dir eine Perspektive in einer der zukunftssichersten Branchen. Uns zeichnen offene Arbeitsstrukturen, Duz-Kultur und flache Hierarchien mit unvergleichlichem Team-Spirit aus. Wir sind fest davon überzeugt, dass Job und Spaß vereinbar sind und bieten Dir hierfür das entsprechende Umfeld. Bei ständigem Wachstum sind wir stets auf der Suche nach neuen Kolleginnen und Kollegen. Werde Teil von IONOS und lass uns gemeinsam wachsen.

Bei IONOS arbeitest Du bei dem führenden europäischen Anbieter von Cloud-Infrastruktur, Cloud-Services und Hosting-Dienstleistungen partnerschaftlich mit unterschiedlichen Teams zusammen. Wir bieten Dir eine Perspektive in einer der zukunftssichersten Branchen. Uns zeichnen offene Arbeitsstrukturen, Duz-Kultur und flache Hierarchien mit unvergleichlichem Team-Spirit aus. Wir sind fest davon überzeugt, dass Job und Spaß vereinbar sind und bieten Dir hierfür das entsprechende Umfeld. Bei ständigem Wachstum sind wir stets auf der Suche nach neuen Kolleginnen und Kollegen. Werde Teil von IONOS und lass uns gemeinsam wachsen.

Als Site Reliability Engineer (SRE) in unserem Application Hosting Team bildest Du das technische Rückgrat unserer Produktplattform für Managed Nextcloud, IONOS GPT sowie weitere Web Services, die wir auf unserer Kubernetes Plattform betreiben. Gemeinsam mit erfahrenen Kolleg*innen entwirfst Du neue Dienste und Produkte, die auch bei höchster Last performant und ausfallsicher bleiben.

Aufgabenbereich

  • Dein Haupteinsatzbereich ist die Weiterentwicklung der Infrastruktur unserer Produkte, sowie die Integration neuer Produkte/Webdienste in unsere Kubernetes - und Cloud - Infrastruktur.
  • Du bist verantwortlich für den stabilen und sicheren Betrieb unserer Produktplattform. Deine Expertise ist gefragt, wenn es um tiefgreifende Analysen und die Optimierung unserer primär containerisierten und Kubernetes-basierten Anwensungsinfrastruktur geht.
  • Du lebst Automatisierung. Mit Tools wie Terraform, Gitlab CI/CD und ArgoCD provisionierst und verwaltest du unsere gesamte Infrastruktur deklarativ und reproduzierbar.
  • Du analysierst und behebst komplexe Probleme in einer verteilten Systemlandschaft und arbeitest an der stetigen Verbesserung unserer Plattform.
  • Du entwickelst und pflegst unsere Monitoring-, Logging- und Alerting-Lösung (z. B. mit Prometheus, Grafana, ELK-Stack), um proaktiv Engpässe und Fehlerquellen zu identifizieren.

Qualifikationen

  • Du hast mehrjährige Erfahrung als Site Reliability Engineer oder in einer verwandten Rolle (Linux System Administrator, Platform Engineer, DevOps Engineer, Full Stack Developer) in einem Linux und Kubernetes Umfeld.
  • Sehr gute Kenntnisse und mehrjährige Erfahrung in der Verwendung des Linux Betriebssystems, Container-Technologien sowie speziell in Kubernetes.
  • Du hast Erfahrung mit Infrastructure as Code (vorzugsweise Terraform), CI/CD-Pipelines (z. B. GitLab CI/CD oder GitHub Actions) und in der Nutzung und Verwendung von Helm Charts.
  • Du kannst sicher in mindestens einer Programmier- oder Skriptsprache (z. B. Go, Python, Bash) entwickeln, um Automatisierungs- und Monitoring-Aufgaben zu lösen.
  • Erfahrung mit dem Betrieb und der Fehlersuche in hochverfügbaren und verteilten Produktionsumgebungen, einschließlich der Überwachung, der Alarmierung und der Protokollanalyse verteilter Anwendungen (z. B. Prometheus, Grafana, FluentD, ELK, VictoriaMetrics, icinga).
  • Du hast eine proaktive, lösungsorientierte, selbstständige Arbeitsweise und die Fähigkeit, komplexe technische Probleme systematisch zu analysieren und nachhaltig zu beheben.

Sprache: Gute Deutsch- und Englischkenntnisse sind erforderlich.

Standort: Karlsruhe oder Berlin.

Benefits

  • Hybrides Arbeitsmodell.
  • Flexible Arbeitszeiten durch Vertrauensarbeitszeit.
  • An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke.
  • Moderne Büroflächen mit sehr guter Verkehrsanbindung.
  • Diverse Mitarbeiterrabatte für Aktivitäten und Produkte.
  • Mitarbeiterevents wie Sommer- und Winterfeiern, sowie Workshops.
  • Zahlreiche Weiterbildungs- und Entwicklungsmöglichkeiten.
  • Verschiedene Gesundheitsangebote, wie Sport- und Gesundheitskurse.

Über IONOS

IONOS ist der führende europäische Digitalisierungs-Partner für kleine und mittlere Unternehmen (KMU). IONOS hat mehr als sechs Millionen Kundinnen und Kunden und ist mit einer weltweit verfügbaren Plattform in 18 Märkten in Europa und Nordamerika aktiv. Mit seinen Web Presence & Productivity-Angeboten agiert das Unternehmen als “One-Stop-Shop" für alle Digitalisierungs-Bedürfnisse - von Domains und Webhosting über klassische Website-Builder und Do-It-Yourself-Lösungen, von E-Commerce bis zu Online-Marketing-Tools. Darüber hinaus bietet IONOS Cloud-Lösungen für Firmen, die im Zuge der Weiterentwicklung ihres Geschäfts in die Cloud wechseln möchten.

Wir wertschätzen Vielfalt und begrüßen alle Bewerbungen - unabhängig von z. B. Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Behinderung, Alter sowie sexueller Orientierung und Identität, körperlichen Merkmalen, Familienstand oder einem anderen sachfremden Kriterium nach geltendem Recht.


Bei IONOS arbeitest Du bei dem führenden europäischen Anbieter von Cloud-Infrastruktur, Cloud-Services und Hosting-Dienstleistungen partnerschaftlich mit unterschiedlichen Teams zusammen. Wir bieten Dir eine Perspektive in einer der zukunftssichersten Branchen. Uns zeichnen offene Arbeitsstrukturen, Duz-Kultur und flache Hierarchien mit unvergleichlichem Team-Spirit aus. Wir sind fest davon überzeugt, dass Job und Spaß vereinbar sind und bieten Dir hierfür das entsprechende Umfeld. Bei ständigem Wachstum sind wir stets auf der Suche nach neuen Kolleginnen und Kollegen. Werde Teil von IONOS und lass uns gemeinsam wachsen.

Bei IONOS arbeitest Du bei dem führenden europäischen Anbieter von Cloud-Infrastruktur, Cloud-Services und Hosting-Dienstleistungen partnerschaftlich mit unterschiedlichen Teams zusammen. Wir bieten Dir eine Perspektive in einer der zukunftssichersten Branchen. Uns zeichnen offene Arbeitsstrukturen, Duz-Kultur und flache Hierarchien mit unvergleichlichem Team-Spirit aus. Wir sind fest davon überzeugt, dass Job und Spaß vereinbar sind und bieten Dir hierfür das entsprechende Umfeld. Bei ständigem Wachstum sind wir stets auf der Suche nach neuen Kolleginnen und Kollegen. Werde Teil von IONOS und lass uns gemeinsam wachsen.

Als Site Reliability Engineer (SRE) in unserem Application Hosting Team bildest Du das technische Rückgrat unserer Produktplattform für Managed Nextcloud, IONOS GPT sowie weitere Web Services, die wir auf unserer Kubernetes Plattform betreiben. Gemeinsam mit erfahrenen Kolleg*innen entwirfst Du neue Dienste und Produkte, die auch bei höchster Last performant und ausfallsicher bleiben.

Aufgabenbereich

  • Dein Haupteinsatzbereich ist die Weiterentwicklung der Infrastruktur unserer Produkte, sowie die Integration neuer Produkte/Webdienste in unsere Kubernetes - und Cloud - Infrastruktur.
  • Du bist verantwortlich für den stabilen und sicheren Betrieb unserer Produktplattform. Deine Expertise ist gefragt, wenn es um tiefgreifende Analysen und die Optimierung unserer primär containerisierten und Kubernetes-basierten Anwensungsinfrastruktur geht.
  • Du lebst Automatisierung. Mit Tools wie Terraform, Gitlab CI/CD und ArgoCD provisionierst und verwaltest du unsere gesamte Infrastruktur deklarativ und reproduzierbar.
  • Du analysierst und behebst komplexe Probleme in einer verteilten Systemlandschaft und arbeitest an der stetigen Verbesserung unserer Plattform.
  • Du entwickelst und pflegst unsere Monitoring-, Logging- und Alerting-Lösung (z. B. mit Prometheus, Grafana, ELK-Stack), um proaktiv Engpässe und Fehlerquellen zu identifizieren.

Qualifikationen

  • Du hast mehrjährige Erfahrung als Site Reliability Engineer oder in einer verwandten Rolle (Linux System Administrator, Platform Engineer, DevOps Engineer, Full Stack Developer) in einem Linux und Kubernetes Umfeld.
  • Sehr gute Kenntnisse und mehrjährige Erfahrung in der Verwendung des Linux Betriebssystems, Container-Technologien sowie speziell in Kubernetes.
  • Du hast Erfahrung mit Infrastructure as Code (vorzugsweise Terraform), CI/CD-Pipelines (z. B. GitLab CI/CD oder GitHub Actions) und in der Nutzung und Verwendung von Helm Charts.
  • Du kannst sicher in mindestens einer Programmier- oder Skriptsprache (z. B. Go, Python, Bash) entwickeln, um Automatisierungs- und Monitoring-Aufgaben zu lösen.
  • Erfahrung mit dem Betrieb und der Fehlersuche in hochverfügbaren und verteilten Produktionsumgebungen, einschließlich der Überwachung, der Alarmierung und der Protokollanalyse verteilter Anwendungen (z. B. Prometheus, Grafana, FluentD, ELK, VictoriaMetrics, icinga).
  • Du hast eine proaktive, lösungsorientierte, selbstständige Arbeitsweise und die Fähigkeit, komplexe technische Probleme systematisch zu analysieren und nachhaltig zu beheben.

Sprache: Gute Deutsch- und Englischkenntnisse sind erforderlich.

Standort: Karlsruhe oder Berlin.

Benefits

  • Hybrides Arbeitsmodell.
  • Flexible Arbeitszeiten durch Vertrauensarbeitszeit.
  • An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke.
  • Moderne Büroflächen mit sehr guter Verkehrsanbindung.
  • Diverse MitarbeiterMehr