Site Reliability Engineer (m/w/d)

F24 AG

Job Description

Was wir tun:

F24 ist Europas führender Software-as-a-Service (SaaS) Anbieter für Resilienz. Mehr als 5.500 Kunden weltweit vertrauen auf die digitalen Lösungen von F24, die Unternehmen und Organisationen in allen Bereichen der Resilienz unterstützen. Die Lösungen umfassen Business Messaging und Service Notification, Notfall- und Massenbenachrichtigung, Incident- und Krisenmanagement sowie Governance, Risk und Compliance.

F24 unterstützt Kunden aus nahezu allen Branchen, von Energie, Gesundheitswesen, Industrie, Finanzwesen, IT, Tourismus und Luftfahrt bis hin zu einer Vielzahl von öffentlichen Organisationen. Langjährige internationale Erfahrung macht F24 zum Experten für die Verbesserung der Resilienz durch digitale Lösungen.

Gegründet wurde das Unternehmen im Jahr 2000 in München, wo sich auch der Hauptsitz der F24 AG befindet. Heute unterstützt F24 Unternehmen und Organisationen in mehr als hundert Ländern, an über 20 Standorten in Europa und darüber hinaus. Der Vorstand der F24 AG besteht aus dem F24-Mitbegründer Christian Götz und dem Vorstandssprecher Dr. Jörg Rahmer.

Gute Gründe, um bei F24 zu arbeiten:

  • Habe einen spürbaren Impact! Arbeite in einem agilen Umfeld, in welchem Du einen wichtigen Beitrag zum Erfolg unserer Kunden und zur Zukunft unseres Unternehmens leistest.
  • Werde Teil unseres etablierten Unternehmens mit einer inspirierenden Kultur, flachen Hierarchien und unseres offenen, ehrlichen, innovativen und unterstützenden Teams!
  • Wachse mit uns: Wir sind eine Firma auf Erfolgskurs, die in stetigem, internationalen Wachstum begriffen ist. Du hast die Möglichkeit unsere Entwicklung mitzugestalten.
  • Nutze unser flexibles Arbeitsmodell: Wir setzen auf eine Kombination aus Präsenz in unseren Offices und Arbeit aus dem Home-Office. So stärken wir unseren Teamgeist und geben Dir zugleich die Möglichkeit, die bestmögliche Balance aus privatem und professionellem Leben zu erreichen.


Für unser professionelles und hochmotiviertes Operations-Team in München suchen wir ab sofort dich als erfahrenen, versierten und engagierten Site Reliability Engineer (m/w/d) in Vollzeit. Du hilfst uns dabei, eine moderne, hochverfügbare Infrastruktur aufzubauen, weiterzuentwickeln und zu betreiben.

Dein Aufgabengebiet:

  • Sicherstellung der Verfügbarkeit, Performance und Skalierbarkeit unserer Systeme in Cloud- und On-Prem-Umgebungen
  • Monitoring, Logging und Observability unserer Infrastruktur und Applikationen mit Tools wie Prometheus, Grafana und Elastic Stack
  • Automatisierung von Infrastruktur-Provisionierung und Konfiguration mittels Infrastructure as Code (Ansible, Terraform, Helm, GitOps)
  • Verwaltung und Optimierung von Kubernetes-Clustern und containerisierten Anwendungen
  • Mitgestaltung und Weiterentwicklung einer stabilen, sicheren und agilen Plattform-Infrastruktur
  • Enge Zusammenarbeit mit Development, Security und Operations im Sinne der DevOps- und SRE-Prinzipien
  • Betrieb und Support unserer produktiven Umgebungen im Rahmen einer 24/7 Bereitschaft (im Rotationssystem)
  • Laufende Evaluierung neuer Technologien, Erstellung technischer Konzepte und Unterstützung bei Architekturentscheidungen
  • Umsetzung von IT-Sicherheitsstandards sowie Behebung von Audit-Findings


  • hast ein abgeschlossenes Studium oder Ausbildung im Bereich IT sowie fundierte Berufserfahrung im Betrieb und in der Automatisierung von Cloud-Infrastrukturen.
  • besitzt tiefgreifende Kenntnisse in folgenden Bereichen:
    • Linux/Unix-Administration (Ubuntu, CentOS, Amazon Linux)
    • Container-Orchestrierung (Docker, Kubernetes)
    • Cloud-Plattformen (AWS, Azure, GCP oder europäische Anbieter)
    • Infrastructure as Code (Ansible, Terraform, Helm, Git)
    • Monitoring & Observability (Prometheus, Grafana, Kibana, Logstash)
    • Netzwerke & IT-Security (Firewalls, VPN, Routing, System-Hardening)
    • Scripting und CI/CD (Shell, Python, GitLab CI/CD, Nexus, Maven).
  • hast Erfahrung mit hochverfügbarer Systemarchitektur und Skalierung verteilter Systeme.
  • hast Erfahrung in agilen Teams und mit Tools wie Jira und Confluence.
  • besitzt Teamgeist, Eigeninitiative und eine strukturierte, verantwortungsbewusste Arbeitsweise.


Mehr über die Arbeit bei F24 erfährst Du hier.

View More