eUni.de Site Reliability Engineer (m/w/d)

Alpha Strike Labs GmbH

Berlin
Veröffentlicht am: 8. August 2025

Jobbeschreibung

Wir sind Alpha Strike Labs – ein Cyber Intelligence Unternehmen mit Hauptsitz in Berlin. Unsere Alpha Strike Platform bietet Analyst:innen und Unternehmen die gleichen Informationen die auch ein echter Cyberangreifer hat. Dafür scannen wir regelmäßig das Internet, analysieren Darknet Daten und suchen Schwachstellen in der externen Angriffsoberfläche.

Werde Teil von Alpha Strike Labs – und gestalte die Zukunft von Cyber Intelligence

Unsere Technologie wird bereits erfolgreich eingesetzt – nun skalieren wir und mit dem Start im B2B‑Markt wächst unsere Platform rasant weiter. Dafür suchen wir dich:

Als Site Reliability Engineer (SRE) bist du das Fundament unserer Plattform.

Du bringst Leidenschaft für hochverfügbare, skalierbare Infrastruktur mit und hast Freude daran, eigenentwickelte Systeme produktiv und sicher am Laufen zu halten. SRE‑Prinzipien wie Toil‑Reduction, SLO‑Orientierung und Proaktivität sind für dich keine Buzzwords, sondern Alltag.

Du stellst sicher, dass unsere Systeme jederzeit zuverlässig, sicher und leistungsfähig laufen – und schützt damit Unternehmen und Staaten weltweit vor digitalen Bedrohungen.
Du betreibst unsere dedizierte Infrastruktur, automatisierst Prozesse, etablierst SRE-Best-Practices und sorgst für einen stabilen, skalierbaren Betrieb.
Mit deiner Arbeit legst du den Grundstein für Innovation, Wachstum und schnelle Entwicklungszyklen – kurz: Du bist ein Schlüssel zum Erfolg von Alpha Strike Labs.

Betrieb und Weiterentwicklung unserer Linux-basierten Infrastruktur (On-Prem / Colocation) für regelmäßige, globale Internet-Scans und unserer Alpha Strike Platform
Aufbau und Pflege von Infrastructure as Code
Überwachung und Optimierung der Systemverfügbarkeit mit Prometheus, Grafana, ELK
Planung und Umsetzung robuster Backup- & Disaster-Recovery-Strategien
Automatisierung von Abläufen (Deployment, Konfiguration, Backup, Recovery)
Definition und Tracking von SLIs/SLOs, Incident Management, Postmortems
Dokumentation technischer Abläufe, Wissenstransfer im Team
In enger Zusammenarbeit mit dem Entwicklungsteam sorgst du für kontinuierliche Verbesserung und reibungslosen Betrieb

Mind. 3 Jahre Erfahrung als SRE, DevOps- oder System Engineer
Analytisch, strukturiert, eigenverantwortlich: du gehst Herausforderungen systematisch und selbstständig an
Hands-On-Mentalität und Bereitschaft, Infrastrukturprobleme pragmatisch zu lösen
Freude am kontinuierlichen Lernen und Einarbeiten in komplexe Eigenentwicklungen
Du hast Erfahrung in der Automatisierung komplexer Infrastruktur
Fundierte Linux-Kenntnisse (Debian/Ubuntu), Shell-Scripting (Bash, Python)
Erfahrung mit IaC-Tools wie Terraform, Ansible, Chef, Puppet. Ansible wird bevorzugt.
Containerization und Container-Orchestration inkl. Networking & Security, idealerweise mit Docker und Kubernetes
Erfahrung im Aufbau und der Weiterentwicklung von Monitoring & Logging (z.B. Prometheus, Grafana, ELK)
Sicher im Umgang mit CI/CD-Pipelines (GitLab), Git
Erfahrung mit Backup/Recovery & Security (Firewalls, IDS, Systemhärtung)
Verständnis für das Design und die Umsetzung von SLIs/SLOs in Zusammenarbeit mit dem Team und Kenntnisse in SRE-Prinzipien (Toil-Reduktion, Fehlerbudgets, Incident‑Triage und Post‑Mortems)
Idealerweise hast du Erfahrung mit datenintensiven Plattformen und großen Datenmengen
Von Vorteil sind Golang Kenntnisse zur Pflege und Erweiterung unserer Tools

Keine Sorge, wenn du nicht jede Einzelheit erfüllst – wir legen viel Wert auf Konzepte, Lernbereitschaft und Entwicklungspotenzial. Technische Tool-Kenntnisse lassen sich erlernen, und Weiterbildung ist bei uns ausdrücklich erwünscht und wird aktiv gefördert. Wir freuen uns auf deine Bewerbung, wenn du dich für SRE-Konzepte begeisterst und motiviert bist, dich gemeinsam mit uns weiterzuentwickeln!

Bei uns erwartet dich ein spannendes Arbeitsumfeld, in dem du dich fachlich weiterentwickeln und deine Fähigkeiten voll entfalten kannst. Wir bieten dir die Möglichkeit, eigene Projekte voranzutreiben und die Zukunft unserer Infrastruktur mitzugestalten.

Ein motiviertes, technikaffines Team mit starkem Innovationsdrang, flachen Hierarchien und kurzen Entscheidungswegen
Eine technologisch anspruchsvolle Umgebung mit starker Wachstumsperspektive – keine Legacy-Systeme, keine Bürokratie
Verantwortung für Betrieb und Stabilität einer anspruchsvollen Plattform für globale Internet-Scans und Cyber Intelligence
Raum für eigene Ideen & technische Innovation – von Toil-Reduktion über Performance-Tuning bis zu Automatisierungslösungen
Einführung und Etablierung von SRE-Prinzipien im gesamten Betrieb
Hybrides Arbeitsmodell (Berlin & bis zu 60 % Remote)
Weiterbildungsmöglichkeiten wie Schulungen, Konferenzen, technische Workshops
110 € steuerfreie Gutscheine/Monat (frei wählbar z. B. Rewe, IKEA, MediaMarkt)

Mehr

DevOps & Site Reliability Engineer (w/m/d) Flugsicherungssysteme
DFS Deutsche Flugsicherung GmbH, München
IT-Spezialist/in - Site Reliability Engineer
European Southern Observatory (ESO), Garching bei München
Site Reliability Engineer (all genders)
ParshipMeet Group, Hamburg, Dresden, Berlin
Site Reliability Engineer (all genders)
PRODYNA SE, Frankfurt am Main, Berlin, Hamburg, Düsseldorf, München, Stuttgart
Site Reliability Engineer (w/m/d)
DFS Deutsche Flugsicherung GmbH, Karlsruhe
Site Reliability Engineer (f/m/d)
alfaview gmbh, bundesweit

Site Reliability Engineer (m/w/d)

Alpha Strike Labs GmbH

Jobbeschreibung

Ähnliche Jobs