Site Reliability Engineer (m/w/d)

Alpha Strike Labs GmbH

  • Berlin
  • Veröffentlicht am: 8. August 2025
Jobbeschreibung

Wir sind Alpha Strike Labs – ein Cyber Intelligence Unternehmen mit Hauptsitz in Berlin. Unsere Alpha Strike Platform bietet Analyst:innen und Unternehmen die gleichen Informationen die auch ein echter Cyberangreifer hat. Dafür scannen wir regelmäßig das Internet, analysieren Darknet Daten und suchen Schwachstellen in der externen Angriffsoberfläche.

Werde Teil von Alpha Strike Labs – und gestalte die Zukunft von Cyber Intelligence

Unsere Technologie wird bereits erfolgreich eingesetzt – nun skalieren wir und mit dem Start im B2B‑Markt wächst unsere Platform rasant weiter. Dafür suchen wir dich:

Als Site Reliability Engineer (SRE) bist du das Fundament unserer Plattform.

Du bringst Leidenschaft für hochverfügbare, skalierbare Infrastruktur mit und hast Freude daran, eigenentwickelte Systeme produktiv und sicher am Laufen zu halten. SRE‑Prinzipien wie Toil‑Reduction, SLO‑Orientierung und Proaktivität sind für dich keine Buzzwords, sondern Alltag.



Du stellst sicher, dass unsere Systeme jederzeit zuverlässig, sicher und leistungsfähig laufen – und schützt damit Unternehmen und Staaten weltweit vor digitalen Bedrohungen.
Du betreibst unsere dedizierte Infrastruktur, automatisierst Prozesse, etablierst SRE-Best-Practices und sorgst für einen stabilen, skalierbaren Betrieb.
Mit deiner Arbeit legst du den Grundstein für Innovation, Wachstum und schnelle Entwicklungszyklen – kurz: Du bist ein Schlüssel zum Erfolg von Alpha Strike Labs.

  • Betrieb und Weiterentwicklung unserer Linux-basierten Infrastruktur (On-Prem / Colocation) für regelmäßige, globale Internet-Scans und unserer Alpha Strike Platform
  • Aufbau und Pflege von Infrastructure as Code
  • Überwachung und Optimierung der Systemverfügbarkeit mit Prometheus, Grafana, ELK
  • Planung und Umsetzung robuster Backup- & Disaster-Recovery-Strategien
  • Automatisierung von Abläufen (Deployment, Konfiguration, Backup, Recovery)
  • Definition und Tracking von SLIs/SLOs, Incident Management, Postmortems
  • Dokumentation technischer Abläufe, Wissenstransfer im Team
  • In enger Zusammenarbeit mit dem Entwicklungsteam sorgst du für kontinuierliche Verbesserung und reibungslosen Betrieb


  • Mind. 3 Jahre Erfahrung als SRE, DevOps- oder System Engineer
  • Analytisch, strukturiert, eigenverantwortlich: du gehst Herausforderungen systematisch und selbstständig an
  • Hands-On-Mentalität und Bereitschaft, Infrastrukturprobleme pragmatisch zu lösen
  • Freude am kontinuierlichen Lernen und Einarbeiten in komplexe Eigenentwicklungen
  • Du hast Erfahrung in der Automatisierung komplexer Infrastruktur
  • Fundierte Linux-Kenntnisse (Debian/Ubuntu), Shell-Scripting (Bash, Python)
  • Erfahrung mit IaC-Tools wie Terraform, Ansible, Chef, Puppet. Ansible wird bevorzugt.
  • Containerization und Container-Orchestration inkl. Networking & Security, idealerweise mit Docker und Kubernetes
  • Erfahrung im Aufbau und der Weiterentwicklung von Monitoring & Logging (z.B. Prometheus, Grafana, ELK)
  • Sicher im Umgang mit CI/CD-Pipelines (GitLab), Git
  • Erfahrung mit Backup/Recovery & Security (Firewalls, IDS, Systemhärtung)
  • Verständnis für das Design und die Umsetzung von SLIs/SLOs in Zusammenarbeit mit dem Team und Kenntnisse in SRE-Prinzipien (Toil-Reduktion, Fehlerbudgets, Incident‑Triage und Post‑Mortems)
  • Idealerweise hast du Erfahrung mit datenintensiven Plattformen und großen Datenmengen
  • Von Vorteil sind Golang Kenntnisse zur Pflege und Erweiterung unserer Tools

Keine Sorge, wenn du nicht jede Einzelheit erfüllst – wir legen viel Wert auf Konzepte, Lernbereitschaft und Entwicklungspotenzial. Technische Tool-Kenntnisse lassen sich erlernen, und Weiterbildung ist bei uns ausdrücklich erwünscht und wird aktiv gefördert. Wir freuen uns auf deine Bewerbung, wenn du dich für SRE-Konzepte begeisterst und motiviert bist, dich gemeinsam mit uns weiterzuentwickeln!


Bei uns erwartet dich ein spannendes Arbeitsumfeld, in dem du dich fachlich weiterentwickeln und deine Fähigkeiten voll entfalten kannst. Wir bieten dir die Möglichkeit, eigene Projekte voranzutreiben und die Zukunft unserer Infrastruktur mitzugestalten.

  • Ein motiviertes, technikaffines Team mit starkem Innovationsdrang, flachen Hierarchien und kurzen Entscheidungswegen
  • Eine technologisch anspruchsvolle Umgebung mit starker Wachstumsperspektive – keine Legacy-Systeme, keine Bürokratie
  • Verantwortung für Betrieb und Stabilität einer anspruchsvollen Plattform für globale Internet-Scans und Cyber Intelligence
  • Raum für eigene Ideen & technische Innovation – von Toil-Reduktion über Performance-Tuning bis zu Automatisierungslösungen
  • Einführung und Etablierung von SRE-Prinzipien im gesamten Betrieb
  • Hybrides Arbeitsmodell (Berlin & bis zu 60 % Remote)
  • Weiterbildungsmöglichkeiten wie Schulungen, Konferenzen, technische Workshops
  • 110 € steuerfreie Gutscheine/Monat (frei wählbar z. B. Rewe, IKEA, MediaMarkt)

Mehr