DevOps Engineer – Kubernetes & Cloud Infrastructure (m/w/d)

epostbox epb GmbH

  • Berlin
  • Post Date: 20. October 2025
Job Description

Wir katapultieren Unternehmen in die Zukunft. Mit einem Betriebssystem für Geschäftsprozesse, das alles verändert. KI-gestützt. Radikal effizient. Unverwechselbar – genau wie das Team dahinter.

Für unsere Marke nolas workspace suchen wir dich als DevOps Engineer.
Nicht zum Mitlaufen. Sondern zum Vorangehen. Denn von 100 % machen nur 5 % den Unterschied – und genau da kommst du ins Spiel.

Hier würde jetzt der übliche „Über uns“-Text stehen. Sparen wir uns. Du willst wissen, was dich erwartet?

Wir suchen:

DevOps Engineer – Kubernetes & Cloud Infrastructure (m/w/d)
in Berlin


Eine vollständig containerisierte KI-Plattform. Mehrere Microservices. Echtzeit-Kommunikation. Intelligente Dokumentenanalyse.
Und alles läuft auf skalierbarer, automatisierter Infrastruktur – orchestriert über Kubernetes.

Dein Impact:

  • Du bist verantwortlich für die komplette DevOps-Umgebung – von Infrastructure as Code bis Monitoring.
  • Du gestaltest mit, wie wir Workflows automatisieren, Services absichern und Systeme skalieren.
  • Du arbeitest eng mit Backend, AI und Produkt zusammen – echte Ownership, keine Ticketschieberei.

Deine Mission im Detail

Infrastructure & Cloud

  • Design, Rollout und Betrieb unserer Kubernetes-Cluster (Dev / Staging / Prod)
  • Infrastructure as Code (IaC) mit Terraform, Helm oder Kustomize
  • Cloud-Management mit Fokus auf Kostenoptimierung, Sicherheit und Skalierbarkeit (EKS, GKE oder AKS)
  • Implementierung von Auto-Scaling-Strategien für dynamische Workloads (horizontal & vertikal)
  • Verwaltung von Netzwerkressourcen, Ingress, Load Balancing und SSL/TLS-Zertifikaten
  • Optimierung von Cloud-Ressourcen hinsichtlich Kosten, Performance und Sicherheit

Microservices & Container

  • Containerisierung und Orchestrierung unserer Microservices:
    • REST APIs (Node.js / Hono) – Core Application Backend
    • WebSocket Server – Echtzeitkommunikation
    • Kafka Consumer – Event-getriebene Verarbeitung
    • AI Processing Services – Analyse und Klassifikation
    • Frontend (Vue.js) – Benutzeroberfläche
  • Image-Optimierung für Performance und Sicherheit
  • Secrets- und Config-Management mit Vault oder Kubernetes Secrets
  • Umsetzung von Security Policies (RBAC, Network Policies, Pod Security Standards

Monitoring & Reliability

  • Aufbau und Pflege einer umfassenden Monitoring- und Observability-Umgebung:
    • Prometheus – Metriken & Alerting
    • Grafana – Dashboards & Visualisierung
    • Loki – Logging & Analyse
  • Entwicklung anwendungsspezifischer Custom Metrics
  • Implementierung von Alerting- und Incident-Response-Workflows
  • Erstellung und Pflege von SLI/SLO-Dashboards zur Sicherstellung der Service-Zuverlässigkeit

CI/CD & Automation

  • Design und Pflege von CI/CD-Pipelines (GitHub Actions / GitLab CI)
  • Automatisiertes Testing, Security Scanning, Build & Deployment
  • Verwaltung von Container-Registries und Artefakt-Repositories
  • Rollback-Mechanismen und Canary Deployments bei fehlerhaften Releases
  • Implementierung von GitOps-Workflows für konsistente Deployments

Security & Compliance

  • Umsetzung von Kubernetes-Sicherheitsrichtlinien (RBAC, Pod Security, Network Policies)
  • Verwaltung von Secrets & Zertifikaten über Vault oder Kubernetes-native Tools
  • Container-Image-Scanning und Vulnerability Management
  • Sicherstellung der Datenschutz- und Compliance-Anforderungen (z. B. DSGVO)
  • Audit Logging und revisionssichere Dokumentation aller Änderungen

Performance & Optimization

  • Monitoring und Optimierung der Ressourcennutzung in Kubernetes
  • Performance-Tuning für hohe Durchsatzlasten in Dokumentenverarbeitung und AI-Pipelines
  • Implementierung von Caching-Strategien und CDN-Integrationen
  • Optimierung von Container-Images hinsichtlich Größe und Laufzeitverhalten
  • Backup- und Wiederherstellungsstrategien für Datenbanken und Cluster

  • 3+ Jahre Erfahrung im produktiven Kubernetes-Cluster-Management
  • Tiefgehende Kenntnisse in Docker und Container-Optimierung
  • Erfahrung mit Cloud-Plattformen (AWS / GCP / Azure – Fokus auf Managed Kubernetes)
  • Expertise in IaC mit Terraform, Helm oder Kustomize
  • Monitoring-Tools: Prometheus, Grafana, Loki, AlertManager
  • CI/CD: GitHub Actions oder GitLab CI, inklusive automatisiertem Testing & Deployment
  • Scripting mit Bash, Python oder Go zur Automatisierung
  • Erfahrung mit GitOps-Prinzipien und Versionskontrolle (Git)
  • Grundkenntnisse in Backup-Strategien und PostgreSQL High Availability
  • Kenntnisse in Node.js, TypeScript, PostgreSQL, Apache Kafka, Bull Queues und TypeSense

Was sonst noch zählt

  • Du wohnst in Berlin oder bist bereit, hierher zu ziehen – beides ist Voraussetzung, denn unser Office ist vor Ort.

Du bekommst ein Brett für deine Performance. Was draufsteht? Bestimmst du. Fähigkeiten bringen dich rein. Persönlichkeit bringt dich voran. Was du bekommst, hängt davon ab, was du draus machst.

View More