Jobbeschreibung
Wir katapultieren Unternehmen in die Zukunft. Mit einem Betriebssystem für Geschäftsprozesse, das alles verändert. KI-gestützt. Radikal effizient. Unverwechselbar – genau wie das Team dahinter.
Für unsere Marke nolas workspace suchen wir dich als DevOps Engineer.
Nicht zum Mitlaufen. Sondern zum Vorangehen. Denn von 100 % machen nur 5 % den Unterschied – und genau da kommst du ins Spiel.
Hier würde jetzt der übliche „Über uns“-Text stehen. Sparen wir uns. Du willst wissen, was dich erwartet?
Wir suchen:
DevOps Engineer – Kubernetes & Cloud Infrastructure (m/w/d)
in Berlin
Eine vollständig containerisierte KI-Plattform. Mehrere Microservices. Echtzeit-Kommunikation. Intelligente Dokumentenanalyse.
Und alles läuft auf skalierbarer, automatisierter Infrastruktur – orchestriert über Kubernetes.
Dein Impact:
- Du bist verantwortlich für die komplette DevOps-Umgebung – von Infrastructure as Code bis Monitoring.
- Du gestaltest mit, wie wir Workflows automatisieren, Services absichern und Systeme skalieren.
- Du arbeitest eng mit Backend, AI und Produkt zusammen – echte Ownership, keine Ticketschieberei.
Deine Mission im Detail
Infrastructure & Cloud
- Design, Rollout und Betrieb unserer Kubernetes-Cluster (Dev / Staging / Prod)
- Infrastructure as Code (IaC) mit Terraform, Helm oder Kustomize
- Cloud-Management mit Fokus auf Kostenoptimierung, Sicherheit und Skalierbarkeit (EKS, GKE oder AKS)
- Implementierung von Auto-Scaling-Strategien für dynamische Workloads (horizontal & vertikal)
- Verwaltung von Netzwerkressourcen, Ingress, Load Balancing und SSL/TLS-Zertifikaten
- Optimierung von Cloud-Ressourcen hinsichtlich Kosten, Performance und Sicherheit
Microservices & Container
- Containerisierung und Orchestrierung unserer Microservices:
- REST APIs (Node.js / Hono) – Core Application Backend
- WebSocket Server – Echtzeitkommunikation
- Kafka Consumer – Event-getriebene Verarbeitung
- AI Processing Services – Analyse und Klassifikation
- Frontend (Vue.js) – Benutzeroberfläche
- Image-Optimierung für Performance und Sicherheit
- Secrets- und Config-Management mit Vault oder Kubernetes Secrets
- Umsetzung von Security Policies (RBAC, Network Policies, Pod Security Standards
Monitoring & Reliability
- Aufbau und Pflege einer umfassenden Monitoring- und Observability-Umgebung:
- Prometheus – Metriken & Alerting
- Grafana – Dashboards & Visualisierung
- Loki – Logging & Analyse
- Entwicklung anwendungsspezifischer Custom Metrics
- Implementierung von Alerting- und Incident-Response-Workflows
- Erstellung und Pflege von SLI/SLO-Dashboards zur Sicherstellung der Service-Zuverlässigkeit
CI/CD & Automation
- Design und Pflege von CI/CD-Pipelines (GitHub Actions / GitLab CI)
- Automatisiertes Testing, Security Scanning, Build & Deployment
- Verwaltung von Container-Registries und Artefakt-Repositories
- Rollback-Mechanismen und Canary Deployments bei fehlerhaften Releases
- Implementierung von GitOps-Workflows für konsistente Deployments
Security & Compliance
- Umsetzung von Kubernetes-Sicherheitsrichtlinien (RBAC, Pod Security, Network Policies)
- Verwaltung von Secrets & Zertifikaten über Vault oder Kubernetes-native Tools
- Container-Image-Scanning und Vulnerability Management
- Sicherstellung der Datenschutz- und Compliance-Anforderungen (z. B. DSGVO)
- Audit Logging und revisionssichere Dokumentation aller Änderungen
Performance & Optimization
- Monitoring und Optimierung der Ressourcennutzung in Kubernetes
- Performance-Tuning für hohe Durchsatzlasten in Dokumentenverarbeitung und AI-Pipelines
- Implementierung von Caching-Strategien und CDN-Integrationen
- Optimierung von Container-Images hinsichtlich Größe und Laufzeitverhalten
- Backup- und Wiederherstellungsstrategien für Datenbanken und Cluster
- 3+ Jahre Erfahrung im produktiven Kubernetes-Cluster-Management
- Tiefgehende Kenntnisse in Docker und Container-Optimierung
- Erfahrung mit Cloud-Plattformen (AWS / GCP / Azure – Fokus auf Managed Kubernetes)
- Expertise in IaC mit Terraform, Helm oder Kustomize
- Monitoring-Tools: Prometheus, Grafana, Loki, AlertManager
- CI/CD: GitHub Actions oder GitLab CI, inklusive automatisiertem Testing & Deployment
- Scripting mit Bash, Python oder Go zur Automatisierung
- Erfahrung mit GitOps-Prinzipien und Versionskontrolle (Git)
- Grundkenntnisse in Backup-Strategien und PostgreSQL High Availability
- Kenntnisse in Node.js, TypeScript, PostgreSQL, Apache Kafka, Bull Queues und TypeSense
Was sonst noch zählt
- Du wohnst in Berlin oder bist bereit, hierher zu ziehen – beides ist Voraussetzung, denn unser Office ist vor Ort.
Du bekommst ein Brett für deine Performance. Was draufsteht? Bestimmst du. Fähigkeiten bringen dich rein. Persönlichkeit bringt dich voran. Was du bekommst, hängt davon ab, was du draus machst.
Mehr