Senior AI / ML Engineer profile
Professional Profil

Senior AI / ML Engineer

12+ Jahre Erfahrung6 Stationen9 Zertifikate

Über mich

Senior AI / ML Engineer mit ueber 12 Jahren Erfahrung in Software- und Platform Engineering, nun vollstaendig fokussiert auf Design, Aufbau und Betrieb produktionsreifer AI/ML-Systeme im grossen Massstab. Ich schliesse die Luecke zwischen forschungsnahen Modellen und Enterprise-Produkten — von Datenpipelines ueber Training und Fine-Tuning bis hin zu zuverlaessigem, beobachtbarem Inference-Serving. Meine Kernstaerken umfassen End-to-End-ML-Plattform-Design (Feature Stores, Training-Orchestrierung, Model Registries, A/B-Serving), Integration und Fine-Tuning grosser Sprachmodelle (LoRA/QLoRA, RLHF, DPO), Retrieval-Augmented Generation (RAG) mit fortgeschrittenen Chunking-, Embedding- und Reranking-Strategien sowie agentenbasierte AI-Systemarchitektur mit Tool-Use, Planning und Memory-Patterns. Ich entwerfe AI-Systeme, die sicher, erklaerbar und konform mit EU AI Act, NIST AI RMF und ISO/IEC 42001 sind. Ich architekturiere skalierbare Inference-Infrastruktur auf Kubernetes (GKE, EKS) mit GPU-Scheduling, Autoscaling und kostenoptimiertem Serving ueber vLLM, TGI und Triton. Ich verfuege ueber produktive Praxiserfahrung mit Vertex AI, Amazon SageMaker, Azure ML und Open-Source-Stacks (MLflow, Kubeflow, Ray). Ich kann komplexe AI-Systemarchitektur klar fuer Executives, Produktteams und Regulierungsbehoerden praesentieren — mit hochwertigen Diagrammen, Risikobewertungen und Business-Impact-Analysen. Ich fuehre Architektur-Reviews, AI-Risikobewertungen und Implementierungsplanung fuer verantwortungsvolle, skalierbare AI-Delivery durch. Google Cloud (5x Professional zertifiziert): Professional Cloud Architect, Professional Cloud Network Engineer, Professional Security Operations Engineer, Professional Cloud DevOps Engineer, Professional Data Engineer. Technical Expert: Build with Vertex, Intelligent Search, Customer Engagement Suite with Google AI. Als publizierter technischer Autor veroeffentliche ich regelmaessig praxisnahe AI-Engineering-Erkenntnisse auf Medium und in Fachpublikationen und habe mehrere AI-Hackathons bei der Deutschen Telekom gewonnen.

Kontakt

LinkedInGitHub

Fähigkeiten

LLM-Fine-Tuning (LoRA, QLoRA, RLHF, DPO)
Retrieval-Augmented Generation (RAG)
Agentenbasierte KI (Tool-Use, Planning, Memory)
Prompt Engineering & Evaluation (RAGAS, DeepEval)
Transformer-Architektur & Attention-Mechanismen
Vektordatenbanken (Pinecone, Weaviate, pgvector, ChromaDB)
Embedding-Modelle & Semantische Suche
ML-Plattform-Architektur (Feature Store, Model Registry, A/B-Serving)
Training-Orchestrierung (Kubeflow, Ray, Vertex AI Pipelines)
Inference-Serving (vLLM, TGI, Triton, TorchServe)
GPU-Infrastruktur & Scheduling (NVIDIA A100/H100, MIG)
Modelloptimierung (Quantisierung, Destillation, Pruning)
Vertex AI (AutoML, Custom Training, Endpoints, Gemini)
Amazon SageMaker & Bedrock
Azure OpenAI Service & Azure ML
LangChain / LlamaIndex / CrewAI
Hugging Face Ecosystem (Transformers, PEFT, TRL, Datasets)
MLOps & Experiment Tracking (MLflow, W&B, Neptune)
Data Engineering fuer ML (Spark, BigQuery, Dataflow, dbt)
Computer Vision (YOLO, ViT, Detectron2)
NLP (NER, Sentiment, Zusammenfassung, Klassifikation)
Responsible AI & AI Safety (Guardrails, Red-Teaming, Bias-Audit)
KI-Governance (EU AI Act, NIST AI RMF, ISO/IEC 42001)
KI-Risikomanagement (ISO/IEC 23894)
Python (PyTorch, TensorFlow, JAX)
Go (Golang)
Kubernetes (GKE, EKS)
Docker
Terraform / Pulumi
CI/CD (GitLab CI, GitHub Actions, Cloud Build)
Argo CD / Argo Workflows (GitOps, ML-Pipelines)
Observability (Prometheus, Grafana, OpenTelemetry)
API-Design (REST, gRPC, GraphQL, OpenAPI)
Ereignisgesteuerte Architektur (Kafka, Pub/Sub, NATS)
Security fuer AI-Systeme (Modellsicherheit, Data-Poisoning-Abwehr)
Architekturdiagramme & Technisches Storytelling

Berufserfahrung

Senior Google Cloud Platform Engineer (GKE / GCP-Fokus)

T-Digital by Deutsche Telekom · Vollzeit

Sep 2024 - Present · 1 Jahr 9 Monate

Thessaloniki, Central Macedonia, Griechenland · Hybrid

- Produktive Multi-Region-/Multi-Cluster-GKE-Plattform fuer mehrere Produktteams verantwortet und weiterentwickelt: mit Terraform (google/google-beta-Provider) provisioniert, via Argo CD GitOps ueber Standard- und Autopilot-Cluster-Modi verwaltet.
- GCP-Netzwerk entworfen und betrieben: Shared-VPC-Topologie, Private Service Connect, VPC Peering, private GKE-Cluster mit autorisiertem Control-Plane-Zugriff, Cloud DNS Private-/Public-Zone-Management.
- HTTPS-L7-Ingress mit Google-managed Certificates, Multi-Backend-Routing via Cloud Load Balancing und Cloud Armor WAF-Regeln (Rate Limiting, Geo-Restriktion, benutzerdefinierte OWASP-Regelwerke) implementiert.
- GCP IAM gehaertet: Workload Identity Federation fuer schluesselloses CI/CD-Authentifizierung, Least-Privilege-Service-Account-Design, Org-Policy-Constraints, Binary Authorization Policy Enforcement.
- GCP Secret- und Key-Management betrieben: Cloud KMS (CMEK), Secret Manager mit Rotation-Triggern, External Secrets Operator fuer nahtlose Pod-Secret-Injection.
- Vollstaendige Observability auf GCP aufgebaut: Cloud Monitoring Dashboards und SLO-basiertes Alerting, Cloud Logging mit log-basierten Metriken und Log Analytics, Cloud Trace ueber OpenTelemetry Collector integriert.
- Vulnerability-Pipeline verwaltet: Artifact Registry Container Scanning, Trivy in CI, CVE-Triage-Prozess, Binary Authorization Attestation Gates zum Blockieren unsignierter Images in Produktion.
- Plattform-Resilienz verbessert: Cluster-etcd-Backup zu Cloud Storage, PVC-Snapshots, Cross-Region-Failover-Validierung, RPO/RTO-Dokumentation aligned mit SLO-Zielen.

Expert in Platform Engineering & Cloud Automation (GCP)

T-Digital by Deutsche Telekom · Vollzeit

Jun 2022 - Sep 2024 · 2 Jahre 4 Monate

Thessaloniki, Central Macedonia, Griechenland · Hybrid

- Multi-Workload-Plattform von OpenStack/AWS auf GCP migriert: VPC-Topologie entworfen (Shared VPC, Subnetze, Firewall-Regeln, Cloud NAT), GKE-Cluster mit Terraform provisioniert und GitOps-Delivery via Argo CD etabliert.
- CI/CD-Grundlagen auf GCP (Cloud Build + GitLab CI) fuer 50+ Microservices aufgebaut und standardisiert; immutable Image Builds via Artifact Registry und Deployment-Promotion-Workflows (Dev -> Staging -> Prod) durchgesetzt.
- Terraform-IaC-Module fuer GCP-Ressourcen entwickelt: GKE, VPC, Cloud Armor, KMS, Secret Manager, Cloud Monitoring Alert Policies — peer-reviewed, versioniert und teamuebergreifend wiederverwendet (~40% schnellere Umgebungs-Provisionierung).
- GCP IAM gehaertet: OS Login, Service Account Impersonation Limits, Org-Policy-Deny-Listen fuer oeffentliche IPs und Legacy APIs, automatisiertes IAM-Audit-Reporting.
- L4/L7-Traffic-Management eingesetzt: interne/externe TCP/UDP Load Balancer, HTTPS-Frontend mit SSL-Policy-Enforcement, Backend-Health-Check-Tuning fuer GKE-Workloads.
- Cloud Monitoring Alert Policies an SLI/SLO-Ziele geknuepft und mit PagerDuty integriert; Cloud Logging Dashboards und Log Sinks nach BigQuery fuer Compliance-Export und Kostenanalyse aufgebaut.
- GCP-Ressourcen-Lifecycle-Workflows automatisiert (VNF-Skalierung, Node-Pool-Autoscaling-Policies, Cloud Scheduler + Cloud Functions) — ~20% Infra-Kosteneinsparung erzielt.

Projekte

Stock Predict Architecture

Implementierte eine ML-Plattform auf GCP fuer Aktienprognosen und Sentiment-Analyse. Daten fliessen von Yahoo Finance und oeffentlichen APIs in CloudSQL (Postgres) als historische Speicherung. Vertex AI uebernimmt die Sentiment-Analyse, waehrend ARIMA-Modelle in optimierten GKE-Pods (8Gi RAM, 4 CPU) laufen. CI/CD-Pipelines mit Cloud Build und Artifact Registry gewaehrleisten schnelle Bereitstellung; GitHub-Quellen sind mit signierten Images (Cosign), SBOMs (Syft) und Secrets in Vault abgesichert. Infrastruktur ist mit Terraform automatisiert, Monitoring & Logging fuer Observability integriert.

GCPKubernetesCloudSQLVertex AIPythonCloud BuildArtifact RegistryCosignSyftVaultTerraformCloud Monitoring
Datum: 2024

Multiregionaler GKE-Cluster mit GitOps

Multiregionales Kubernetes-Deployment ueber die Regionen West 3 und West 4 mit GitLab Config Sync und Google Fleet. Hohe Verfuegbarkeit durch verteilte Workloads (App A, App B, App C) auf Zonen (a, b, c). Einheitliche GitOps-Delivery-Pipelines, konsistente Sicherheitsrichtlinien und Cross-Cluster-Management mit Fleet.

Google Kubernetes Engine (GKE)Google FleetGitLab CIConfig Sync (GitOps)Multi-Regional HAKubernetes
Datum: 2025

Lizenzen & Zertifikate

Google logo

Google Cloud Certified Professional Cloud Architect

Ausgestellt von Google · Ausgestellt Mai 2025

Kennung: 8a9ddfba001e4a55bf42667a6b62da9b

Skills: Cloud-Loesungsarchitektur, Sicherheit und Compliance, Cloud-Netzwerke, +6 weitere

Nachweis anzeigen
Google logo

Google Cloud Certified Professional Data Engineer

Ausgestellt von Google · Ausgestellt Jan 2024

Kennung: 4f3e7970bbdb4a61805a8209cfe215ed

Skills: Daten-Engineering, Big Data & ML-Pipelines, Daten-Governance & Sicherheit, +6 weitere

Nachweis anzeigen

Kurse

British Standards Institution (BSI)

ISO/IEC 23894:2023 Awareness fuer Risikomanagement von Kuenstlicher Intelligenz

British Standards Institution (BSI)

2025

Awareness eLearning-Abschlusszertifikat zu ISO/IEC 23894:2023 Leitfaden fuer Risikomanagement von KI: Prinzipien, Kontext, Identifizierung, Bewertung und Minderung von Risiken in KI-Systemen fuer vertrauenswuerdige und verantwortungsvolle KI.

Zertifikat: ISO/IEC 23894:2023 Awareness fuer Risikomanagement von Kuenstlicher Intelligenz
AIQI / UKAS

ISO/IEC 42001:2023 Awareness fuer Managementsysteme fuer Kuenstliche Intelligenz

AIQI / UKAS

2025

Awareness eLearning-Abschlusszertifikat zu ISO/IEC 42001:2023 Managementsysteme fuer Kuenstliche Intelligenz: Schluesselkonzepte, Struktur, Kontrollen, Governance und laenderspezifische Ueberlegungen.

Zertifikat: ISO/IEC 42001:2023 Awareness fuer Managementsysteme fuer Kuenstliche Intelligenz
The Linux Foundation

LFS120: Conversational AI: Compliance sicherstellen und Risiken mindern

The Linux Foundation

2025

Compliance- und risikoorientiertes Training fuer Conversational AI. Behandelt Anforderungen des EU AI Act, des NIST AI RMF sowie ISO/IEC 42001:2023; Methoden zur Identifikation, Analyse und Minderung ethischer, technischer und regulatorischer Risiken; sowie Praktiken fuer vertrauenswuerdige, verantwortungsvolle AI-Implementierungen.

Zertifikat: LFS120: Conversational AI: Compliance sicherstellen und Risiken mindern

Ausbildung

Humanitarian, Economic and Information Institute of Technology

2012 - 2016

Bachelor, Rechtswissenschaft

Datenschutz und SicherheitCompliance und RegulatorikKommunikation und ZusammenarbeitTechnische Analyse

Militaerakademie der Strategischen Raketentruppen (Peter der Grosse)

2007 - 2012

Ingenieurabschluss, Automatisierungs-Managementsysteme

ZeitmanagementSelbstdisziplinKommunikation und Zusammenarbeit

Militaerakademie der Strategischen Raketentruppen (Peter der Grosse)

2007 - 2012

Ingenieurabschluss, Uebersetzung

ZeitmanagementSelbstdisziplinKommunikation und Zusammenarbeit

Veröffentlichungen

Medium

Linux top von Grund auf erklaert — klar & praxisnah (2025)

DataDrivenInvestor · Aug 18, 2025

Schritt-fuer-Schritt-Anleitung zum Lesen von Linux top: Load Averages, Speichernutzung, CPU-Aufschluesselung und Prozesszustaende. Enthaelt praxisnahe Szenarien zur Diagnose von Rechen-, I/O- und VM-Engpaessen — mit klaren Gewohnheiten, um rohe Zahlen in umsetzbare Erkenntnisse zu verwandeln.

Artikel öffnen
Medium

Skalierbarer Micro-Kernel mit Go, Ausgabe 2025

Level Up Coding · Jul 28, 2025

Stellt eine Micro-Kernel-Architektur in Go vor, bei der der Kern nur Lebenszyklus, Routing und Synchronisation uebernimmt, waehrend die gesamte Geschaeftslogik als Plug-in-Module laeuft. Zeigt Hot-Swapping-Plugins fuer Metriken, Caching und E-Mail — fuer feingranulares Skalieren, nicht blockierendes Pub/Sub und saubere Code-Evolution.

Artikel öffnen

Auszeichnungen

Google Cloud Gen AI Technical Expert Badge Challenge - Early Adopter Edition iconGoogle Cloud Gen AI Technical Expert Badge Challenge - Early Adopter Edition

Ausgezeichnet von Google Cloud - Aug 2025

Zertifizierung / Auszeichnung

Als einer der ersten 1.100 Fachleute weltweit die Gen AI Technical Expert Badge Challenge (Early Adopter Edition) abgeschlossen. Diese anspruchsvolle Challenge erforderte den Erwerb mehrerer hochrangiger Google Cloud Technical Expert Zertifikate, darunter 'Build with Vertex', 'Intelligent Search' und 'Customer Engagement Suite with Google AI'. Die Auszeichnung belegt Fachkenntnisse in der Anwendung von Generativer KI fuer Unternehmensszenarien.

Certificate for Google Cloud Gen AI Technical Expert Badge Challenge - Early Adopter Edition
Google Cloud Arcade - Champions Meilenstein iconGoogle Cloud Arcade - Champions Meilenstein

Ausgezeichnet von Google Cloud - Jun 2024

Auszeichnung

Als einer der wenigen Fachleute weltweit fuer das Erreichen des Champions-Meilensteins in der Google Cloud Arcade ausgezeichnet mit insgesamt 78 Punkten. Diese seltene Leistung spiegelt ueber sechs Monate konsequentes Lernen und praxisorientiertes Arbeiten ueber verschiedene Google-Cloud-Technologien wider.

Certificate for Google Cloud Arcade - Champions Meilenstein
3. RIL AI Hackathon icon3. RIL AI Hackathon

Ausgezeichnet von Research Innovation Lab - Jun 2024

Hackathon

1. Platz beim 3. RIL AI Hackathon, veranstaltet vom Research Innovation Lab und assoziiert mit T-Digital (Deutsche Telekom). Unser Team entwickelte einen produktionsreifen Data Uploader fuer RAG-basierte Chatbots. Er unterstuetzt die Aufnahme von PDF-Dokumenten, bietet mehrere adaptive Chunking-Strategien, arbeitet autonom mit hochgeladenen Korpora und waehlt mithilfe LLM-basierter Bewertung automatisch die beste Strategie aus. Zudem integrierten wir RAGAS zur Messung der Antwortqualitaet.

Certificate for 3. RIL AI Hackathon
2. RIL AI Hackathon icon2. RIL AI Hackathon

Ausgezeichnet von Research Innovation Lab - Dez 2023

Hackathon

1. Platz beim 2. RIL AI Hackathon, veranstaltet vom Research Innovation Lab in Zusammenarbeit mit T-Digital (Deutsche Telekom). Entwickelte eine KI-Loesung zur Analyse von User Stories und Testfaellen, die wertvolle Einblicke zur Verbesserung von Qualitaet und Effizienz in der Softwareentwicklung liefert.

Certificate for 2. RIL AI Hackathon