Senior AI / ML Engineer mit ueber 12 Jahren Erfahrung in Software- und Platform Engineering, nun vollstaendig fokussiert auf Design, Aufbau und Betrieb produktionsreifer AI/ML-Systeme im grossen Massstab. Ich schliesse die Luecke zwischen forschungsnahen Modellen und Enterprise-Produkten — von Datenpipelines ueber Training und Fine-Tuning bis hin zu zuverlaessigem, beobachtbarem Inference-Serving.
Meine Kernstaerken umfassen End-to-End-ML-Plattform-Design (Feature Stores, Training-Orchestrierung, Model Registries, A/B-Serving), Integration und Fine-Tuning grosser Sprachmodelle (LoRA/QLoRA, RLHF, DPO), Retrieval-Augmented Generation (RAG) mit fortgeschrittenen Chunking-, Embedding- und Reranking-Strategien sowie agentenbasierte AI-Systemarchitektur mit Tool-Use, Planning und Memory-Patterns. Ich entwerfe AI-Systeme, die sicher, erklaerbar und konform mit EU AI Act, NIST AI RMF und ISO/IEC 42001 sind.
Ich architekturiere skalierbare Inference-Infrastruktur auf Kubernetes (GKE, EKS) mit GPU-Scheduling, Autoscaling und kostenoptimiertem Serving ueber vLLM, TGI und Triton. Ich verfuege ueber produktive Praxiserfahrung mit Vertex AI, Amazon SageMaker, Azure ML und Open-Source-Stacks (MLflow, Kubeflow, Ray).
Ich kann komplexe AI-Systemarchitektur klar fuer Executives, Produktteams und Regulierungsbehoerden praesentieren — mit hochwertigen Diagrammen, Risikobewertungen und Business-Impact-Analysen. Ich fuehre Architektur-Reviews, AI-Risikobewertungen und Implementierungsplanung fuer verantwortungsvolle, skalierbare AI-Delivery durch.
Google Cloud (5x Professional zertifiziert): Professional Cloud Architect, Professional Cloud Network Engineer, Professional Security Operations Engineer, Professional Cloud DevOps Engineer, Professional Data Engineer. Technical Expert: Build with Vertex, Intelligent Search, Customer Engagement Suite with Google AI.
Als publizierter technischer Autor veroeffentliche ich regelmaessig praxisnahe AI-Engineering-Erkenntnisse auf Medium und in Fachpublikationen und habe mehrere AI-Hackathons bei der Deutschen Telekom gewonnen.
LLM-Fine-Tuning (LoRA, QLoRA, RLHF, DPO)
Retrieval-Augmented Generation (RAG)
Agentenbasierte KI (Tool-Use, Planning, Memory)
Prompt Engineering & Evaluation (RAGAS, DeepEval)
Transformer-Architektur & Attention-Mechanismen
Vektordatenbanken (Pinecone, Weaviate, pgvector, ChromaDB)
Embedding-Modelle & Semantische Suche
ML-Plattform-Architektur (Feature Store, Model Registry, A/B-Serving)
Training-Orchestrierung (Kubeflow, Ray, Vertex AI Pipelines)
Inference-Serving (vLLM, TGI, Triton, TorchServe)
GPU-Infrastruktur & Scheduling (NVIDIA A100/H100, MIG)
Modelloptimierung (Quantisierung, Destillation, Pruning)
Vertex AI (AutoML, Custom Training, Endpoints, Gemini)
Amazon SageMaker & Bedrock
Azure OpenAI Service & Azure ML
LangChain / LlamaIndex / CrewAI
Hugging Face Ecosystem (Transformers, PEFT, TRL, Datasets)
MLOps & Experiment Tracking (MLflow, W&B, Neptune)
Data Engineering fuer ML (Spark, BigQuery, Dataflow, dbt)
Computer Vision (YOLO, ViT, Detectron2)
NLP (NER, Sentiment, Zusammenfassung, Klassifikation)
Responsible AI & AI Safety (Guardrails, Red-Teaming, Bias-Audit)
KI-Governance (EU AI Act, NIST AI RMF, ISO/IEC 42001)
KI-Risikomanagement (ISO/IEC 23894)
Python (PyTorch, TensorFlow, JAX)
Go (Golang)
Kubernetes (GKE, EKS)
Docker
Terraform / Pulumi
CI/CD (GitLab CI, GitHub Actions, Cloud Build)
Argo CD / Argo Workflows (GitOps, ML-Pipelines)
Observability (Prometheus, Grafana, OpenTelemetry)
API-Design (REST, gRPC, GraphQL, OpenAPI)
Ereignisgesteuerte Architektur (Kafka, Pub/Sub, NATS)
Security fuer AI-Systeme (Modellsicherheit, Data-Poisoning-Abwehr)
Architekturdiagramme & Technisches Storytelling