Role overview
Als GenAI Engineer bouw je end-to-end applicaties die Large Language Models (LLM’s) gebruiken — zowel open-source (bijv. Llama, Mistral) als commercieel (bijv. OpenAI, Anthropic, Google). Jij maakt van proof-of-concepts robuuste producten: van datasourcing en RAG-architectuur tot agentic workflows, evaluatie, observability en veilig uitrollen in productie.
Bij Team Rockstars IT kun je gaan werken aan uitdagende projecten bij toonaangevende klanten (van scale-ups tot corporates zoals ASML, Rabobank, ABN Amro of Schiphol Groep).
Voorbeelden van wat je zou kunnen doen:
What you'll work on
- Ontwerpen en bouwen van RAG-systemen (retrieval, chunking, indexing, hybrid search & reranking) voor knowledge-intensive processen.
- Implementeren van agentic AI (planning, tools/function calling, multi-agent) om complexe taken end-to-end te automatiseren.
- Productiseren van conversational & copilots (chat, forms, voice, vision) inclusief auth, caching, cost controls en prompt-/model-versioning.
- Inrichten van een LLMOps-stack: CI/CD, offline/online evals, monitoring, guardrails, canaries & feature flags.
What we're looking for
- LLM’s & Serving: OpenAI/Anthropic/Vertex AI/Azure OpenAI; open-source via vLLM, TGI, Ollama.
- Agentic AI: CrewAI, LangChain (+LangGraph), PydanticAI; tool-execution & planning, memory, orchestration.
- RAG & Search: LlamaIndex/LangChain toolset, vector stores (pgvector/FAISS/Qdrant /Weaviate), embeddings & rerankers.
- Testing & Evaluatie: RAGAS voor pipeline-validatie, Giskard/TruLens/DeepEval/OpenAI Evals voor model- en prompt-evals, synthetic data & golden sets.
- Monitoring & Observability: Langfuse (tracing, prompts, costs), MLflow (experiments/registry), OpenTelemetry/Prometheus/Grafana, Arize Phoenix.
- MLOps/LLMOps & Data: Airflow/Prefect, dbt, Spark, Terraform, Docker/Kubernetes, GitHub Actions/Azure DevOps.
- Platforms: GCP (Vertex), AWS (Bedrock/SageMaker), Azure (AI Studio/ML), Databricks.