Directiesecretariaat — Agents & AI
Agents · prompting · veiligheid · praktijk
WORKSHOP
BENCHMARKS

Modelgedrag in
één oogopslag.

10 ‘gedrag & vaardigheden’‑benchmarks × 8 varianten (Basis vs Zwaar). Dit is een kwalitatieve index uit de brontekst (0 = n.v.t.).

10×8 overzicht Basis ↔ Zwaar 0 = n.v.t.
Claude-logoClaude OpenAI-logoOpenAI Mistral-logoMistral Gemini-logoGemini

Overzicht (10×8)

Warmtekaart (10×8): benchmarks × modellen. Score 0–100, 0 = n.v.t.
Bron: Benchmarking LLM Behavior.mdllm_benchmarking_10x8.json Tip: gebruik dit als ‘gespreksstarter’.

Agentisch werken

Staafdiagram: agentische taakprestatie (Basis vs Zwaar per modelfamilie).

Emotionele intelligentie

Staafdiagram: emotionele intelligentie (Basis vs Zwaar per modelfamilie).