BENCHMARKS
Modelgedrag in
één oogopslag.
10 ‘gedrag & vaardigheden’‑benchmarks × 8 varianten (Basis vs Zwaar). Dit is een kwalitatieve index uit de brontekst (0 = n.v.t.).
10×8 overzicht
Basis ↔ Zwaar
0 = n.v.t.
Claude
OpenAI
Mistral
Gemini
Overzicht (10×8)
Bron:
Benchmarking LLM Behavior.md → llm_benchmarking_10x8.json
Tip: gebruik dit als ‘gespreksstarter’.
Agentisch werken
Emotionele intelligentie