045 — Modelgedrag — benchmarks

BENCHMARKS

Modelgedrag in
één oogopslag.

10 ‘gedrag & vaardigheden’‑benchmarks × 8 varianten (Basis vs Zwaar). Dit is een kwalitatieve index uit de brontekst (0 = n.v.t.).

10×8 overzicht Basis ↔ Zwaar 0 = n.v.t.

Claude

OpenAI

Mistral

Gemini

Bron: Benchmarking LLM Behavior.md → llm_benchmarking_10x8.json Tip: gebruik dit als ‘gespreksstarter’.