intermediateTechnisch

6 min leestijd

Redeneermodel

Reasoning-model (denkmodel / thinking model)

Door Dennis Claassen · Laatst bijgewerkt feb 2026

Simpele Uitleg

Een redeneermodel is een AI-model dat eerst nadenkt voordat het antwoordt. Waar een gewoon taalmodel zijn antwoord meteen woord voor woord uittypt, maakt een redeneermodel eerst een soort kladblok aan dat je normaal niet ziet: het plant, probeert aanpakken en controleert zichzelf. Pas daarna geeft het het echte antwoord. Die denkfase kost extra rekenwerk en tijd, maar levert vaak een beter antwoord bij moeilijke vragen zoals wiskunde, programmeren of meerstaps-planning. Je hoort ze ook wel denkmodel of thinking model. Het Engelse woord is reasoning-model.

Technische Definitie

Een redeneermodel genereert eerst interne denk-tokens (reasoning tokens of thinking tokens) voordat het zijn zichtbare antwoord produceert. Anthropic beschrijft dit als extended thinking dat "enhanced reasoning capabilities for complex tasks" geeft via "thinking content blocks" met de interne redenering, vóór het eindantwoord (platform.claude.com). OpenAI introduceert "reasoning tokens in addition to input and output tokens"; die zijn niet zichtbaar via de API maar "occupy space in the model's context window and are billed as output tokens" (developers.openai.com). Google Gemini gebruikt "an internal thinking process that significantly improves their reasoning and multi-step planning abilities" (ai.google.dev). Het onderliggende concept is test-time compute: het model steekt meer rekenkracht in een antwoord op het moment van gebruik, met afnemende meeropbrengst (nauwkeurigheid verbetert logaritmisch met het aantal denk-tokens).

Waarom Dit Belangrijk Is

Waarom zou een model eerst nadenken in plaats van direct antwoorden? Omdat moeilijke vragen vaak niet in één keer goed gaan. Door eerst te plannen, alternatieven te proberen en zichzelf te corrigeren, lost een redeneermodel complexe taken betrouwbaarder op: wiskunde, debuggen, wetenschappelijk redeneren en agent-workflows die beslissingen nemen.

De kern van de term is een afweging die je zelf in de hand hebt. Meer laten denken kost meer geld en tijd, want je betaalt voor de denk-tokens en het antwoord komt later. Wie dat begrijpt, kiest per taak hoeveel denkwerk nodig is in plaats van blind het duurste model op alles te zetten.

Voor wie met Claude Code of andere agentic tools werkt, is dit dagelijkse kost: een redeneermodel als planner dat de strategie bepaalt, en snellere modellen die de losse taken uitvoeren. Hoe je die keuzes maakt in de praktijk staat in de gids over Claude Code gebruiken.

Hoe Het Werkt

Het verloopt in vier stappen. Eerst stel je je vraag. Daarna genereert het model interne denk-tokens: het plant, probeert aanpakken, controleert zichzelf en corrigeert fouten. OpenAI omschrijft dat het model via training leert "to recognize and correct its mistakes... to break down tricky steps into simpler ones... to try a different approach when the current one isn't working." Pas daarna komt het zichtbare antwoord. De denk-tokens worden na het antwoord weggegooid, maar ze tellen wel mee voor de kosten en namen plek in je context window in.

Alle drie de grote aanbieders geven je een knop voor hoeveel het model mag denken. Het is hetzelfde idee onder verschillende namen. Anthropic gebruikt budget_tokens, het maximumaantal denk-tokens, dat kleiner moet zijn dan max_tokens. OpenAI gebruikt een effort-niveau (reasoning.effort), op dit moment van none tot xhigh, waarbij lager sneller en goedkoper is en hoger dieper redeneert. Google gebruikt thinking_level en een thinkingBudget in tokens, met dynamic thinking waarbij het model zelf inschat hoeveel het nodig heeft. Exacte namen en waarden veranderen; check de officiële docs voor de actuele set.

Wat je te zien krijgt is meestal niet de ruwe gedachtegang maar een samenvatting (thought summaries bij Google, samengevatte thinking blocks bij Anthropic). Belangrijk: die getoonde redenering is een venster, geen volledige waarheid (zie de misvattingen).

Use Cases

Complexe, meerstaps problemen

Voor moeilijke wiskunde, programmeren en debuggen, wetenschappelijk redeneren en planning presteren redeneermodellen aantoonbaar beter. Google raadt voor dit soort taken expliciet een hoog denkbudget aan; het extra denkwerk verdient zich terug in nauwkeurigheid.

Een planner die andere modellen aanstuurt

OpenAI's hybride advies: gebruik een redeneermodel om de strategie te bedenken, en snellere standaardmodellen om de losse taken uit te voeren, "particularly when speed and cost are more important than perfect accuracy." In agentic workflows met Claude Code is dit een gangbaar patroon.

Wanneer nauwkeurigheid boven snelheid gaat

Bij taken waar een fout duur is — een financieel model controleren, een ingewikkelde migratie plannen — is het langere wachten en de hogere kosten het waard. Je zet de denkknop dan bewust hoger.

Simpele taken bewust zónder veel denken

Voor een feitvraag, classificatie of een kort, voor de hand liggend antwoord is denken niet nodig. Google noemt zulke taken expliciet als gevallen waar denken "not required" is. Zet de knop dan laag of uit: sneller, goedkoper, even goed.

Latency-kritische toepassingen

Bij chat met hoge doorvoer of realtime interactie telt elke seconde. Daar kies je een lager effort-niveau of een gewoon model, omdat de denkfase het antwoord vertraagt.

Voorbeelden

Denken aanzetten met een tokenbudget (Anthropic, Python)

Bij Anthropic zet je extended thinking aan met een thinking-blok en een budget_tokens dat kleiner is dan max_tokens. De modelnaam hieronder is een momentopname uit de docs; check platform.claude.com voor de actuele naam.

import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 10000},
    messages=[{"role": "user", "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"}],
)

Denkdiepte kiezen met een effort-niveau (OpenAI, Python)

Bij OpenAI kies je hoeveel het model denkt via reasoning.effort. Lager is sneller en goedkoper, hoger redeneert dieper. Modelnaam en effort-waarden zijn een momentopname; check developers.openai.com.

from openai import OpenAI
client = OpenAI()
response = client.responses.create(
    model="gpt-5.5",
    reasoning={"effort": "low"},
    input=[{"role": "user", "content": "Write a bash script..."}]
)
print(response.output_text)

Wanneer wel en wanneer niet (conceptueel)

Vraag: "In welke stad is DeepMind opgericht?" Dat is een simpele feitvraag — denken is niet nodig, een gewoon model is sneller en goedkoper. Vraag: "Los dit meerstaps wiskunde- of codeerprobleem op en controleer je werk." Daar loont het denken wel. Dezelfde tool, andere knopstand: dat is precies waar de term om draait.

Veelgemaakte Fouten

"Een redeneermodel is altijd beter."

Niet waar. Bij simpele taken halen gewone modellen vaak even hoge of hogere nauwkeurigheid, én ze zijn sneller en goedkoper. Onderzoek vindt dat standaardmodellen bij lage complexiteit beter en efficiënter presteren (arXiv 2506.06941, "The Illusion of Thinking"). Kies per taak.

"Je moet ze vragen om 'stap voor stap te denken'."

Onnodig. OpenAI: "Since these models perform reasoning internally, prompting them to 'think step by step' or 'explain your reasoning' is unnecessary." Houd je prompt juist kort en duidelijk; few-shot voorbeelden zijn vaak overbodig. Probeer eerst zero-shot.

"De getoonde redenering laat precies zien hoe het model denkt."

Onjuist. Anthropic-onderzoek laat zien dat de chain-of-thought niet altijd "faithful" is: modellen verwoorden lang niet altijd de echte factoren achter hun antwoord (faithfulness was in sommige tests rond 25% bij bepaalde hints). De zichtbare gedachten zijn een venster, geen volledige waarheid.

"Meer denken is altijd een beter antwoord."

Niet vanzelfsprekend. Bij "overthinking" vinden modellen het juiste antwoord soms vroeg en verpesten het door door te blijven redeneren. Bovendien neemt de meeropbrengst van extra denken logaritmisch af. Begin laag en verhoog alleen als de kwaliteit het nodig heeft.

Tools Die Dit Gebruiken

Claude (extended thinking)ChatGPT / OpenAI (reasoning effort)Google Gemini (thinking)Claude Code

Veelgestelde Vragen

Wat is een reasoning-model?

Een reasoning-model (redeneermodel of denkmodel) is een AI-model dat eerst intern nadenkt voordat het antwoordt. Het genereert eerst verborgen denk-tokens waarin het plant, aanpakken probeert en zichzelf corrigeert, en geeft pas daarna het zichtbare antwoord. Dat kost extra tijd en geld, maar levert vaak betere antwoorden bij complexe taken.

Wat is het verschil tussen een redeneermodel en een gewoon taalmodel?

Een gewoon taalmodel typt zijn antwoord direct uit, woord voor woord. Een redeneermodel maakt eerst een interne denkfase aan (een soort kladblok dat je niet ziet) en pas daarna het echte antwoord. Bij simpele vragen is het verschil klein en is het gewone model sneller en goedkoper; bij moeilijke, meerstaps taken wint het redeneermodel meestal op nauwkeurigheid.

Wanneer moet ik een redeneermodel gebruiken?

Gebruik het bij complexe, meerstaps problemen: moeilijke wiskunde, programmeren en debuggen, wetenschappelijk redeneren, planning en agent-workflows. Voor simpele feitvragen, classificatie of taken waar lage latency telt, kun je beter een gewoon model of een laag denkbudget kiezen. Vuistregel: zet de denkknop zo laag als kan en verhoog alleen als de kwaliteit het vraagt.

Kosten redeneermodellen meer?

Ja, meestal wel, omdat je voor de denk-tokens betaalt ook al zie je ze niet. OpenAI rekent reasoning tokens "as output tokens", Anthropic zegt "you're charged for the full thinking tokens generated" en Google's prijs is "the sum of output tokens and thinking tokens". Meer laten denken betekent dus hogere kosten en een trager antwoord.

Moet ik een redeneermodel vragen om stap voor stap te denken?

Nee. Omdat het model intern al redeneert, is een instructie als "denk stap voor stap" of "leg je redenering uit" overbodig; OpenAI noemt het letterlijk "unnecessary". Houd je prompt kort en duidelijk, en probeer eerst zonder voorbeelden (zero-shot). Te veel sturing kan de kwaliteit zelfs verlagen.

Hallucineren redeneermodellen minder?

Niet vanzelfsprekend. Het idee dat "nadenken" hallucinaties voorkomt klopt niet automatisch: onderzoek wijst juist op factuele degradatie bij sommige reasoning-modellen op feitgerichte taken (arXiv 2505.23646). Extra denken helpt bij redeneerproblemen, maar is geen garantie tegen onjuiste feiten.

Gerelateerde Termen

Chain of Thought Token Context Window LLM Hallucination Temperature Prompt Engineering

Wil je deze term in de praktijk leren toepassen?

Bekijk Trainingen Plan Kennismaking