Redeneermodel
Reasoning-model (denkmodel / thinking model)
Simpele Uitleg
Een redeneermodel is een AI-model dat eerst nadenkt voordat het antwoordt. Waar een gewoon taalmodel zijn antwoord meteen woord voor woord uittypt, maakt een redeneermodel eerst een soort kladblok aan dat je normaal niet ziet: het plant, probeert aanpakken en controleert zichzelf. Pas daarna geeft het het echte antwoord. Die denkfase kost extra rekenwerk en tijd, maar levert vaak een beter antwoord bij moeilijke vragen zoals wiskunde, programmeren of meerstaps-planning. Je hoort ze ook wel denkmodel of thinking model. Het Engelse woord is reasoning-model.
Technische Definitie
Een redeneermodel genereert eerst interne denk-tokens (reasoning tokens of thinking tokens) voordat het zijn zichtbare antwoord produceert. Anthropic beschrijft dit als extended thinking dat "enhanced reasoning capabilities for complex tasks" geeft via "thinking content blocks" met de interne redenering, vóór het eindantwoord (platform.claude.com). OpenAI introduceert "reasoning tokens in addition to input and output tokens"; die zijn niet zichtbaar via de API maar "occupy space in the model's context window and are billed as output tokens" (developers.openai.com). Google Gemini gebruikt "an internal thinking process that significantly improves their reasoning and multi-step planning abilities" (ai.google.dev). Het onderliggende concept is test-time compute: het model steekt meer rekenkracht in een antwoord op het moment van gebruik, met afnemende meeropbrengst (nauwkeurigheid verbetert logaritmisch met het aantal denk-tokens).
Waarom Dit Belangrijk Is
Waarom zou een model eerst nadenken in plaats van direct antwoorden? Omdat moeilijke vragen vaak niet in één keer goed gaan. Door eerst te plannen, alternatieven te proberen en zichzelf te corrigeren, lost een redeneermodel complexe taken betrouwbaarder op: wiskunde, debuggen, wetenschappelijk redeneren en agent-workflows die beslissingen nemen.
De kern van de term is een afweging die je zelf in de hand hebt. Meer laten denken kost meer geld en tijd, want je betaalt voor de denk-tokens en het antwoord komt later. Wie dat begrijpt, kiest per taak hoeveel denkwerk nodig is in plaats van blind het duurste model op alles te zetten.
Voor wie met Claude Code of andere agentic tools werkt, is dit dagelijkse kost: een redeneermodel als planner dat de strategie bepaalt, en snellere modellen die de losse taken uitvoeren. Hoe je die keuzes maakt in de praktijk staat in de gids over Claude Code gebruiken.
Hoe Het Werkt
Het verloopt in vier stappen. Eerst stel je je vraag. Daarna genereert het model interne denk-tokens: het plant, probeert aanpakken, controleert zichzelf en corrigeert fouten. OpenAI omschrijft dat het model via training leert "to recognize and correct its mistakes... to break down tricky steps into simpler ones... to try a different approach when the current one isn't working." Pas daarna komt het zichtbare antwoord. De denk-tokens worden na het antwoord weggegooid, maar ze tellen wel mee voor de kosten en namen plek in je context window in.
Alle drie de grote aanbieders geven je een knop voor hoeveel het model mag denken. Het is hetzelfde idee onder verschillende namen. Anthropic gebruikt budget_tokens, het maximumaantal denk-tokens, dat kleiner moet zijn dan max_tokens. OpenAI gebruikt een effort-niveau (reasoning.effort), op dit moment van none tot xhigh, waarbij lager sneller en goedkoper is en hoger dieper redeneert. Google gebruikt thinking_level en een thinkingBudget in tokens, met dynamic thinking waarbij het model zelf inschat hoeveel het nodig heeft. Exacte namen en waarden veranderen; check de officiële docs voor de actuele set.
Wat je te zien krijgt is meestal niet de ruwe gedachtegang maar een samenvatting (thought summaries bij Google, samengevatte thinking blocks bij Anthropic). Belangrijk: die getoonde redenering is een venster, geen volledige waarheid (zie de misvattingen).
Use Cases
Complexe, meerstaps problemen
Voor moeilijke wiskunde, programmeren en debuggen, wetenschappelijk redeneren en planning presteren redeneermodellen aantoonbaar beter. Google raadt voor dit soort taken expliciet een hoog denkbudget aan; het extra denkwerk verdient zich terug in nauwkeurigheid.
Een planner die andere modellen aanstuurt
OpenAI's hybride advies: gebruik een redeneermodel om de strategie te bedenken, en snellere standaardmodellen om de losse taken uit te voeren, "particularly when speed and cost are more important than perfect accuracy." In agentic workflows met Claude Code is dit een gangbaar patroon.
Wanneer nauwkeurigheid boven snelheid gaat
Bij taken waar een fout duur is — een financieel model controleren, een ingewikkelde migratie plannen — is het langere wachten en de hogere kosten het waard. Je zet de denkknop dan bewust hoger.
Simpele taken bewust zónder veel denken
Voor een feitvraag, classificatie of een kort, voor de hand liggend antwoord is denken niet nodig. Google noemt zulke taken expliciet als gevallen waar denken "not required" is. Zet de knop dan laag of uit: sneller, goedkoper, even goed.
Latency-kritische toepassingen
Bij chat met hoge doorvoer of realtime interactie telt elke seconde. Daar kies je een lager effort-niveau of een gewoon model, omdat de denkfase het antwoord vertraagt.
Voorbeelden
Denken aanzetten met een tokenbudget (Anthropic, Python)
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[{"role": "user", "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"}],
)Denkdiepte kiezen met een effort-niveau (OpenAI, Python)
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5.5",
reasoning={"effort": "low"},
input=[{"role": "user", "content": "Write a bash script..."}]
)
print(response.output_text)Wanneer wel en wanneer niet (conceptueel)
Veelgemaakte Fouten
"Een redeneermodel is altijd beter."
Niet waar. Bij simpele taken halen gewone modellen vaak even hoge of hogere nauwkeurigheid, én ze zijn sneller en goedkoper. Onderzoek vindt dat standaardmodellen bij lage complexiteit beter en efficiënter presteren (arXiv 2506.06941, "The Illusion of Thinking"). Kies per taak.
"Je moet ze vragen om 'stap voor stap te denken'."
Onnodig. OpenAI: "Since these models perform reasoning internally, prompting them to 'think step by step' or 'explain your reasoning' is unnecessary." Houd je prompt juist kort en duidelijk; few-shot voorbeelden zijn vaak overbodig. Probeer eerst zero-shot.
"De getoonde redenering laat precies zien hoe het model denkt."
Onjuist. Anthropic-onderzoek laat zien dat de chain-of-thought niet altijd "faithful" is: modellen verwoorden lang niet altijd de echte factoren achter hun antwoord (faithfulness was in sommige tests rond 25% bij bepaalde hints). De zichtbare gedachten zijn een venster, geen volledige waarheid.
"Meer denken is altijd een beter antwoord."
Niet vanzelfsprekend. Bij "overthinking" vinden modellen het juiste antwoord soms vroeg en verpesten het door door te blijven redeneren. Bovendien neemt de meeropbrengst van extra denken logaritmisch af. Begin laag en verhoog alleen als de kwaliteit het nodig heeft.
Tools Die Dit Gebruiken
Veelgestelde Vragen
Wat is een reasoning-model?
Wat is het verschil tussen een redeneermodel en een gewoon taalmodel?
Wanneer moet ik een redeneermodel gebruiken?
Kosten redeneermodellen meer?
Moet ik een redeneermodel vragen om stap voor stap te denken?
Hallucineren redeneermodellen minder?
Wil je deze term in de praktijk leren toepassen?