advancedTechnisch

5 min leestijd

Structured Outputs

Gestructureerde AI-Output (JSON, XML)

Simpele Uitleg

Structured outputs zijn antwoorden van een AI-model in een vast, voorspelbaar formaat — zoals JSON of XML — in plaats van vrije tekst. Stel je voor dat je een collega vraagt om klantgegevens. Die collega kan een verhaal vertellen ("Jan woont in Amsterdam en is 42 jaar") of een formulier invullen met nette vakjes voor naam, stad en leeftijd. Structured outputs zijn dat formulier: de AI levert data in precies het formaat dat je software verwacht, zodat het direct verwerkt kan worden zonder handmatig parsen.

Technische Definitie

Structured outputs worden technisch gerealiseerd via constrained decoding: het JSON Schema wordt omgezet naar een context-free grammar (CFG) die bepaalt welke tokens geldig zijn bij elke generatiestap. Ongeldige tokens worden gemaskeerd (kans op nul gezet) vóór de sampling, wat een 100% structurele garantie biedt. OpenAI introduceerde Structured Outputs in augustus 2024 met strict mode (`strict: true`), waarbij GPT-4o van 26% naar 100% nauwkeurigheid ging op complexe JSON schema's. Anthropic biedt JSON Schema enforcement als beta-feature voor Claude, met ondersteuning voor Zod (TypeScript) en Pydantic (Python) schema-definities. Beide garanderen nul parse-fouten.

Waarom Dit Belangrijk Is

Zonder structured outputs is AI-integratie in bedrijfssoftware een nachtmerrie. Je krijgt tekst terug die je moet parsen, interpreteren en omzetten naar het formaat dat je systemen verwachten. Eén onverwachte zin en je hele pipeline breekt.

Met structured outputs verandert dat compleet. Je definieert precies welk formaat je verwacht — welke velden, welke datatypes, welke structuur — en het model levert gegarandeerd output die daaraan voldoet. Dit maakt AI bruikbaar voor data-pipelines, API-integraties, CRM-koppelingen en geautomatiseerde workflows.

Voor bedrijven die AI willen integreren in hun systemen is dit een fundamentele capability. Een AI-agent die facturen verwerkt moet gestructureerde data opleveren, niet een samenvattende tekst. Een chatbot die bestellingen plaatst moet een geldig orderformaat genereren.

In de ChatGPT, Claude & Gemini Masterclass leer je hoe je structured outputs inzet voor zakelijke toepassingen. De AI als Teamsport training behandelt team-brede AI-integratie in bedrijfsprocessen.

Hoe Het Werkt

Structured outputs werken door het AI-model te begrenzen zodat het alleen output kan genereren die aan je schema voldoet.

Je begint met het definiëren van een JSON Schema: welke velden verwacht je, welke datatypes (string, number, boolean), welke velden zijn verplicht, en wat is de structuur (geneste objecten, arrays). Dit schema geef je mee aan de API-aanroep.

Achter de schermen zet het systeem je schema om naar een grammatica — een set regels die bepaalt welke tokens (woorden, tekens) geldig zijn op elk punt in de generatie. Als het model een JSON-object genereert en net een `"naam":` heeft geschreven, zijn alleen string-tokens geldig als volgende stap. Tokens die het schema zouden schenden krijgen een kans van nul.

Het resultaat: elk antwoord dat het model genereert is gegarandeerd geldig JSON dat exact aan je schema voldoet. Geen parse-fouten, geen onverwachte velden, geen missende data.

Belangrijk: structurele validatie garandeert niet dat de inhoud klopt. Het model kan een veld "leeftijd" correct als nummer invullen, maar het verkeerde nummer kiezen. De structuur is perfect, de inhoud moet je nog steeds verifiëren — dat is waar guardrails en menselijke controle bij komen.

Use Cases

Factuurverwerking

Een AI-model extraheert gestructureerde data uit PDF-facturen: bedrijfsnaam, factuurnummer, bedrag, BTW, betaaldatum. De output gaat direct de boekhoudsoftware in zonder handmatige invoer. De AI voor Finance teams training behandelt deze toepassing.

CRM-data extractie

Een sales-AI analyseert e-mails en gesprekken en levert gestructureerde klantgegevens: contactinformatie, behoeften, budget, volgende stappen. Dit gaat rechtstreeks naar het CRM-systeem. De AI voor Sales teams training laat dit zien.

Multi-stap agent workflows

In een agentic loop moet de output van de ene stap de input van de volgende zijn. Structured outputs garanderen dat elke stap data oplevert in het verwachte formaat, zodat de keten niet breekt.

API-integraties

Een AI-agent die bestellingen plaatst via een API moet exact het juiste JSON-formaat genereren. Met structured outputs is die output gegarandeerd geldig — geen HTTP 400 fouten door malformed requests.

Voorbeelden

OpenAI strict mode

OpenAI's Structured Outputs met `strict: true` haalde GPT-4o van 26% naar 100% nauwkeurigheid op complexe JSON schema's. Het combineert model fine-tuning (93%+ basisscore) met constrained decoding voor de laatste perfectie. Elke API-aanroep levert gegarandeerd geldig JSON.

Anthropic tool use + JSON

Claude biedt twee mechanismen: JSON output controls voor responsformaat en strict tool use voor toolparameters. Gecombineerd kan Claude tools aanroepen met gegarandeerd geldige parameters én gestructureerde JSON retourneren. Nul parse-fouten.

Constrained decoding uitgelegd

Stel dat het model een JSON-object genereert en net `{"naam": "Jan", "leeftijd":` heeft geschreven. Het schema zegt dat leeftijd een nummer is. De grammatica blokkeert nu alle tokens behalve cijfers. Het model kan fysiek geen string genereren waar een nummer hoort — de structuur is wiskundig gegarandeerd.

Veelgemaakte Fouten

"Structured output betekent dat de inhoud correct is"

Structured outputs garanderen alleen dat het formaat klopt — niet dat de waarden kloppen. Het model kan een veld "omzet" perfect als nummer invullen, maar het verkeerde bedrag kiezen. Valideer inhoud altijd apart, via guardrails of menselijke controle.

"Ik kan elk JSON Schema gebruiken"

Niet alle JSON Schema features worden ondersteund. OpenAI's strict mode vereist dat alle velden `required` zijn en staat geen `oneOf` toe. Anthropic heeft vergelijkbare beperkingen. Check de documentatie van je provider voor ondersteunde schema-features.

"JSON mode is hetzelfde als structured outputs"

JSON mode garandeert alleen dat de output geldig JSON is, niet dat het aan je specifieke schema voldoet. Structured outputs met schema-enforcement zijn strenger en betrouwbaarder. Gebruik altijd schema-gebaseerde structured outputs voor productietoepassingen.

Tools Die Dit Gebruiken

ChatGPT APIClaude APIGemini APIvLLMLangChain

Veelgestelde Vragen

Welke AI-modellen ondersteunen structured outputs?

OpenAI (GPT-4o en nieuwer) met strict mode, Anthropic Claude met JSON Schema enforcement (beta), en Google Gemini met response schema. Open-source tools als vLLM ondersteunen het ook via constrained decoding. De implementatie verschilt per provider.

Vertragen structured outputs de response?

Minimaal. Het schema wordt vooraf verwerkt en gecached. De extra latentie per token is verwaarloosbaar. De tijdsbesparing op parsing en foutafhandeling in je applicatie weegt ruimschoots op tegen de minimale overhead.

Kan ik structured outputs combineren met tool use?

Ja, en dat is een krachtige combinatie. Bij Anthropic kun je strict tool use gebruiken zodat tool-parameters gegarandeerd het juiste formaat hebben, én JSON output controls voor het eindresultaat. OpenAI biedt function calling met strict mode voor hetzelfde doel.

Welk formaat moet ik kiezen: JSON, XML of CSV?

JSON is de standaard voor API-integraties en webapplicaties. XML wordt gebruikt in enterprise-systemen en SOAP APIs. CSV is geschikt voor eenvoudige tabulaire data en spreadsheet-exports. JSON heeft de breedste ondersteuning bij AI-providers en is in de meeste gevallen de beste keuze.

Gerelateerde Termen

Tool Use / Function Calling AI Agent Agentic Loop LLM Context Window Guardrails

Wil je deze term in de praktijk leren toepassen?

Bekijk Trainingen Plan Kennismaking