Codex vs Claude Code vs Antigravity

Meer leren over AI?

AI inzetten voor je team? In onze trainingen leer je het in 4 uur.

Dennis Claassen

AI-trainer · 35+ teams getraind

Key Takeaways

•Claude Code draait sinds 28 mei 2026 op Opus 4.8, met een SWE-bench Verified-score van 88,6% en een nieuwe "dynamic workflows"-modus die honderden subagents tegelijk laat draaien (Anthropic).
•Codex draait standaard op GPT-5.5 en scoort 82,7% op Terminal-Bench 2.0; let op: een los model met de naam "GPT-5.5-codex" bestaat niet (OpenAI).
•Antigravity is goedkoop in te stappen maar berucht onbetrouwbaar: de gratis laag ging van 250 naar 20 requests per dag en Ultra-gebruikers meldden lockouts van 7 tot 10 dagen (vibecoding.app).
•Kosten kunnen brutaal uiteenlopen: in één community-test kostte dezelfde Express.js-refactor ongeveer $15 op Codex en ongeveer $155 op Claude Code (CatDoes).
•Dit artikel geeft een winnaar per use-case — niet "het hangt ervan af", maar een concrete keuze op basis van benchmarks, developer-sentiment en kosten.

Je opent drie tabbladen. Codex, Claude Code, Antigravity. Op alle drie staat "de beste AI-codeertool van 2026". Op alle drie staan benchmarks die nét even anders meten. En ergens op Reddit zit iemand die zweert dat jouw favoriet eigenlijk overhyped is. Klinkt dat bekend?

De vraag die je meestal gesteld krijgt is "welke is het slimst?" Dat is de verkeerde vraag. Deze drie tools zitten op de SWE-bench zó dicht bij elkaar dat het verschil in jouw dagelijkse werk verdwijnt achter ruis. De echte vraag is: welke past bij jóuw workflow, jouw codebase en jouw budget?

Eerlijk vooraf: Project Impact verkoopt zelf een Claude Code Masterclass. Dit had een verkooppraatje kunnen worden, maar dat wordt het niet. Ik laat je juist precies zien waar Claude Code verliest, want als ik dat verzwijg kun je de rest ook niet vertrouwen. Het oordeel rust op het bewijs.

De drie tools in het kort (juni 2026)

Wie draait op welk model, en waar gebruik je het?

Claude Code (Anthropic)

Claude Code is de terminal-first agentic codeeragent van Anthropic. Sinds 28 mei 2026 draait hij op Claude Opus 4.8. De grote nieuwe feature heet dynamic workflows: een research preview die werk plant en honderden parallelle subagents in één sessie draait, geschikt voor migraties die zich over honderdduizenden regels code uitstrekken. Er is ook een "fast mode" die volgens Anthropic ongeveer 2,5x sneller en 3x goedkoper is dan bij eerdere modellen. Het opvolgermodel, "Mythos", was bij de Opus-release al aangekondigd voor "de komende weken". Dit veld beweegt snel.

OpenAI Codex

Codex is geen los product maar één agent-systeem met meerdere oppervlakken: web, CLI, een IDE-extensie, iOS, een SDK en een cloud-sandbox waarin de agent autonoom werkt. Het aanbevolen standaardmodel is GPT-5.5, uitgebracht op 23 april 2026 en het eerste volledig hertrainde basismodel sinds GPT-4.5, met agentic-first training. Eén waarschuwing die veel artikelen verkeerd doen: een variant die exact "GPT-5.5-codex" heet bestaat niet. Wie meer over de onderliggende generatie wil weten, leest ons stuk over de beste LLM's van 2026.

Google Antigravity

Antigravity is Google's agent-first IDE, aangekondigd op 18 november 2025 samen met Gemini 3. De insteek is anders: het is een volledige agentic IDE met een editor, een Manager-surface om meerdere agents asynchroon te orkestreren, en "Artifacts" zoals takenlijsten, plannen, screenshots en browser-recordings ter verificatie. Het draait met model-keuze. De officiële build-blog noemt Gemini 3 Pro plus ondersteuning voor Claude en GPT-OSS. Welk model standaard draait, wisselt per release; op Google I/O 2026 kwamen er een upgrade en Gemini 3.5 Flash bij. Eén tijdsgevoelig detail: de Gemini CLI stopt op 18 juni 2026 en gaat op in de Antigravity CLI.

Tool	Aanbieder	Hoofdmodel	Platform	Instapprijs
Claude Code	Anthropic	Opus 4.8	Terminal, IDE, web	$20/mnd (Pro)
Codex	OpenAI	GPT-5.5	CLI, IDE, web, iOS, cloud	$0 (in ChatGPT Free)
Antigravity	Google	Gemini 3-serie + keuze	Agent-IDE (Mac/Win/Linux)	$0 (gratis, rate-limited)

Benchmarks: wat zeggen de cijfers?

Korte waarschuwing vooraf: benchmarks zijn niet je dagelijkse ervaring. Ze meten geïsoleerde taken onder ideale omstandigheden, niet jouw rommelige codebase op een dinsdagmiddag. Toch geven ze een ruwe rangorde.

Op de officiële cijfers staat Claude Opus 4.8 bovenaan voor SWE-bench Verified met 88,6%, een sprongetje vanaf 87,6% op Opus 4.7, plus 69,2% op SWE-bench Pro (Computing for Geeks). Op wiskunde (USAMO 2026) springt Opus van 69,3% naar 96,7%. GPT-5.5 in Codex pakt 82,7% op Terminal-Bench 2.0 en 58,6% op SWE-Bench Pro volgens OpenAI's eigen agentic-cijfers. Gemini 3 Pro, de basis onder Antigravity, zit op 76,2% SWE-bench Verified (nxcode).

Let op het addertje: dit zijn verschillende benchmarks met verschillende methodologie. Je kunt 88,6% (SWE-bench Verified) niet zomaar naast 82,7% (Terminal-Bench 2.0) leggen en zeggen "dus de eerste is beter". Dat zijn andere examens.

Er is ook een tweede categorie cijfers, uit community-vergelijkingen. In één blind onderzoek over 36 rondes won Claude Code 67% van de codekwaliteits-vergelijkingen tegen 25% voor Codex (CatDoes), terwijl Codex won op Terminal-Bench. Behandel die getallen als indicatief: het is één onderzoek, geen consensus.

Wat zeggen developers écht?

En hier wringt het: de benchmark-winnaar en de praktijk-winnaar zijn niet dezelfde tool. Dat is het belangrijkste inzicht van dit hele stuk.

Waar Claude Code wint

Er komt een opvallend patroon naar boven: in blind reviews werd de code van Claude Code consistent als schoner en idiomatischer beoordeeld (CatDoes). Claude "snapt" beter wat je bedoelt en levert wat je vroeg, zonder ongevraagd uit te dijen. Een aparte analyse van ruim 500 Reddit-developers noteert dat Claude Code veruit het meeste discussievolume genereert, 4x zoveel als Codex, wat iets zegt over betrokkenheid en ecosysteem.

Dat ecosysteem is het tweede sterke punt. Een in die analyse geciteerde developer vat het samen: "Claude Code has way more features than Codex. Hooks, Rewind, Claude in Chrome, plugins, Plan mode." Dat zit ook in de werkwijze: een CLAUDE.md-bestand waarin je je codebase-conventies vastlegt, en ondersteuning voor MCP om de agent aan je eigen tools te koppelen. Wil je hier dieper in? Lees dan hoe je Claude Code in 2026 gebruikt.

De karakterisering die in vergelijkingen rondgaat klopt verrassend goed: Claude Code is de senior engineer. Scoped, levert end-to-end wat gevraagd is, en ruimt netjes op.

Waar Codex wint

Nu het ongemakkelijke deel voor wie Claude Code aanbeveelt. Datzelfde onderzoek van 500+ developers laat zien dat 65,3% dagelijks de voorkeur geeft aan Codex, en op upvotes gewogen zelfs 79,9%. Dus de tool die schonere code schrijft, is níét de tool die de meeste mensen kiezen voor het echte werk.

Waarom? Twee redenen: kosten en autonomie. Een veelgedeeld kosten-citaat: "Codex $20 lets you code all day without hitting limits, while Claude Code $20 runs out on a handful of complex prompts." In dezelfde analyse staat het scherpste bewijs dat ik tegenkwam: dezelfde Express.js-refactor kostte ongeveer $15 op Codex en ongeveer $155 op Claude Code. Tien keer zoveel, voor hetzelfde werk.

En autonomie. In dezelfde aggregatie beschrijft een developer Codex zo: "Throw work at it, it disappears into its own VM, comes back with a PR." Je gooit een taak erin, de agent verdwijnt naar zijn eigen sandbox en komt terug met een pull request. Dat is precies de "all day coding"-belofte die Codex zo geliefd maakt voor de dagelijkse grind.

Codex is in die zin de gedisciplineerde security-architect: conservatief, autonoom, kosten-efficiënt. Niet de mooiste code, wel de tool die je niet voor de voeten loopt.

Waar Antigravity wint, en pijnlijk faalt

Antigravity heeft een echt onderscheidend voordeel: visuele verificatie. Door de browser-recordings en screenshots in zijn Artifacts kun je letterlijk zien wat de agent deed. In een maand-lange hands-on test koos een XDA-redacteur Antigravity als persoonlijke winnaar, als "the only tool that bridges the gap between an autonomous agent and the manual precision of a traditional IDE". Voor prototypes en demo's waarbij je het resultaat in beeld wilt zien, is dat sterk.

Maar diezelfde redacteur erkende meteen: "it isn't a perfect victory", met "performance instability issues" tijdens het testen. En daar zit de pijn. Antigravity kreeg de bijnaam "paperweight" nadat de gratis laag van 250 naar 20 requests per dag werd teruggeschroefd, een daling van 92%, en een credit-systeem in maart 2026 leidde tot lockouts van 7 tot 10 dagen, óók voor betalende Ultra-gebruikers.

Het scherpst is de klacht op het Google AI Developer Forum, de enige direct verifieerbare community-bron die ik kon openen: "You've reduced rate limits by 5x and on top of that you've switched from 3 flash good price model to 3.5 flash that burns tokens like there's no tomorrow." Daarbij de terugkerende fout "agent terminated due to error: Our servers are experiencing high traffic". Antigravity is het ambitieuze prototype: bouwt meer dan je vroeg, met minder type-coverage, en valt soms gewoon om.

De terugkerende klachten per tool

De zwakke plekken verschillen per tool — en ze zijn voorspelbaar genoeg om vooraf in te calculeren.

Codex mist MCP-ondersteuning, doet bij lange sessies aan context-pruning waardoor het de draad kan verliezen, en pakt soms ongevraagd extra werk op.

Claude Code is duur en raakt op je $20-plan snel op. Een veelgehoorde klacht: "One complex prompt burns 50-70% of your 5-hour limit." En het werd erger door bugs: in mei en juni 2026 moest Anthropic usage counters resetten omdat de afhandeling van Opus 4.8-requests te veel parallelle subagents opriep; al eerder, in maart 2026, trok een aparte bug limieten versneld leeg. Precies het soort detail dat ik níét ga verzwijgen.

Antigravity, zoals hierboven: instabiliteit en een rate-limit-beleid dat de community tegen zich in het harnas joeg.

AI Training

Wil je AI leren inzetten?

In onze praktische trainingen leer je hoe je ChatGPT, Claude en andere AI-tools effectief inzet voor jouw werk.

Bekijk trainingen

Codex, Claude Code en Antigravity: drie kampioenen die elk op een ander vlak winnen — codekwaliteit, autonomie of visuele verificatie

Het eerlijke oordeel per use-case

Nu de problemen op tafel liggen, durf ik te kiezen. Want "het hangt ervan af" is een laf antwoord, en per situatie is er wél een duidelijke winnaar.

Beste voor gevoelige, complexe productie-code

Auth-flows, payment-integraties, een migratie die je niet twee keer wilt doen. Hier telt codekwaliteit en het begrijpen van je intent zwaarder dan de prijs per token. De schonere, idiomatischere output van Claude Code en de dynamic-workflows-modus voor codebase-brede klussen geven de doorslag. Als de code fout mag, kies je goedkoper. Als de code níét fout mag, betaal je voor de senior engineer.

Winnaar: Claude Code — omdat codekwaliteit en intent-begrip belangrijker zijn dan kosten zodra een fout je geld of klanten kost.

Beste voor de autonome, kosten-bewuste dagelijkse grind

Features bouwen, bugs fixen, de honderd kleine PR's die een week vullen. Hier wint de tool waarmee je de hele dag kunt doorwerken zonder een limiet te raken, en waarmee je niet tien keer zoveel betaalt voor hetzelfde werk. Die VM-en-PR-workflow van Codex is precies wat deze grind nodig heeft.

Winnaar: Codex — omdat autonomie en kosten-efficiëntie het winnen zodra je volume hoog is en de inzet per taak laag.

Beste voor prototypes, demo's en visuele verificatie

Snel iets bouwen dat je wilt laten zien, waarbij je in beeld wilt zien wat de agent deed. De browser-recordings en het Mission Control-overzicht van Antigravity zijn hier uniek. Met één groot voorbehoud: reken niet op betrouwbaarheid onder druk, en niet op de gratis laag voor serieus werk.

Winnaar: Antigravity — omdat visuele verificatie en agent-orkestratie nergens anders zo zijn ingebouwd, mits je de instabiliteit accepteert.

Beste power stack voor teams

De slimste teams kiezen niet één tool. Ze combineren. Codex voor het volume en de autonome grind, Claude Code voor de gevoelige stukken waar kwaliteit telt. Je betaalt voor twee abonnementen, maar je krijgt het beste van twee karakters: de gedisciplineerde grinder en de senior engineer.

Winnaar: Codex + Claude Code samen — omdat hun sterktes precies elkaars zwaktes dekken.

Welke kies jij?

Ben je een solo-developer met een krap budget? Begin met Codex. De "all day"-ervaring op $20 is voor de meeste mensen ruim genoeg, en je raakt niet halverwege je middag je limiet kwijt.

Werk je aan gevoelige productie-code of complexe refactors, en mag de kwaliteit niet onderhandelbaar zijn? Dan is Claude Code op Opus 4.8 zijn meerprijs waard. Hou wel rekening met dat $20 op het Pro-plan snel opraakt; voor serieus werk kijk je naar een Max-tier of de API.

Run je een team? Combineer. Laat dit niet polariseren tot "kamp Codex" versus "kamp Claude". De stack wint.

Ben je geen developer, maar wil je begrijpen wat je technische team bedoelt als ze het over vibe coding hebben? Begin niet bij de tool maar bij de basis. Onze ChatGPT, Claude & Gemini Masterclass legt het fundament; daarna ga je pas de terminal in.

Weet je nog niet welke tools je überhaupt naast elkaar moet leggen? Begin dan bij het overzicht van alle AI-codeertools. Dat stuk is het startpunt en helpt je per profiel kiezen; deze post levert vervolgens de diepte van het driegevecht.

Eén waarschuwing die belangrijker is dan welke tool dan ook: dit veld schuift elke paar maanden. Opus 4.8 is van eind mei, Mythos staat al aangekondigd, en de Antigravity CLI verandert op 18 juni. Wat vandaag de winnaar is, kan over een kwartaal tweede staan. Kies dus niet voor de eeuwigheid, kies voor nu, en blijf het herzien.

Niet de tool, maar hoe je hem aanstuurt

Project Impact traint bedrijven met Claude Code, en je hebt hierboven gelezen waar het verliest: op kosten, op rate limits, en op het feit dat de meeste developers dagelijks toch Codex pakken.

Wat blijft staan: als jouw werk gevoelige, complexe code raakt en je wilt het maximale uit Claude Code halen zonder je limiet halverwege de middag te verbranden, dan zit het verschil niet in de tool maar in hoe je hem aanstuurt. Daarover gaat de Claude Code Masterclass. En wil je eerst zelf experimenteren met goede instructies? Begin in onze promptbibliotheek.

Veelgestelde vragen

Is Claude Code beter dan Codex?

Voor codekwaliteit en het begrijpen van je intentie wel: in blind reviews leverde Claude Code consistent schonere, idiomatischere code. Voor dagelijks volume-werk wint Codex juist op autonomie en kosten — in een analyse van 500+ Reddit-developers koos 65,3% dagelijks toch Codex. Het hangt dus af van of kwaliteit of kosten voor jou zwaarder weegt.

Wat kost Claude Code per maand?

Het Pro-plan kost $20 per maand en geeft toegang tot Sonnet en Opus, met ongeveer 10 tot 40 prompts per rollend venster van 5 uur. Daarboven is er Max 5x voor $100 en Max 20x voor $200 per maand, plus pay-as-you-go via de API ($5 per miljoen input-tokens en $25 per miljoen output-tokens voor Opus 4.8). In de praktijk raakt $20 snel op: één zware prompt kan 50 tot 70% van je 5-uurs-limiet opslokken.

Is Google Antigravity gratis?

Er is een gratis laag, maar die is fors beperkt en ging van 250 naar 20 requests per dag, waardoor hij voor serieus werk nauwelijks bruikbaar is. Volgens third-party bronnen (niet officieel door Google bevestigd) kosten de betaalde tiers $20 per maand (AI Pro) en $249,99 per maand (AI Ultra). Reken ook op betaalde plannen op rate-limit-problemen.

Welk model gebruikt Codex?

Codex draait standaard op GPT-5.5, uitgebracht op 23 april 2026 en het eerste volledig hertrainde basismodel van OpenAI sinds GPT-4.5. Let op: een los model met de exacte naam "GPT-5.5-codex" bestaat niet. De Codex-modellenlijst bevat onder meer GPT-5.5, GPT-5.4, GPT-5.4-mini en GPT-5.3-codex.

Kan ik Codex en Claude Code combineren?

Ja, en voor teams is dat vaak de slimste keuze. Gebruik Codex voor de autonome, kosten-bewuste dagelijkse grind en Claude Code voor gevoelige of complexe code waar kwaliteit telt. Hun sterke punten dekken precies elkaars zwakke plekken: je betaalt voor twee abonnementen, maar je krijgt twee complementaire karakters.

Plan een kennismakingsgesprek

Codex vs Claude Code vs Antigravity: welke is de beste?