Terug naar Woordenboek
intermediateGeavanceerd
5 min leestijd

RAG

Retrieval Augmented Generation

Simpele Uitleg

RAG is de techniek waarmee je AI toegang geeft tot jouw eigen documenten. Zonder RAG "gokt" ChatGPT op basis van wat het ooit heeft geleerd. Met RAG doorzoekt het eerst jouw bedrijfsdocumenten en antwoordt dan met échte informatie uit jouw bestanden. Denk aan een medewerker die instant alle handleidingen, contracten en productinfo kan raadplegen voordat die antwoordt.

Technische Definitie

RAG is een architectuurpatroon waarbij een LLM gecombineerd wordt met een zoeksysteem over je eigen data. Het oorspronkelijke RAG-paper beschrijft het proces: (1) documenten worden opgeknipt in chunks en omgezet naar embeddings, (2) deze worden opgeslagen in een vector database, (3) bij een vraag wordt via semantic search de meest relevante chunks gezocht, (4) die chunks worden als context meegegeven aan het LLM, (5) het model genereert een antwoord op basis van de gevonden bronnen. Dit vermindert hallucinaties omdat de AI antwoordt vanuit jouw documenten.

Waarom Dit Belangrijk Is

Het grootste probleem van AI: het weet niets over jouw bedrijf. Vragen over jouw producten, klanten of procedures? Zonder RAG krijg je generieke of verzonnen antwoorden.

RAG lost dit op zonder een compleet nieuw model te trainen (wat €100.000+ kost). Een support chatbot die antwoordt met info uit 500 handleidingen. Een sales-assistent die productspecs instant opzoekt. Een HR-bot die werknemers helpt met bedrijfsbeleid.

Voor bedrijven is RAG het verschil tussen "AI is leuk" en "AI bespaart ons 40% tijd." Het is de meest praktische AI-implementatie die je kunt doen. In AI als Teamsport leer je hoe je RAG organisatie-breed inzet.

Hoe Het Werkt

Stel: je hebt 1.000 PDF's met productinformatie en wilt een chatbot die daar vragen over beantwoordt.

Zonder RAG vraag je: "Wat kost product X?" ChatGPT antwoordt: "Sorry, ik heb geen toegang tot actuele prijsinformatie." Nutteloos.

Met RAG: (1) Je uploadt de PDF's. Het systeem knipt ze op in stukken van ~300 woorden en zet elk stuk om naar een embedding — een lijst getallen die de betekenis vastlegt. (2) Bij een vraag maakt het systeem ook een embedding van je vraag, zoekt de 5 meest relevante stukken, en geeft die mee aan het LLM. (3) Het model antwoordt nu: "Product X kost €499. Bron: productcatalogus pagina 37."

Update je een PDF? Upload opnieuw en de chatbot heeft direct de nieuwe info. Wil je leren hoe dit werkt voor jouw bedrijf? Bekijk AI voor bedrijven.

Use Cases

Customer support automatiseren

Een support team bouwt een RAG-chatbot op 500 support-artikelen. Klanten stellen vragen, de chatbot zoekt het juiste artikel en geeft een antwoord met bronvermelding. Resultaat: 60% van routine-tickets automatisch opgelost.

Sales productkennis assistent

B2B-bedrijf met 1.000+ producten en technische specs. Sales reps vragen: "Welke producten zijn geschikt voor temperatuur >100°C met CE-certificering?" en krijgen direct een lijst met specificaties. Geen handmatig zoeken in PDF's meer.

Interne HR-chatbot

Werknemers vragen: "Hoe vraag ik ouderschapsverlof aan?" of "Wat is de thuiswerkvergoeding?" De chatbot antwoordt direct met referenties naar officiële HR-documenten. Het HR-team krijgt 80% minder repetitieve vragen.

Team-breed AI inzetten

RAG werkt het beste als elk team toegang heeft tot hun eigen kennisbank. Support op handleidingen, sales op productinfo, finance op beleid. In AI als Teamsport leer je hoe je dit organisatie-breed uitrolt.

Voorbeelden

Met en zonder RAG vergeleken

Vraag aan gewone ChatGPT: "Wat is ons retourbeleid voor elektronica?"
Antwoord: een generiek verhaal over retourbeleid dat niet klopt voor jouw bedrijf.

Zelfde vraag met RAG: het systeem zoekt je retourbeleid-document, vindt de relevante passage, en antwoordt: "Elektronica kan binnen 14 dagen retour mits onbeschadigd en in originele verpakking. Bron: Retourbeleid v3.2, pagina 4."

Het verschil: bronvermelding in plaats van gokwerk.

Wanneer RAG faalt

Bedrijf uploadt 500 technische PDF's en verwacht een perfecte chatbot.

Wat er misging: tabellen werden slecht verwerkt, afkortingen waren niet uitgelegd, en er was geen filtering op documentversie — de chatbot gaf soms oude informatie.

De les: RAG is niet "upload en klaar." Je moet data voorbewerken, metadata toevoegen (datum, versie, categorie), en testen met echte vragen. Investeer in data-kwaliteit voor betere resultaten.

Veelgemaakte Fouten

"Je uploadt gewoon PDF's en het werkt"

RAG werkt het beste met schone, gestructureerde tekst. PDF's met tabellen, afbeeldingen of rare opmaak vragen voorbewerking. Investeer tijd in data-cleaning — dat maakt het verschil tussen een matige en een uitstekende chatbot.

"Gooi zoveel mogelijk tekst in elke chunk"

Te grote chunks (2.000+ woorden) bevatten te veel irrelevante info. Optimaal is 200-400 woorden per chunk met 20% overlap. Kleinere chunks = preciezere zoekresultaten via semantic search.

"RAG vervangt [fine-tuning](/woordenboek/fine-tuning)"

RAG is voor feiten en kennis (productinfo, procedures, beleid). Fine-tuning is voor tone of voice en gedragspatronen. 90% van bedrijven heeft RAG nodig, niet fine-tuning — maar soms wil je beide.

Tools Die Dit Gebruiken

PerplexityChatGPT EnterpriseNotion AIGleanPinecone

Veelgestelde Vragen

Is RAG moeilijk te implementeren?
Er zijn drie niveaus. No-code: tools als CustomGPT of Chatbase — upload PDF's, klik, klaar (€50-200/maand). Low-code: OpenAI Assistants API of Pinecone — vraagt basiskennis programmeren. Custom: zelf bouwen met LangChain en een vector database — volledige controle, maar vraagt een developer. Voor 80% van de toepassingen is no-code of low-code voldoende.
Wat kost een RAG-systeem?
Vector database: €20-200/maand. Embeddings: €0,10 per miljoen woorden. LLM-calls: ~€0,002 per vraag. Een bedrijf met 1.000 vragen per dag betaalt ongeveer €115/maand. Vergelijk dat met een support-medewerker voor €2.500+/maand — de ROI is binnen een maand positief.
RAG vs. fine-tuning: wanneer gebruik je wat?
RAG voor feiten en kennis die vaak verandert (productinfo, procedures, beleid). Fine-tuning voor tone of voice en gedragspatronen (merkstem, sector-jargon). 90% van bedrijven heeft RAG nodig, niet fine-tuning. Fine-tuning kost €500-5.000+ per model en moet opnieuw bij elke update. RAG: update je document en het werkt direct.
Hoe test je of RAG goed werkt?
Schrijf 50-100 testvragen met de juiste antwoorden. Meet accuracy (target: >85%), retrieval precision (worden de juiste documenten gevonden? target: >90%), en responstijd (target: <3 seconden). Test altijd met echte gebruikers voordat je live gaat en verzamel intensief feedback in de eerste twee weken.

Wil je deze term in de praktijk leren toepassen?