RAG
Retrieval Augmented Generation
Simpele Uitleg
RAG is de techniek waarmee je AI toegang geeft tot jouw eigen documenten. Zonder RAG "gokt" ChatGPT op basis van wat het ooit heeft geleerd. Met RAG doorzoekt het eerst jouw bedrijfsdocumenten en antwoordt dan met échte informatie uit jouw bestanden. Denk aan een medewerker die instant alle handleidingen, contracten en productinfo kan raadplegen voordat die antwoordt.
Technische Definitie
RAG is een architectuurpatroon waarbij een LLM gecombineerd wordt met een zoeksysteem over je eigen data. Het oorspronkelijke RAG-paper beschrijft het proces: (1) documenten worden opgeknipt in chunks en omgezet naar embeddings, (2) deze worden opgeslagen in een vector database, (3) bij een vraag wordt via semantic search de meest relevante chunks gezocht, (4) die chunks worden als context meegegeven aan het LLM, (5) het model genereert een antwoord op basis van de gevonden bronnen. Dit vermindert hallucinaties omdat de AI antwoordt vanuit jouw documenten.
Waarom Dit Belangrijk Is
Het grootste probleem van AI: het weet niets over jouw bedrijf. Vragen over jouw producten, klanten of procedures? Zonder RAG krijg je generieke of verzonnen antwoorden.
RAG lost dit op zonder een compleet nieuw model te trainen (wat €100.000+ kost). Een support chatbot die antwoordt met info uit 500 handleidingen. Een sales-assistent die productspecs instant opzoekt. Een HR-bot die werknemers helpt met bedrijfsbeleid.
Voor bedrijven is RAG het verschil tussen "AI is leuk" en "AI bespaart ons 40% tijd." Het is de meest praktische AI-implementatie die je kunt doen. In AI als Teamsport leer je hoe je RAG organisatie-breed inzet.
Hoe Het Werkt
Stel: je hebt 1.000 PDF's met productinformatie en wilt een chatbot die daar vragen over beantwoordt.
Zonder RAG vraag je: "Wat kost product X?" ChatGPT antwoordt: "Sorry, ik heb geen toegang tot actuele prijsinformatie." Nutteloos.
Met RAG: (1) Je uploadt de PDF's. Het systeem knipt ze op in stukken van ~300 woorden en zet elk stuk om naar een embedding — een lijst getallen die de betekenis vastlegt. (2) Bij een vraag maakt het systeem ook een embedding van je vraag, zoekt de 5 meest relevante stukken, en geeft die mee aan het LLM. (3) Het model antwoordt nu: "Product X kost €499. Bron: productcatalogus pagina 37."
Update je een PDF? Upload opnieuw en de chatbot heeft direct de nieuwe info. Wil je leren hoe dit werkt voor jouw bedrijf? Bekijk AI voor bedrijven.
Use Cases
Customer support automatiseren
Een support team bouwt een RAG-chatbot op 500 support-artikelen. Klanten stellen vragen, de chatbot zoekt het juiste artikel en geeft een antwoord met bronvermelding. Resultaat: 60% van routine-tickets automatisch opgelost.
Sales productkennis assistent
B2B-bedrijf met 1.000+ producten en technische specs. Sales reps vragen: "Welke producten zijn geschikt voor temperatuur >100°C met CE-certificering?" en krijgen direct een lijst met specificaties. Geen handmatig zoeken in PDF's meer.
Interne HR-chatbot
Werknemers vragen: "Hoe vraag ik ouderschapsverlof aan?" of "Wat is de thuiswerkvergoeding?" De chatbot antwoordt direct met referenties naar officiële HR-documenten. Het HR-team krijgt 80% minder repetitieve vragen.
Team-breed AI inzetten
RAG werkt het beste als elk team toegang heeft tot hun eigen kennisbank. Support op handleidingen, sales op productinfo, finance op beleid. In AI als Teamsport leer je hoe je dit organisatie-breed uitrolt.
Voorbeelden
Met en zonder RAG vergeleken
Antwoord: een generiek verhaal over retourbeleid dat niet klopt voor jouw bedrijf.
Zelfde vraag met RAG: het systeem zoekt je retourbeleid-document, vindt de relevante passage, en antwoordt: "Elektronica kan binnen 14 dagen retour mits onbeschadigd en in originele verpakking. Bron: Retourbeleid v3.2, pagina 4."
Het verschil: bronvermelding in plaats van gokwerk.
Wanneer RAG faalt
Wat er misging: tabellen werden slecht verwerkt, afkortingen waren niet uitgelegd, en er was geen filtering op documentversie — de chatbot gaf soms oude informatie.
De les: RAG is niet "upload en klaar." Je moet data voorbewerken, metadata toevoegen (datum, versie, categorie), en testen met echte vragen. Investeer in data-kwaliteit voor betere resultaten.
Veelgemaakte Fouten
"Je uploadt gewoon PDF's en het werkt"
RAG werkt het beste met schone, gestructureerde tekst. PDF's met tabellen, afbeeldingen of rare opmaak vragen voorbewerking. Investeer tijd in data-cleaning — dat maakt het verschil tussen een matige en een uitstekende chatbot.
"Gooi zoveel mogelijk tekst in elke chunk"
Te grote chunks (2.000+ woorden) bevatten te veel irrelevante info. Optimaal is 200-400 woorden per chunk met 20% overlap. Kleinere chunks = preciezere zoekresultaten via semantic search.
"RAG vervangt [fine-tuning](/woordenboek/fine-tuning)"
RAG is voor feiten en kennis (productinfo, procedures, beleid). Fine-tuning is voor tone of voice en gedragspatronen. 90% van bedrijven heeft RAG nodig, niet fine-tuning — maar soms wil je beide.
Tools Die Dit Gebruiken
Veelgestelde Vragen
Is RAG moeilijk te implementeren?
Wat kost een RAG-systeem?
RAG vs. fine-tuning: wanneer gebruik je wat?
Hoe test je of RAG goed werkt?
Gerelateerde Termen
Wil je deze term in de praktijk leren toepassen?