AI-prompt: Data opschonen en voorbereiden
Met deze AI-prompt schoon je als data-analist je dataset op — ontbrekende waarden, dubbele records en inconsistenties aangepakt, zodat je analyse op betrouwbare data rust.
Ook compatibel met:ClaudeGemini
#CONTEXT: Neem de rol aan van een data-engineer die weet dat 80% van data-werk opschonen is, en dat "garbage in, garbage out" de hardste wet van analyse is: een prachtige analyse op vervuilde data geeft een prachtig fout antwoord. Je weet dat opschonen systematisch moet: ontbrekende waarden, duplicaten, inconsistente formats, uitschieters, en verkeerde datatypes — elk met een bewuste keuze hoe je ermee omgaat (en die keuze documenteren, want hij beïnvloedt het resultaat). Je laat het werk via de datafunctie doen op de echte data, niet op een aanname. Je denkt vanuit de betrouwbaarheid van het eindresultaat. Je helpt de data systematisch opschonen. #DOEL: Schoon mijn dataset systematisch op: identificeer de problemen, los ze met een bewuste keuze op, en documenteer wat je deed — zodat mijn analyse op betrouwbare data rust. #WERKWIJZE: 1. Vraag me de data te uploaden of een beschrijving + voorbeeld te geven, plus waar ik de data voor ga gebruiken. Vraag niets méér. 2. Inspecteer via de datafunctie: ontbrekende waarden, duplicaten, inconsistente formats/categorieën, uitschieters, datatypes. 3. Stel per probleem een bewuste oplossing voor (bv. ontbrekende waarden: verwijderen, opvullen, of markeren) met de gevolgen. 4. Voer het op (of geef de stappen) en documenteer elke keuze, want die beïnvloedt het resultaat; markeer wat ik moet besluiten. #INFORMATIE VAN MIJ: - Data (uploaden) of beschrijving + voorbeeld: [INVULLEN] - Waar ik de data voor gebruik: [INVULLEN] #OUTPUT: 1. De gevonden dataproblemen (via de tool). 2. Per probleem een voorgestelde oplossing + gevolgen. 3. De opgeschoonde data (of de stappen) + de gedocumenteerde keuzes. Zo werkt goed opschonen (illustratief): besluit bewust ontbrekende inkomens niet op te vullen met het gemiddelde (dat vertekent), maar te markeren — en documenteert waarom. #BELANGRIJKE REGELS: - Werk via de datafunctie op de echte data; schat niet. - Maak per probleem een bewuste keuze en documenteer de gevolgen. - Garbage in, garbage out; opschonen is geen bijzaak. #BEPERKINGEN: - Verzin geen data; werk met wat ik aanlever. - Opschoonkeuzes beïnvloeden het resultaat; ik beslis bewust. - Gebruik een zakelijke omgeving voor gevoelige data.
Training
Leer zelf prompts schrijven die altijd werken — niet alleen kopiëren.
Dennis Claassen
AI-trainer · 35+ teams getraind
Wanneer gebruik je deze prompt?
80% van data-werk is opschonen, en "garbage in, garbage out" is de hardste wet van analyse: een prachtige analyse op vervuilde data geeft een prachtig fout antwoord. Deze prompt inspecteert je data via de datafunctie, stelt per probleem een bewuste oplossing voor, en documenteert elke keuze.
Analyse op betrouwbare data. Onderdeel van de set voor data-analisten.
Tips
- 1Tool-niveau: data-analyse. Upload de echte data en laat het via de tool inspecteren — opschonen op aannames mist precies de problemen.
- 2Documenteer je keuzes: hoe je met ontbrekende waarden of uitschieters omgaat, beïnvloedt je resultaat en moet navolgbaar zijn.
Veelgestelde vragen
Waarom is data opschonen zo belangrijk?
Omdat "garbage in, garbage out" geldt: een analyse op vervuilde data geeft een fout antwoord, hoe goed de methode ook is. Opschonen is vaak 80% van het werk. De prompt pakt ontbrekende waarden, duplicaten en inconsistenties systematisch aan via de datafunctie.
Hoe ga ik om met ontbrekende waarden?
Dat is een bewuste keuze: verwijderen, opvullen (bijv. met een gemiddelde of mediaan) of markeren — elk met gevolgen voor je resultaat. De prompt stelt per geval een passende aanpak voor en documenteert de keuze, zodat je analyse navolgbaar en eerlijk blijft.
Probeer ook
Prompts die goed combineren met deze
Data-analyse · Beste in ChatGPT
Verkennende data-analyse (EDA)
Met deze AI-prompt verken je als data-analist een nieuwe dataset snel — de verdelingen, patronen, uitschieters en verbanden, zodat je de data leert kennen vóór je conclusies trekt.
Bekijk promptData-analyse · Beste in ChatGPT
Analyse valideren (sanity check)
Met deze AI-prompt controleer je als data-analist je eigen analyse kritisch — de aannames, de cijfers en de logica — zodat je geen fout resultaat de organisatie in stuurt.
Bekijk promptVan prompts naar resultaat
Wil je je team hier écht goed in maken?
Losse prompts kopiëren is een goed begin. In een hands-on training of begeleidingstraject leren we je team AI dagelijks, veilig en effectief inzetten — op jullie eigen werk, met jullie eigen voorbeelden.
- Hands-on, op jullie locatie
- Met jullie eigen casussen
- 180 dagen tevredenheidsgarantie
- Van eerste prompt tot werkproces
Dennis Claassen
AI-trainer · 35+ teams getraind
“De teams die AI goed inzetten, winnen van de teams die dat niet doen. Wij zorgen dat jullie bij de eerste groep horen.”