Vertrouw geen AI die nooit twijfelt

Leer hoe je AI hallucinaties snel detecteert en corrigeert.

5/24/20265 min read

Een tijdje terug liet ik AI een paar honderd leveranciers indelen in categorieën. De eerste tien klopten, ik knikte tevreden, en de rest nam ik voor lief. Pas later kwam ik erachter dat een flink deel er finaal naast zat. Niet omdat het model dom was, maar omdat het een fout antwoord met exact dezelfde stelligheid bracht als een goed antwoord. En ik had geen idee waar ik moest kijken.

Dat is voor mij het echte addertje onder AI in je werk. Niet dat het soms mis is, dat zijn mensen ook. Het punt is dat je het verschil niet ziet. Een verzonnen getal en een kloppend getal zien er identiek uit: allebei netjes, allebei zonder enige aarzeling.

Hieronder deel ik hoe ik daar inmiddels mee omga. Geen truc om hallucinaties weg te poetsen, want dat lukt niemand. Wel een manier om ze zichtbaar te maken, zodat het controleren je niet meer tijd kost dan AI je oplevert.

Waarom een model eigenlijk gokt

Even een stap terug, want het helpt om te snappen waaróm dit gebeurt. Een taalmodel begrijpt je vraag niet. Het rekent. Woord voor woord schat het in wat statistisch gezien het meest logische vervolg is op wat er al staat. Vaak rolt daar iets goeds uit, want de meest waarschijnlijke zin is meestal ook de juiste. Maar af en toe wijst die kansberekening de verkeerde kant op, en het model merkt er niets van dat het is afgeslagen. Jij overigens ook niet, want de zin loopt gewoon lekker. Dat is een hallucinatie: geen storing, maar een bijproduct van de manier waarop het ding in elkaar zit.

Je kunt het terugdringen met betere prompts, en daar wijd ik later nog een apart stuk aan. Maar op nul krijg je het nooit. Dus richt ik me hier niet op voorkomen, maar op betrappen: zien op het moment dat het misgaat.

Bedenk je controle vóór je de vraag stelt

De meeste mensen werken precies andersom. Eerst een vraag aan AI, dan een net antwoord, en dán pas de gedachte: zou dit eigenlijk wel kloppen? Dat is te laat. Op dat moment heb je niets meer om het tegenaan te leggen, en in de praktijk laat je het er dan bij zitten.

Keer de volgorde om. Vraag jezelf vóór de opdracht af: waarmee ga ik dit straks naast leggen? Leg het contract, de offerte, de leverancierslijst of het rapport alvast klaar. Moet je achteraf op zoek naar bewijsmateriaal, dan gebeurt het verifiëren simpelweg niet meer.

Laat de AI hardop denken

Geef het model niet alleen een opdracht, maar vraag er meteen bij hoe het tot zijn antwoord komt. Waar baseert het zich op? Wat neemt het aan?

Een voorbeeld zoals ik het zelf gebruik: “Maak een presentatie over onze bedrijf voor organisatie X. Lever daarnaast een kort document waarin je per slide aangeeft waarom die erin zit, waarom hij op die plek staat, welke gegevens je gebruikt en welke aannames je doet.”

Wat je terugkrijgt is dan geen kant-en-klaar verhaal dat je maar moet geloven, maar een redeneerlijn. Daar kun je iets mee. Je ziet in één oogopslag waar de logica stevig staat en waar het gokwerk begint.

Vraag een zekerheidsscore, maar wees er wantrouwig over

Laat het model bij elke conclusie een zekerheid noemen, bijvoorbeeld op een schaal van 0 tot 100 procent. Met één belangrijke kanttekening: AI is hierin stelselmatig te optimistisch. Onderzoek uit 2025 laat zien dat modellen hun eigen zekerheid structureel overschatten. De score die ze noemen ligt gemiddeld hoger dan hoe vaak het antwoord echt blijkt te kloppen.

Gebruik die scores dus om je aandacht te sturen, niet als eindoordeel. De lage scores loop je allemaal na. De hoge scores controleer je steekproefsgewijs. En betrap je een hoge score op een fout, dan is dat een signaal: ga de andere hoge scores alsnog grondig na, want dan loopt het model deze keer te hard van stapel.

Concreet, terug naar die leveranciers. Ik laat ze door AI indelen in Excel, met twee extra kolommen erachter: één voor de onderbouwing, één voor de zekerheidsscore. Vervolgens sorteer ik van laag naar hoog. De twijfelgevallen pak ik als eerste, de rest scan ik steekproefsgewijs. De onderbouwing ernaast laat me razendsnel zien of een indeling hout snijdt. Zo hoef ik niet de hele lijst regel voor regel te controleren, maar precies de plekken waar het model zelf aangeeft dat het twijfelde. Een 40 procent naast een 95 procent vertelt je waar je moet beginnen. Maar die 95 procent is nooit een vrijbrief.

Lees de kleine lettertjes

Bijna elk model zet onder of naast zijn werk nog een stukje uitleg. “Ik ben ervan uitgegaan dat...”, “let op dat...”, “deze cijfers kon ik niet controleren”. Juist daar staat vaak het belangrijkste. Veel mensen scrollen er overheen, want ze hebben hun antwoord al. Doe dat niet. Het is het model dat je zelf vertelt waar zijn zwakke plekken zitten.

Gratis of betaald is niet hetzelfde

Nog iets praktisch. Gratis modellen blijven op dit punt minder betrouwbaar dan betaalde. Voor een snelle samenvatting prima. Maar gaat het om werk waar iets van afhangt, zoals een analyse die de deur uitgaat naar een klant of een advies waar een beslissing op rust, dan verdient een betaald model zich terug. Je krijgt consistenter werk en een serieuzere onderbouwing.

Hoe het er bij ons in de praktijk uitziet

Bij Tendria maken Marijke en ik de eindpresentaties van onze inkoopscans voor een groot deel met AI. Maar we laten het model er standaard twee dingen bij maken. Een verantwoording waarin elke keuze in de presentatie wordt uitgelegd: waarom dit cijfer, waarom deze quote, waarom deze conclusie. En de onderliggende feiten netjes op een rij, zodat we ze tegen de bron kunnen houden.

Voordat zo'n presentatie naar de klant gaat, lopen we eerst die verantwoording door. Daar zien we hoe het verhaal is opgebouwd, waar het stevig staat, en waar de AI iets te makkelijk een conclusie heeft getrokken. En eerlijk: hier kruipt best wat tijd in. Maar ik zoek elke keer uit waar het misging en repareer het voor de volgende keer, zodat het stapje voor stapje minder werk wordt.

Zonder zo'n tussenstap werk je met een AI-product zonder te weten hoe het is ontstaan. En dat is precies waar hallucinaties zich verstoppen. Niet in een opzichtig verzonnen getal, maar in een conclusie die plausibel klinkt en nergens op blijkt te staan.

Wat je hier morgen mee doet

Pak een prompt die je vaak gebruikt en plak er deze regel onder: “Geef bij elk onderdeel een korte onderbouwing en een zekerheidsscore van 0 tot 100 procent, en maak al je aannames expliciet.”

Zorg dat je bronmateriaal beschikbaar is. Lees de uitleg die het model erbij geeft. En behandel een hoge zekerheidsscore als “waarschijnlijk goed”, niet als “klaar”.

Tot slot

Hallucinaties zitten ingebakken in de manier waarop een taalmodel werkt, en ze gaan voorlopig niet weg. Maar je kunt ze wel onder controle houden. Het kost je een halve minuut extra in je prompt. En het bespaart je de vervelende ontdekking, weken later, dat een keurig ogende conclusie nergens op stond.