Nederlands Tijdschrift voor Natuurkunde

De achilleshiel van LLM-AI

Foto: Matheus Bertelli

NTvN 91-09

Het septembernummer is uit!

Topquark blijkt toch geen eenling

Lees in het septembernummer waarom de topquark toch geen eenling blijkt (illustratie: D. Dominguez/CERN)

Vorige Volgende

Artikel

De achilleshiel van LLM-AI

Gepubliceerd: 1 September 2025 13:22

Niemand verbaast zich als minstens een kwart van een weten schappelijk artikel uit fouten analyse bestaat. En niemand zou een publicatie over waarnemingen waarin zo’n analyse van het experiment ontbreekt langer bekijken dan nodig is om op de prullenbakknop te klikken. Het is grotendeels door de rigoureuze foutenanalyse dat weteerbaast zich als min stens een kwart van een weten schappelijk artikel uit fouten analyse bestaat. En niemand zou een publicatie over waarnemingen waarin zo’n analyse van het experiment ontbreekt langer bekijken dan nodig is om op de prullenbakknop te klikken. Het is grotendeels door de rigoureuze foutenanalyse dat wetenschap niet ‘ook maar een mening’ is.

Lees het volledige interview in het augustusnummer of klik hier.
Nederlands Tijdschrift voor Natuurkunde
Het Nederlands Tijdschrift voor Natuurkunde is hét Nederlandstalige vakblad voor natuurkundigen, vol nieuws uit de natuurkunde. Een greep uit de onderwerpen: onderzoek aan de frontlinie, natuurkunde en kunst, onderwijs, bijzondere loopbanen, interviews met prominente wetenschappers en een kijkje in de keuken bij bedrijven. Jaarlijks verschijnt vlak voor de zomer een extra dik themanummer. Leden van de NNV ontvangen het tijdschrift maandelijks.
Speciale editie Onbegrepen natuurkunde
cover NTvN 91-07
Onbegrepen natuurkunde is het thema van onze speciale editie van 2025. De écht Grote Raadsels in de natuurkunde blijven langdurig voor opschudding zorgen. Dit speciale themanummer gaat over die grote vragen en de drijfveren om grip te krijgen op de onbegrepen natuurkunde.
Het themanummer Onbegrepen natuurkunde is los te bestellen door een mailtje te sturen aan het NNV-bureau (bureau@nnv.nl), vergeet niet om een verzendadres te vermelden. Het nummer kost 10 euro, inclusief btw en verzendkosten (voor verzenden naar het buitenland rekenen we extra kosten).

Auteur: Vincent Icke

In het dagelijks leven is dat drastisch anders. Wie zegt “Die jas staat je goed,” zou vreemd opkijken als de aangesprokene zou vragen om de hoeveelheid spreiding rond de aanduiding ‘goed’. Dat komt door de taal. Die is sociaal zo bruikbaar dankzij een zekere mate van vaagheid. Maar daarom is het onmogelijk om een exacte vraag te formuleren, en een exact antwoord geven is evenmin mogelijk.

Wij zijn dat gewend; sterker nog, taalvaagheid voelt goed. Daarom zijn de producten van AI zo aantrekkelijk. ChatGPT en aanverwante machinerie gebruiken grootschalige taalmodellen (Large Language Models, LLM) om correlaties in data, bijeengestolen door roofsoftware, aan de gebruiker te presenteren. In een vorm die voor iedere mens natuurlijk is: taal.

Daarom zijn AI-producten onbetrouwbaar, en dat is iets anders dan onjuist. Ook het weerbericht voorspelt de temperatuur niet exact, maar je weet wel wat de verwachte afwijkingen zijn. Daardoor blijft die onjuistheid beheersbaar, en wordt de uitspraak betrouwbaar. Bij AI Is dat niet het geval: je wordt bedonderd en je weet niet eens hoeveel.

Op een vraag aan AI krijg je nooit tweemaal hetzelfde antwoord. Dat wordt AI vaak verweten, maar dat slaat de plank mis. Want ook in een wetenschappelijk experiment geeft een waarneming nooit exact dezelfde uitkomst als de vorige. Dat is nu juist een van de redenen dat foutenanalyse essentieel is.

Zo’n analyse is bij AI principieel niet mogelijk, omdat het verschil tussen twee uitspraken niet meetbaar is, voornamelijk doordat taal symbolisch is. De afstand tussen Leiden en Haarlem is bekend, binnen een marge die ook bekend is. Maar wat is de afstand tussen twee complimenten? Twee dichtregels? Wat is de spreiding in de afstanden tussen twaalf partijprogramma’s?

‘Alle stukken aan stuurboord.’ ‘Alle hens aan dek.’ Iedere matroos begrijpt het verschil tussen die twee, maar AI begrijpt niets, omdat er geen maat is voor de afstand ertussen. Grammaticaal is de afstand nul, maar als De Ruyter op AI had moeten varen had-ie de Vierdaagse Zeeslag geheid verloren.

De vaagheid van taal, ingebakken in de LLM’s, is de achilleshiel van AI. Hoewel ik denk dat deze fundamentele zwakte onoplosbaar blijft, is het theoretisch niet uitgesloten dat ooit een bruikbare kwantificering wordt gevonden voor taalkundige uitspraken. Dan kunnen we meten wat de afstand is tussen de ware uitspraak ‘Vincent vertrouwt AI niet’ en de mededeling ‘Vincent is in 2026 jarig’. Ook dat laatste is waar, tenzij ik voor die tijd overlijd… maar voorlopig zit ik nog binnen mijn foutmarge.

Lees dit redactioneel in het septembernummer of klik hier.