Kunstmatige Intelligentie NRC - nrc ZATERDAG�17�JUNI�& ZONDAG�18�JUNI�2�02� nrc W2 Wetenschap

nrc

ZATERDAG�17�JUNI�&ZONDAG�18�JUNI�2�02�3

nrc

ZATERDAG�17�JUNI�&ZONDAG�18�JUNI�2�02�3 Wetenschap W3

W2We t e n sch a p

Slim maar

nog niet echt

i nte l l i ge nt

KUNSTMATIGE�INTELLIGENTIE

Hoe goed is ChatGPT in Nederlands, rechten, biologie

en programmeren? Vier hoogleraren zochten het uit.

Door�onze�medewerker�Bennie�Mols

Afgelopen maart schreven Micro-

soft-onderzoekers in het nog

niet peerreviewed artikel S p a rk s

of Artificial General Intelligence:

Early experiments with GPT-4:

„Wij tonen aan dat GPT-4 niet

alleen taal beheerst, maar ook nieuwe en

moeilijke taken kan oplossen op het gebied

van wiskunde, programmeren, geneeskunde,

recht, psychologie en nog veel meer, zonder

dat daarvoor speciale aanwijzingen nodig

zijn. Bovendien komen de prestaties van GPT-

4 in al deze taken opvallend dicht in de buurt

van prestaties op menselijk niveau.”

GPT-4 is het taalmodel dat aan de basis ligt

van de meest recente versie van ChatGPT, een

AI-systeem dat teksten schrijft op basis van

een stukje invoertekst en dat sinds de lance-

ring in november 2022 voor een storm aan op-

winding heeft gezorgd. Die storm is inmiddels

wat geluwd en onderzoekers uit talloze we-

tenschapsgebieden hebben ermee kunnen ex-

perimenteren. N RC vroeg hoogleraren uit vier

vakgebieden naar hun eerste experimenten

met ChatGPT en de betekenis ervan voor hun

we te n s c h a p sge b i e d .

Marc van Oostendorp,

hoogleraar Nederlands en acade-

mische communicatie aan de

Radboud Universiteit, legde het

centrale vwo-eindexamen Ne-

derlands voor aan ChatGP T.

„Mijn eerste experiment deed ik met ChatGP T

gebaseerd op GPT-3.5. Dit systeem haalde 33

FOTO�GETTY�IMAGES

van de 60 punten en is daarmee op net gezakt.

Maar toen ik het experiment opnieuw deed met

de op GPT-4 gebaseerde ChatGPT slaagde het

programma wel, met iets van een 8 of zelfs 8,5.

Voor het vwo-eindexamen Frans haalde Chat-

GPT ook ruim een 8, maar de sessie voor Fries

was heel bedroevend met zelfs bizarre antwoor-

den.

„Ik had een jaar geleden niet voorspeld dat er

nu een computer zou zijn die het vwo-eindexa-

men Nederlands min of meer haalt. De antwoor-

den varieerden wel tussen ‘ik ben verbaasd dat

een computer dit goed heeft’en ‘wat een rare

fo u t ’. Het systeem is betrekkelijk goed in het

analyseren van de vragen, maar niet zo goed in

het begrijpen van het genre van het examen zelf.

„Het centraal examen gaat over meetbare as-

pecten van omgaan met teksten zoals het her-

kennen van argumentatieschema’s, drogrede-

nen en verbanden tussen alinea’s. Natuurlijk

kun je de vraag stellen of ChatGPT de tekst echt

begrijpt als deze dat allemaal kan, maar die

vraag werd ook vóór ChatGPT al gesteld als het

gaat over scholieren. ‘Begrijpend lezen’van het

eindexamen is misschien niet écht begrip. Dat is

bijvoorbeeld ook een tekst in de context kunnen

plaatsen, zoals aan welk debat de auteur van dit

stuk meedoet, of nog wat ingewikkelder tek-

sten lezen dan de opiniestukken uit het centraal

eindexamen: literaire teksten bijvoorbeeld.

„Op wetenschappelijk niveau zie je dat Chat-

GPT de taalkunde op zijn kop zet. Decennia-

lang woedt er al een debat of en in hoeverre

taal aangeboren is. Sommige wetenschappers

zeggen dat ChatGPT laat zien dat het idee van

aangeborenheid onzin is. Andere wetenschap-

pers zeggen weer dat ChatGPT weliswaar men-

selijke taal kan leren, maar net zo goed onmen-

selijke taal, bijvoorbeeld een taal waarin je elke

lettergreep nummert, en dan de klemtoon legt

op lettergrepen die een priemgetal zijn. Men-

sen kunnen dat niet, computers wel.

„Bij kunstmatige intelligentie zijn er altijd

verschuivende grenzen: eerst gold schaken als

de hoogste vorm van menselijke intelligentie,

daarna het spel go, en als dat ook blijkt opge-

lost, kiezen we weer een nieuwe grens. Zoiets

gebeurt er nu ook bij tekstbegrip. Ik vind het

heel interessant hoe ons denken over ons den-

ken steeds preciezer wordt doordat we het

moeten afzetten tegen wat computers wel of

niet kunnen.”

Anne Meuwese

is hoogleraar public law and

governance of artificial intelligen-

ce aan de Universiteit Leiden.

Zij experimenteerde met ChatGP T

als schrijver van wetten.

„Ik gaf ChatGPT de volgende opdracht: schrijf

Kunstmatige Intelligentie NRC - nrc ZATERDAG�17�JUNI�&amp; ZONDAG�18�JUNI�2�02� nrc W2 Wetenschap - Studeersnel (2024)

Kunstmatige Intelligentie NRC - nrc ZATERDAG�17�JUNI�& ZONDAG�18�JUNI�2�02� nrc W2 Wetenschap - Studeersnel (2024)