Onderwijs- en Innovatieplein
Toetsdesign en generatieve AI
Hoe pas je je toetsen verstandig aan op GenAI? Op basis van literatuur geeft Izaak Dekker docententeams de volgende constateringen en adviezen.
Constateringen
► Gebruik van GenAI is wijdverspreid onder studenten. Het wordt vooral voor schrijven en editen gebruikt (>70%) maar ook voor het samenvatten van teksten (54%) (aiinhe.org).
► Het is moeilijk betrouwbaar te detecteren (Fleckenstein et al., 2024). Er zijn zelfs apps zoals Quillbot dit GenAI tekst 'humanizen'.
► Houd twee principes in het oog:
- het betrouwbaar willen beoordelen wat studenten geleerd hebben
- studenten willen voorbereiden op het actief en ethisch om kunnen gaan met AI in het werkveld/de samenleving (Lodge et al., 2024).
Adviezen
De volgende zeven adviezen helpen bij het nastreven van bovenstaande twee principes.
1. Validity matters more than cheating (Dawson et al., 2024)
Wanneer we uit paniek alle tentamens omzetten naar mondelingen examens gaat fraude beperkten ten koste van validiteit. Alleen maar mondelinge tentamens zijn geen passende test bij wat iemand in het werkveld moet kunnen en maakt het toetsprogramma minder inclusief (voor minder verbale studenten).
2. Talk is cheap (Corbin et al., 2024)
Veel opleidingen geven met bijvoorbeeld stoplichten aan welk AI gebruik bij welke opdracht toegestaan is en welke niet. Dit zijn discursieve oplossingen die de verantwoordelijkheid voor goed gedrag eenzijdig bij de studenten leggen. We hebben ondertussen ook structurele oplossingen nodig die het makkelijker maken om het goed te doen en moeilijker om er misbruik van te maken (verkeersdrempels vs borden).
3. Reverse scaffolding (Dawson, 2025)
AI kan gebruikt worden om mensen als scaffold te helpen dingen te doen of leren, maar vaak is de verleiding dan erg groot om erop te gaan leunen. Het is wellicht verstandiger om aan 'reverse scaffolding' te doen. Eerst moet je laten zien dat je het zonder kan, daarna mag je het -met hogere eisen- gebruiken.
4. GenAI is niet pedagogisch
Het is een pleasemachine die alles voor je doet wat je vraagt. In de opvoeding zou dit leiden tot verwende nesten. Een pedagogische (of zelfs menselijke) relatie stimuleert en dwingt je zelf na te denken. Pas als de AI ingezet wordt binnen een afgekaderde pedagogische situatie (zoals met custom bots of Educative AI) kan het mogelijk hier een meerwaarde bieden.
5. Cognitive offloading: intrinsic or extraneous? (Dawson, 2025)
Is de inspanning intrinsiek aan wat je moet leren of staat die er los van? Intrinsieke inspanning moet je behouden!
6. Evaluative judgment
Hoe leren we studenten om te beoordelen of wat AI genereert klopt? Kennis blijft nodig om verantwoordelijkheid te kunnen nemen! 7 the Swiss-cheese model Ga niet als individuen alle losse modules AI-proof proberen te maken. Zorg voor een gevarieerd toetsplan dan spreid je de risico's en kies een paar strategische momenten waar studenten moeten laten zien het zonder AI te kunnen.
7. The Swiss-cheese model
Ga niet als individuen alle losse modules AI-proof proberen te maken. Zorg voor een gevarieerd toetsplan dan spreid je de risico's en kies een paar strategische momenten waar studenten moeten laten zien het zonder AI te kunnen.
Meer weten?
Bekijk hieronder bijbehorende PowerPoint en download de one-pager: Toetsdesign en generatieve AI.