AI als kans voor toetsing: aanbevelingen voor het hoger onderwijs
Momenteel volg ik de BKE, een professionaliseringsprogramma voor docenten in het hoger onderwijs dat me (hopelijk) het predikaat ‘toetsbekwaam’ gaat opleveren. Samen met UvA-collega’s Saar Mollen en Marten Stienstra boog ik me voor een groepsopdracht op AI in toetsing. Binnen de academische wereld wordt AI daarbij vaak gezien als bedreiging: hoe gaan we fraude tegen? Maar voor toetsing en docentprofessionalisering kan het ook een kans zijn: om de samenhang tussen leerdoelen en toetsen onder de loep te nemen en beter af te stemmen.
We spraken met collega’s van verschillende universiteiten en bekeken diverse beleidsdocumenten, waaronder bestaande AI-indices van Tilburg University en de Universiteit Utrecht. Het resultaat was naast een presentatie in de BKE ook een beleidsdocument met daarin uitgangspunten voor AI-beleid, aanbevelingen voor beleid en een voorstel voor een eigen UvA AI-index.
Uitgangspunten
- De universiteit is er niet om studenten te leren hoe je zo efficiënt mogelijk gebruik maakt van AI tools, maar universiteiten zouden studenten moeten leren wanneer, hoe en waarom je AI verantwoord en kritisch kan inzetten.
- Bepaalde AI-praktijken keuren we af (verbieden we); bepaalde AI-praktijken juichen we toe. Welke wel en niet hangt af van de leerdoelen van het specifieke vak.
Studenten moeten werken met UvA AI Chat of door de docent goedgekeurde AI-toolS (AVG-conform). Docenten kunnen afwijken van de index, specifieke opdrachtinstructies zijn leidend, binnen bredere beleidskaders en regelgeving (OER).
Inzichten
AI-geletterdheid zou een eigen leerlijn moeten zijn, waarin studenten aan het begin van hun studie leren hoe te redeneren, argumenteren, schrijven etc. zonder AI en hier ook passend op getoetst worden. AI wordt dan een academische vaardigheid, die verbonden is aan bestaande vaardigheden, zoals bronkritiek, argumentatie, analyse en methodologisch bewustzijn. Net als in de rest van de wetenschappelijke praktijk staan transparantie en verantwoordelijkheid voorop. De student is eindverantwoordelijk en moet altijd kunnen uitleggen wat ingeleverd is en daarop kritisch kunnen reflecteren: waarom is AI ingezet, wat voegde het toe, wat waren de beperkingen?
De voorgestelde index kan daarbij een handig hulpmiddel zijn, waarbij studenten gedurende hun bacheloropleiding van een laag AI-index-niveau steeds hoger gaan. Dit betekent fundamentele herziening van bestaande eindtermen: welke competenties blijven cruciaal en welke moeten worden geherformuleerd?
Aanbevelingen
Zo’n integratie van AI in het toetsen vereist in de eerste plaats heldere institutionele kaders. Opleidingen moeten eenduidig AI-niveaus hanteren en er moeten conventies/standaarden worden opgesteld voor promptlogs en reflectieonderdelen. Deze moet ook transparant aan studenten worden gecommuniceerd. Onderwijsinhoud en beoordelingsinstrumenten moeten worden aangepast.
Daartoe is ook professionalisering van docenten nodig. Zo vraagt promptbeoordeling om verregaande AI-geletterdheid van docenten. Zij moeten inzicht hebben in de werking, beperkingen en epistemologische implicaties van gen-AI, binnen de kaders van de EU AI act. Dit is zowel kostbaar als tijdrovend, en bestaande digitale vaardigheden variëren al sterk.
Klik op de afbeelding om te vergroten.
