artikel> Blind grading tegen vooroordelen
‘Laat schriftelijke examens op een computer maken’
Begin januari stelden drie onderzoekers aan de KU Leuven voor om schriftelijke examens voortaan anoniem te verbeteren. Rector Rik Torfs was geen voorstander.
Op 2 januari publiceerden Els Vandensande, Johan Lievens en Andy Thys van de KU Leuven een opiniestuk in De Standaard met de stelling: maak examens anoniem om zo vooroordelen bij het verbeteren te voorkomen. Ondanks dat de praktijk van ‘blind grading’ in het buitenland op regelmatige basis voorkomt, noemde De Standaard het voorstel ‘opvallend’.
Rector Rik Torfs was geen voorstander. ‘Studenten zijn geen anonieme mensen’, liet de rector weten. Torfs heeft vertrouwen in de docenten en wijst erop dat de meerderheid van de examens mondeling gebeurt, tekende persagentschap Belga op. Aan ROB-tv verklaarde Torfs zijn positie: ‘Zelfs als je examens anonimiseert zijn er andere subjectieve aspecten die zullen meespelen; het handschrift en de leesbaarheid ervan of de al dan niet wat krukkige taalbeheersing bij sommigen. Taalachterstand schemert altijd door bij examens, dus dat los je daardoor ook niet op. Ik zou eerlijk gezegd gewoon eerder open kaart spelen.’
Naam creëert verwachting
Winibert Segers, professor aan de KU Leuven, doet al jaren onderzoek naar de problematiek van betrouwbaarheid van toetsen. ‘Ik ben verrast door de discussie’, laat Segers weten. ‘Die problematiek is helemaal niet nieuw. Toetskundig probeer je elke vorm van 'bias', vertekening, te vermijden. Een van de vormen van bias is de naam. Dat is al zeer grondig bestudeerd.’
‘Je ziet dat de naam al bij de evaluator een bepaalde indruk opwekt en dat die indruk het eindoordeel beïnvloedt’, vervolgt Segers. ‘Die ‘blind grading’ is dus eigenlijk evident en een uitstekend idee. In Frankrijk is het bijvoorbeeld absoluut gebruikelijk.’
Een Zweedse studie uit 2014 toonde aan dat studenten met een vreemde naam 10% minder scoren dan hun klasgenoten met een Zweeds-klinkende naam
‘En zoiets gebeurt niet noodzakelijk bewust’, vult Segers aan. ‘Je moet er immers altijd van uitgaan dat een evaluator eerlijk probeert te beoordelen.’
Studies die uitwijzen dat niet-geanonimiseerd examineren onderhevig is aan vooroordelen over gender (zoals vrouwelijke studenten die lagere cijfers krijgen bij het schrijven over chemie), huidskleur (zwarte studenten die in bepaalde contexten lagere scores krijgen dan witte studenten) of zelfs vrij willekeurige vooroordelen (zoals studenten met een ‘aantrekkelijke’ of veelvoorkomende naam die hogere punten krijgen dan studenten met een zeldzame of ‘niet-aantrekkelijke’ naam), zijn er te over. Een Zweedse studie uit 2014 toonde bijvoorbeeld aan dat studenten met een vreemde naam 10% minder scoren dan hun klasgenoten met een Zweeds-klinkende naam. Belangrijk is dat dit om een contextgebonden studie gaat en dus is voorzichtigheid geboden bij de interpretatie. Toch is de bias duidelijk waar te nemen.
Nachtrust als factor
‘Er zijn natuurlijk nog bias-factoren buiten de naam’, licht Segers toe, ‘handschrift is er zo één van. Eigenlijk zou zoiets als een mooi handschrift totaal geen rol mogen spelen. Je zou dat kunnen uitschakelen door bijvoorbeeld examens op computers te laten maken.’
Segers heeft evenwel weinig begrip voor Torfs’ kritiek dat ‘blind grading’ dergelijke vooroordelen niet wegneemt. ‘Dat is natuurlijk geen argument tegen het anoniem beoordelen van examens an sich. Je moet proberen zoveel mogelijk storende factoren bij het afnemen van een toets uit te schakelen.’
Toch kan Torfs’ argument op enige sympathie rekenen van Katrien Struyven, hoofddocent Educatiewetenschappen aan de Vrije Universiteit Brussel. ‘Blind grading werkt inderdaad ‘maar' op een klein stukje van wat de kwaliteit van de beoordeling uitmaakt. Het neemt het vooroordeel over een naam weg, maar er zijn zoveel andere factoren die een resultaat mee beïnvloeden.
Dat kan gaan van de examenlocatie tot de nachtrust van de student, die maken dat je mogelijk niet meet wat je wenst te meten. Een kwaliteitsvolle beoordeling omvat dus een veelheid aan factoren die te maken hebben met ‘meten’, maar die ook te maken hebben met leren, zoals het beklijvend karakter van kennis in de opleiding van studenten. Deze ‘leervraagstukken’ zijn minstens even interessant om de kwaliteit van evaluatie te garanderen in een opleiding.’
'Studenten hebben immers nooit geklaagd over mondelinge examens'
Marie Vanwingh, Studenteraad KU Leuven
Segers vindt tout court dat we te weinig bezig zijn met de betrouwbaarheid en validiteit van examens. ‘Wij lopen hier achter in Vlaanderen. Dat is een algemeen probleem: er zou echt veel meer aandacht moeten gaan naar toetskundige aspecten. Zo is een mondeling examen, een examenvorm die hier vaak voorkomt, vaak de minst geschikte, minst betrouwbare examenvorm van allemaal.’
Blind grading als vehikel voor de democratisering van het onderwijs? ‘Blind grading en de thematiek worden mee geïnspireerd door het feit dat jongeren uit sociaal moeilijkere situaties het minder doen in onderwijs,’ legt Struyven uit. ‘Zoiets louter wijten aan intelligentie kan natuurlijk niet. Onderzoek heeft aangetoond dat er dingen spelen in de context die te maken hebben met verwachtingen van leerlingen. Met blind grading probeer je die context wat uit te schakelen.’
De studentenraad van de KU Leuven bevraagt momenteel de mogelijkheden van blind grading. ‘We wachten de resultaten van onze examenenquête af’, stelt Stura-voorzitter Marie Vanwingh. ‘Daarin peilden we naar de ideeën van de studenten over dit onderwerp. Die bespreken we op de algemene vergadering van 3 maart. Dan zullen we met een officieel standpunt komen.’
Over mondelinge examens is Vanwingh wel formeel. Stura wil deze vorm niet laten vallen. ‘Studenten hebben immers nooit geklaagd over deze examenvorm. Hoe dan ook pleiten wij voor een diversiteit aan examenvormen waarbij de vorm goed aansluit bij de inhoud van wat bevraagd wordt.'