18/12/2012 — Casper Hulshof

Hoe bereken je cijfers voor een toets?

Toelichting: Onderstaande tekst werd oorspronkelijk geschreven door Michiel Couzijn (Instituut voor de Lerarenopleiding, UvA) in 2005. Ik heb het tekstueel enigszins aangepast en geschikt gemaakt voor het format van deze blog.

Kort en zonder uitleg:

Bereken eerst de score voor elk gemaakt werk
Maak een keuze met betrekking tot de cesuur (dat is: de te behalen score voor het cijfer 6)
Maak keuzes met betrekking tot de scores die horen bij respectievelijk het cijfer 10 en bij het cijfer 1
Werk een normeringstabel uit, waarin je scores koppelt aan cijfers en waarbij deze koppeling van 1 tot 6 en van 6 tot 10 gelijkmatig oploopt

Voor een toets met 20 vragen (en een mogelijke score van 0 tot 20 punten) volgen hier twee voorbeelden, A en B. In voorbeeld B ligt de eis voor de cesuur hoger (14 punten nodig voor een cijfer 6) maar is ook de kans om een 10 te halen iets hoger.

Cesuren

Voorbeeld A is kort te omschrijven als “Twee fouten betekent 1 punt eraf.” Voorbeeld B kun je omschrijven als “Score 14 ot 19: 1 fout is 0,8 punt eraf; Score 4 tot en met 13: 1 fout is 0,5 punt eraf.” In het eerste geval telt elke fout dus even zwaar, ongeacht het aantal gemaakte fouten, in het tweede geval worden de eerste fouten zwaarder aangerekend dan latere fouten.

Lang en met uitleg:

Wie onderwijs geeft moet het resultaat deugdelijk toetsen. Als docent wil je immers te weten te komen of je onderwijs succes had. Je leerlingen willen weten hoe ze het er van af brachten in de ogen van de docent. Goed, daar zit je dan met je pak leerlingwerk op het bureau: tekstverklaringen, een stapel opstellen, een set boekverslagen of wat dan ook. Hoe bepaal je dan de schoolcijfers?

Er zijn twee belangrijke stappen te nemen: de scoring en de normering.

De scoring bestaat eruit dat je bepaalt op grond van welke criteria leerlingen punten kunnen verdienen, gevolgd door toepassing van die criteria op elk gemaakt werk. Bij een schrijftoets kunnen de criteria bijvoorbeeld zijn: opbouw en overtuigingskracht. Of correct taalgebruik (bijvoorbeeld het aantal grammaticale en spelfouten). Of opbouw, originaliteit en correct taalgebruik. Het hangt er maar net van af wat je hebt onderwezen, en waarop je de leerlingen (deze keer) wilt afrekenen. Van belang is wel dat leerlingen van te voren – dus voorafgaand aan de toetsing – weten waarop ze worden beoordeeld, zodat ze daar rekening mee kunnen houden. Het is vrij zinloos leerlingen te onderwijzen in tekstopbouw en hen een schrijfopdracht daarover te laten maken, en die dan te beoordelen op ‘originaliteit’ als ze niet van tevoren wisten dat dit aspect ook zou meewegen.

Bij een tekstverklaring bestaat de scoring er bijvoorbeeld uit dat je bepaalt hoeveel punten de leerlingen bij elke vraag kunnen verdienen, of er een aftrekregeling geldt voor incorrect taalgebruik, of er bonusvragen zijn enzovoort. Opnieuw: dit hoor je voorafgaand aan, of bij de toets zelf te vermelden. Het is zinloos – en oneerlijk – om een vraag achteraf als ‘bonusvraag’ te benoemen omdat-ie te moeilijk of verkeerd gesteld bleek. Zo’n slechte vraag moet je gewoon weglaten uit je scoring (hij had natuurlijk niet eens in de toets moeten zitten…)

Bij een spreekbeurt (moderner: presentatie) is het eveneens van belang leerlingen te informeren hoe ze punten kunnen verdienen, en waarop ze dus moeten (leren) letten bij het voorbereiden en houden van hun verhaal voor de klas. Stemgebruik? Contact met publiek? De inhoud van hun verhaal? Gebruik van media? Het ligt voor de hand dat de keuze van de criteria zijn weerslag heeft op de instructie die je geeft, de aandacht die leerlingen bij de opdracht aan bepaalde aspecten geven, en wat er dus feitelijk geleerd zal worden. Toetsen = onderwijzen = leren.

Uit de toepassing van de gekozen criteria op elk gemaakt werk (of elke gegeven presentatie) volgt dan een score. Een score is iets anders dan een schoolcijfer. Wie twintig woordjes overhoort in een s.o. en een punt toekent per correct antwoord, heeft in feite een toets met een maximale score van 20 punten. Wie slechts tien woordjes overhoort, heeft een toets met een maximale score van 10 punten. In het laatste geval heb je dus echt niet te maken met schoolcijfers (van 1 t/m 10) maar met scores van 0 tot 10. Een toets kan elke denkbare reikwijdte en maximumscore hebben: van 0 tot 10, van 5 tot 100, van 0 tot 43, van 1 (voor het opschrijven van je naam) tot 17½ , van 500 tot 550 (zoals bij de CITO-toets basisonderwijs), enzovoort.

Hoe kom je nu aan schoolcijfers op basis van de behaalde scores? De omzetting van scores naar schoolcijfers heet de normering. Bij een normering moeten een aantal arbitraire keuzes gemaakt worden. Dat ze arbitrair zijn, betekent dat de verantwoordelijkheid voor die keuzes op de schouders van de docent rust, dat hij/zij zich dus de aard en het belang van die keuzes moet realiseren, en de gemaakte keuzes moet kunnen verantwoorden. Er bestaan geen objectieve criteria voor deze keuzes. Wel bestaan er tal van onzin-opinies over:

“Je moet 25% onvoldoendes hebben” – alsof het niks uitmaakt of de klas goed of slecht heeft gewerkt c.q. geleerd, en alsof jouw onderwijs nooit succesvol of juist ineffectief kan zijn.
“60% goed is een zes” – alsof je geen hogere of lagere eisen zou kunnen stellen, en alsof elke toets precies even moeilijk is.
“Alleen een maximumscore is een 10” – alsof alléén een foutloze toets het predikaat ‘uitmuntend’ verdient.
“Voor dit werk kunnen leerlingen nooit een 10 krijgen, want het resultaat is nooit perfect” – alsof jij leerlingen hebt geleerd hoe ze ‘perfect’ kunnen presteren (en alsof jij dat zelf als expert per definitie wél kunt!)

De te maken keuzes komen in het algemeen neer op het bepalen van de cesuur en van de scores die horen bij het cijfer 10 en het cijfer 1.

Wat de cesuur betreft, moet je kiezen welke score je ‘voldoende’ noemt. Dit is de allerbelangrijkste vraag die je jezelf moet stellen: het antwoord bepaalt namelijk hoe tevreden jij zult zijn – en de leerlingen zullen zijn – met de geleverde prestaties, hoeveel onvoldoendes er zullen vallen, hoeveel bespreekgevallen er zijn op de rapportvergadeing enzovoort. Heel belangrijk dus. Je baseert je antwoord op een schatting van het vereiste niveau en de door leerlingen in redelijkheid te leveren inspanning om dat niveau te bereiken. Met andere woorden: was de toets gemakkelijk of moeilijk voor deze klas? En wat zou, gezien de voortgang die je met deze klas moet boeken, hun gemiddelde score nu moeten zijn? Voor het maken van zulke keuzes is deskundigheid en ervaring nodig. Schroom dus niet om als beginnend docent hier hulp van collega’s in te roepen.

Stel dat je een s.o. hebt gegeven over twintig woordjes en je geeft elk goed antwoord 1 punt. Dan is je maximumscore 20 en je minimumscore 0. Welke prestatie vind je nu ‘voldoende’ in de zin van ‘kan er net mee door’? 10 woordjes goed (snel tevreden)? 12 woordjes goed? 16 woordjes goed (hoge eisen)? Er is hier geen fout antwoord. De hoogte van de te stellen eis is geheel aan jou (en je vakcollega’s) ter bepaling. In het algemeen geldt hierbij: lage eisen kunnen leiden tot gemakzucht bij sommige leerlingen en (herstel van) zelfvertrouwen bij anderen; hoge eisen kunnen leiden tot demotivatie bij sommigen en juist werklust bij anderen. Hierbij zijn dus pedagogische en curriculaire afwegingen in het geding.

Laten we zeggen dat je met 14 goede antwoorden van de 20 vragen tevreden bent (de cesuur, een ‘6’). De volgende vraag is: welke prestatie noem je ‘uitmuntend’ en beloon je dus met het cijfer 10? Moet de toets daartoe perfect gemaakt zijn (score 20 = cijfer 10) of mogen de leerlingen toch een of twee steken laten vallen (bijv. score 19 = cijfer 10)? Ook dit zijn allebei arbitraire beslissingen; er is geen reden de eerste keuze ‘normaal’ en de tweede ‘een uitzondering’ te noemen. Het is ook motiverend voor sommige leerlingen als de 10 eerder binnen hun bereik ligt. Hetzelfde geldt voor het cijfer 1. Bij welke score vind je dat de leerling geen noemenswaardige prestatie heeft geleverd? Wie een 20-item-meerkeuzetoets geblinddoekt maakt, heeft meestal toch 5 vragen goed zonder van enige kennis van zaken blijk te geven. Als ik morgen een 100-item-toets maak over ‘de orbitaaltheorie van Newton’ – of een ander onderwerp waar ik niets van weet – heb ik toch mooi 25 vragen goed! Die prestatie verdient dan geen beloning ten opzichte van iemand die meer pech had dan ik en op 15 of 20 goede vragen uitkwam. Deze blinde-gok-scores verdienen dus allemaal het schoolcijfer 1.

Sterker nog, de laagste scores zijn doorgaans het resultaat van een combinatie van blind gokken en ‘test wiseness’: de slimheid die leerlingen hebben ontwikkeld op het gebied van het maken van toetsen. Zo zijn sommige afleiders van een meerkeuzevraag zichtbaar te idioot geformuleerd om goed te wezen, of is een antwoord zoveel langer of duidelijker geformuleerd dan de andere dat het op het oog al meer kans maakt correct te zijn. Voor het goede antwoord op vraag c) hieronder hoef je ook niet te kunnen rekenen:

a) 5 appels min 2 appels = ….. appels

b) 8 appels min 4 appels = ….. appels

c) 7 appels min 6 appels = ….. appel (nota bene: authentiek voorbeeld!)

Kortom, er is meer dan één reden om de score voor het cijfer 1 niet te laag te stellen. En we hebben de cijferschaal van 1 tot 10 niet voor niets: een goede docent is niet bang de hele schaal te gebruiken als hij van mening is dat er onder de leerlingprestaties zowel ‘slechte’ als ‘uitmuntende’ prestaties voorkomen.

Het scoregebied boven de cesuur toont hoeveel beter de prestatie is dan ‘voldoende’. De koppeling van dat scoregebied aan de cijferschaal moet bij voorkeur gelijkmatig ofwel evenredig zijn. Stel dat de cesuur van een toets op 14 punten ligt. Een leerling met een score van 18 punten is dan twee keer zo ver verwijderd van een ‘voldoende’ als een leerling met een score van 16 punten, namelijk 4 respectievelijk 2 scorepunten. Het ligt voor de hand dit tot uitdrukking te brengen in het cijfer: de meerwaarde in het cijfer moet dan ook twee keer zo groot zijn. De leerling met score 18 kan dan bijvoorbeeld het cijfer 8 krijgen (meerwaarde: 2 cijferpunten) en de leerling met score 16 bijvoorbeeld het cijfer 7 (meerwaarde: 1 cijferpunt). Een andere mogelijkheid: de leerling met 18 scorepunten krijgt het cijfer 8,6 (meerwaarde: 2,6 cijferpunten) en de leerling met 16 scorepunten het cijfer 7,3 (meerwaarde: 1,3 cijferpunten). Beide mogelijkheden zijn goed; de keuze hangt af van welke prestatie je met een ‘10’ wilt belonen. In het eerste geval zou dat de score 22 zijn, in het laatste geval de score 20 (die is dan eigenlijk een 9,9 waard, maar ja, daar maak je natuurlijk een 10 van).

Iets vergelijkbaars geldt voor het scoregebied onder de cesuur: die toont hoeveel slechter de prestatie is dan ‘voldoende’. Je mag ‘hoeveelheid beter’ en ‘hoeveelheid slechter’ best met dezelfde maatstaf uitdrukken (‘punten per fout’), maar dat hoeft niet per se. Dat niet te doen laat je ook vrij om te bepalen welke score je met het cijfer 1 beloont. Stel weer dat je de cesuur van een toets op 14 punten hebt bepaald. Een leerling met score 10 is dan twee keer zo ver verwijderd van een voldoende als een leerling met score 12. Dat kun je in het schoolcijfer uitdrukken door de eerste leerling een 4 te geven (tekort: 2 punten) en de tweede leerling een 5 (tekort: 1 punt). Je kunt het ook doen door de eerste leerling met een 3 te ‘belonen’ (tekort: 3 punten) en de tweede leerling met een 4,5 (tekort: 1,5 punt). In het eerste geval is een score van 4 en lager gekoppeld aan het cijfer 1. In het tweede geval krijgt een leerling al het cijfer 1 bij de score 7 (eigenlijk: 7, 3) en lager. Het laatste geval past beter bij een 20-item-meerkeuzetoets waar leerlingen door blind gokken en wat ‘test-wiseness’ al snel 7 vragen goed hebben zonder kennis van zaken te tonen.

Hoe stel je nu zo’n tabel op waarbij scores en schoolcijfers aan elkaar zijn gekoppeld? Dat is niet moeilijk en vereist alleen wat elementair rekenwerk. Stel, je hebt van een toets met een maximumscore van 40 punten de cesuur gekozen, de 10-score en de 1-score. Dan is dit bijvoorbeeld de situatie:

tabel2

Zo verkrijg je de volgende normeringstabel:

tabel3

Tot zover deze uitleg over het construeren van een normeringstabel. Er blijven enkele discussiepunten over, die ik de lezer ter overweging wil meegeven:

Is dit alles niet te veel werk voor een docent?
Is deze manier van normeren wel duidelijk en acceptabel voor leerlingen?
Waar leg je de cesuur: bij een 6 of bij een 5,5?
Wanneer bepaal je de cesuur: vooraf of pas tijdens het nakijken?

Casper Hulshoff

4 3 votes

Article Rating

Abonneren

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.

17 Reacties

nieuwste

oudste meest gestemd

Inline Feedbacks

View all comments

wpDiscuz

About Casper Hulshof

Casper Hulshof is docent bij de afdeling Onderwijskunde aan de Universiteit Utrecht. Hij is geïnteresseerd in alles wat met onderwijs, psychologie, en wetenschap in het algemeen te maken heeft en bekijkt de zaken het liefst met een nuchtere, kritische, maar altijd oprechte blik.