In dit stuk legt Frans Droog nog eens uit hoe het zit met de N-termen. Het CvTE heeft een goede verklaring voor de soms grote verschillen in N-termen van het eerste en tweede tijdvak. Het is de vraag of hiermee alle onrust uit de lucht is. Dit verscheen eerder op zijn blog Droog’s Leren Delen.

De N-termen voor het tweede tijdvak van de centrale eindexamens dit jaar waren voor een aantal vakken nogal verschillend van die in het eerste tijdvak. Dit leverde de nodige discussies op over de totstandkoming, de validiteit en de betrouwbaarheid van deze N-termen. Deze soms hooglopende discussies waren zichtbaar op verschillende fora en sociale media en ongetwijfeld hoorbaar tijdens menige bespreking van de behaalde resultaten voor de leerlingen die in het tweede tijdvak een herkansing hadden gedaan, neem ik zomaar aan.

Als voorbeeld de resultaten voor de VWO vakken waarvoor een tweede tijdvak examen gedaan kon worden.

Grote verschillen zijn zichtbaar voor wiskunde B, van 0,9 naar 1,8, en biologie, van 0,8 naar 1,6. Voor een aantal vakken is de N-term voor het tweede tijdvak ook verlaagd en werd dit in het algemeen in de voorlopige N-term voor het tweede tijdvak al aangekondigd, bijvoorbeeld bij Nederlands, Duits en Management  & Organisatie. Bij de vakken Natuurkunde en Scheikunde werd de aangekondige voorlopige N-term voor het tweede tijdvak die tot een verlaging zou leiden uiteindelijk toch nog verhoogd.

Voer genoeg voor discussie dus.

Maar hoe komt die N-term voor het tweede tijdvak nu uiteindelijk tot stand?

Hieronder de verklaring van het CvTE hierover. Mogelijk maakt dit het nodige duidelijk.

Normering tweede tijdvak

Het vaststellen van de N-term bij het tweede tijdvak gaat anders dan bij het eerste tijdvak. Dit komt omdat de groep die het tweede tijdvak maakt kleiner is en van jaar tot jaar niet goed vergelijkbaar is. Bij het tweede tijdvak moeten we dus op een andere manier dan bij het eerste tijdvak zicht krijgen op de moeilijkheid van het examen. De moeilijkheid van het examen bepaalt vervolgens de hoogte van de N-term. Deze zijn één op één aan elkaar gekoppeld. Om zicht te krijgen op de moeilijkheid van het tweede tijdvak wordt gekeken naar de prestaties van de herkansers met een onvoldoende op het eerste tijdvak. De cijferverbeteraars laten we hiermee grotendeels buiten beschouwing. We nemen de groep herkansers met een onvoldoende op het eerste tijdvak omdat deze groep zeer gemotiveerd is om op het tweede tijdvak zichzelf te verbeteren.

Globale werkwijze

Tijdens de normering van het eerste tijdvakexamen (tv1) wordt een voorlopige N-term voor het tweede tijdvakexamen (tv2) vastgesteld. Deze twee zijn in principe gelijk aan elkaar. Alleen incidentele ophogingen in tv1 (bijvoorbeeld ter compensatie van een onvolkomen vraag) worden niet meegenomen. De voorlopige N-term tv2 is gelijk aan tv1 omdat we als vertrekpunt nemen dat tv2 ongeveer even moeilijk zal zijn als tv1, aangezien tv1 en tv2 door hetzelfde team en onder dezelfde voorwaarden tot stand gebracht zijn. Mocht achteraf blijken dat tv2 moeilijker was, dan wordt de voorlopige N-term tv2 opgehoogd. Als tv2 makkelijker blijkt te zijn dan tv1 dan wordt de voorlopige N-term niet naar beneden bijgesteld. De voorlopige N-term geeft dus een bodemwaarde.

Onderzoeken van de moeilijkheid

Het onderzoek of tv2 moeilijker is dan tv1 begint met het berekenen van het verschil in procentuele score tussen tv2 en tv1. We kijken daarvoor naar de groep herkansers die in tv1 een onvoldoende haalde. We vergelijken dus de procentuele score van deze groep op tv2 met de procentuele score die deze groep haalde op tv1. Nu zijn er drie factoren die van invloed zijn op dit verschil in procentuele score:

1 Verschil in moeilijkheid tussen tv2 en tv1

2 Het regressie-effect

3 De leerwinst

De eerste factor is wat we bij het normeren willen weten. De N-term compenseert voor een verschil in moeilijkheid tussen verschillende examens (zie ook Examenblad.nl). Dat verschil in moeilijkheid moet dus vastgesteld worden.

De tweede factor is een empirisch, statistisch bekend verschijnsel: leerlingen met lage cijfers zullen zich gemiddeld meer verbeteren dan leerlingen met hoge cijfers.

De derde factor, leerwinst, draagt bij aan een verschil omdat de leerling in de voorbereiding op zijn herkansing nog even alles op alles zet. Dit zorgt ervoor dat dat deze groep in juni (tv2) iets vaardiger is dan in mei (tv1).

Om de hoogte van de N-term tv2 te bepalen moet de invloed van alle drie factoren bekend zijn. Het verschil in procentuele score kan berekend worden aan de hand van de ingestuurde gegevens in Wolf. Het regressie- effect wordt berekend met behulp van een statistische methode. De leerwinst kan geschat worden door uitkomsten over heel veel jaren te middelen.

Als we het verschil in procentuele score tussen tv2 en tv1 voor de onvoldoende herkansers compenseren voor het regressie-effect en de leerwinst, kennen we het verschil in moeilijkheid tussen tv2 en tv1. Als tv2 moeilijker blijkt wordt de voorlopige N-term tv2 opgehoogd met het zojuist berekende verschil in moeilijkheid.

Bijzonderheden

Soms blijkt vlak na de afname van het eerste tijdvak dat een vraag niet deugde. Dan wordt een aanvulling op het correctievoorschrift uitgedaan waarin de correctoren verzocht wordt om alle leerlingen de maximale score toe te kennen voor die vraag. Het eerste tijdvakexamen wordt daarmee gemakkelijker en krijgt een lagere N-term dan wanneer de vraag niet in het examen had gezeten. De voorlopige N-term tv2 zou dus hoger geweest zijn als de ondeugdelijke vraag niet in tv1 had gezeten. Hoeveel hoger de N-term zou zijn geweest, wordt wel berekend maar wordt pas doorgevoerd als uit de tweede tijdvakvergelijking (zie hierboven) blijkt dat het tweede tijdvak daadwerkelijk moeilijker blijkt. Als uit de tweede tijdvakvergelijking blijkt dat het tweede tijdvak gemakkelijker is, wordt de voorlopige N-term tv2 niet naar beneden bijgesteld. De N-term is in dit geval dus al hoger dan op basis van de moeilijkheid passend zou zijn. Om deze reden wordt de ophoging vanwege de ondeugdelijke vraag in tv1 niet doorgevoerd.

Vanzelfsprekend is het in tijdvak 2 ook mogelijk om via de N-term te compenseren voor het nadeel dat leerling mogelijk hebben ondervonden door bijvoorbeeld een fout in het examen.

Bron:

Examenblad. Normering tweede tijdvak.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Category

examen, onderwijs, praktijk

Tags