Dit is een bijdrage van gastblogger René Kneyber. De post verscheen eerder op zijn blog Toetsrevolutie.

Zie ook de recensie van het boek Cijfers geven werkt niet door Frans Droog.

Een groot misverstand over formatief toetsen is dat het synoniem zou zijn aan geen cijfers geven. Ik ben daar natuurlijk enigszins schuldig aan omdat ik besloot het boek Embedded Formative Assessment als Cijfers geven werkt niet te vertalen. Dus ik wil bij deze ook mijn verantwoordelijkheid nemen en dit misverstand de wereld uit helpen.

Beoordelingspraktijk versus didactisch handelen

Een beperkte hoeveelheid stof behandelen, zoals een hoofdstuk, daar een toets over geven dat beoordeeld wordt in de vorm van een cijfer, is een voorbeeld van een beoordelingspraktijk. De drie strategieën van formatief toetsen (het stellen van doelen, het checken van begrip, en het geven van feedback) vormen samen geen beoordelingspraktijk, maar een didactische aanpak. Iets dergelijks wordt goed geïllustreerd in de bijdrage van Ed van den Berg in het boek Toetsrevolutie. Hij laat in zijn hoofdstuk zien hoe formatieve toetsing gebruikt kan worden om de instructie te verbeteren.

Het is daarom misschien ook beter om te spreken over formatief handelen en summatief toetsen.

Toch houden ze verband met elkaar

Er zit natuurlijk wel enige samenhang tussen summatief toetsen (als beoordelingspraktijk) en formatief toetsen (als didactische aanpak). Als het goed is beoordeel je met summatief toetsen of bepaalde doelen gehaald zijn. Bij formatief toetsen kijk je ook hoe de leerling ervoor staat (of de leerling doet dit zelf). Bij summatief toetsen is er feedback in de vorm van een cijfer. Bij formatief toetsen is er sprake van rijkere, ontwikkelingsgerichte feedback.

Het is natuurlijk begrijpelijk dat leraren die hier kennis van nemen, en de ontwikkeling van leerlingen centraal stellen, formatief toetsen gaan zien als de verbeterde versie van summatief toetsen. Maar door simpelweg de summatieve toetsen te vervangen door formatief toetsen does not een beoordelingspraktijk make; door gewoon dezelfde toetsen als voorheen te gebruiken maar daar rijkere feedback op te geven, in plaats van feedback via een cijfer, creëert vermoedelijk meer problemen dan er worden opgelost.

Een beoordelingspraktijk is tenslotte ook een antwoord op de vraag van de leerling waar hij of zij het voor doet, en wat telt en wat niet telt. Stel je vervangt je summatieve toetsen door formatief te handelen, welke informatie is dan van belang om belangrijke beslissingen op te baseren? Welke inspanning van de leerling loont? En als dat onduidelijk is waarom zou de leerling zich dan eigenlijk nog inspannen?

Intelligente mix tussen summatief toetsen en formatief handelen

Ik zou eenieder die iets met formatief toetsen wil gaan doen adviseren om een slimme mix te gebruiken tussen summatief toetsen en formatief handelen. In het boek Assessment for Learning: The Challenge of Implementation zien we dat veel docenten in andere landen kiezen voor een mix, zodat er vormen van overlap ontstaan.

In variant A wordt de informatie die voortkomt uit het formatief handelen gebruikt om tot een summatieve beoordeling te komen. Om een rapportcijfer te geven gebruikt de leraar niet alleen de resultaten uit summatieve toetsen, maar weegt ook zijn observaties en de inhoud van gesprekken mee die hij deed en had tijdens het formatief handelen in de lessen. Dit soort gebruik van informatie uit formatief toetsen wordt beschouwd als robuuster en meer valide dan wanneer er slechts een gemiddelde cijfer wordt berekend (Allal, 2013).

In variant B wordt de informatie die voortkomt uit summatieve toetsing gebruikt op een formatieve manier. Nadat een biologieleraar bijvoorbeeld een verslag beoordeeld heeft, verzamelt ze alle veelvoorkomende fouten om zo nieuwe activiteiten te ontwerpen die de leerlingen kunnen helpen om hun begrip te verbeteren. Deze wijze van formatief gebruik van summatieve informatie komt volgens de auteurs van dit boek met name voor wanneer het aantal contacturen beperkt is, waardoor er weinig tijd is om een goede scheiding te maken tussen formatief handelen en summatieve beoordeling.

In variant C is er sprake van een uitgebreide en langdurige evaluatie-activiteit waarin fases of componenten van formatief handelen zitten, en waarin fases of componenten van summatieve beoordeling zitten. Een voorbeeld hiervan is het werken, gedurende een jaar, aan een schrijf-portfolio dat uiteindelijk gebruikt wordt om een eindcijfer te geven, maar waarin – gedurende de opeenvolgende fases – de leerling wordt aangemoedigd om zijn schrijfvaardigheid te verbeteren door middel van feedback van de leraar of door klasgenoten, en door middel van reflectie op het proces van schrijven en revisie (door metacognitieve zelfevaluatie). (Zie bijvoorbeeld de procedures die hiervoor zijn ontwikkeld door Tierney c.s. (1991))

Het grote voordeel van deze intelligente mixen is dat er weinig hoeft te veranderen aan de bestaande praktijken. Leerlingen krijgen nog steeds een rapport met cijfers. Hierdoor begrijpen ouders en collega’s die cijfers gewend zijn gemakkelijk ‘hoe het er voor staat’. Voor leerlingen is het zo ook duidelijk hoe de formatieve activiteiten bijdragen aan hun beoordeling.

Overal toepasbaar

Soms lees ik of krijg ik te horen dat formatief toetsen niet zou kunnen werken in de bovenbouw van het voortgezet onderwijs, of in het mbo, in het primair onderwijs, of bij Nederlands, gym of wat dan ook. Bovengenoemde implementatievarianten laten duidelijk zien dat formatief toetsen overal mogelijk is, en een meerwaarde kan leveren.

Variant C kan bijvoorbeeld gebruikt worden voor een PTA-onderdeel over schrijven en dat uiteindelijk beoordeeld wordt met een cijfer in het PTA.

Ik wil hierbij nog opmerken dat er ook nog een vierde variant in opkomst is: het programmatisch toetsen, hierover hoop ik een binnenkort een volgende post te schrijven.

Bronnen

Linda Allal (2013). Teachers’ professional judgement in assessment: A cognitive act and a socially situated practice. Assessment in Education: Principles, Policy & Practice, 20, 20–34.

Ed van den Berg (2016). Formatieve toetsing met onmiddelijke feedback. In Dominique Sluijsmans & René Kneyber (red.). Toetsrevolutie. Naar een feedbackcultuur in het voortgezet onderwijs. Culemborg. Uitgeverij Phronese.

Dany Laveault en Linda Allal (red.) (2016). Assessment for Learning: The Challenge of Implementation. Londen. Springer International Publishing.

Dominique Sluijsmans & René Kneyber (red.) (2016). Toetsrevolutie. Naar een feedbackcultuur in het voortgezet onderwijs. Culemborg. Uitgeverij Phronese.

Tierney, R. J., Carter, M. A., & Desai, L. E. (1991). Portfolio assessment in the reading-writing classroom. Norwood, MA. Christopher-Gordon.

Dylan Wiliam (2018). Cijfers geven werkt niet. Meppel. Ten Brink Uitgevers. (Oorspronkelijke titel: Embedded Formative Assessment. Vert. René Kneyber.)


René Kneyber is wiskundeleraar, coach, uitgever en auteur van boeken over orde houden en gezag dragen. Samen met Jelmer Evers schreef hij Het Alternatief I en II en Flip the System.

Join the conversation! 1 Comment

  1. Welke informatie dient de summatieve evaluatie?
    Het is opvallend hoe de laatste tijd in de didactische literatuur en discussies het thema ‘evaluatie’ is gestegen op gebied van aantal bijdragen. Evaluatie speelt dan ook een bepalende rol in onderwijs op alle gebied. Veranderingen op gebied van evaluatie hebben een grote impact op andere aspecten binnen het onderwijs. Om een discussie goed te kunnen voeren is het belangrijk om de begrippen voldoende duidelijke te stellen.
    In deze blogbijdrage verwijst René Kneyber naar het boek ‘Toetsrevolutie’ om te stellen dat formatieve evaluatie eerder een handelingspraktijk is dan een beoordelingspraktijk. Andere bronnen maken het onderscheid tussen formatieve en summatieve evaluatie eerder naargelang de functie of het doel van de evaluatie: formatieve evaluatie treedt op wanneer je een beslissing wil nemen naar de aanpak van de leerling op basis van informatie die je over de leerling hebt behaald en bij summatieve evaluatie wil je een beslissing nemen over de leerling of hij een bepaalde onderwijsperiode succesvol heeft afgesloten en/of hij een bepaalde volgende grote stap in het onderwijs mag aanvatten. Krijgt de leerling een attest en waarvoor geldt dit attest? Wat kan hij daarmee aanvangen?
    In deze optiek moet je de argumentie uit de blog van Kneyber bekijken. Een beoordelingspraktijk (summatieve evaluatie) is een antwoord op de vraag van de leerling (en de ouders en eigenlijk ook de leerkrachten zelf) wat telt en wat niet telt.
    Stel je vervangt (alle) summatieve evaluatie door formatief handelen, welke informatie is dan van belang om belangrijke beslissingen op te baseren?
    De aanvullende vraag van Kneyber ‘Welke inspanning van de leerling loont?’ impliceert dat een leerling alleen leert omwille van het behalen van een attest. Dat wil ik betwijfelen. Er is heel wat onderzoek gedaan naar de impact van externe motivering op interne motivering die andere dingen stelt. Maar deze discussie zou ons te ver leiden voor de reactie op deze blog.
    Ik kom terug op de vraag van de leerling ‘wat telt en wat telt niet’ om een belangrijke beslissing te nemen. Dat hangt natuurlijk af van welke beslissing er genomen moet worden en hoe zwaarwichtig die beslissing is en voor wie en hoeveel kans er is dat deze beslissing de juiste is en hoe (on)herroepelijk deze beslissing is.
    Ik zet twee belangrijke beslissingen op een rijtje en zet er kort een mogelijk antwoord bij voor de verschillende deelvragen.
    Beslissing voor summatieve evaluatie: zittenblijven of overgaan naar een volgend jaar in de opleiding.
    Zwaarwichtig voor de leerling in kwestie omdat dit een impact van minstens één jaar heeft op zijn leven maar misschien zijn leermotivatie voor de rest van zijn leven fnuikt. Dit heeft ook een gevolg voor de sfeer in de klas van de andere leerlingen, het gevoel van onwrikbaarheid of misschien van pedagogische mislukking voor sommige leerkrachten, een maatschappelijke kost …
    De kans dat via zittenblijven de leerling het niet-geleerde nu beter zal leren en het reeds geleerde minstens evengoed zal blijven hangen, is nog niet zo vaak onderzocht maar wordt toch niet hoog ingeschat.
    Deze beslissing kan aangevochten worden via een interne en externe beroepscommissie. Hiervoor jagen de scholen de leerkrachten op om een deel van hun energie te spenderen aan het rechtskundig onderbouwen van een beslissing.
    Een andere belangrijke beslissing die via summatieve evaluatie moet genomen worden is het bepalen van de beperkingen van kiezen van een vervolgrichting, b.v. bij de overgang van een eerste naar een tweede graad secundair onderwijs of na het secundair onderwijs of …
    Wat is het gewicht van deze beslissing? En voor wie? B.v. zal de motivatie van een leerling die een gewilde vervolgopleiding niet mag aanvatten achteruitgaan? Heeft de leerling meer kans op slagen?
    Wat is de kans dat deze beslissing valide en betrouwbaar is? Dat de opgelegde beperking in keuzemogelijkheden van vervolgonderwijs overeenstemt met wat de leerling in realiteit zou aangekund hebben.
    Is deze beslissing onherroepelijk of kan de leerling via een alternatieve (langere) weg toch de gewilde vervolgopleiding aanvatten?

    Om beslissingen te nemen met deze impact moeten we duidelijk zijn naar de leerling wat telt en wat niet telt maar vooral moeten we grondig nadenken welke informatie valide en betrouwbaar genoeg is om zulke zwaarwichtige beslissing op te baseren.
    De beoordelingspraktijk in bijna alle scholen wordt nu opgezet omdat het een gewoonte is, het lijkt voor alle betrokkenen een evidentie in het onderwijs.
    Een rapportcijfer genereren is ook een doel op zich in plaats van de vraag te stellen waarvoor moet een beslissing genomen en wie moet daarvan en op welk moment op de hoogte gesteld worden.
    Ouders worstelen wat ze aan moeten met rapportcijfers. Ze willen ze want ze geven een gevoel van vertrouwdheid, iets wat ze zelf kennen van vroeger. Maar geven deze rapportcijfers ons een antwoord op de vraag welke beperkingen moeten we inbouwen in de keuzevrijheid van het vervolgonderwijs?
    Het voorstel van Kneyber is om de dagelijkse toetsen zowel voor formatieve evaluatie als voor summatieve evaluatie te gebruiken.
    Persoonlijk ben ik een grotere voorstander om summatieve evaluatie zo min mogelijk uit te voeren. Deze beperkende beslissing naar vervolgopleiding enkel te baseren op een beperkt aantal vakken die in de vervolgopleiding de hoofdzaak uitmaken en dan voor elk van deze deze vakken een onafhankelijke toets te gebruiken zoals de paralleltoets of de peilingstoets, die is opgesteld door deskundigen op gebied van de eindtermen en van toetsontwikkeling. De resultaten van deze toetsen bespreken met de leerlingen en de ouders een half jaar voor de beslissing genomen moet worden om een kans op een ‘herroepingsstrategie’ toe te laten.

    Reply

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

About Gastblogger

Gastbloggers publiceren op uitnodiging en op persoonlijke titel. Hun visie is niet noodzakelijkerwijs de visie van het Blogcollectief. Commerciële uitingen worden niet geplaatst.

Latest Posts By Gastblogger

Category

onderwijs, praktijk, toetsen

Tags

,