Waarom Visible Learning van John Hattie pseudowetenschap is – herblogd

Dit stuk verscheen eerder op de blog van René Kneyber. Zijn punt is dat je de ranglijst van Hattie niet als onderbouwing kunt inzetten.

Het boek Visible Learning van John Hattie verscheen in 2008, en is in Nederland verschenen als Leren zichtbaar maken. In dit boek vergelijkt hij  onderzoek naar interventies in het onderwijs om zo te komen tot een ranglijst te komen van wat werkt en wat niet werkt. Anno 2020 is zijn aanpak zeer omstreden, en daarmee dus ook de harde conclusies die hij trekt. Dit besef lijkt in het Nederlands onderwijs nog niet voldoende ingedaald. Regelmatig kom ik op scholen waar Hattie nog als zoete koek geslikt wordt.

In deze blog som ik de grootste bezwaren op, en reflecteer ik op wat we wel en niet kunnen met dit boek.

Introductie

Eind 2010 deed ik mee aan debat over prestatiebeloning en dat was om meerdere redenen gedenkwaardig. Zo stond ik na afloop zes uur lang in een sneeuwstormfile, ik ontmoette Thijs Jansen van de stichting Beroepseer wat de eerste stap was richting het boek Het Alternatief, en tijdens het debat begon Jan Tishauser (die ik toen nog niet kende) over het boek Visible Learning: een ranglijst van wat werkt in het onderwijs, en wat nauwelijks of tegengesteld werkt. Ik raakte nieuwsgierig, mailde hem nog eens over de titel, bestelde het, las het en ik was meteen verkocht.

Ik was al heel lang op zoek naar een goed overzicht van wat we kunnen leren uit onderwijsonderzoek en dit boek leek precies dat te bieden. Voor de zekerheid googelde ik wél op kritiek op het boek (het was tenslotte al twee jaar uit), maar ik kon niet veel serieuze kritiek vinden. Zo’n populair boek – ook wel de ‘heilige graal van het onderwijs’ genoemd –… als er iets mis mee was dan zou de eerste serieuze criticaster zich wel gemeld hebben, toch?

Synthese van meta-analyses

Voor de zekerheid zal ik kort uitleggen wat John Hattie en collega’s precies hebben gedaan, mocht je het gemist hebben.

Stel je bent onderzoeker en je doet onderzoek naar bijv. klassengrootte. Je doet kwantitatief onderzoek naar de resultaten van een grote groep in de les (32 leerlingen) en een kleinere groep (24 leerlingen). Hoewel de ene groep het misschien gemiddeld beter zal doen qua leerprestaties dan de andere valt er aan de resultaten nog niet zoveel op te hangen. Om te zien of deze verbetering of verslechtering statisch significant is moet er een zogenoemde ‘effect-grootte’ berekend worden. Hoe groter de effect-grootte hoe meer ‘impact’ de interventie had.

Deze resultaten publiceer je. Maar aan de bevindingen valt nog niet zoveel op te hangen. Eén onderzoek is geen onderzoek, zegt men wel eens. Er kan sprake zijn van bijv. bias of een toevalstreffer. Het is daarom altijd goed om meer onderzoeken naar iets te doen, of het onderzoek door een andere onderzoeker te laten herhalen.

Als je echt wilt weten wat in grote lijnen de effecten zijn van een klassenverkleining is een meta-analyse nodig. Je pakt al het onderzoek naar klassenverkleining bij elkaar en je gaat vergelijken. Zo’n meta-analyse kun je ook doen naar de effecten van samenwerkend leren, directe instructie, zittenblijven etc.

In Visible Learning doet John Hattie een van de eerste grote pogingen om al deze meta-analyses met elkaar te vergelijken aan de hand van de effect-groottes. Het is dus in feite een meta-meta-analyse: al is het beter om te spreken van een synthese van meta-analyses.

De bevindingen van Hattie

Deze synthese leidt tot een aantal bevindingen en conclusies, die ik hieronder kort zal opsommen.

a) Een effectiviteitsranglijst

A screenshot of a cell phone

Voorbeeld

Figuur 1 Voorbeeld van korte ranglijst met effectgroottes afkomstig van www.visible-learning.org.

Door de ‘effect-grootte’ als universele indicator in te zetten beweert Hattie in staat te zijn om interventies met elkaar te vergelijken. Bovenstaand diagram toont tien interventies en hoe ze zich tot elkaar verhouden. ‘Feedback’ scoort met een gemiddelde effect-grootte van 0,73 hoog en ‘het wisselen van school’ scoort negatief met -0,34. De hele ranglijst is te groot om hier zinvol weer te geven, maar kijk gerust eens hier.

b) Alles werkt wel, ‘soort van’

Een opvallende conclusie van Hattie is dat elke interventie wel soort van werkt. Er zijn maar een paar interventies op de lijst zoals zittenblijven en wisselen van school die een negatieve impact hebben. Het overgrote deel van mogelijke interventies heeft een positieve bijdrage. Ja, zelfs als leerlingen geen of een slechte leraar voor de klas hebben gaan ze nog wel een beetje vooruit; al is een goede leraar natuurlijk altijd beter.

c) Omslagpunt voor voldoende positief effect

Als alles wel soort van werkt dan zullen we moeten kijken naar wat het allerbeste werkt, zegt Hattie. Het gemiddelde van alle effectgroottes is namelijk 0,4. Wat hij the hinge point, oftewel het omslagpunt noemt. Eigenlijk, stelt hij, zouden we ons niet moeten bekommeren om zaken die minder effectief zijn dan gemiddeld. Zonde van de tijd en energie.

Om dit inzichtelijk te maken werkt hij met zogenaamde barometers waarin pijltjes aangeven waar de interventie precies valt.

A picture containing device

Description automatically generated

Anno 2011 nog weinig kritiek

Zoals gezegd, toen ik me in het werk verdiepte in 2011 was er weinig kritiek te vinden. Zover ik me kan herinneren, trof ik op mijn rondje over internet het volgende (al kan ik niet alles meer terugvinden).

a) Constructivisten waren tegen

Aanhangers van constructivistisch onderwijs kregen in het boek de wind van voren. Hattie vindt in zijn synthese veel aanwijzingen dat een leraar die directe instructie toepast het meest effectief is. De interventies die een ‘coach ‘doet in een constructieve setting zijn allemaal minder effectief. Om dit te illustreren maakt hij gebruik van tabelletjes zoals de volgende (hier uit EDI 2.0):

Tegenstanders van Hattie vond je vooral in de sociaal-constructivistische hoek. Zij wezen op tekortkomingen in de methode van Hattie of op de platheid van een tabel zoals bovenstaande. Een leraar als coach zal tenslotte ook feedback geven. 

b) Betekenis voor beleid onduidelijk

Een van de opmerkelijke uitkomsten van de synthese is dat klassengrootte er niet toe doet. Aangezien klassenverkleiningen kostbaar zijn, en klassenvergrotingen veel opleveren was dit voer voor beleidsmakers over de hele wereld om klassen in ieder geval niet kleiner te maken (want duur, en geen effect). In 2011 was er daarom discussie of je de uitkomsten wel op deze manier mocht interpreteren en gebruiken om beleid op te baseren.

Anno 2020 meer kritiek

De afgelopen jaren groeit de kritiek op het werk van Hattie. Hattie bagataliseert veel van de kritiek. Hij onderneemt wel eens pogingen om kritiek te weerleggen, maar die zijn vaak niet overtuigend.

George Liley houdt een website bij met alle kritiek die inmiddels gepubliceerd is. En dat is nogal wat: (http://visablelearning.blogspot.com) ik zal die hier niet allemaal herhalen, maar het is zeker de moeite waard om alles eens te bekijken. De belangrijkste punten in de kritiek zal ik hier bespreken.

a) Leerlingen zijn niet gemiddeld, dus wat heb je hieraan…

De grote paradox is volgens Larson (2014) dat in de synthese van meta-analyse met 240 miljoen datapunten de leerlingen ondergesneeuwd raken en verdwijnen. Leerlingen zijn niet gemiddeld. Zoals Dylan Wiliam vaak zegt: Alles werkt wel ergens, maar niets werkt overal. Wie onderzoek wil gebruiken om de praktijk te verbeteren moet zich afvragen ‘wat werkt, voor wie, waarom, hoe en onder welke condities’. In de grote-gemiddelden-show van Visible Learning is de informatie die je als leraar nodig hebt en wilt hebben, juist verdwenen.

b) Effectgroottes kun je zo niet gebruiken. Statistische warboel

In 2017 publiceerde Bergeron een artikel met de veelzeggende titel  How to engage in pseudoscience with real data: A criticism of John Hattie’s arguments in Visible Learning from the perspective of a statistician” met stevige statistische kritiek op Visible Learning. Zijn conclusies zijn niet mals:

“Wie door de bril van een expert naar het boek Visible Learning kijkt ziet niet een machtig kasteel maar een fragiel kaartenhuis dat snel uit elkaar zal vallen….

Wie Hattie gelooft heeft een blinde vlek in zijn kritische vermogen om iets op wetenschappelijkheid te beoordelen. Zijn werk promoten is als de promotie van pseudowetenschap. Tot slot, wie Hattie zelfs in het licht van deze serieuze kritiek blijft verdedigen houdt zich bewust blind.”

c) De wiskunde klopt niet

Een van de meest opvallende fouten van Visible Learning is dat de wiskunde simpelweg niet klopt. John Hattie maakt gebruik van twee statistische concepten effectgrootte en CLE. Deze CLE is een kans. Kansen zijn  – weet je misschien nog van de middelbare school – minimaal 0% en maximaal 100% maar bij John Hattie bestaan er plots ook kansen van -49% en 219%! Is het magie? Nee, na enig aandringen gaf Hattie ruiterlijk de fout toe (maar heeft het nooit aangepast).

d) Omslagpunt van 0,4 is twijfelachtig

Om adequaat met effectgroottes te kunnen werken zijn allerlei correcties nodig. Ten eerste voor leeftijd van de deelnemers omdat de effectgroottes van interventies bij jonge kinderen groter zijn . Diverse onderzoekers wijzen erop dat door dit soort correcties toe te passen de gemiddelde effectgrootte veel lager wordt, wellicht zelfs maar 0,2.

e) Eenzijdige focus op kwalificatie

Onze eigen Gert Biesta is een van de veteranen onder de Hattie-criticasters. Zijn kritiek is wel andersoortig van toon. Of de statistische methode nu goed is of niet, dat doet er volgens Biesta niet eens toe. Het werk van Hattie richt zich tenslotte slechts op het meetbare van kwalificatie. Iets kan wel ‘effectief’ zijn, maar dat betekent nog niet dat het ook goed onderwijs is, aangezien we dan ook andere domeinen in ogenschouw moeten nemen. Kortgezegd: Een interventie kan effectief zijn, maar dat maakt haar nog niet wenselijk.

Uit goede bron vernam ik dat dat Hattie op deze kritiek reageerde met de woorden: ‘[dat] Mevrouw (sic) Biesta wel een punt heeft, maar dat onderwijs desondanks toch alleen maar gaat over kwalificatie.’

Mijn punt is dat je de ranglijst van Hattie niet als onderbouwing kunt inzetten.

Wat kunnen we er nog mee?

Ik ben een fan van veel van de conclusies van Hattie. De afgelopen jaren is het gemakkelijk geweest om mijn gelijk te krijgen door te zeggen: ‘Uit het onderzoek van John Hattie blijkt…’ Mijn leven zou ongetwijfeld makkelijker zijn door dit allemaal halsstarrig vol te houden,maar inmiddels ben ik al een tijdje zover dat ik het Visible Learning-werk van Hattie gewoonweg niet meer serieus kan nemen. Wie serieus beoogt dat onderzoek een belangrijke bron vormt voor het handelen in de klas kan dat huis niet bouwen op het drassige moeras dat Visible Learning heet. Mijn adviezen zijn daarom ook de volgende:

a) Hattie niet meer gebruiken als bron

Er is zoveel mis met Visible learning dat je het niet meer als bron zou moeten inzetten. De verwijzing Hattie (2008) of Hattie (2009) kun je dus beter niet meer gebruiken.

b) Probeer je conclusies anders te onderbouwen

Misschien vind je de conclusies van Hattie heel fijn. Dat vind ik ook. Ik ben geen sociaal-constructivist en ik ben blij dat formatief handelen hoog staat in de Visible Learning ranglijst. Maar als ik het punt wil maken dat formatief handelen belangrijk, effectief, goed en wenselijk is, dan zal ik dat punt op een andere manier moeten maken. 

c) Per definitie dus ongeschikt voor beleidsbeslissingen

Misschien overcompleet, maar de conclusies van John Hattie zijn ongeschikt om beleid op te baseren. Goed beleid kijkt naar deugdelijk onderzoek — en daar is hier uiteraard geen sprake van — maar moet rekening houden met de context waarbinnen onderwijs zich bevindt en praktische kennis.

d) Ander werk van Hattie mogelijk nog wel interessant

Dat we Visible Learning niet meer kunnen gebruiken betekent niet dat we het andere werk van John Hattie niet meer kunnen gebruiken. Zijn onderzoek naar expertise onder leraren staat nog steeds, en zijn werk naar feedback is ook nog steeds onomstreden.

Al wil ik niet uitsluiten dat dit over twee jaar anders kan zijn.

e) De interventies die Visible Learning aanprijst zijn nog steeds zinnig

Veel scholen zijn aan de slag gegaan met de interventies die volgens Hattie krachtig zijn: leerdoelen, formatief handelen, feedback, directe instructie, noem het maar op. Dit artikel is geen verwerping van deze strategieën. Op andere manieren valt even goed te onderbouwen dat dit nuttig is (voor wat je er mee wilt bereiken). Mijn punt is dat je de ranglijst van Hattie niet als onderbouwing kunt inzetten.

gastblogger's avatar

13 Reacties naar “Waarom Visible Learning van John Hattie pseudowetenschap is – herblogd”

  1. Onbekend's avatar

    Dit stuk verdiende commentaar en aanvullingen en niet om hier nog eens ‘herblogd’ te worden (vgl https://nl.wikipedia.org/wiki/John_Hattie). Een nogal teleurstellende herhaling van zetten.

    Like

  2. Onbekend's avatar

    In het artikel van René worden kritische kanttekeningen geplaatst bij het basisonderzoek van John Hattie. Hij zet het onderzoek af tegen de actualiteit. Helaas gaat René in zijn artikel voorbij aan de recente ontwikkelingen en aanvullingen binnen Visible Learning (in het Nederlands: Leren Zichtbaar Maken). Eerder reageerde ik via LinkedIn en heb ik geprobeerd om deze informatiegaten te vullen. Hierbij de link naar mijn reactie:
    https://www.linkedin.com/pulse/hatties-leren-zichtbaar-maken-wetenschappelijk-%C3%A9n-actueel-bogaarts/?lipi=urn%3Ali%3Apage%3Ad_flagship3_profile_view_base_post_details%3BP5LQqtEmSXu7qYY2vH3EyQ%3D%3D

    Like

  3. Onbekend's avatar

    Spijtig genoeg is het leren op mijn school nog steeds grotendeels onzichtbaar, alles van uit zijn onderzoek nog steeds toepasbaar

    Like

  4. Onbekend's avatar
    Ruben De Baerdemaeker Beantwoorden 4 januari 2021 bij 08:55

    Is het geen symptoom van een fundamentele onzekerheid dat de onderwijswereld zich wereldwijd zo vastklampt(e) aan het “harde” cijfermateriaal van Hattie? Ik ben blij dat er steeds meer kritiek komt op dat werk – en dat die kritiek ook steviger onderbouwd blijkt dat het doelwit ervan. Dank voor deze mooie en verhelderende synthese, die alleen maar kan helpen om het “prachtige risico” weer te omarmen.

    Like

  5. Onbekend's avatar

    In het onderwijs wordt nog te vaak Hattie als onderbouwing van schoolbeleid aangevoerd, vooral in het PO, wat komt omdat (te) weinig mensen in het PO wetenschappelijk geschoold zijn. Dus goed om dit artikel nogmaals te publiceren.
    Er zitten wat hinderlijke taalfouten in, die zou ik er uithalen.
    Dan nog iets. Al deze onderzoeken en ook de discussies over onderwijs (op deze maar ook andere blogs) gaan voorbij aan de inhoud van het onderwijs: wát we aan kinderen leren. Kijk, je kunt kinderen didactisch perfecte leeslessen geven, maar als ze daarbij de helft van de letters leren gaat het lezen toch niet lukken.
    Oftewel: het effect van de inhoud van het onderwijs is vele malen groter dan welke didactische aanpak dan ook. Toch krijgt die inhoud weinig aandacht.
    Het kennisaanbod in het Nederlandse onderwijs is heel laag, en daarom kunnen Nederlandse kinderen slecht lezen. Want achtergrondkennis is bepalend voor tekstbegrip. Er is dus een verband tussen Timms en Pirls. Nederlandse kinderen scoren bij Timms laag op het natuuronderwijs (de zaakvakken) en daarin wordt juist de achtergrondkennis onderwezen die nodig is voor tekstbegrip (Pirls).
    In Nederland wordt 3% onderwijstijd aan de zaakvakken besteed, in Duitsland is dat 13%. Een belangrijke reden waarom dit kennisaanbod zo laag is, is dat leerkrachten -hier komt een ouderwets woord- zelf nog weinig ‘algemene ontwikkeling’ hebben. Dat wordt op de Pabo’s niet meer aan leerkrachten bijgebracht. De zaakvakmethodes hebben zich daarop aangepast (want ze worden meestal door de leerkrachten gekozen), dus ze bieden veel plaatjes en leuke weetjes, maar geen serieuze kennisopbouw meer. Zo beland je in een neergaande cirkel die zich tot een stille ramp aan het ontwikkelen is: we onderwijzen aan kinderen geen kennis meer. Het zal heel moeilijk zijn om de neergang weer om te buigen naar een opwaartse lijn waarin kennis weer op de eerste plaats komt in het onderwijs, want dat is wat onderwijs is: kennis- en cultuuroverdracht.
    Gelukkig wordt dit in andere landen inmiddels begrepen, zie https://www.coreknowledge.org/ , en wie weet gaat over een tijdje het kwartje in Nederland ook vallen.

    Like

  6. Onbekend's avatar

    Mmmmm, niet zozeer de kritische blik op Hattie maakt me in verwarring, alswel dat Hattie destijds geframed werd als onderwijs-onderzoek en daarmee dus goed en betrouwbaar. Zeker als het gaat over meta-analyses. Klinkt tocht allemaal krachtig, goed doordacht etc.
    Het roept de vraag op: welk onderwijs-onderzoek kan ik wel vertrouwen en waarom?

    Like

  7. Onbekend's avatar

    Er is niets zo erg als betweters zoals Rene Kneybers, die denken dat economische cijfers en wiskundige concepten klakkeloos op mensen, kinderen en vooral binnen het onderwijs zondermeer toepasbaar zijn zonder enige context.

    Hier zijn mijn tegenargumenten:
    Ja, in het onderwij kunnen we spreken van een groei van meer dan 100%. Aangezien voor ieder leerjaar leerdoelen gesteld zijn en een kind die deze behaalt, scoort 100%. Echter, geef je zo’n kind een eindtoets van het daarop volgende jaar, dan scoort die leerling die zoiets foutoos maakt m.i. 200%. Dus zo ook een negatief percentage, indien een kind onder zijn niveau scoort. Ik heb in mijn 30 jarige carriere genoeg meegemaakt en gezien hoe kinderen binnen starten met een bepaalde kennis en na een verwarrende uitleg van bijvoorbeeld een stagiaire, onervaren docent of onbevoegde docent, compleet verward raakten en hierdoor in niveau achteruit gingen, zelfs onder hun beginsituatie aan de start van die les. Dus zelfs zonder ooit het onderzoek van Hattie uitgeplozen te gelezen te hebben, kan ik in alle functies (en hobbies) die ik uitgevoerd heb in mijn carriere als wetenschapper, docent NASK, SK, NA, Bio, politicus, beleidsmedewerker, jurist, tutor, schrijfster en moeder (van een kind die ooit een periode faalangst had) tegen je zeggen…. niets is zo ongrijpbaar als een kind. Kinderen kun je wel zien als een gemiddelde van alle meetbare uitkomsten. Een gemiddelde van alle biologische processen en hun psychologische ontwikkeling, vaak geindiceerd door hun homoonhuishouding. We zijn als mensen allemaal uniek, maar nog steeds voor 99,99% gelijk. ZO ook onze pupillen… onze leerlingen.

    Ze ontwikkelen zich allemaal in hun eigen tempo, maar gemiddeld genomen kan ieder kind voor zijn 2e levensjaar lopen en voor zijn 4e levensjaar zijn plas en poep ophouden. Je ziet het zelfs in de blik van hun ogen, hoe rijp ze al dan niet zijn om bepaalde concepten te kunnen begrijpen. En als kinderen een leesvaardigheids achterstand van 2 jaar kunnen oplopen, of zo intelligent zijn dat ze klassen overslaan, dan kunnen die percentages idd negatief uitvallen of groter dan 100% zijn. Dit commentaar valt mijns inziens nergens op. Ik zie geen enkele wetenschappelijke onderbouwing door iemand die werkzaam is in het onderwijs en een statist weet beter dan iedereen, dat alle resutaten van onderzoek zodanig te manipuleren zijn, dat er naar een uitkomst toegeredeneerd kan worden. Kijk maar met de manier waarop er gemanipuleerd is met de wetenschappelijke en statische resultaten mbt Covid, waarbij voor het gemak niet alle variabelen meegerekend werden.

    Een prettige dag nog samen.

    Like

Trackbacks/Pingbacks

  1. Zaakkennis van de leraar niet belangrijk? | Blogcollectief Onderzoek Onderwijs - 13 oktober 2021

    […] Waarom Visible Learning van John Hattie pseudowetenschap is. […]

    Like

  2. Commissie Beter Onderwijs – rapport van het rapport | Blogcollectief Onderzoek Onderwijs - 21 november 2021

    […] – zeker als die mens ook een lezer is van OnderzoekOnderwijs en zich deze uitstekende post van René Kneyber herinnert. (Het gaat natuurlijk niet enkel over deze groepsblog: het werk van […]

    Like

  3. Geen punt.  | Blogcollectief Onderzoek Onderwijs - 23 januari 2023

    […] kader. 5Het werk van Hattie slikken we beter niet zomaar (zie bijvoorbeeld deze kritische bijdrage van René Kneyber), en de focus op leerrendement (door de “onderwijsmeetindustrie”, zoals […]

    Like

Geef een reactie of deel je eigen ervaringen. Graag met je volledige naam en achternaam ondertekenen, geen pseudoniemen. Anonieme reacties worden verwijderd.