Archief

Auteursarchief:

Een regelmatig terugkomende discussie.

Onderwijs is een doelgericht, georganiseerd en daarmee intentioneel proces (Romiszowski, 1981).

Er zijn specifieke doelen

Ja

Nee

Er is lesmateriaal

Ja

Onderwijs

Theater, museum bezoek, excursie, etc.

Nee

Stages, onderzoek, projecten

Incidenteel leren

Dus? Meestal wel, hangt van de voorbereiding van de school af.

Wanneer de discussie gevoerd wordt, gaat het meestal niet over het schoolreisje, maar over de kosten in geld en tijd. En of leuke dingen zoals skien of in de Italiaanse zon lopen, wel bij een school horen.

Met materiaal (werkboek, software, digitale bronnen) en opdrachten waarmee de activiteiten gestuurd worden en doelen behaald, ontstaat onderwijs. Ontbreekt een van de twee, dan is er wel sprake van leren, maar niet van schools onderwijs. Ook binnen schools onderwijs is er regelmatig sprake van niet-onderwijs, vooral wanneer nagelaten wordt de doelen te formuleren.

Bibliografie

Romiszowski, A. (1981). Designing instructional systems: Decision making in course planning and curriculum design. London: Kogan Page.

Waarom bevat ons onderwijs de thema’s die het nu kent? Waarom onderwijzen we wel Nederlands, wiskunde en geen bushcraft, schaken of bier brouwen? Legitieme vraag die in de sociale media nogal eens gesteld wordt, daar nogal eens negatieve reacties oproept en uiteindelijk zonder heldere conclusie opdroogt. Een poging om die vraag eens gedegen te benaderen.

Wat te onderwijzen?

Wat onderwezen moet worden is sinds de invoering van wat wij zien als onderwijs, onderwerp van discussie. Pratt (Pratt, 1980) verwijst naar de Griekse en Romeinse culturen waarin over dit onderwerp al geschreven wordt. Degene die volgens Pratt daar als eerste wat systematisch naar kijkt is Spencer (Spencer, 1890). Spencer introduceert een lijstje met criteria waarmee het mogelijk wordt om onderwijsinhoud op volgorde van belangrijkheid te zetten:

Our first stop must obviously be to classify, in the order of their importance, the leading kinds of activity which constitute human life. They may be naturally arranged into:—1. Those activities which directly minister to self-preservation; 2. Those activities which, by securing the necessaries of life, indirectly minister to self-preservation; 3. Those activities which have for their end the rearing and disciplinie of offspring; 4. Those activities which are involved in the maintenance of proper social and political relations; 5. Those miscellaneous activities which make up the leisure part of life, devoted to the gratification of the tastes and feelings.

Het spreekt voor zich, dat hoewel het lijstje universeel is, de uitwerking tijd en plaats gebonden is. Het stelt ieder in staat om het “te onderwijzen” te scheiden van het “niet te onderwijzen”.

Spencer noemt naar mijn mening een vrij technisch lijstje. Dewey (Wikipedia, John Dewey) kiest een andere invalshoek en heeft rond 1900 in de USA hierover veel gepubliceerd en geldt nog steeds als een invloedrijk denker op dit gebied. Hij vult het lijstje van Spencer verder in (en vult volgens mij dus niet aan) door ook expliciet naar de samenleving te kijken. Dewey noemt in zijn boek Democracy and Education (Dewey, 1916) o.a.

  • Onderwijs is er op gericht om de samenleving in stand te houden. Kennis, ervaring, normen en waarden worden daarom van generatie op generatie doorgegeven.
  • Onderwijs leert opgroeiende mensen wat hoort en wat niet hoort. Kinderen, jongeren, willen zaken die ze als volwassenen later niet meer willen. Het is de taak van onderwijs om hen dat duidelijk te maken. Op een schommel zitten is voor een kind van 10 prima, voor een puber van 15 een lolletje en voor een volwassene uitzonderlijk gedrag. Resultaat (mede) van onderwijs. Hiermee wordt de maatschappelijke orde en ordening in stand gehouden: van gewoontes, normen en waarden tot wetten.
  • Onderwijs moet opgroeiende mensen voorbereiden op het leven als volwassene: relatievorming, stichten van een gezin etc. Daartoe moet talent ontwikkeld worden zodat later in het eigen onderhoud voorzien kan worden. Deze ontwikkeling, in het Duits mooi “Ausbildung” genoemd, gaat over het ten volle benutten van de talenten van ieder mens. Of het nu gaat om loodgieter, balletdanser, docent of journalist.
  • Onderwijs neemt kennis samen, selecteert en actualiseert die kennis. Het onderwijs brengt hiermee de samenleving verder, innoveert en maakt het onderwijs een toekomstgerichte kracht in de samenleving. Zo is uiteindelijk de theorie dat de aarde plat is vervangen door de theorie (en later het bewijs), dat de aarde min of meer rond is.

Deze punten, uiteindelijk meer filosofisch van aard, geven invulling aan het antwoord op de vraag waarom we onderwijs hebben en daarmee een begin aan een antwoord op de vraag wat er onderwezen moet worden.

Progressief / conservatief

De hier van Dewey geparafraseerde punten illustreren een wankel evenwicht: onderwijs is enerzijds diep conservatief: normen en waarden van de ouders en de bestaande maatschappij worden vastgehouden en doorgegeven. Anderzijds dient onderwijs de samenleving te innoveren en het individu voor te breiden op de veranderde samenleving, zelfs zonder harde kennis over hoe de samenleving er uit zal zien.

Vanuit het conserverende zal de oudere generatie vaak zeggen “leren ze dit niet meer op school”, een bericht dat regelmatig in de maatschappelijke discussie naar boven komt. Daartegenover staan bijvoorbeeld de oproepen van werkgevers om het onderwijs te laten aansluiten bij de technologie (in de breedste zin), van morgen.

Levert relatief neutrale vakinhoud al discussie op, zodra discussie over normen en waarden gaat, komt het maatschappelijk debat over “hoe het hoort” in alle hevigheid naar boven. Vooral wanneer de normen en waarden van subgroepen niet overeen komen met die van de rest van de samenleving. Denk bv. aan de discussie over het onderwijs over de evolutietheorie en het confessioneel onderwijs.

Tijdsduur

Hoewel Dewey in zijn werk juist regelmatig het accent legt op persoonlijke ontwikkeling, voegt hij daar ook de eis van efficiency aan toe. Pratt citeert Dewey:

The subject announced for today was “Waste in Education.”… It deals with the question of organization, because all waste is the result of the lack of it, the motive lying behind organization being promotion of economy and efficiency. These matters count; but the primary waste is that of a human life, the life of the children while they are at school, and afterward because of inadequate and perverted preparation.

Tijdens mijn studie Toegepaste Onderwijskunde heb ik college gehad van prof. Wim Nijhof. Hij kon zeer eloquent duidelijk maken dat onderwijs gehouden is om zuinig om te gaan met de tijd van leerlingen. Het is immers het enige en het meest kostbare wat telt in een mensenleven, de tijd die jouw leven duurt. Geen ander heeft zonder bijzonder goede reden, de tijd die je hebt op aarde, van een ander af te nemen en voor die ander in te vullen (Nijhof, 1983). Dit argument wordt aangevuld met maatschappelijke en economische argumenten over de meest wenselijke duur van het verplichte onderwijs. Elk jaar dat een kind onderwijs volgt kost de samenleving geld waar opbrengsten voor verlangd worden. Opbrengsten die niet altijd direct zichtbaar of kwantificeerbaar zijn.

Samengenomen moet onderwijs dus zorgen voor de ontwikkeling van jonge mensen naar volwassenheid door hen in de breedte te ontwikkelen in een zo kort mogelijke tijd met de meest actuele kennis die relevant is voor het nu en het straks.

In Nederland

In Nederland is er beperkte vrijheid van onderwijs, die richt zich vooral op de vrijheid van (geloofs-) richting (Wikipedia, Vrijheid van onderwijs). De inhoud van het onderwijs wordt door de regering bepaald. Aangezien de regering door het parlement gecontroleerd wordt, bepalen uiteindelijk alle burgers van Nederland (indirect) de inhoud van het onderwijs. Wanneer scholen hiervan afwijken wordt duidelijk welke middelen ingezet worden om de rijen weer gesloten te krijgen: leerlingen voldoen niet aan de leerplicht, ouders krijgen een boete; scholen worden negatief beoordeeld en uiteindelijk wordt de financiering ingetrokken (Wikipedia, De Kampanje) waarna de school gemarginaliseerd wordt en op den duur verdwijnt.

Dergelijke sturing door de overheid dient enerzijds om de maatschappelijke coherentie in stand te houden, anderzijds om de individuele kinderen te “beschermen” tegen onderwijs waarvan niet inzichtelijk is of dit leidt tot het resultaat dat door de samenleving als nastrevenswaardig gezien wordt. Het belang van de samenleving ontstijgt dat van het individu.

Bibliografie

Dewey, J. (1916). Democracy and Education: An Introduction to the Philosophy of Education. New York: Macmillan.

Nijhof, W. (1983). College Onderwijsfilosofie. Enschede.

Pratt, D. (1980). Curriculum: Design and Development. London: Harcourt Brace Jovanovich.

Spencer, H. (1890). Education: Intellectual, Moral, And Physical (1891 ed.). New York: D. Appleton And Company.

Wikipedia. (n.d.). De Kampanje. Retrieved 05 09, 2013, from Wikipedia: http://nl.wikipedia.org/wiki/De_Kampanje

Wikipedia. (n.d.). John Dewey. Retrieved 05 07, 2013, from Wikipedia: http://nl.wikipedia.org/wiki/John_Dewey

Wikipedia. (n.d.). Vrijheid van onderwijs. Retrieved 05 09, 2013, from Wikipedia: http://nl.wikipedia.org/wiki/Vrijheid_van_onderwijs

Door Paul Ket

Toetsen en docenten horen bij elkaar als Brussel en Manneke Pis. Niet zonder discussie, maar het is, hoe er ook tegenaan gekeken wordt, een essentieel onderdeel van het werk van een docent om een oordeel over het leren van een leerling uit te spreken. En wanneer je dat doet, al dan niet met tegenzin, is het zaak om dat volgens de regelen der kunst te doen. Over de voorbereiding van toetsen zijn bibliotheken volgeschreven, over het nawerk weinig. Deel vijf over een eerste statistische analyse van de toets.

Vooraf

Het is voor elke statistische analyse van belang dat de vragen en de punten, te verkrijgen en toegekend, in de computer terecht komen. Excel is hiervoor de eerste keuze. Hoewel de beschreven methodieken uit 1962 komen, ver voor de brede beschikbaarheid van de computer.

Gemiddelde

Elke docent rekent als eerste het gemiddelde van de behaalde cijfers uit. Dat kan ook met de toegekende punten. Voor de betekenis van de uitkomst maakt het niet uit, voor de vergelijkbaarheid wel. Omzetten naar schoolcijfers maakt gemiddeldes onderling vergelijkbaar. Het (rekenkundig) gemiddelde is een centrummaat, het geeft een samenvatting van de punten per leerling door het middelen. Andere centrummaten zoals de modus en de mediaan worden in het onderwijs nauwelijks gebruikt voor het rapporteren over behaalde punten.

Moeilijkheid

De moeilijkheid van een (deel-)opgave kan worden berekend door het percentage toegekende punten voor die opgave te bepalen (Ebel, 1972). Bij een incidentele afname van de toets geeft de moeilijkheid alleen informatie over hoe deze leerlingen deze opgave gemaakt hebben en als moeilijk of niet hebben ervaren. De oorzaak van het al dan niet moeilijk ervaren, dient verder onderzocht te worden.

Wanneer de moeilijkheid handmatig berekend wordt, kan, aldus Ebel, volstaan worden met het berekenen van het percentage toegekende punten van de onderste en bovenste 27% procent van de behaalde scores. Wanneer de behaalde punten per opgave in Excel staan, kunnen alle uitkomsten hierbij betrokken worden.

Ebel geeft geen norm voor wat een ideale moeilijkheid zou moeten zijn. De na te streven waarde hangt af van het doel van de betreffende opgave. Zo is in een proefwerk de eerste opgave meestal een relatief eenvoudige binnenkomer. Daar wil je dus een hoog percentage. De opgave bedoeld om de slimme leerlingen nog even uit te dagen, zou een laag percentage moeten hebben.

Bij meerkeuze-opgaven heet de moeilijkheid de p-waarde.

Voorbeeld:

Voor een open vraag kunnen 7 punten behaald worden. De (kleine) groep leerlingen die deze op gave maakt behalen: 3, 5, 2, 6, 5, 7, 3, 1, 6, 0, 6, en 5 punten. Bij elkaar 49 punten. Het gemiddelde is 4 punten. Het maximaal te behalen aantal punten is 12 x 7 = 84 punten. Dan zijn 58% van de punten toegekend.

Discriminatie-index (D)

Opgaven in een proefwerk hebben tot doel onderscheid te maken tussen leerlingen die de opgave wel en niet kunnen maken. Dit is cruciale informatie voor de docent. Het percentage punten dat de sterke leerlingen meer behalen dan de zwakke leerlingen, geeft het discriminerend vermogen van de opgave aan (Ebel, 1972). Ebel geeft het volgende stappenplan:

  1. Sorteer de leerlingen op de toetsscore van laag naar hoog.
  2. Selecteer de leerlingen met de 27% laagste scores en de 27% hoogste scores.
  3. Bepaal voor deze deelgroepen per opgave de som van aantal punten dat behaald is.
  4. Bepaal het verschil tussen de somscores.
  5. Deel het verschil door het aantal punten dat deze twee deelgroepen had kunnen behalen om de Discriminatie-index te verkrijgen.

Voorbeeld

Behaalde punten: 3, 5, 2, 6, 5, 7, 3, 1, 6, 0, 6, 5
Gesorteerd: 0, 1, 2, 3, 3, 5, 5, 5, 6, 6, 6, 7
Onderste 27%: 0, 1, 2. Som = 3.
Bovenste 27%: 6, 6, 7. Som = 19.
Verschil: 19 – 3 = 16.
Maximaal te behalen door 6 leerlingen: 6 x 7 = 42.
Discriminatie-index = 16 / 42 = 0,38.

Wanneer uitgegaan wordt van alle leerlingen, komt de Discriminatie-index lager uit. Voor de zoals hierboven berekende waarden voor D geeft Ebel de volgende indeling:

0,4 en hoger: Zeer goede items
0,3 t/m 0,39: Redelijk goede items, wellicht zijn verbeteringen mogelijk.
0,2 t/m 0,29: Marginale items, aanpassing hiervan is noodzakelijk.
Onder de 0,19: Slechte items, dienen verwijderd of verbeterd te worden.

D is, aldus Ebel, wel afhankelijk van de leerlingengroep. Alleen bij grote aantallen neemt de invloed van de groep af.

Gebruik

Hiervoor zijn drie maten besproken. De eerste, het gemiddelde, is een centrummaat voor de gehele toets. Alleen wanneer deze opvallend afwijkt van de 6, zal er verder gekeken worden naar of de leerlingen of de toets.

De twee andere maten geven informatie over de opgaven binnen de toets. De eerste, de moeilijkheid, geeft aan in hoeverre leerlingen in staat gebleken zijn om punten te behalen voor die opgave. Opgaven vervullen binnen een toets een verschillende rol, dus hoewel we voor gewone opgaven een moeilijkheid rond de 50% zouden willen hebben, zijn er zeker redenen te noemen om hier van af te wijken.

De tweede, de Discriminatie-index D, laat zien in hoeverre een opgave onderscheid maakt tussen sterke en zwakke leerlingen.

Deze drie getallen dienen weloverwogen en in samenhang bekeken te worden. Ook de marges die Ebel geeft voor de D, zijn indicatief aangezien toeval zeker invloed heeft op de D.

Bibliografie

Ebel, R. L. (1972). Essentials of Educational Measurement (2 ed.). Englewood Cliffs, NJ.: Prentice-Hall Inc.

Om de zoveel tijd komt de discussie weer naar boven: ze kunnen niet eens meer… Dan gaat het over een particuliere waarneming dat een kind/leerling op school iets nog niet geleerd heeft wat de spreker zelf rond die leeftijd wel al onder de knie had. Vier redenen waarom dat kan voorkomen, met toelichting voornamelijk geïllustreerd vanuit de wiskunde, daar weet ik het meeste van.

  1. Het onderwerp is vervallen. Thema’s in het onderwijs komen en gaan. Het onderwijs past zich aan aan de samenleving. Onder invloed van maatschappelijke organisaties komen er steeds weer nieuwe onderwerpen bij en moeten andere onderwerpen afvallen. Daarnaast zijn er bij verschillende vakken jaarlijks wisselende thema’s. Bij wiskunde is de graaf een (relatief) nieuw onderwerp (voorbeeld: kaart van spoorwegnet).
    Deze veranderingen worden doorgevoerd na lange discussie met betrokkenen (politiek, maatschappelijke organisaties, vakverenigingen) en vastgelegd in de syllabus voor het eindexamen, uitgegeven door CvE.
  2. Het belang van het onderwerp is anders. Moderne techniek, bijvoorbeeld de rekenmachine, maakt dat bijvoorbeeld het benaderen van een wortel in de wiskunde geen onderwerp meer is. Het principe wordt onderwezen, de moeilijke toepassingen worden opgelost met de rekenmachine. De vrijgekomen tijd wordt (in het ideale geval) besteed aan andere onderwerpen binnen het vak.
    Daarnaast is er de afgelopen jaren het onderwijs aangepast aan het nut voor die doelgroep. Rekenen en wiskunde voor het VMBO is er om later in het MBO toe te passen en heeft weinig affiniteit met stellingen en bewijzen, maar is slechts een hulpmiddel ten behoeve van andere vakken. Wiskunde in het VWO is er ter voorbereiding op een universitaire studie en meer een zelfstandig doel. Ziet er dus in de bovenbouw heel anders uit.
    Deze veranderingen worden doorgevoerd na lange discussie met betrokkenen en vastgelegd in de syllabus voor het eindexamen, uitgegeven door CvE.
  3. De volgorde van de onderwerpen is aangepast. Sommige schoolvakken bouwen vanaf het eerste leerjaar langzaam op. Andere zijn meer een samenhangende puzzel van individuele onderwerpen waarbij de volgorde niet veel uitmaakt. Dan kan het voorkomen dat een onderwerp verschoven wordt van bijvoorbeeld begin leerjaar 2 naar eind leerjaar 3. Vaak is hier een goede reden voor. Zo wordt de volgorde bij natuurkunde nog wel eens aangepast aan de volgorde bij wiskunde, de grammatica bij Frans aangepast aan de volgorde bij Nederlands, enz.
    Deze veranderingen worden vormgegeven enerzijds door de gebruikte methode, anderzijds door de docenten zelf. Ze weerspiegelen de visie van de school. Het eindexamen vormt een ijkpunt dat voorkomt dat de methode of de school uit de bocht vliegt.
  4. De didactiek is aangepast. Vroeger werd de stelling van Pythagoras op de Mavo onderwezen met a-kwadraat is b-kwadraat plus c-kwadraat. In de praktijk bleek vaak dat dit door leerlingen niet begrepen werd, maar gewoon mechanisch opgevolgd. Met alle fouten van dien. Want de stelling geldt alleen wanneer de bedoelde rechthoekige driehoek volgens alle geldende wiskundige regels getekend wordt. Een grote ver-van-mijn-bed-schow. Terwijl bij de lessen techniek de leerlingen met een 3,4,5-driehoek prima een werkstuk haaks afgemeten krijgen. Dus heeft de wiskunde het nu over rechthoekszijden en de lange zijde en gaat het toepassen van Pythagoras aanzienlijk vaker succesvol.
    Deze veranderingen worden vormgegeven enerzijds door de gebruikte methode, anderzijds door de docenten zelf. Ze weerspiegelen de visie van de school. Het eindexamen vormt een ijkpunt dat voorkomt dat de methode of de school uit de bocht vliegt.

Discussies over de inhoud van het onderwijs zijn van alle tijden. Mopperen op de jeugd van tegenwoordig ook. Echter, de leerlingen zijn in deze discussie geen partij, het zijn de keuzes van de politiek en de scholen die tot het onderwijs leiden wat onze leerlingen krijgen.

De discussies worden veelal gevoerd vanuit een particuliere waarneming en hebben een hoog “wat voor mij goed was, is ook voor een ander goed” gehalte, waarmee de professionaliteit van de docenten die elke dag voor de klas proberen het beste uit de leerlingen te halen, ter discussie wordt gesteld.

Paul Ket

Toetsen en docenten horen bij elkaar als Duitsland en het Oktoberfest. Niet zonder discussie, maar het is, hoe er ook tegenaan gekeken wordt, een essentieel onderdeel van het werk van een docent om een oordeel over het leren van een leerling uit te spreken. En wanneer je dat doet, al dan niet met tegenzin, is het zaak om dat volgens de regelen der kunst te doen. Over de voorbereiding van toetsen zijn bibliotheken volgeschreven, over het nawerk weinig. Deel drie over het belang van werken volgens de regelen der kunst, namelijk de fouten die er gemaakt worden.

Loopbaan

Gedurende de schoolloopbaan van een Nederlander, worden er over hem/haar een groot aantal beslissingen genomen. Het proefwerk is gemaakt, de beslissing van de docent is dat er een voldoende gegeven wordt.

Volgens de klassieke testtheorie (dit is een naam, geen beschrijving), kan het niet anders dan dat er bij een meting een meetfout gemaakt wordt. Net zoals de thermometer in een beker water het water iets opwarmt (of afkoelt), creëert de toetssituatie een kunstmatigheid die de prestatie beïnvloedt. Ondanks die meetfout wordt er toch een beslissing genomen.

Mogelijkheden

Wanneer er een beslissing genomen moet worden, dan zijn er vier mogelijkheden die in de tabel weergegeven zijn (vrij naar Slotboom) (Slotboom, 1996).

Werkelijke toestand
Onbekwaam Bekwaam
Oordeel docent Onbekwaam Correcte beslissing.Leerling krijgt onvoldoende Foute beslissing.Leerling krijgt onvoldoende.

Type II

Bekwaam Foute beslissing.Leerling krijgt voldoende.

Type 1.

Correcte beslissing.Leerling krijgt voldoende.

Belangrijk hierbij is dat we de “Werkelijke toestand” niet weten. Immers, als er altijd en steeds weer een meetfout gemaakt wordt, weten we niet wat de werkelijkheid is.

In de wetenschap wordt er, wanneer er onderzoek gedaan wordt naar het effect van bijvoorbeeld een nieuwe onderwijsmethode, gestart met de gedachte dat de nieuwe methode even goed / slecht is als de oude. De eerste fout die je dan kan maken, is dat je een leerling bekwaam verklaart, terwijl deze dat niet is. Dit heet een Type 1 fout. Je kan ook concluderen dat de leerling niet bekwaam is, terwijl deze het wel is. Dit heet een Type 2 fout. De twee overgebleven vakjes in het schema geven de correcte beslissingen weer.

Het meest erg..

In de wetenschap is er een niet aflatende discussie welke Type fout met meest verwerpelijk is. Dat blijkt per wetenschapsgebied te verschillen. De Type 1 fout is de onterechte voldoende. De schade hiervan komt vooral bij de maatschappij te liggen: een diploma dat minder waard is dan gedacht, fouten gemaakt bij het werk enz. De Type 2 fout is de onterechte onvoldoende. De schade hiervan komt vooral bij de leerling te liggen. Extra studietijd, zitten blijven, diploma niet halen enz. De individuele schade die uiteindelijk ook leidt tot maatschappelijke schade: langere verblijftijd in het onderwijs kost nu eenmaal geld.

De schade, vooral aan de individuele leerling, moet voorkomen worden, want voor de economische schade komt de individuele emotionele schade. Die schades voorkomen is ook de taak van de docent.

Paul Ket

Boek

Slotboom, A. (1996). Statistiek in woorden. De meest voorkomende termen en technieken. (2 ed.). Groningen: Wolters Noordhoff.

Toetsen en docenten horen bij elkaar als Engeland en hete curry. Niet zonder discussie, maar het is, hoe er ook tegenaan gekeken wordt, een essentieel onderdeel van het werk van een docent om een oordeel over het leren van een leerling uit te spreken. En wanneer je dat doet, al dan niet met tegenzin, is het zaak om dat volgens de regelen der kunst te doen. Over de voorbereiding van toetsen zijn bibliotheken volgeschreven, over het nawerk weinig. Deel twee van de poging om een best practice voor dat natraject te formuleren. Hierin aandacht voor het nakijken van open vragen.

Open vragen

Voor wat precies een open vraag is, gaan we te raden bij Ebel (Ebel, 1972). Hij gebruikt het woord essay, wat een langer antwoord suggereert. Hij stelt: “An essay test question requires the student to plan his own answer and to express it in his own words. An objective test item requires him to choose among several designated alternatives”. Uit deze omschrijving blijkt overigens het lange antwoord niet, wel stelt hij het tegenover gesloten antwoorden. Ik zou het niet tegenover gesloten vragen willen stellen, aangezien er ook nog half open vragen zijn.

Voorbeeld gesloten vraag:

Geef de formule bij de stelling van Pythagoras.

Voorbeeld half open vraag:

Noem drie van de vijf factoren die tot de oorzaken van de beurskrach van 1929 worden gerekend.

Voorbeeld open (essay) vraag:

Bespreek de ontwikkelingstheorie van Vygotsky.

Uit de omschrijving van Ebel blijkt (deels) wat de breedte van een open vraag kan zijn. Een opgave van waarin een zelfgeformuleerd antwoord wordt gevraagd waarbij het ideale antwoord in lengte kan variëren van twee zinnen tot aan een compleet boek. Met dit in gedachten, eerst aandacht voor correct nakijken en daarna een poging om tot aanbevelingen te komen.

Correct nakijken

Bij toetsen is het belangrijk dat ze correct worden nagekeken. Dit is een on-wetenschappelijke omschrijving, maar die wel aansluit bij wat leerlingen en docenten vinden. Wanneer er doorgevraagd wordt, dan blijkt dat het belangrijk is dat wat in het onderwijs (les, boek, betrouwbare bron) als correct is aangeduid, dat ook is in de toets. Daarnaast moet wat bij de ene leerling goed / fout gerekend is, ook bij de andere goed / fout gerekend worden. Als laatste moet het niet uitmaken wie nakijkt: verschillende docenten moeten tot hetzelfde oordeel komen.

De eerst eis wordt in de methodologie (meettechniek) aangeduid met inhouds-validiteit. De toets en het beoordelen van het werk, moet passen bij hetgeen onderwezen is. Een belangrijk deel van de zorg hiervoor zit bij de voorbereiding en laat ik buiten beschouwing.

De tweede eis heet intra-beoordeler betrouwbaarheid. Dat die ene docent, betrouwbaar is in zijn oordeel bij alle leerlingen. Lastig genoeg bij elke toets, bij open vragen een grote zorg.

De laatste eis heet de inter-beoordeler betrouwbaarheid. Dat twee of meer nakijkers tot hetzelfde resultaat komen.

Bij deze drie vereisten speelt mee, dat naarmate de meetschaal fijnmaziger is, de betrouwbaarheid afneemt en omgekeerd: wanneer de schaal algemener is, de betrouwbaarheid toeneemt. Immers: wanneer er veel goedgerekend kan worden, worden er makkelijker punten toegekend en komt het minder vaak voor dat er onterecht een puntje teveel of te weinig gegeven wordt. Het is dan ook gemakkelijker om tot eenzelfde oordeel te komen, ook wanneer verschillen in oordeel veroorzaakt worden door de beoordelaar. Naarmate de beoordelingsschaal gedetailleerder is, neemt de overeenstemming tussen beoordelaars af.

Anders dan bij meerkeuze-vragen is bij open vragen subjectiviteit een thema waar aandacht voor nodig is. Douwsma en Horsten (Dousma & Horsten, 1989) noemen drie problemen:

  • De eerste toetsen worden nauwkeuriger nagekeken dan de overige.
  • Wanneer een opvallend goed antwoord in de toets van leerling A gevonden wordt, wordt de toets van leerling B, direct daarna, strenger nagekeken.
  • Het uiterlijk van het werk speelt een grote rol.

Daarnaast spelen halo- en self-fulfilling prophecy effecten een grote rol (Holzhauer & Minden, 1978). Goede leerlingen krijgen een betere beoordeling dan zwakkere leerlingen voor hetzelfde werk.

Aanpak

Dat er bij het nakijken van open vragen verschillen in beoordelingen ontstaan, is min of meer onvermijdelijk. Die verschillen wegwerken kost onevenredig veel inspanning, tijd en dus geld. Wanneer je dit weet, is het zaak hier naar te handelen. Het kost minder tijd en inspanning om de beoordeling zo te organiseren dat de fouten wanneer ze gevonden worden, eenvoudig te herstellen zijn. Om dit mogelijk te maken, moet het nakijken, de correctie, voor de leerling te volgen zijn. Dit verlangt van de docent veel schrijven op het gemaakte werk.

Open vragen globaal beoordelen

Er is in de universitaire wereld veel onderzoek gedaan naar de overeenstemming bij verschillende beoordelaars over eindscripties of promoties. Daarbij is vooral gekeken of verschillende beoordelaars tot eenzelfde oordeel komen bij de beoordeling van één werkstuk (daar helaas even geen literatuurreferentie). De overeenstemming tussen beoordelaars blijkt dan snel minder dan 50% te zijn. Dit pleit voor een globaal oordeel, dit geeft immers de meeste kans op overeenstemming tussen de twee (of meer) beoordelaars.

Ebel (Ebel, 1972) suggereert het maken van stapels aan de hand van een twee- drie- of vierdeling en het geven van een etiket aan zo’n stapel. Nogal eens wordt volstaan met een driedeling: goed, matig, onvoldoende, waarbij matig nog net een voldoende is. Naarmate de opdracht meer open is en het werk erg verschillend is, is dit een eerlijke methode: immers, een voldoende kan met heel verschillend werk behaald worden.

Vanuit de leerlingen zal er behoefte zijn aan een onderbouwing van het oordeel. Hiermee ontstaat vrij eenvoudig een checklist, iets wat bij globaal beoordelen nu juist niet de bedoeling is. Om dit de voorkomen zal de nadruk moeten liggen op het feit dat iedere toets als zelfstandige eenheid beoordeeld is en daarmee beoordelingselementen mogen verschillen.

Aanpak

Bij een toets die één of meer open vragen bevat, worden de vragen stuk voor stuk nagekeken. Dus eerst alle opgaven 1, dan alle opgaven 2 enzovoorts. Bij het lezen van alle opgaven 1, wordt direct een stapel gekozen. Het gemaakte werkt wordt dus op niveau van het antwoord op opgave 1 gesorteerd. Vervolgens wordt beoordeeld of al het gemaakte werk in één stapel gelijkwaardig is. Uiteindelijk wordt het label of de punten bij het label, bij de opgave op het werk geschreven. Dit proces herhaalt zich totdat alle open opgaven beoordeeld zijn.

Een dergelijk proces kan ook toegepast worden bij werkstukken, scripties of zelfs boeken. Alleen neemt het leeswerk navenant meer tijd in beslag. Vermoeidheid en verveling of zelfs irritatie over gebrekkig werk, kunnen hierbij een grote invloed hebben op het oordeel. Een constatering van Ebel die ik helaas uit eigen ervaring moet onderschrijven (wat weer leidde tot twee keer nakijken).

Open vragen met een checklist beoordelen

Bij een open vraag kan natuurlijk bij het maken van de toets een lijst(je) gemaakt worden van de gewenste en ongewenste antwoorden (elementen). De checklist kan de vorm van een correctievoorschrift krijgen zoals bij elk eindexamen.

Elk jaar weer wordt duidelijk dat aan deze aanpak grenzen zitten: niet elk antwoord is voorzienbaar. Een checklist kan meer of minder gedetailleerd zijn. De 100-woorden eis bij de stelopdracht Nederlands is enerzijds heel algemeen, er worden geen eisen aan die woorden gesteld, anderzijds heel specifiek: één teveel is een fout. Het nakijkvoorschrift bij de wiskunde eindexamens schrijft meestal één of twee oplossingsmethodes voor, waarbij zéér gedetailleerd punten voor elke tussenstap worden toegekend. Een Rubric (Wikipedia) is een speciale vorm van een checklist. De checklist kan ook de eigen uitwerking door de docent zijn.

Uit het onderzoek naar de beoordeling van scripties komt naar voren dat de meeste beoordelaars zich eerst een globaal oordeel vormen om vervolgens met de checklist in de hand de onderdelen zodanig te scoren dat dat globale oordeel het eindoordeel is. De onderdelen van de checklist fungeren dan als onderbouwing van het algemeen oordeel. Vanuit de natuurwetenschappen komt een tweede verklaring voor de verschillen: elke meting heeft een meetfout. Naarmate er meer metingen gedaan worden, neemt het effect van die meetfout toe. Elk onderdeel van de checklist kan gezien worden als een meting. Meer elementen in de checklist, leidt dus tot meer verschillen tussen beoordelingen.

Vooral bij groter werk, kan de mening ontstaan dat de score op de elementen niet de score voor het geheel goed weergeeft. Blijkbaar worden er bij de deelelementen zaken gemist of krijgen een verkeerde waardering. Deze spanning zit altijd bij het beoordelen van open opdrachten met een checklist.

Omdat een checklist gedetailleerd nakijken veronderstelt, ontstaan er verschillen tussen beoordeelaars. Docenten met examenklassen ervaren de praktijk hiervan elk jaar weer. Ook als er redelijk wat overeenstemming is, zou de overeenstemming groter zijn, wanneer er algemener nagekeken zou mogen worden.

Aanpak

Ook bij het beoordelen van open vragen met een checklist wordt opgave voor opgave nagekeken. Bij elk werk wordt beoordeeld of en in welke mate aan het gestelde in de checklist wordt voldaan. Het element uit de checklist dat de doorslag gegeven heeft, wordt, samen met de punten, op het werk genoteerd.

Open vragen ombouwen naar gesloten

Een andere aanpak is om wel open vragen te stellen, om daarna aan de hand van de gegeven antwoorden een lijst op te stellen van die antwoorden en die van een punten te voorzien. Op deze manier wordt een open opgave een meerkeuze-opgave.

Met deze aanpak wordt bij de beoordeling aangesloten bij wat de leerlingen aan de docent aanbieden, wat meer aansluit bij het globaal beoordelen, terwijl wel met de precisie van het werken met een checklist tot een oordeel gekomen wordt. En inderdaad, er kunnen lange lijsten komen, maar nergens staat dat een meerkeuze-opgave zich moet beperken tot een keuze uit vier. De lijst met antwoorden geeft naderhand inzicht in hoe de leerlingen de opgave en de lesstof begrepen hebben en is daarmee voor elke docent van grote waarde.

Deze werkwijze lijkt wellicht de deur open te zetten tot willekeur en grote verschillen tussen beoordelaars. Echter, over de analyse van kwalitatief materiaal, waar we het hier over hebben, bestaat in de wetenschappelijke wereld een duidelijke consensus over wat wel en wat niet. Zie bijvoorbeeld Miles en Huberman (Miles & Huberman, 1994).

Aanpak

Het werk wordt per opgave nagekeken in twee rondes. In een eerste ronde worden alle verschillende gegeven antwoorden geïnventariseerd. Elke antwoord krijgt vervolgens een puntenaantal toegekend. In de tweede ronde wordt vervolgens bij elke leerling genoteerd welk antwoord uit de lijst gegeven is en wordt het puntenaantal in de kantlijn genoteerd.

Na afloop

Na afloop van het beoordelen, worden de op het werk genoteerde punten overgenomen in het rekenblad.

Tot slot

Uit het voorgaande blijkt wel dat het beoordelen van wat Ebel een essaytest noemt, bij het beoordelen nogal wat haken en ogen zitten. Bij andere toetsvormen zitten die haken en ogen bij de voorbereiding. Wellicht zijn er nog meer tips en praktische aanwijzingen. Laat het weten!

Bibliografie

Dousma, T., & Horsten, A. (1989). Tentamineren (2 ed.). Groningen: Wolters-Noordhoff b.v.

Ebel, R. L. (1972). Essentials of Educational Measurement (2 ed.). Englewood Cliffs, NJ.: Prentice-Hall Inc.

Holzhauer, F., & Minden, J. v. (1978). Psychologie: Theorie en Praktijk (2 ed.). Leiden: Stenfert Kroese.

Miles, M. B., & Huberman, A. M. (1994). Qualitative Data Analysis: An Expanded Sourcebook (2 ed.). Thousand Oaks, USA: Sage.

Wikipedia. (sd). Rubric (Academic). Opgeroepen op 10 07, 2012, van Wikipedia: http://en.wikipedia.org/wiki/Rubric (academic)

 

Wanneer je ergens je mening over geeft, dan is het belangrijk het eigen referentiekader te benoemen. Voor de bespreking van dit artikel is dat zeker van belang. Daarom deze start: ik heb aan de Universiteit Twente Toegepaste Onderwijskunde gestudeerd. Onderwijskunde zoals aangeboden was strak en zakelijk gericht op het zo efficiënt overdragen van kennis, zodat de beroepsuitoefening van de postbode of manager beter zou verlopen. Niks geen gedachten over persoonlijke ontwikkeling, noch bij kinderen, noch bij volwassenen. In de vierjarige studie was er één boek Didactiek in een bibliotheek aan Instructional Design. Didactiek was daarmee een andere wereld. Vaag, zweverig, normatief en onbegrepen. Sinds die tijd (eind jaren ’90 vorige eeuw), is er veel veranderd en toch weer niet in deze twee vakgebieden. Het verhaal hoe deze twee stromen in de onderwijskunde zich ontwikkelen heb ik niet aandachtig gevolgd en dat was goed. Tot dit artikel langs kwam.

Zierer en Seel (Zierer & Seel, 2012) bespreken de ontwikkeling van Instructional Design en Algemene Didactiek over de jaren heen. Ze beschrijven de respectievelijke geschiedenis, schetsen de problemen, noemen veel namen en modellen en komen tot een conclusie. Het is een compact geschreven verhaal dat bol staat van de verwijzingen. Een gesorteerde omgevallen boekenkast, zoals je van een meta-analyse mag verwachten. De print van het artikel, zo’n 40 velletjes dubbelzijdig, is voor de helft literatuurlijst. Zo maken zij duidelijk dat ze getracht hebben compleet te zijn, wat hun achtergrond is zonder hierbij hun Rijnlandse roots van Bildung, pedagogiek en normatief handelen expliciet te benoemen.

Algemene Didactiek

De start is met Algemene Didactiek. Na de vraag wat Algemene Didactiek is, beginnen ze bij de oude Grieken en lopen dan de wereldgeschiedenis door om bij het heden uit te komen. Didactiek richt zich hierbij op de vraag wat er onderwezen moet worden en op welke wijze dat dient te geschieden. Zo dient rekenen gegeven te worden met ruime oefening, omdat doorzettingsvermogen een nastrevenswaardige persoonlijke eigenschap is. Aan het einde van het historische overzicht signaleren zij dat de Algemene Didactiek vastgelopen is. Het thuisland van de didactiek, Duitsland, blijkt in de PISA onderzoeken tot de middenmoot te behoren, ondanks de vele jaren aan onderzoek over het belang en de invulling van de Bildung. Deze constatering heeft tot een crisis en veel onderzoek in de didactiek geleid. Constatering was: docenten vinden Didactiek onnodig ingewikkeld en gebruiken het niet. En een theorie die niet gebruikt wordt, is blijkbaar geen goede theorie. Als “redding” van de Algemene Didactiek zien de auteurs enerzijds in de vakdidactiek (in contrast tot de algemene didactiek), anderzijds de didactiek over het onderwijs dat docenten zelf niet gevolgd hebben. Zij verwijzen hierbij naar een studiehuis-achtige aanpak.

Hier loop ik tegen twee problemen aan: allereerst wat is Bildung nou precies? Ook Zierer en Seel gebruiken het Duitse woord in het in het Engels geschreven artikel. En als het begrip zo lastig is, waar gaat die Algemene Didactiek dan over? Het is een rationele, wellicht reductionistische vraag over een in essentie normatief wellicht holistisch begrip. Dit spanningsveld is komt mooi naar voren in ‘Zen and the art of motorcycle maintenance’ (Prisig, 1974).

Ten tweede vind ik hen te streng. Natuurlijk rapporteren docenten dat Didactiek niet nuttig is. Net zomin een rijschool nuttig is voor iemand met jaren rijervaring. Maar je kan toch niet zonder. En wanneer ik Beknopte Didaxologie (De Corte, Geerligs, Lagerweij, Peters, & Vandenberghe, 1981) weer eens doorblader zie ik een schat aan praktijkervaring samengenomen met gedegen theorieën die bij elkaar elke docent een stevig fundament geven. Wel theorieën die toen ik studeerde ver van mij af stonden omdat ik te weinig praktijkervaring had, maar nu ik in het VO werk, zeer relevant zijn. Maar… niet gebruikt worden docenten, want onbekend maakt onbemind. En ook: het zijn praktijktheorieën. Beweringen opgesteld uit de praktijk, die weergeven wat ervaren docenten doen. Dergelijke theorieën zijn voor ervaren docenten overbodig, terwijl ze voor jonge docenten nog weinig betekenis hebben omdat zij te weinig praktijkervaring hebben. Een typisch geval van én door de hond én door de kat gebeten worden. De auteurs schrijven de Algemene Didactiek naar mijn mening te snel af. Al die kennis en ervaring, neergeslagen in de didactiek, zouden weer teruggebracht moeten worden naar de praktijk, net zoals een advocaat regelmatig op opfriscursus gaat.

Instructional Design

De opzet van het deel over Instructional Design is analoog. De andere focus van Instructional Design, maakt echter wel de discussie anders. I.D. richt zich op het vormgeven van onderwijs- of instructiemomenten met als doel om die te optimaliseren. De vraag wat er onderwezen moet worden is een rationele, in plaats van een normatieve. Het gaat hier om ‘Needs Assessment’ niet om ‘Bildung’. Zo hoeft een ambulance-verpleegkundige geen beter mens te worden door een diep inzicht in de filosofie, als de mond-op-mond beademing maar goed toegepast wordt. De nadruk op rationaliteit en toepasbaarheid is in de bedrijfsopleidingen een pluspunt, maar in het gewone reguliere onderwijs een minpunt. De nadruk op rekenen, toetsen en cognitie sluit aan bij de aannames van Instructional Design en staat op gespannen voet met de visie dat onderwijs ook bij moet dragen aan de ontwikkeling van de leerling tot volwassene. Daarnaast negeert Instructional Design de ambachtelijkheid van lesgeven. Een cursus wordt simpelweg gegeven, vanuit het ontwerp kunnen daar aanwijzingen bijkomen, maar voor het resultaat mag het niet uitmaken. Een aanname die ook bij bedrijfsopleidingen tot problemen leidt. Als laatste staat het gebruik van Instructional Design modellen ver af van de reguliere onderwijspraktijk. Daar liggen namelijk doelen en inhouden grotendeels vast. Hiermee worden grote delen van de beschikbare theorieën overbodig. Ook de Instructional Design is volgens de auteurs in een crisis geraakt, maar de diagnose is echter anders dan bij de didactiek. De kritiek richt zich op twee punten.

Ten eerste het gebrek aan ontwikkeling in de Instructional Design. Iets wat ik met mijn eigen studie kan illustreren. Tijdens mijn studie was het boek van Reigeluth (Reigeluth, 1983) het standaardwerk dat, zoals de titel al aangeeft, een vlootschouw gaf van de actuele stand van zaken op dat moment. En Zierer en Seel wijzen vervolgens één model aan, van Van Meriënboer, uit 1997, dat op dit moment het meest actueel is. Dat betekent toch zeker 15 jaar geen significante ontwikkelingen. Dat is in elk wetenschapsgebied lang.

Ten tweede hekelen zij de wildgroei aan modellen. Hoewel in essentie gelijk, zijn er verschillende modellen die verschillende accenten leggen in het Instructional Design proces. Elk model zijn eigen voor- en nadelen en voor- en tegenstanders. Met het bijkomende probleem dat geen enkel model voldoende in de empirie gegrond is om te kunnen claimen beter te zijn dan een ander model.

Dit zijn twee terechte constateringen. Over de ernst hiervan kan verschillend gedacht worden, dat weer wel.

Gemeenschappelijk

Zierer en Seel sluiten af met een vooruitblik. Waar gaan Didactiek en Instructional Design naar toe? Hoe komen ze uit de crisis die nu al zo lang duurt? Zonder hier een opvallend antwoord te formuleren, geven zij wel de gemeenschappelijke weg vooruit aan. Zij benoemen het hedendaags onderwijs, met studiehuis, Internet etc. etc. als kans. De tijd zal het, volgens hen, leren of zelfs bewijzen dat deze ontwikkelingen afhankelijk zijn van de ontwikkelingen in de didactiek en de instructional design. Een redenering die ik kan volgen, aangezien het om onderwijsvormen gaat waarbij de docent veel tijd in de voorbereiding moet steken om aan de coachende taak toe te komen. Dat vraagt om een afgewogen visie op doelen en onderwijsstrategieën bij de docent. Modellen helpen hierbij om de focus scherp te krijgen en als afvink-lijst om zeker te weten dat de voorbereiding volledig is. Wel vind ik het een kans die voortkomt uit het ontbreken van kansen op andere, belangrijkere vlakken, ik krijg een “dan maar dit” gevoel.

Om dit mogelijk te maken moet er naar mijn mening eerst een ander probleem opgelost worden. Beide stromen hebben naast onderwijs-theorie, ook leertheorie in zich. Zo grijpt Instructional Design, voor bepaalde inhoud, terug op conditionering volgens Skinner. (Wikipedia, Skinner, 2012), om vervolgens net zo makkelijk door te gaan met attributietheorie (Reigeluth, 1983) (Wikipedia, Attributietheorie , 2012) zonder helder te formuleren wanneer het een of het ander toepasselijk is. In Nederland is het onderwijs niet op deze hoogte geschoold in leertheorie. Dat is een gemis, maar m.i. ook een feit. Dit maakt Instructional Design een specialisme, ver van de ‘common sense’. Hiermee wordt de bruikbaarheid van de theorie voor de reguliere docent bijna nul. De keuze voor een leertheorie is daarnaast niet waardenvrij en weerspiegelt de mens- en maatschappijvisie van de docent.

Ook de didaktiek heeft een dergelijk probleem. Wat onderwezen moet worden en op welke wijze, is nauw verbonden aan de eigen ontwikkeling en het normen- en waarden patroon van de docent. De overheid lost dit wat betreft de inhoud op met centralisatie van de examens, maar keuzes ten aanzien van inrichting van een concrete les, liggen nog steeds bij de individuele docent. Keuzes van andere personen hierin worden, we zijn immers allemaal gelijkwaardig, eenvoudig verworpen, ook als die keuze door of namens het parlement gemaakt wordt. Een fenomeen dat o.a. door De Caluwé voor het onderwijs beschreven is (de Caluwé & Vermaak, 2006). Samen met een ongelukkig implementatietraject is dergelijke houding een garantie voor falende onderwijsveranderingen, denk hierbij aan bv. het studiehuis en competentiegericht onderwijs in het MBO.

Twee redelijk recente publicaties, één van de VO-raad (VO-raad, 2011) en een van Coppoolse en Vroegindeweij (Coppoolse & Vroegindeweij, 2010) bestrijden het pessimisme van de auteurs. Beide boeken geven een selectie uit de modellen uit beide vakgebieden, net zoals De Corte c.s. (De Corte, Geerligs, Lagerweij, Peters, & Vandenberghe, 1981) dat doen. Volgens de VO-raad kan het VO uit de voeten met 59 modellen die ingaan op de volle breedte van het onderwijs, van het ontwerp van gebouwen, langs de ontwikkelstadia van een docent, tot aan de twee belangrijkste punten voor goed onderwijs volgens leerlingen. Coppoolse c.s. houden het op 75 modellen met een soortgelijke breedte.

Mij spreken deze bundels aan. Enerzijds maken ze duidelijk dat er ook in de praktijk van alledag blijkbaar behoefte is aan sturing in de vorm van modellen. Anderzijds is er blijkbaar een redelijk consensus over welke modellen tot de canon van het onderwijs behoren. Als laatste, en dat is weer een persoonlijke om af te sluiten: het is een mix van soms losse modellen die gelegenheid geeft tot eigen keuze. Pragmatisch en behulpzaam bij het hier en nu van het onderwijs, in de stijl waarin ik opgeleid ben aan de Universiteit Twente. Deed ik beide publicaties onlangs af als willekeurige selectie uit een breed aanbod, dankzij het artikel zie ik waar de publicaties vandaan komen en dat ze een markering in de tijd vormen. Dat maakt de boeken, maar ook dit ene artikel, waardevol.

______________________________________

Bibliografie

Coppoolse, R., & Vroegindeweij, D. (Red.). (2010). 75 modellen van het onderwijs (1 ed.). Groningen / Houten: Noordhoff Uitgevers. Inhoudsopgave

de Caluwé, L., & Vermaak, H. (2006). Leren veranderen (2 ed.). Kluwer Bedrijfswetenschappen.

De Corte, E., Geerligs, C., Lagerweij, N., Peters, J., & Vandenberghe, R. (1981). Beknopte Didaxologie (5 ed.). Groningen: Wolters-Noordhoff.

Pirsig, R. M. (1974). Zen and the art of motorcycle maintenance: An inquiry into values.

Reigeluth, C. M. (1983). Instructional-Design Theories and Models: An overview of their Current Status. Hillsale N.J., London: Lawrence Earlbaum Ass.

VO-raad. (2011). 59 VO-modellen voor maatwerk en motivatie (1 ed.). (V. Thomas, & T. Ekens, Red.) Utrecht: VO-raad. pdf downloaden

Wikipedia. (2012, 08 17). Attributietheorie . Opgeroepen op 09 15, 2012, van Wikipedia:
http://nl.wikipedia.org/wiki/Attributietheorie

Wikipedia. (2012, 08 04). Skinner. Opgeroepen op 09 15, 2012, van Wikipedia:
http://nl.wikipedia.org/wiki/Skinner

Zierer, K., & Seel, N. (2012, 07 17). General Didactics and Instructional Design: eye like twins. A transatlantic dialogue about similarities and differences, about the past and the future of two sciences of learning and teaching. Opgeroepen op 09 15, 2012, van Springerplus.com:
http://www.springerplus.com/content/1/1/15/abstract

Toetsen en docenten horen bij elkaar als zomer en winter. We kunnen ons werk niet doen zonder uiteindelijk de leerlingen de maat te nemen en te beoordelen of zij voldoen aan de normen. Het meestgebruikte middel hiervoor is de schriftelijke toets. Die komt in allerlei soorten en maten, maar heeft in ieder geval het gemeenschappelijke dat er toetsopgaven zijn en dat de leerling antwoord geeft, meestal geschreven op papier. Over de voorbereiding van een toets is veel geschreven, over een best practice hoe met gemaakt werk om te gaan om te komen tot een oordeel weinig. Een poging tot inventarisatie van wat voor elke docent normaal zou moeten zijn. Dit alles in de veronderstelling hiermee een serie open deuren in te trappen.

Voor de afname

Twee zaken zijn van belang vooraf aan de afname:

  • Leerlingen schrijven hun naam op het in te leveren papier (proefwerkblaadje).
  • Antwoorden worden in één kolom gegeven. Dus niet om papier te sparen werken in twee kolommen.

Na de afname

In het leslokaal start de zorg voor het gemaakte werk. Dat de naam van de leerling op het werk moet staan is de start. Zodra een leerling het werk inlevert is het zaak om het gemaakte werk bij elkaar te houden. Leerlingen krijgen dan ook de instructie om een stapeltje te maken met bovenop de opgaven en daaronder het gemaakte werk. Mocht een leerling op de opgaven geschreven hebben, dan is nog terug te halen wie dat gedaan heeft, ondanks dat op opgaven meestal niet de naam geschreven wordt. Bij eerste gelegenheid wordt al het ingeleverde papier gecontroleerd en worden, als het nodig is, de ingeleverde papieren aan elkaar geniet.

Correctie/nakijken

Vooraf aan het corrigeren of nakijken wordt de toets door de docent zelf gemaakt, vooral wanneer de docent niet de toetsmaker is. Zo wordt zéér duidelijk wat er gevraagd wordt en krijgt de docent ook enig beeld van de tijd die de leerlingen nodig hebben voor de toets.

Wanneer er sprake is van een diagnostische wordt het werk gecorrigeerd. Naast de fouten worden verbeteringen of hints in het werk genoteerd. Bij een eindtoets kan volstaan worden met nakijken, dan worden alleen de fouten aangestreept. De gegeven punten voor het antwoord komen in de kantlijn, vandaar dat antwoorden onder elkaar geschreven worden.

Gemaakt werkt wordt opgave voor opgave bekeken. Dus eerst alle opgaven 1, dan alle opgaven 2, enzovoorts. Bij langere opgaven eerst de opgaven 1a, 1b en 1c, en daarna 1d, 1e en 1f. Dit zorgt voor meer consistentie bij het nakijken en maakt dat het tempo omhoog kan, omdat minder verschillende zaken onthouden hoeven te worden. Wanneer er géén punten behaald zijn voor een opgave wordt dit ook genoteerd. Dit voorkomt vergissingen bij de volgende stap.

Punten noteren

De in de kantlijn genoteerde punten worden vervolgens overgenomen in een rekenblad, bijvoorbeeld Excel (Windows, Mac) of Numbers (Mac, iOS) of Calc (LibreOffice, meerdere platforms). Hiermee worden de punten eenvoudig vastgelegd voor toekomstig gebruik.

Per proefwerk wordt een apart bestand gemaakt. Handig is het om aan het begin van het schooljaar even tijd te steken in het maken van een bestand en dit gedurende het schooljaar steeds aan te passen. De datum van afname, klas, leerweg en het onderwerp staan dan in de bestandsnaam, zodat terugzoeken eenvoudiger wordt. Data worden genoteerd in het jjjj/mm/dd formaat zodat ze netjes chronologisch gesorteerd worden, ook als op de computer op naam wordt gesorteerd. Bijvoorbeeld: 20120924_1a_TL_kijklijnen_h1.xlsx

In het voorbeeld staan de namen van de leerlingen in kolom A. Het door leerlingen behaalde cijfer in kolom B. Dit cijfer wordt bepaald door middel van een omrekening van de punten uit kolom C. De punten in kolom C zijn weer een optelling van de punten zoals die in de verschillende kolommen genoteerd staan. Met deze eenvoudige opzet is het later mogelijk om de toets te analyseren en is de omzetting van punten naar cijfers eenvoudig aan te passen. De kleuren en lijnen per opgave zijn een visuele ondersteuning.

In kolom C staat de opdracht om de punten in de kolommen D tot en met O op te tellen. In Excel is dat: =som(D4:O4). In cel C3 staat dan het totaal aantal te behalen punten, in C4 het aantal punten dat Aya heeft. In het voorbeeld is dat 29. De formule kan eenvoudig van cel C3 naar beneden gekopieerd worden. Elke handleiding van een rekenblad legt dit uit.

In kolom B staat de formule die de punten omrekent naar een cijfer. De meest eenvoudige formule is: het aantal behaalde punten delen door het totaal aantal punten, maal negen plus 1. In ons Excel voorbeeld is dat: =C4/36*9+1. Cel C4 geeft het totaal aantal punten van Aya, B4 het cijfer met deze formule. We laten hierbij het rekenwerk en de afronding aan de rekenblad, zonder afronding heeft Aya een 8,25.

Net zoals bij het nakijken/corrigeren, gaat het invoeren van de punten het best per opgave. In de meeste rekenbladen is het zo in te stellen dat met de Enter-toets er naar de regel eronder gegaan wordt. Zo kunnen de punten snel ingevoerd worden.

Werken met een dergelijk rekenblad maakt het werk van een docent overzichtelijk en zorgt er ook voor dat eventuele aanpassingen van het aantal punten direct vertaald wordt naar een ander cijfer.

Tot slot

Docenten beoordelen het werk van leerlingen en dienen dat naar beste kunnen te doen. Zij dienen op een navolgbare wijze het werk van een leerling te beoordelen. Inzicht in de toekenning van de punten en de omzetting naar het cijfer behoort hierbij. Een best practice dient dit te weerspiegelen. Hiertoe wordt gebruik gemaakt van een rekenblad. Dit vormt de basis voor verdere toetsanalyse. Daarover later meer.

Reactie op Standaardtesten in het onderwijs. Moet dat nou?

Elk jaar weer is er een discussie over de waarde, nut en noodzaak van de verschillende standaardtoetsen die in het onderwijs worden afgenomen. De teneur is nogal eens dat de toetsen niks bijdragen aan goed onderwijs. Toch blijven ze bestaan. Enkele achtergronden zijn van belang.

Dé start van standaardtoetsen in het onderwijs in Nederland wordt gelegd bij het boek van A.D. de Groot (1966), “Vijven en zessen”. In dit boek beschrijft hij de praktijk in het onderwijs ten aanzien van beoordeling en selectie door docenten en leerkrachten. Naast een aantal methodologische bezwaren (de Groot was methodoloog), staat hij op tegen wat hij ziet als willekeur bij beslissingen over bevorderen of doubleren en zakken of slagen. Hij signaleert dat er bij deze beslissingen een veelheid aan argumenten een rol spelen die voor de schoolloopbaan van de leerling niet van belang zijn. Zo krijgt het kind van de handarbeider met gelijke cijfers, een lager advies dan het kind van de academicus, waarmee kinderen met min of meer gelijke cognitieve capaciteiten, toch zeer ongelijke kansen in het onderwijs en daarmee in het leven krijgen. Een feitelijke constatering die door opeenvolgende regeringen opgepakt is en verwerkt in wet- en regelgeving. Enerzijds omdat alle leerlingen gelijke kansen behoren te hebben, ook leerlingen uit zwakke milieus naar de universiteit moeten kunnen, anderzijds omdat werkgevers, industrie, goed- dan wel hoog geschoold personeel willen die deskundig zijn in hun vak en/of weten hoe ze een hamer moeten vasthouden. De keuze van de argumenten hangt (mede) af van de heersende politieke voorkeur.

Een belangrijke oorzaak voor de verschillende beoordelingen van leerlingen, attributie, is inherent verbonden met ons onderwijs: een leerkracht “kent” de leerling en “weet wat deze waard is”. Het proefwerk van de zwakke leerling wordt dan ook anders nagekeken dan het proefwerk van de excellente leerling. Aan de leerling worden kenmerken toegedicht die niet aanwezig zijn. De Groot pleit dan ook voor toetsen die samengesteld en beoordeeld worden los van de eigen docent(en) zodat dit fenomeen geen of weinig effect heeft op de schoolloopbaan van de leerling. De discussie over de geldigheid van de centrale (CITO) toetsen gaat dus deels over de professionaliteit, onafhankelijkheid en deskundigheid van docenten en leerkrachten. Het is daarmee een normatief argument.

Met de gestandaardiseerde toetsen reduceert De Groot, en dat is een veelgehoord verwijt, het resultaat van onderwijs tot beoordelingen voor taal, rekenen, wiskunde en Engels. Deze bedoeling wordt nogal eens bestreden. De taak van onderwijs wordt door velen immers breder dan dat gezien. De discussie over het ontbreken van thema’s in de toetsen of de onmogelijkheid om zaken in centrale toetsen op te nemen, gaat dus over het doel van het onderwijs zoals wij dat kennen. Het is daarmee een normatief of zelfs politiek argument.

Zoals uit het voorgaande blijkt, heeft de politiek een grote bijdrage aan de hedendaagse situatie. De ontwikkelingen hieromtrent volgen de ontwikkelingen van het na-oorlogse Nederland. Na de oorlog moest het land opgebouwd worden en waren er arbeiders en ambachtslieden nodig. De kinderen van de arbeiders werden ook arbeider, de kinderen van de hoogleraar, en dat waren er niet zo veel, konden naar de universiteit. De steden werden opgebouwd, Flevoland aangelegd, infrastructuur hersteld.

De lancering van de Spoetnik (1958) maakte duidelijk dat wanneer het Westen niet zou investeren in kennis, het communisme spoedig de overhand zou hebben. Dit moment wordt gezien als de start van de onderwijskunde (in ieder geval in de USA), waarbij één van de doelen was om het aanwezige talent in de bevolking op te sporen en ieder wat betreft niveau een maximale opleiding te laten volgen. Dat het kind van de metselaar ook metselaar zou worden was niet langer gewenst. Een visie die nog steeds doorspeelt in ons huidige onderwijs en heeft geleid tot een explosieve groei in het Hoger Onderwijs. De koppeling van opleidingsniveau aan het salaris, heeft ook voor andere opleidingsniveaus de opwaartse druk verder gestimuleerd.

De sturing van de Inspectie op de resultaten van scholen, de hoeveelheid gestandaardiseerde toetsen die hiertoe ingezet wordt, moet m.i. in het licht van deze langdurige en algemene ontwikkelingen gezien worden. Zaken als efficiency-denken, bezuinigingen en de angst voor terugval in welvaart, hebben deze trend gestuurd.

De taak van het Basisonderwijs is thans om basisvaardigheden te onderwijzen en het niveau van het vervolgonderwijs te bepalen. Het voortgezet onderwijs wordt geacht dit niveau te realiseren en toe te leiden tot een arbeidsmarktkwalificatie of een vervolgopleiding. Het professioneel oordeel van de docent wordt hierbij ingewisseld voor standaard toetsen.

Referentie

Groot, A.D. de. (1966). Vijven en zessen. Groningen. JB Wolters.

Volg

Get every new post delivered to your Inbox.

Join 1.469 other followers

%d bloggers like this: