Anders Jönsson: Varför är det så svårt att sätta likvärdiga betyg?

Bristande likvärdighet i målrelaterad betygssättning har lett till att röster nu höjs för återgång till relativa betyg. Det vore att förhasta sig, menar Anders Jönsson, och ger förslag på hur likvärdigheten kan förbättras. (red.)

En viktig anledning, förutom allmän politisk målstyrningsiver, till att implementera det som i Sverige ofta kallas ”mål- eller kunskapsrelaterad bedömning”, är drömmen om att bedömningen i skolan ska kunna uppfylla såväl formativa som summativa syften. Genom att utgå från mer eller mindre ”tydliga” målformuleringar, förväntas graden av måluppfyllelse kunna bedömas – varefter denna information kan användas dels för att återkoppla till eleverna, så att de kan närma sig målen, samtidigt som informationen ligger till grund för beslut av mer summativ karaktär (som betyg). Tråkigt nog har det visat sig att drömmen inte håller så väl i den riktiga världen. Ett problem – av flera – är att betygen inte är likvärdiga. Vissa menar därför att formuleringarna av mål och kriterier bör bli ännu mer detaljerade och ”tydliga”. Det finns dock anledning att misstänka att detta inte nödvändigtvis skulle hjälpa, vilket jag tänkte visa med stöd av ett exempel.

Vi genomförde ett experiment, där lärare fick bedöma och betygsätta ett antal skriftliga prestationer (i engelska) från några olika elever. Avsikten var att undersöka om olika sätt att genomföra betygsättningen gav olika resultat, dels i termer av samstämmighet mellan lärarna (dvs. om de satte samma betygsomdöme), dels i termer av samsyn (dvs. om de utgick från samma kriterier/kvaliteter i bedömningen). Den ena gruppen fick tillgång till elevprestationer kontinuerligt under terminen, bedömde dessa och satte ett omdöme på varje uppgift. Detta förfaringssätt kallade vi analytisk betygsättning. Den andra gruppen fick tillgång till alla elevprestationerna vid ett enda tillfälle, så att de fick göra en helhetsbedömning, utan att ha bedömt uppgifterna enskilt tidigare. Detta förfaringssätt kallade vi holistisk betygsättning.

När vi sammanställde resultaten kunde vi se att den analytiska gruppen var överens i cirka två tredjedelar av fallen, medan den holistiska gruppen var överens i knappt hälften av fallen. Detta innebär dels att grupperna skilde sig avsevärt när det gällde samstämmigheten i betyg, till den analytiska betygsättningens fördel, dels att ingen av grupperna kom ens i närheten av att vara totalt samstämmiga. Skillnaden mellan grupperna tycks delvis bero på komplexiteten i underlaget, där sammanvägningen i den analytiska betygsättningen kan bli mer ”mekanisk”, eftersom det finns omdömen sedan tidigare att ”luta sig mot”, medan en helhetsbedömning av ett mer eller mindre heterogent underlag blir väldigt komplext (och kan därmed göras på många olika sätt).

Det som kanske var mest spännande var dock att vi även bad lärarna att motivera sina bedömningar. Antagandet var att eftersom den analytiska betygsättningen baserade sig på en sammanvägning av tidigare genomförda bedömningar och omdömen, skulle den holistiska vara mer valid, genom att ta bättre hänsyn till helheten. Så var det emellertid inte, utan motiveringarna var näst intill identiska i de båda grupperna. Faktum var att i princip alla lärarna i studien var överens om: a) Vilka kriterier som var tillämpliga i bedömningen av elevernas prestationer, b) Vilka styrkor och utvecklingsbehov som respektive elev uppvisade samt c) Den inbördes rangordningen mellan eleverna. Så trots att alla lärarna var helt överens i sin bedömning, satte de alltså ändå olika betygsomdömen! Varför är det så?

Summativ bedömning utifrån kriterier är en tvåstegsprocess. Första steget innebär att man identifierar kvaliteterna i en elevprestation utifrån kriterierna. Andra steget innebär att man väger samman dessa kvaliteter till ett helhetsomdöme. Om det finns flera kriterier att ta hänsyn till, kan enskilda lärare värdera dessa olika, vilket påverkar helhetsomdömet. Två matematiklärare kan således vara överens om att bedömningen behöver beakta såväl lösningen som svaret, men vara oense om hur stor vikt som ska läggas vid det ena eller det andra. Detta kan leda till att de sätter olika poäng eller omdöme på uppgiften.

En betygsättning som ska ta hänsyn till flera olika aspekter av elevernas prestationer kommer därför obönhörligen att innebära problem med samstämmigheten. Och att ytterligare precisera formuleringen av de enskilda aspekterna kommer troligen inte att lösa detta bekymmer. Man bör komma ihåg att inte ens bedömningen av de nationella proven har tillräckligt hög samstämmighet, trots de ytterst omfattande bedömningsanvisningarna och de (i vissa fall) strikta reglerna för sammanvägning till provbetyg.

Viktigt att notera är dock att detta endast gäller den summativa bedömningen, alltså där elevernas prestationer ska sammanfattas i ett omdöme. Som exemplet ovan antyder, är den formativa bedömningen helt opåverkad av detta problem, eftersom lärarna – trots olikheterna i betygsomdöme – var helt överens om vilka styrkor och utvecklingsbehov eleverna uppvisade.

Slutligen: Innebär detta att man måste överge idén om kriterierelaterade betyg? Inte nödvändigtvis, då det fortfarande finns mycket som kan göras för att förbättra likvärdigheten i betygsättningen, men som ännu inte prövats systematiskt eller i någon större omfattning, som a) nationella riktlinjer för hur betygsättning ska gå till, b) utbildning för hur betygsättning ska gå till inom lärarutbildningarna, c) system för medbedömning (dvs. där olika lärare bedömer samma elevunderlag oberoende av varandra) samt d) mindre omfattande kunskapskrav. Kanske är det värt att testa några av dessa innan vi tvingas återvända till normrelaterad bedömning och standardprov?

Anders Jönsson är professor i didaktik vid Högskolan Kristianstad

Länk till studien: https://pareonline.net/getvn.asp?v=23&n=12

8 kommentarer till “Anders Jönsson: Varför är det så svårt att sätta likvärdiga betyg?

  1. Jag skulle vilja lägga till e) som enligt min ringa erfarenhet är den bästa metoden för betygsättning:

    e) system för medbedömning (dvs. där olika lärare bedömer samma elevunderlag TILLSAMMANS med varandra)

    Varje lärare tar med sig några typfall som man själv uppfattar som självklara A, B, C, D, E och F samt några av de fall då man är genuint osäker. Man diskuterar dessa tillsammans och kommer gemensamt fram till vilket betyg som är det rätta.

    Detta tar naturligtvis tid men jag anser att det är väl värt att använda arbetstid på detta sätt. Betygssättningen blir mer rättvis mellan olika klasser, jag blir bättre på att bedöma kvaliteten i elevernas arbete och jag har en helt annan trygghet i mig när jag möter eleverna. Dessutom är det lättare för elever att acceptera ett betyg som de kanske inte är nöjda med om de vet att tre olika lärare har varit inblandade i betygsättningen.

    • Tack Daniel, för din kommentar. Du har rätt i att sambedömning också kan vara ett alternativ. Forskningen pekar dock på att även om man är överens om det man bedömer tillsammans, tenderar man att göra annorlunda med annat underlag, som man bedömer själv. Så bedömningen blir inte alltid likvärdig ändå, såvida man inte gör alla bedömningarna tillsammans – åtminstone inte på kort sikt. Däremot tror jag att sambedömning är ett viktigt långsiktigt redskap för likvärdighet, eftersom sambedömning bidrar till en gemensam syn på vilka kriterier som ska användas och hur bedömningen ska gå till.

  2. Att bägge bedömningsgrupperna rangordnade eleverna likadant pekar väl ändå mot att om de skulle fått sätta relativa betyg så hade samstämmigheten, och därmed likvärdigheten, blivit större?

    • Om lärarna bara rangordnade eleverna, så ja. Frågan blir något mer komplicerad om eleverna även ska placeras i betygskategorier, men det tycks otvivelaktigt enklare att rangordna än att placera in i nivåer.

  3. Det lärarutbildningen och skoldebatten tidigare handlade om gällde didaktikens huvudfrågor Vad? Hur? Varför? Frågorna om vad eleverna skulle lära sig, hur de skulle lära sig det och varför de skulle lära sig det just på detta sätt gav en bra grund för diskussioner om hur skolan skulle utvecklas.
    Men in kom en elefant i rummet. Nu blockeras skoldebatten om frågorna vad och hur betygen ska sättas. Dock inte varför? Jag vill gärna lyfta fram den frågan. Se artikeln ”Den betygsfria skolan” på sidan 122 i boken ”Tankeställare om skolan” http://perackeorstadius.se/pdfBocker/tankestallareOmSkolan.pdf

  4. Jag vill bara att betygssystemet ska lämna undervisningen någorlunda ifred. En förutsättning för det är att betygen går att använda i antagningsprocesser med hyggligt resultat.

    Om det då är relativa betyg med instruktioner om vilka områden det är som ska bedömas eller kriterierelaterade betyg med så korta och allmänt hållna kriterier att kriterierna i praktiken inte spelar någon roll utöver att peka ut vilka området det är som ska bedömas bryr jag mig inte särskilt mycket om.

    Skillnaden är inte rasande stor.

    Men likvärdig bedömning är ingen önskvärd egenskap i ett betygssystem eftersom det är så dyrt att få till. Bättre att sköta det mekaniskt via ekvivalering via register.

  5. Som kunskapsanalytiker hävdar jag att DIDAKTIK alltid hänger ihop med ett ÄMNE. Matematikdidaktik skiljer sig från klarinettdidaktik. Så resonerar också författarna till S.O.S den 9.11 2017: “Didaktik är lärarens egen vetenskap”. Åtminstone vi tre menar, att didaktik behöver egna ABSTRAKTIONER, genom vilka lärare kan tala INITIERAT om ÄMNE och UNDERVISNING.

    Det finns didaktik och didaktik. Jönssons BEGREPPSSYSTEM relateras till elevers, lärarstudenters och examinerade lärares PRESTATION.

    Åtgärder som “vi” (vilka vi) bör pröva innan “vi” tvingas återvända till normrelaterad bedömning och standardprov” är, enligt Jönsson:

    a) Nationella riktlinjer för betygssättningens tillvägagångssätt
    b) Studenterna betygssättning redan i lärarutbildningen
    c) System för medbedömning
    d) Mindre omfattande kunskapskrav

    En kunskapsteoretisk didaktik hanterar ÄMNES-abstraktioner som speglar, tillvaratar och värnar lärarnas undervisningspraktik. Lärarna talar, med hjälp av forskningsprövade ämnesabstraktioner, om UNDERVISNING och om saklig beskaffenhet hos olika ÄMNEN, och om elevers tanketrösklar med ämnet.

    KUNSKAP = Åskådning + Begrepp, utifrån ÄMNETS/TINGETS beskaffenhet

    Så, didaktiker Anders Jönsson! Var vänlig beskriv och förklara det KUNSKAPSBEGREPP som Du använder i åtgärdspunkten: d) Mindre omfattande KUNSKAP-krav.

    Kerstin I. M. Holm
    Kunskapsanalytiker
    Utbildningsledare i H. S. Hermods Supportorganisation
    Fil.dr. i pedagogik

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Din e-postadress behövs för godkänd kommentar. S.O.S. sparar e-postadresser, men vidareförmedlar dem ej. På begäran kan din e-postadress tas bort ur vårt register, varvid kommentar/kommentarer raderas.

SKOLA OCH SAMHÄLLE

WEBBTIDSKRIFT
ISSN 2001-6727

REDAKTÖRER
Sara Hjelm
Magnus Hultén
Malin Ideland
Anders Jönsson
Björn Kindenberg

E-POST
redaktionen@skolaochsamhalle.se

© COPYRIGHT
Skola och Samhälle

S.O.S. på Twitter