Forskning

Forsker: Test styrer skolens retning

Skal vi have test og eksamen, skal de afspejle skolens formål, siger professor Jens Dolin. Han advarede før indførelsen af de nationale test politikerne om, at det ville få negative konsekvenser. For test påvirker skolen, siger han.

Publiceret

FORSKERENS BUD PÅ TEST I DANMARK

Jens Dolin mener grundlæggende, at test og eksamen fylder altfor meget i den danske skole, ikke mindst efter atafgangskaraktererne er blevet adgangsgivende, og testene bruges tilat måle skolens kvalitet. Han foreslår helt at droppe dem og istedet uddanne lærerne bedre til at give formativ feedback og såindimellem at trække summative data ud af den daglige undervisning,i det omfang politikerne har brug for dem til at styre og støtteskolen. Evalueringen kan for eksempel foregå i et portfolioformat,hvor eleverne løbende kan lære af den feedback, de får, og hvor desummative data reelt afspejler elevernes kompetencer.

HVOR VED HAN DET FRA?

Jens Dolin startede med 20 år som gymnasielærer i geografi ogfysik kombineret med arbejde på Amtscentralen, eksternt lektorat ididaktik og leder af pædagogikum. Han drev efter en ph.d. over iuniversitetsverdenen, hvor han i to årtier nu har undervist ogforsket i undervisning på alle niveauer i uddannelsessystemet.

Han har deltaget i og ledet en lang række forsknings- ogudviklingsprojekter inden for undervisning og uddannelse, herunderom evaluering: »Validering af Pisa-projektet« (2005-09),»Pædagogisk brug af test - et systematisk review« (2007-09),EU-projektet Assist-Me (2014-17) om evaluering af kompetencer,»Karakterfri klasser i gymnasiet« (2018), evalueringen af »Énbedømmer ved Folkeskolens Prøver« (2016-18).

Jens Dolin er medlem af en lang række nationale oginternationale organisationer og har skrevet artikler og bøger omen bred vifte af undervisningstemaer som for eksempel dannelse,kompetencer og evaluering, ligesom han har engageret sig iuddannelsespolitiske problematikker.

Han blev i 2007 institutleder for det nyoprettede Institut forNaturfagenes Didaktik ved Københavns Universitet og har siden 2017været professor emeritus samme sted.

Bemærk

Denne artikel er flyttet fra en tidligere version af folkeskolen.dk, og det kan medføre nogle mangler i bl.a. layout, billeder og billedbeskæring, ligesom det desværre ikke har været teknisk muligt at overføre eventuelle kommentarer under artiklen.

Test og eksamen styrer, hvor skolen bevæger sig hen - det er som på en labrador, hvor halen logrer med hele hunden. Den sandhed har Jens Dolin igen og igen gennem sin forskerkarriere arbejdet med og mod. Netop derfor er det problematisk, hvis danske nationale test og afgangsprøver ikke handler om det, man mener er vigtigt i skolen, og ikke måler korrekt på det, de så faktisk handler om, siger han.

»Systemet retter sig ind efter evalueringen - test eller eksamen - uanset hvad intentionen har været. Så hvis evalueringen ikke passer med det, man har ønsket sig af skolen, bliver undervisningen, lærerne og i høj grad eleverne klemt«, forklarer professor emeritus på Institut for Naturfagenes Didaktik ved Københavns Universitet Jens Dolin, som de seneste 20 år har forsket i evaluering og effekterne af test i Danmark og udlandet. Han stod blandt andet i spidsen for det store EU-forskningsprojekt Assist-Me, hvor man undersøgte, hvordan man kan fremme evalueringskulturen i skolen.

»I 90'erne kom der et skifte fra undervisning til læring, og jeg var med til det udviklingsarbejde på gymnasieområdet. Allerede der blev det tydeligt, at vi ikke kunne ændre på undervisningen, hvis vi ikke ændrede på eksamen. Hvis eksamen tester paratviden og løsning af standardopgaver, er det meget svært for lærerne at holde fokus på kompetencer. For slet ikke at tale om alle de andre områder, der ikke er med«.

Jens Dolin var dengang meget inspireret af de prøver, man havde i folkeskolen, fordi de med projektopgaver og gruppeeksamener i langt højere grad simulerede den virkelige verden.

»Hvis man vil undersøge, hvad eleverne faktisk har af færdigheder og kompetencer, så handler det jo om at evaluere deres evne til at handle i virkelige situationer baseret på den viden, de har fået. Det gør man ikke ved at placere dem ved en computer i en gymnastiksal«, siger forskeren.

Evalueringskulturen var god nok

Men folkeskolen, der dengang havde en evalueringskultur, der i Jens Dolins øjne var godt på vej og fokuserede de rigtige steder, fik en noget anden drejning, efter at de første Pisa-undersøgelser i 2000 og 2003 viste, at danske elever langtfra var de verdensmestre, man troede.

Et rejsehold fra OECD blev derfor i 2003 inviteret til at bedømme den danske folkeskole. Holdet konkluderede blandt andet, at Danmark havde en svag evalueringskultur. Det lagde grunden for de nationale test. Problemet var bare, ifølge Jens Dolin, at både Pisa-undersøgelsernes måling og OECD-holdets konklusion var skæv.

»Det er dygtige folk, der udarbejder Pisa-testene. Det er gode opgaver - langt bedre end de nationale test - og de er blevet bedre undervejs. Men det er opgaveregning. Det kan være vigtigt nok, men det indfanger på ingen måde alt det, man skal kunne i fagene«.

Jens Dolin gennemførte efter de første Pisa-test et valideringsstudie, hvor han fik 120 danske elever, der havde været med i Pisa, til at løse de samme opgaver, men som en del af en almindelig undervisningsaktivitet.

»Det viste sig, at alle elever, men især de svage, var bedre til at løse opgaverne, når de ikke var belastet af den kunstige testsituation«.

Danske elever kunne have klaret sig bedre i Pisa 

Han er også kritisk over for rejseholdets konklusioner, som ikke var forskningsbaseret, men baseret på udvalgte informanter.

»Jeg gennemførte selv en undersøgelse af evalueringskulturen i naturfag, og den var klart bedre, end OECD sagde. Vi gennemførte en landsdækkende spørgeskemaundersøgelse, der viste, at naturfagslærerne brugte et væld af forskellige evalueringsformer, som de selv udviklede og tilpassede til deres undervisning. Men det drejede sig om evalueringer til lokalt brug, typisk for at forbedre undervisningen og elevernes læring, som ikke kunne levere data, der kunne sammenlignes på tværs af klasser og skoler«.

Testene fører til større ulighed

Jens Dolin mener altså ikke, at Danmark havde et problem med evalueringskulturen, før man indførte de nationale test - hvis man altså med evalueringskultur mener en kultur om lærerens evaluering af elevernes læring. Selvfølgelig kunne den forbedres.

Men at indføre landsdækkende standardiserede test var på ingen måde vejen at gå, mener han baseret på sin forskning:

»Den kur, man foreskrev til en sygdom, som jeg ikke mener eksisterede, var virkelig uheldig«.

Daværende Dansk Clearinghouse for Uddannelsesforskning undersøgte, hvad konsekvenserne af at indføre test ville være. Jens Dolin deltog i arbejdet sammen med forskere fra Norge og Sverige. De gennemførte et metastudie af, hvad indførelse af test ville betyde for eleverne, undervisningen og lærerne. 5.700 forskningsartikler om emnet blev sorteret ned til 61 relevante studier, som de analyserede.

»Det var interessant, for analysen sagde utvetydigt, at når man indfører test, bliver undervisningen forsimplet, så den passer til testene. De dele af undervisningen, der ligger uden for testen, bliver nedprioriteret. Fag, der ikke testes i, får færre timer og resurser. Med andre ord: Hele undervisningen bliver forsimplet og rettet ind efter det, man har valgt at teste i«, forklarer Jens Dolin.

Analysen viste også, at eleverne bliver påvirket af at blive testet. Og ikke nok med at alle bliver nervøse af det, test rammer også skævt, så de lavest præsterende elever bliver ekstra nervøse og klarer sig dårligere. Det giver dem lavere selvværd, så de præsterer endnu dårligere næste gang.

»Det giver en ret dramatisk polarisering, som jo på ingen måde er det, man ønsker, når man vil styrke elevernes niveau«.

Det resultat viser ifølge Jens Dolin tydeligt, hvorfor det er en langt bedre ide - hvis man gerne vil teste - at man gør som i Pisa-testene og vælger for eksempel 4.000 elever ud hvert tredje år.

Leder: Test læseglæden

»Det traumatiserer ikke eleverne, for de får ikke deres egne resultater, og det er kun kort tid for få elever en enkelt gang. Hvis man tror på test, så er det en god måde at trække resultater ud på. Det farlige er nationale test, som foregår i klasserum, hvor den enkelte elev får egne resultater«, siger han.

Rapporten blev fremlagt for politikerne, men ikke desto mindre holdt de fast i de nationale test.

Skadelig præstationsorientering

Fik testen så også den negative påvirkning, som Jens Dolin og hans kolleger havde forudset? Ja, det mener forskeren helt klart.

»Hvis jeg skal være positiv, så er der nok sket en øgning i faglighed - forstået som den konkrete viden - for det er der kommet mere fokus på. Men det er sket på bekostning af den mangfoldighed, der er i undervisningen - i dannelsen, kreativiteten, muligheden for at gå ud ad sideveje og i elevernes medindflydelse«, siger Jens Dolin.

Dertil kommer det store pres på eleverne, hvor antallet af børn i folkeskolen, der er diagnosticeret med angst, depressioner og spiseforstyrrelser, er fordoblet i løbet af de seneste ti år.

»Hele systemet er blevet gennemsyret af en instrumentel tankegang, hvor mange kun vil lære noget, hvis det skal bruges til eksamen. Jeg gør det, fordi jeg bliver målt på det. Det er en kedelig tilgang at gå ud i livet med. Det er samfundsmæssigt problematisk. Politikerne har villet se value for money, derfor har de villet have data ud af systemet, og test er en billig måde. Men man har ikke taget højde for, hvad konsekvenserne af test koster samfundet på længere sigt. Og forskningen viser klart, at jo mere præstationsorienteret et system er, jo mindre dybt lærer man«.

Test og eksamen fylder for meget

Jens Dolin var gennem fire år leder af det store EU-forskningsprojekt Assist-Me, hvor en lang række prominente forskere undersøgte, hvad man kan gøre for at fremme evalueringskulturen i de europæiske skolesystemer. De undersøgte brugen af formativ og summativ evaluering, og hvordan man kan fremme brugen af formativ feedback i skolen.

»Alle test og evalueringer kan bruges både formativt og summativt. Hvis du evaluerer for at måle et niveau, er det summativt, hvis du gør det for at lære noget af det, er det formativt. Og det er svært at gøre begge dele samtidig. Der er massiv forskning, der viser, at hvis du bruger noget summativt - sætter tal eller niveau på - så kan du blokere for det formative, fordi eleven kun ser på tallet«, siger han.

Man kan godt bruge testresultater formativt, hvis læreren bruger resultaterne og diskuterer dem med eleven. Men noget af det, forskningsprojektet viste, var, at lærerne har brug for mere uddannelse i, hvordan man giver god formativ feedback. Projektet understregede også, at testresultaterne kun kan bruges, hvis de både er valide og pålidelige. Validiteten ligger i, om man måler det, man er interesseret i at måle - kompetencer, dannelse og så videre. Pålideligheden handler om, hvor stabilt testene måler det, man har valgt at måle på.

»Her er vi så ved en anden kerne i problemerne med de nationale test, for de ligger meget lavt både på validitet og pålidelighed. Derfor er det et stort problem, når man bruger dem som termometer for, hvordan det går i skolen. Og det er svært for lærerne at bruge dem formativt til at gøre eleverne dygtigere«, siger Jens Dolin.

Hvad skal man gøre i stedet

Men hvad er så vejen frem, hvis man fortsat gerne vil give lærerne både et evalueringsredskab til brug for at forbedre undervisningen og en måde at holde øje med niveauet i skolen på?

»I forskningsverdenen er der ideer til, hvordan man kan arbejde med evaluering, og rigtig mange kan se ideen om at kombinere det formative og det summative. Det kan godt lade sig gøre, men det kræver, at man respekterer evalueringstrekanten, der siger, at der skal være overensstemmelse mellem mål, undervisning og evaluering«, siger Jens Dolin.

Han kunne sagtens forestille sig, at man helt droppede eksamener og test og i stedet brugte data fra undervisningen til at vurdere elevniveau. Det kræver, at den såkaldte didaktiske kontrakt er klar, så eleverne ved, hvornår de bliver bedømt og på hvilket grundlag. Det kan for eksempel foregå i et portfolioformat, hvor eleverne løbende skriver ting ind, de lærer, og får feedback. Og på et tidspunkt, som eleverne kender, trækker man så bedømmelsen ud.

Sådan kan man arbejde med formativ og summativ feedback: Al dokumentation af elevpræstationer kan bruges både formativt og summativt. Forskellen er, hvilke kriterier der ligger bag, og hvad formålet med bedømmelsen er. I modellen vises, hvordan der kan arbejdes formativt ud fra den konkrete elevs optimale læreproces, og undervejs i processen trækkes ensartede summative data ud. 

Det er under alle omstændigheder nødvendigt at efteruddanne lærerne i folkeskolen i at blive endnu bedre til at kunne evaluere eleverne - både formativt og summativt. Men det kræver, at skoler, kommuner og hele systemet skal tage ejerskab til det, mener professoren.

»At udvikle et sådant nyt evalueringssystem kan kun ske gennem et aktionsforskningsprojekt, hvor alle parter går i dialog med hinanden for at få ønsker og muligheder til at hænge sammen. Vi har på instituttet i samarbejde med en professionshøjskole, Astra og en kommune designet et sådant projekt, som ligger i forlængelse af EU-projektet. Det har fået stor velvilje fra de vigtigste aktører, der kan se perspektiverne i det, men Undervisningsministeriet har ikke de nødvendige forskningsmidler, og de store fonde finder ikke projektet relevant«, fortæller Jens Dolin.

Hvis han skal gå op i helikopterperspektivet, har han meget svært ved at forstå, hvorfor danske politikere indførte landsdækkende test - eller hvorfor de skulle fastholde dem.

»Vi har et dansk samfund, som må siges at være meget velfungerende. Stort set alle de mennesker, der har skabt det, har gået i den danske folkeskole. Det er da et ret godt eksistensbevis på et godt system. Men i stedet for at rose folkeskolen har danske politikere været stupide nok til at lytte til OECD's kritik af, hvordan vi var til at teste. Så i stedet for at tale med Sverige og Norge om, hvordan vi kunne blive endnu bedre til det, vi er gode til, kigger vi til Kina eller USA og efterligner deres testsystemer«.

Lærere vil hellere bruge pengene på andet end nye test