Forsigtige konklusioner på 3 mio. kroners evaluering af de nationale test

Der er fortsat problemer med de nationale test. Der er for få svære opgaver og den pædagogiske anvendelse af testene halter. Evalueringen af de nationale test peger desuden på problemer med testopgavernes kvalitet. Men der kan også spores en positiv effekt.

Publiceret

Bemærk

Denne artikel er flyttet fra en tidligere version af folkeskolen.dk, og det kan medføre nogle mangler i bl.a. layout, billeder og billedbeskæring, ligesom det desværre ikke har været teknisk muligt at overføre eventuelle kommentarer under artiklen.

På grund af et teknisk nedbrud i de nationale test i 2010 har firmaet Rambøll haft en mulighed for at sammenligne en gruppe elever, der har taget en national test med en gruppe, der ikke har. Den forsigtige konklusion er, at testen højnede elevernes niveau.

Antorini vil have svar: Har de nationale test løftet fagligheden?

Selvom Rambøll altså har kunnet se lidt bedre resultater hos de elever, der blev testet i læsning i 2010 i forhold til dem, der ikke gjorde, er der også en del af hypoteserne om effekt af testene, som ikke har kunnet bevises, skriver Rambøll.

Det gælder blandt andet lærernes brug af test som pædagogisk redskab. Lærerne bruger ikke resultaterne fra testene til at planlægge undervisningen og det er også begrænset, hvor meget de bliver brugt i skole-hjem-samarbejdet:

"I forhold til den pædagogiske anvendelse er en hovedkonklusion, at de nationale test i dag i langt overvejende grad anvendes summativt og ikke formativt forstået som fremadrettet anvendelse af testresultater til planlægning af undervisningen. Tilsvarende er antagelserne om styrket skole-hjem-samarbejde og bedre dialog med den enkelte elev om fremadrettede læringsmål som følge af de nationale test udfordret i praksis", skriver Rambøll i sin rapport (se link til højre).

"Det er en tidlig evaluering", understreger undervisningsminister Christine Antorini ,"og derfor må resultaterne fortolkes med forsigtighed. Der skal nu laves en redegørelse til Folketinget om virkningerne af de nationale test, hvor evalueringens resultater vil indgå. I den forbindelse vil vi vurdere, om evalueringens resultater giver anledning til at ændre på noget ved testene, eller om der er områder, der kan være væsentlige at få afdækket yderligere".

Ud over sammenligningen mellem elever, der blev testet i 2010 og elever, der ikke gjorde, har Rambøll  også kigget på afgangskaraktererne hos de elever, der gik ud af skolen i 2011 og 2012, og som nåede at prøve de nationale test i fire fag i 8. klasse, med elever, der gik ud i 2009 og 2010, og som aldrig har deltaget i nationale test.

"Analyserne viser et generelt billede af, at karakterne er gået lidt mere frem i fag, hvor eleverne er blevet testet, sammenlignet med fag, hvor eleverne ikke er blevet testet. Dette bestyrker de foregående analysers resultater om, at de nationale test har en positiv effekt for eleverne. Denne analyse på landsplan skal dog tages med forbehold, fordi der er mange andre forhold, som påvirker ændringer i karakterer i fag over tid, herunder udformning af opgaver", understreges det i rapporten.

Rambøll har også undersøgt, om indførelsen af nationale test for tre år siden har styrket evalueringskulturen i folkeskolen. Konklusionen er, at de nationale test har været med til at sætte en dagsorden med fokus på faglighed og evaluering, men at det ikke er de nationale test alene, der skaber en stærkere evalueringskultur. Det er derimod helheden i anvendelsen af nationale test i samspil med en række evalueringsværktøjer samt en stærk ledelse, der understøtter en stærk evalueringskultur. Rambøll har ikke kunnet finde nogen statistisk sammenhæng mellem en styrket evalueringskultur og en højnet faglighed hos eleverne.

Advarer mod test som styringsværktøj Som led i folkeskolereformen skal resultaterne fra de nationale test fremover kriteriebaseres, så de ikke længere viser, hvordan en elev eller klasse ligger i forhold til et landsgennemsnit, men derimod i forhold til en dygtighedsskala. Folkeskolen skal styres efter mål, der blandt andet siger, at mindst 80 procent af eleverne skal være gode til at læse og regne i de nationale test.

Desuden skal andelen af elever med dårlige resultater i de nationale test for læsning og matematik reduceres år for år.

Det får Rambøll til at skrive denne advarsel i rapporten: "En bekymring kan være overdreven fokus på den styringsmæssige dimension, der kan føre til øget snyd med testene. En anden bekymring kan være, at lærerne satser på at løfte de elever, der ligger tæt på de nationalt eller lokalt fastsatte kriterier for fx "en god læser" - og dermed undlader at bruge testresultater til at fokusere på den enkelte elevs styrker og svagheder og tilrettelægge en differentieret undervisning".

Den målstyrede skole

Problemer med opgavekvaliteten Rambøll har haft en række eksperter til at se på de konkrete opgaver i de nationale test. De kritiserer blandt andet, at der er flere eksempler på layout af opgaver, der er direkte forstyrrende for elevernes opgaveløsning. Nogle gange er der flere overskrifter til samme opgave og flere forskellige forklaringer på, hvad opgaven går ud på. Udfordringerne er størst i engelsk, matematik og fysik/kemi.

Grafik og tegninger kritiseres for at være forældede og i en utidssvarende tegnestil, og de udnytter slet ikke de teknologiske muligheder, man har i dag. Og eksperterne peger også på, at der er opgaver, hvor flere af svarmulighederne er rigtige, mens eleven kun må vælge ét svar. Rambøll har desuden bedt over 2000 lærere besvare spørgsmål om opgavernes kvalitet. 36 procent af dem er uenige i, at testopgaverne er klart og entydigt formuleret. 

Et andet problem er, at der ikke er svære opgaver nok i opgavebanken, hvilket medfører, at de dygtige elever simpelthen tømmer banken og får de samme opgaver igen.

Test-evaluering giver ingen svar på, om testene duer

Udviklet på mavefornemmelse Eksperterne peger på, at opgaveudviklerne stort set er overladt til at udvikle opgaverne på basis af egen mavefornemmelse. De får ikke at vide, hvilke opgaver, der bliver kasseret i den såkaldte Rasch-analyse, som skal afgøre, om de er statistik valide. Og der findes ingen analyser af, hvad der definerer de forskellige sværhedsgrader. På den baggrund anbefaler Rambøll, at opgaveudviklerne gennemgår en systematisk uddannelse, som det fx sker i England og Holland.

Samme testopgave er sværere i 4. end i 2.

Ny version af rapporten 20/11, red.: Undervisningsministeriet oplyser, at Rambøll på baggrund af en nærmere analyse af visse data har konstateret mindre ændringer i nogle specifikke resultater i rapporten. Revisionen vedrører effekttallene i dansk, læsning. Disse effekttal er samlet set lidt højere end i den tidligere version. Evaluator anfører, at der således ikke rykkes på nogle af konklusionerne i rapporten.