Nationale test: Slår alle områder sammen for at få et sikrere resultat

De nationale test i folkeskolen skal skiftes ud. Men indtil det sker, er der nu implementeret nogle tekniske ændringer, som mindsker den statistiske usikkerhed. Først og fremmest vil eleverne ikke længere få et resultat i henholdsvis sprogforståelse, afkodning og tekstforståelse, men bare ét resultat i læsning og ét i matematik osv.

Publiceret Senest opdateret

Testevaluering: Det er slet ikke undersøgt, om testene måler sikkert på skole- eller klasseniveau

En stor evaluering, der blev offentliggjort for et år siden, bekræftede, hvad flere tidligere undersøgelser også havde vist -  at testresultaterne for de enkelte elever er behæftet med stor statistisk usikkerhed.

Styrelsen for It og læring foreslog selv en række mulige tiltag til at forbedre målesikkerheden, og i juni sidste år aftalte folkeskoleforligskredsen, at når testene skulle gennemføres igen i fuld skala i foråret 2021, skulle resultaterne i de tre profilområder, som hver test består af, slås sammen.

Nationale test 2021

I skoleåret 2020/2021 skulle skolerne have taget deobligatoriske nationale test fra 1. marts til og med den 30. april.Perioden er forlænget som følge af coronanedluknningen, så skolernei år kan gennemføre nationale test i hele perioden fra den 1. martstil og med den 11. juni

Alle elever skal tage 10 nationale test i løbet af deresskoletid. Læsetest i 2., 4., 6. og 8. klasse, matematik i 3., 6. og8., engelsk i 4. og 7. og fysik/kemi i 8. klasse. Testene varer 45minutter ved en computer, og testene tilpasser sig undervejs denenkelte elev, så man får sværere opgaver, når man svarer rigtigt,og lettere opgaver, når man svarer forkert.

Tidligere var den statistiske usikkerhed, Standard Error of Measurement(SEM), på beregningen af elevens dygtighed i gennemsnit 0,46 og for nogle elevers vedkommende over 0,75. Ved at slå de tre områder sammen, kommer man ned på en statistisk usikkerhed under 0,30 for flertallet af testresultaterne.

0,3 SEM var den statistiske usikkerhed, som firmaet bag de oprindelige test, Cowi, i sin tid havde lovet, og ifølge Styrelsen for It og Læring også de tal, som ministeriets rådgivningsgruppe anbefaler, at man kommer under, hvis testresultaterne skal kunne bruges til noget pædagogisk.

Ups - de nationale test måler ikke så præcist som lovet 

Andel, der er 'gode' læsere, i den oprindelige og den genberegnede opgørelse.

Når sammenlægning af testresultaterne hjælper på den statistiske usikkerhed, er det, fordi elevens score beregnes på besvarelse af omkring 60 opgaver i stedet for kun omkring 20 opgaver i hver af de tre profilområder.

I den store evaluering sidste år bad forskningsinstituttet Vive en gruppe af eksperter i pædagogisk statistik om at bedømme Styrelsen for It og Lærings undersøgelse og forslag. De bakkede op om, at det vil nedbringe usikkerheden af resultaterne ved de nationale test.

De satte dog spørgsmålstegn ved, om der er belæg for at slå profilområderne sammen - altså for, at de tre forskellige profilområder inden for samme fag faktisk kun måler én dimension af elevernes faglige kompetencer.

Når eleverne i løbet af foråret har gennemført de nationale test, vil de også få testresultatet på en anden skala end hidtil. Den såkaldte percentilskala, som eleverne er blevet indplaceret på siden 2010, rummer nemlig nogle store statistiske problemer.

I stedet bliver eleverne indplaceret på en pointskala fra 0-50 og ud fra den i de kendte fem kategorier: klart under middel, under middel, middel, over middel og klart over middel.

For at man kan sammenligne dette års resultater med tidligere års resultater på elev-, skole-, kommune- og nationalt niveau har Styrelsen for It og læring også genberegnet testresultaterne tilbage i tid med opgavernes nye, genberegnede sværhedsgrader. 

Andel, der er 'gode' læsere, i den oprindelige og den genberegnede opgørelse. Kilde: Overbliksnotat, Stil

Stadig ikke flere opgaver til de dygtigste

Noget andet, der for alvor kunne hjælpe på målesikkerheden, er, hvis der blev produceret flere svære opgaver, som kan udfordre de allerdygtigste elever.

Ideen med de adaptive test er, at testen tilpasser sig elevens niveau undervejs, men det er aldrig lykkedes at få produceret opgaver nok, som kan differentiere mellem de dygtigste elever, selvom det er et problem, som har været kendt i mange år.

Og heller ikke denne gang er der blevet produceret ekstra opgaver - tværtimod er 1,2 procent af de eksisterende opgaver blevet slettet, fordi de ikke fungerede i genberegningen af opgavernes sværhedsgrad. Styrelsen for It og Læring har brugt elevernes besvarelser fra de obligatoriske nationale test i perioden 2015-2019 til at beregne opgavernes sværhedsgrader på tværs af profilområderne. 

Minister: Nationale test kan give overblik over 'skolehuller'