Kronik

»Det er afgørende at holde øje med nogen, ikke at undersøge hvad de gør. Således holder kvalitetsrapporter, test og elevplaner øje med skoler, lærere og elever. Ingen af de nævnte evalueringstiltag er særlig gode til at forklare, hvorfor nogen så får bedre resultater end andre«

Skolen tæppebombes med evaluering

Der var engang, hvor man diskuterede, hvornår evaluering var på sin plads, og hvor man forsøgte at evaluere effekten af forskellige tiltag. I dag bruges evalueringssystemer som test og kvalitetsrapporter til at holde øje med nogen

Publiceret Senest opdateret

Bemærk

Denne artikel er flyttet fra en tidligere version af folkeskolen.dk, og det kan medføre nogle mangler i bl.a. layout, billeder og billedbeskæring, ligesom det desværre ikke har været teknisk muligt at overføre eventuelle kommentarer under artiklen.

Blandt evalueringskulturens meget synlige konsekvenser de senere år er test, elevplaner og kvalitetsrapporter. Blandt evalueringskulturens mindre diskuterede aspekter er, hvorvidt måderne at evaluere på afspejler udviklingstræk i samfundet, og om det kunne gøres anderledes.

Faktisk er det mit synspunkt, at netop test, elevplaner og kvalitetsrapporter er præget af en ganske bestemt fortolkning af, hvad evaluering er og bør være. Denne mentalitet er hverken den eneste eller bedste evalueringskultur, man kan forestille sig.

Jeg vil i det følgende prøve at vise, hvor lidt indlysende den nuværende udgave af evalueringsmentaliteten er. Det vil jeg gøre ved at illustrere tre parallelle udviklinger i evalueringsfeltet, som jeg i grov stikordsform vil beskrive som:

- fra velplaceret til heldækkende evaluering

- fra evaluering af virkemiddel til evaluering af udførelse

- fra eksperimenterende til forsikrende sigte med evaluering.

I 1970'erne, før evaluering spillede nogen væsentlig skolepolitisk rolle i Danmark, var der en livlig diskussion i det internationale evalueringsfelt. Man diskuterede blandt andet, hvornår evaluering var på sin plads. Diskussionen førte til en slags »evaluerbarhedsvurdering«, hvor man i hvert enkelt tilfælde nøje skulle overveje fordele og ulemper ved en given evaluering. Fordelene vurderedes til at være størst, når indsatsen og målene var veldefinerede, resultaterne usikre og handleparatheden stor. Heroverfor skulle man så nøje vurdere omkostningerne ved evaluering. Så kunne man bestemme, hvor meningsfuld og virkningsfuld evaluering ville være som et velplaceret instrument i den enkelte situation.

Ideen er senere forladt, måske fordi den er for rationel. Som erstatning for denne ide har man fået ideen om, at alt og alle inden for et politikområde nærmest skal tæppebombes med evaluering. Fælles for test, elevplaner og kvalitetsrapporter er således deres obligatoriske, heldækkende karakter. Det bliver umuligt at slippe. Jeg medgiver, at heldækkende evaluering kan fange problemer, som ellers ikke var blevet belyst. Men problemerne ved heldækkende evaluering er også store. Man vil komme til at udarbejde kvalitetsrapporter over jævnt pænt fungerende skoler - rapporter, som få eller ingen læser. Man vil bede lærere i små fag på distancen lave rutineprægede udsagn til elevplaner for pænt fungerende børn, uden at det vil gøre den store forskel. Test vil blive afholdt, fordi der skal testes. Der mangler vurdering af, hvorvidt fordelene ved disse indsatser står mål med resurserne. Men med heldækkende evalueringssystemer øges resursebeslaglæggelsen i hvert fald.

Vurdering af virkemidler optog forskerne i evalueringens barndom. Hermed menes alle de variationer i indsatser, der kan gøre en forskel for resultaterne. I skolens verden er virkemidlerne for eksempel pædagogiske metoder, klassestørrelsen, lærernes uddannelse, undervisningsmaterialerne og undervisningens organisering. Evalueringsforskere og nogle pædagogiske forskere har været optagede af at kortlægge virkemidlernes effekter. Selvom »effekter« inden for undervisningsverdenen i vidt omfang er kontekstafhængige, så er viden om effekter interessant i et praktisk handlingsperspektiv, fordi den tillader overførsel af viden og læring fra én situation til en anden.

I den dominerende evalueringsmentalitet har man imidlertid glemt fokus på virkemidler. I stedet belyser man de aktører, der er udførende. Det afgørende er at holde øje med nogen, ikke at undersøge hvad de gør. Således holder kvalitetsrapporter, test og elevplaner øje med skoler, lærere og elever. Ingen af de nævnte evalueringstiltag er særlig gode til at forklare, hvorfor nogen så får bedre resultater end andre. Derfor er det også en tilsnigelse, når den eksisterende evalueringsmentalitet tages til indtægt for, at man gerne vil »lære af de gode eksempler«. Vi har allerede set illustrative eksempler på, at det ikke hjælper at udpege den bedst scorende kommune eller skole, hvis ingen er i stand til at sætte ord på de virkemidler, der har skabt de gode resultater.

Samme pointe tydeliggøres af den tredje og sidste udvikling, jeg her vil pege på, nemlig skreddet fra eksperimenter til forsikring. I evalueringens barndom undersøgte man udfaldet af eksperimenter for at finde ud af, om de skulle bruges også efter og uden for eksperimentalsituationen. Eksperimentet ansporer til, at man fordomsfrit afsøger ny viden i kanten af, hvad man kan i forvejen.

Men forkærligheden for eksperimenter er døet ud i den aktuelle evalueringskultur.

Sammen med heldækkende opsyn af de enkelte udførere er man nu i stedet optaget af at undgå udfald og lave scorer. Ingen må falde under den fastsatte standard. Det kalder man kvalitetssikring. Evalueringskulturen afspejler et samfund, som har glemt sine ambitioner om fremskridt og i stedet er blevet optaget af at undgå ulykker - en mentalitet, som har fået vind i sejlene efter september 2001. Men hvis alle er optaget af at få en jævnt pæn score, er det ikke nødvendigvis godt for hverken udviklingstrangen eller arbejdsglæden. Og pædagogisk-filosofisk peger flere seriøse kritikere på, at når fremtiden er spændende, udfordrende, usikker og flertydig, er det bedste, vi kan gøre for vores unge, vores land og vores konkurrenceevne, ikke nødvendigvis at insistere på kanon og test som garantier for det sikre.

I et par af de helt aktuelle diskussioner af evalueringskulturen er man ved at opdage svaghederne ved de netop indførte tiltag. Heldækkende, obligatorisk, forsikrende evaluering med fokus på alle udførende led har ulemper. De er stærkt resursekrævende - idet resurserne dog usynliggøres, fordi de stjæles fra den almindelige arbejdstid. Evalueringstiltagene klemmes ind også i alle de tilfælde, hvor de ingen forskel kan gøre i praksis. Samtidig sætter man tiltagene ind, uden at de er godt udviklede og gennemprøvede. Derfor fremsættes der nu politiske ønsker om, at test alligevel ikke skal være obligatoriske, før de er godt gennemprøvede. Her sender jeg så nostalgiske tanker tilbage til den tid, hvor man faktisk fandt det fornuftigt at udvikle (og evaluere!) tiltag i lille skala, før man gjorde dem obligatoriske.

Nu er jeg ikke fortaler for, at man spoler tiden tilbage til skolens tidligere appel til et stort og varmt værdifællesskab, hvor tillid skulle overflødiggøre enhver dokumentation. Men der er brug for, at vi i et moderne vidensamfund udvikler mere intelligente måder at evaluere på, hvor vi fastholder det bedste af de ideer, der handler om eksperimenter og om virkemidler og om med dømmekraft at sætte evaluering ind dér, hvor den kan gøre en positiv forskel. |

»Man vil bede lærere i små fag på distancen lave rutineprægede udsagn til elevplaner for pænt fungerende børn«»Evalueringstiltagene klemmes ind også i alle de tilfælde, hvor de ingen forskel kan gøre i praksis«