educare 2015:2 - Malmö högskola

Transcription

LisaLisa
Asp-Onsjö
Lisa
Asp-Onsjö
Asp-Onsjö
Challenges
Challenges
Challenges
of of
Assessment
of
Assessment
Assessment
in in
Ethics
in
Ethics
Ethics
– Teachers’
– Teachers’
– Teachers’
reflections
reflections
reflections
when
when
when
assessing
assessing
assessing
National
National
National
Tests
Tests
Tests
Christina
Christina
Christina
Osbeck,
Osbeck,
Osbeck,
Olof
Olof
Olof
Franck,
Franck,
Franck,
Annika
Annika
Annika
LiljaLilja
and
Lilja
and
Annika
and
Annika
Annika
Lindskog
Lindskog
Lindskog
E D U C A R E 2 0 15 : 2
E D U C A R E 2 0 15 : 2
E D U C A R E 2 0 15 : 2
Gästredaktören
Gästredaktören
Gästredaktören
har
har
har
ordet!
ordet!
ordet!
Kritiska
Kritiska
Kritiska
perspektiv
perspektiv
perspektiv
påpå
bedömning
på
bedömning
bedömning
och
och
och
dokumentation
dokumentation
dokumentation
22
015
2015
015
: 2: 2
:2
DeDe
nationella
De
nationella
nationella
proven
proven
proven
i NO
i NO
i NO
åkåk
6.
åk
6.
Skillnader
6.
Skillnader
Skillnader
i resultat
i resultat
i resultat
mellan
mellan
mellan
olika
olika
olika
grupper
grupper
grupper
Frank
Frank
Frank
Bach,
Bach,
Bach,
Birgitta
Birgitta
Birgitta
Frändberg,
Frändberg,
Frändberg,
Mats
Mats
Mats
Hagman,
Hagman,
Hagman,
EvaEva
West
Eva
West
West
ochoch
Ann
och
Ann
Zetterqvist
Ann
Zetterqvist
Zetterqvist
Professionalism
Professionalism
Professionalism
in in
action
in
action
action
– Music
– Music
– Music
teachers
teachers
teachers
onon
an
on
an
assessment
an
assessment
assessment
journey
journey
journey
Johan
Johan
Johan
Nyberg
Nyberg
Nyberg
Kan
Kan
Kan
dudu
tage
du
tage
tage
pigen
pigen
pigen
opop
af
op
af
kufferten?
af
kufferten?
kufferten?
EnEn
analyse
En
analyse
analyse
af af
sproglig
af
sproglig
sproglig
evaluering
evaluering
evaluering
i daginstitutioner
i daginstitutioner
i daginstitutioner
LarsLars
Holm
Lars
Holm
Holm
Bedömning
Bedömning
Bedömning
påpå
systemnivå
på
systemnivå
systemnivå
- En
- En
-komparativ
En
komparativ
komparativ
studie
studie
studie
avav
stegsystemet
av
stegsystemet
stegsystemet
i språk
i språk
i språk
i den
i den
i den
svenska
svenska
svenska
skolan
skolan
skolan
och
och
och
språknivåer
språknivåer
språknivåer
i Europarådets
i Europarådets
i Europarådets
Common
Common
Common
European
European
European
Framework
Framework
Framework
of of
Reference
of
Reference
Reference
forfor
Languages
for
Languages
Languages
(CEFR)
(CEFR)
(CEFR)
KRITISKA
KRITISKA
KRITISKAPERSPEKTIV
PERSPEKTIV
PERSPEKTIV
PÅ
PÅ
PÅBEDÖMNING
BEDÖMNING
BEDÖMNINGOCH
OCH
OCH
DOKUMENTATION
DOKUMENTATION
DOKUMENTATION
Mats
Mats
Mats
Oscarson
Oscarson
Oscarson
Elevbedömning,
Elevbedömning,
Elevbedömning,
motivation
motivation
motivation
och
och
och
uppförande.
uppförande.
uppförande.
EnEn
studie
En
studie
studie
avav
skolvisa
av
skolvisa
skolvisa
skillnader
skillnader
skillnader
i bedömning
i bedömning
i bedömning
och
och
och
diskrepans
diskrepans
diskrepans
mellan
mellan
mellan
vitsord
vitsord
vitsord
och
och
och
testresultat
testresultat
testresultat
i årskurs
i årskurs
i årskurs
9 99
i finlandssvenska
i finlandssvenska
i finlandssvenska
skolor
skolor
skolor
Camilla
Camilla
Camilla
Svens-Liavåg,
Svens-Liavåg,
Svens-Liavåg,
Johan
Johan
Johan
Korhonen
Korhonen
Korhonen
ochoch
Karin
och
Karin
Karin
Linnanmäki
Linnanmäki
Linnanmäki
Sambedömning
Sambedömning
Sambedömning
förför
ökad
för
ökad
ökad
likvärdighet?
likvärdighet?
likvärdighet?
PiaPia
Thornberg
Pia
Thornberg
Thornberg
ochoch
Anders
och
Anders
Anders
Jönsson
Jönsson
Jönsson
Bedömnings-,
Bedömnings-,
Bedömnings-,
dokumentationspraktiker
och
och
och
pedagogiska
pedagogiska
pedagogiska
identiteter
identiteter
identiteter
Ingela
Ingela
Ingela
Andreasson,
Andreasson,
Andreasson,
MajMaj
Asplund
Maj
Asplund
Asplund
Carlsson
Carlsson
Carlsson
ochoch
Marianne
och
Marianne
Marianne
Dovemark
Dovemark
Dovemark
IUP
IUP
IUP
i Praktiken:
i Praktiken:
i Praktiken:
EnEn
skolreforms
En
skolreforms
skolreforms
formande
formande
formande
i skärningspunkten
i skärningspunkten
i skärningspunkten
mellan
mellan
mellan
yttre
yttre
yttre
styrning
styrning
styrning
och
och
och
professionell
professionell
professionell
autonomi
autonomi
autonomi
ÅsaÅsa
Hirsh
Åsa
Hirsh
Hirsh
E DUC
EEDUC
DUC
AA
RAR
EREE
VE
VE
VE
TE
TTNS
EENS
NS
KAP
KAP
KAP
L IG
LLIG
IG
AAA
SKR
SKR
SKR
I FI T
FI FE
TTR
EERR
Lärande
Lärande
Lärande
ochoch
samhälle,
och
samhälle,
samhälle,
Malmö
Malmö
Malmö
högskola
högskola
högskola
ISBN
ISBN
ISBN
978-91-7104-498-3
978-91-7104-498-3
978-91-7104-498-3
(tryckt)
(tryckt)
(tryckt)
ISBN
ISBN
ISBN
978-91-7104-499-0
978-91-7104-499-0
978-91-7104-499-0
(pdf)
(pdf)
(pdf)
2015:
2015:
2015:
1 Kritiska
1 Kritiska
1 Kritiska
perspektiv
perspektiv
perspektiv
på på
bedömning
på
bedömning
bedömning
ochoch
dokumentation
och
dokumentation
dokumentation
E DUC
EEDUC
DUC
AR
AR
AR
E EE
VE
VE
VE
TE
TTNSKAP
EENSKAP
NSKAP
L IG
LLIG
IG
AAA
SKR
SKR
SKR
I FI T
FI FE
TTR
EERR
EDUCARE
EDUCARE
– Vetenskapliga
– Vetenskapliga
skrifter
skrifter
är enärskriftserie
en skriftserie
som som
ges ut
ges
vidutFakulteten
vid Fakulteten
för lärande
för lärande
och och
samhälle,
samhälle,
vid Malmö
vid Malmö
högskola
högskola
sedan
sedan
hösten
hösten
2005.
2005.
Den speglar
Den speglar
den mångfald
den mångfald
av ämnen
av ämnen
och och
forskningsinriktningar
som som
finnsfinns
inominom
utbildningsvetenskap.
EDUCARE
EDUCARE
är också
är också
ett nationellt
ett nationellt
och nordiskt
och nordiskt
forum
forum
där nyare
där nyare
forskning,
forskning,
aktuella
aktuella
perspektiv
perspektiv
på utbildningsvetenskapens
ämnen
ämnen
samtsamt
utvecklingsarbeten
utvecklingsarbeten
med med
ett teoretiskt
ett teoretiskt
fundament
fundament
ges plats.
ges plats.
EDUCARE
EDUCARE
vänder
vänder
sig tillsig till
forskare,
forskare,
lärare
lärare
och studenter
och studenter
vid lärarutbildningar,
högskolor
högskolor
och universitet
och universitet
samtsamt
alla alla
intresserade
intresserade
inominom
skola-skolaoch utbildningsväsende.
och utbildningsväsende.
ADRESS
ADRESS
EDUCARE
EDUCARE
-vetenskapliga
-vetenskapliga
skrifter,
skrifter,
Malmö
Malmö
högskola,
högskola,
205 205
06 Malmö.
06 Malmö.
www.mah.se/educare
www.mah.se/educare
ARTIKL
ARTIKL
AR AR
EDUCARE
EDUCARE
välkomnar
välkomnar
originalmanus
originalmanus
på max
på max
80008000
ord. Artiklarna
ord. Artiklarna
ska vara
ska vara
skrivna
skrivna
på något
på något
nordiskt
nordiskt
språkspråk
eller eller
engelska.
engelska.
Tidskriften
Tidskriften
är refereegranskad
är refereegranskad
vilketvilket
innebär
innebär
att alla
att inkomna
alla inkomna
manus
manus
granskas
granskas
av två
avanonyma
två anonyma
sakkunniga.
sakkunniga.
Redaktionen
Redaktionen
förbehåller
förbehåller
sig rätten
sig rätten
att redigera
att redigera
texterna.
texterna.
Författarna
Författarna
ansvarar
ansvarar
för innehållet
för innehållet
i sinai artiklar.
sina artiklar.
För ytterligare
För ytterligare
information
information
se se
författarinstruktioner
på hemsidan
på hemsidan
www.mah.se/educare
www.mah.se/educare
eller eller
vändvänd
er direkt
er direkt
till redaktionen.
till redaktionen.
Artiklarna
Artiklarna
publiceras
publiceras
ävenäven
elektroniskt
elektroniskt
i MUEP,
i MUEP,
Malmö
Malmö
University
University
Electronic
Electronic
Publishing,
Publishing,
www.mah.se/muep
www.mah.se/muep
REDAK
REDAK
TIONTION
Johan
Johan
Söderman,
Söderman,
huvudredaktör
huvudredaktör
och Björn
och Björn
Sundmark,
Sundmark,
biträdande
biträdande
redaktör
redaktör
Redaktionsråd:
Redaktionsråd:
Cecilia
Cecilia
FermFerm
Thorgersen,
Thorgersen,
Hector
Hector
Perez,
Perez,
Lisa Asp-Onsjö,
Lisa Asp-Onsjö,
Thomas
Thomas
Johansson,
Johansson,
Andreas
Andreas
FejesFejes
och Anna-Carita
och Anna-Carita
Evaldsson.
Evaldsson.
COPYRIGHT:
COPYRIGHT:
Författarna
Författarna
och Malmö
och Malmö
högskola
högskola
EDUCARE
EDUCARE
2015:2
2015:2
Kritiska
Kritiska
perspektiv
perspektiv
på bedömning
på bedömning
och dokumentation
och dokumentation
TitelnTiteln
ingåringår
i serien
i serien
EDUCARE,
EDUCARE,
publicerad
publicerad
vid vid
Fakulteten
Fakulteten
för lärande
för lärande
och samhälle,
och samhälle,
Malmö
Malmö
högskola.
högskola.
GR AFISK
GR AFISK
FORM
FORM
TRYCK:
TRYCK:
Holmbergs
Holmbergs
AB, Malmö,
AB, Malmö,
20152015
ISBNISBN
: 978-91-7104-498-3
: 978-91-7104-498-3
( tr yck)
( tr yck)
ISBNISBN
: 978-91-7104-499-0
: 978-91-7104-499-0
( pdf)( pdf)
ISSNISSN
: 1653-1868
: 1653-1868
BESTÄLLNINGSADRESS
BESTÄLLNINGSADRESS
www.mah.se/muep
www.mah.se/muep
Holmbergs
Holmbergs
AB AB
Box 25
Box 25
201 201
20 Malmö
20 Malmö
TEL. 040-660
TEL. 040-660
66 60
66 60
FAX 040-660
FAX 040-660
66 70
66 70
EPOST
EPOST
: info@holmbergs.com
E D U CA RE
E D U C A R E är latin och betyder närmast ”ta sig an” eller ”ha omsorg för”. Educare är
rotord till t.ex. engelskans och franskans education/éducation, vilket på svenska
motsvaras av såväl ”(upp)fostran” som av ”långvarig omsorg”. I detta lägger vi ett
bildnings- och utbildningsideal som uttrycker människors potential och vilja att
ömsesidigt växa, lära och utvecklas.
EDUCARE 2015:2
Förord
Educare är en sakkunniggranskad tidskrift som finns vid fakulteten
för lärande och samhälle på Malmö högskola. Dess ambition är att
publicera artiklar från det breda fält som utgör det som benämns som
utbildningsvetenskap. Educare avser även att publicera specialnummer
kring aktuella teman inom det utbildningsvetenskapliga fältet. Detta
nummer (Educare 2015:2) består av nio artiklar som alla fokuserar på
bedömningsfrågor inom olika områden. Gästredaktör för detta nummer
är Lisa Asp-Onsjö, universitetslektor vid Göteborgs universitet samt
medlem av Educares redaktionsråd.
Trevlig läsning.
Johan Söderman & Björn Sundmark
EDUCARE 2015:2
3
I N N E H Å LL
Gästredaktören har ordet!
Kritiska perspektiv på bedömning och dokumentation
Lisa Asp-Onsjö
7
Challenges of Assessment in Ethics
– Teachers’ reflections when assessing National Tests
Christina Osbeck, Olof Franck, Annika Lilja and Annika Lindskog
19
De nationella proven i NO åk 6. Skillnader i resultat mellan olika grupper
Frank Bach, Birgitta Frändberg, Mats Hagman, Eva West och Ann Zetterqvist
48
Professionalism in action – Music teachers on an assessment journey
Johan Nyberg
71
Kan du tage pigen op af kufferten?
En analyse af sproglig evaluering i daginstitutioner
Lars Holm
103
Bedömning på systemnivå - En komparativ studie av stegsystemet i språk
i den svenska skolan och språknivåer i Europarådets Common European
Framework of Reference for Languages (CEFR)
Mats Oscarson
128
Elevbedömning, motivation och uppförande. En studie av skolvisa skillnader
i bedömning och diskrepans mellan vitsord och testresultat i årskurs 9
i finlandssvenska skolor
Camilla Svens-Liavåg, Johan Korhonen och Karin Linnanmäki
154
Sambedömning för ökad likvärdighet?
Pia Thornberg & Anders Jönsson 179
Bedömnings-, dokumentationspraktiker och pedagogiska identiteter
Ingela Andreasson, Maj Asplund Carlsson, Marianne Dovemark 206
IUP i Praktiken: En skolreforms formande i skärningspunkten mellan
yttre styrning och professionell autonomi
Åsa Hirsh
234
Medverkande författare
260
EDUCARE 2015:2
Kritiska perspektiv på bedömning och
dokumentation
Lisa Asp-Onsjö
Bedömning, betygsättning, prov och dokumentation av elevers
prestationer har fått en allt större betydelse i skolans vardag så väl
som i den politiska debatten. Primärt handlar betygsättning om
selektion, det används som medel för urval till högre utbildning. I
den marknadsstyrda skolan har konkurrensen hårdnat och krupit ner
i grundskolans tidigare år, betyg i årskurs 4 kommer 2015 att införas
på försök i ett flertal kommuner. Det spelar också allt större roll för
betygen vilken skola en elev gått i. Betygssystemets utformning är en
brännande het politisk fråga som förutom politikerna själva engagerar
lärarnas fackliga organisationer, föräldrar och elever.
Det finns inget område där politikens syn på vilket samhälle man vill
skapa visar sig tydligare än i synen på skolan. I den sammanhållna skolan som formades i Sverige under decennierna efter andra världskriget
utvecklades idéer om att skolan inte bara var en arena för kunskaps
inhämtning och disciplinering av eleverna. Skolan skulle också stärka
medborgarskapet och demokratin (Lundahl, 2014). Erfarenheterna från
den bristande sociala sammanhållning som de stora inkomstklyftorna
skapade, liksom de lärdomar som måste dras från de totalitära rörelser
som lagt grunden för andra världskriget, talade för nödvändigheten att
förhålla sig kritisk till den traditionella skolans auktoritära strukturer.
Elever måste fostras att tänka fritt och inte låta sig underordnas starka
ledare (Lundgren, 1979). Direkt efter krigsslutet tillsattes Skolkommissionen med intentionen att skapa långsiktigt hållbara riktlinjer för svensk
skola (SOU 1948:27). Samtliga politiska partier var överens om värdet
med denna övergripande målsättning, som kom att vara vägledande för
svensk skolpolitik under de följande decennierna (Lundgren, 1979).
EDUCARE 2015:2
7
LISA ASP-ONSJÖ
Betyg och bedömning i en skola för demokrati
Med den nya sammanhållna skolan kom ett modernt betygsystem att
utvecklas, ett system som skulle skapa större rättvisa och motverka att
enbart resursstarka familjers barn hade möjlighet att fortsätta högre upp
i utbildningssystemet. Det fanns, menade man, en begåvningsreserv i
de breda folklagren. Att realisera denna reserv sågs som ett viktigt
moment i formandet av ett samhälle där alla kom till tals på mer
likvärdiga villkor (Lundgren, 1979; Isling, 1980). Samtidigt fanns det
under de radikala 1960 och 1970-talen en stark kritik mot betyg över
huvud taget. Elevorganisationer såväl som politiska ungdomsförbund
ville göra skolan till en central arena för hela samhällsbygget och
betygen sågs då stå i vägen för elevens sökande och fria utveckling.
Idag råder närmast konsensus om betygens nödvändighet, inte minst är
det svårt att se på vilket sätt betygens selekterande funktion för de som
går vidare till högre utbildning helt kan ersättas av något annat system.
Bedömning och betyg har också en kontrollfunktion, där både elever
och skolor jämförs med varandra och kontrolleras. I bedömning och
betygsättning finns alltid aspekter av negativ maktutövning invävda
(Erickson & Gustafsson, 2014). Bedömning kan således inte ses som
vare sig enbart positivt eller negativt. Det handlar snarast om hur
bedömningen görs och i vilket sammanhang.
I dag finns, inte minst i den politiska retoriken, en uppfattning om
att fler och mer omfattande prov är en väg för att höja resultaten i
skolan (Lundahl, 2011). I svensk skola har bedömning fått en allt
mer prioriterad position genom utökade prov och kontrollinstanser.
Samtidigt visar olika kunskapsmätningar att en långt driven provkultur
tvärtom riskerar att sänka skolresultaten. Detta har under senare år
synliggjorts i svenska elevers sjunkande studieresultat i internationella
jämförelser som PISA (Skolverket, 2013). Paradoxalt i detta
sammanhang är att betygsnivån i den svenska skolan stadigt gått upp
över tid, samtidigt som kunskapsnivån i internationella mätningar
går åt motsatt håll. Detta är en konsekvens av den betygsinflation
som under senare tid pressats fram genom skolans marknadisering
(Skolverket, 2012).
8
EDUCARE 2015:2
Fokus på betyg gynnar en instrumentell syn på
kunskap och lärande
I den senaste PISA mätningen placerar sig Sverige strax under
medel bland OECD-länderna. Undersökningen visar också att det är
de lågpresterande elevernas kunskaper som sjunkit mest. De ökade
skillnaderna visar att likvärdigheten i skolan stadigt försämrats
(Skolverket, 2013). Den fokusering på bedömning och betyg som under
senare tid tagit allt större plats i den svenska skolan verkar sammantaget
inte ha lett till bättre prestationer hos eleverna. Detta mönster stämmer
överens med internationell forskning som visar att mer omfattande
mätningar, prov och betyg, trots den uttalade intentionen att proven
skall stödja de svaga och utsatta eleverna, istället leder till att just
dessa barn blir förlorarna och klyftan mellan de välpresterande och
svagpresterande ökar (Alexander, 2010; Ravitch, 2011). Ensidigt fokus
på betyg och kunskapsmätning riskerar i stället att leda till brist på
dialog, sökande och kreativitet, så väl som på oförmåga till kritiskt
tänkande (Liedman, 2012; Wyndhamn, 2013). Den ökade betoningen
på betyg och bedömning riskerar också att gynna en instrumentell
inställning till skola och lärande (Asp-Onsjö, 2011; Liedman, 2012).
Under senare år har det blivit vanligare att elevers betygsnivåer
presenteras och jämförs i olika tabeller och rankninglistor, vilket lett
till ökade krav på skolorna att uppvisa goda resultat för att kunna
rekrytera elever. Reformerna har drivit fram en skolmarknad som gjort
eleven till kund och utbildning till en vara.
Formativ bedömning
Diskussionen om betyg har under senare tid, som ett sätt att parera
instrumentaliseringen av undervisningen, kretsat runt formativ
bedömning eller ”bedömning för lärande”. Denna form av bedömning
ses som mjukare och mer processorienterad (Jönsson, 2011; Lundahl,
2011; Erickson & Gustafsson, 2014). Kritiker menar att man ibland vill
legitimera betyg och bedömning genom att tillskriva dem en pedagogisk
funktion som de inte alltid kan leva upp till. Betyg säger något om vad
en elev presterat men ingenting om elevens utvecklingspotential eller
slumrande möjligheter. Ett annat sätt att uttrycka detta är att kunskapens
frukter inte endast kan skördas i nutid utan även i framtiden, som Nyberg
EDUCARE 2015:2
9
LISA ASP-ONSJÖ
uttrycker det (med hänvisning till Dewey) i sin artikel i denna volym.
Bedömning är således ett tveeggat svärd, en allt för instrumentell
kunskapskontroll tenderar främst att motivera redan studievana elever
medan effekten på de svagpresterande är den motsatta. Att ständigt bli
bedömd som lågpresterande sänker dessa elevers prestationer och får
också konsekvenser för deras identitetsutveckling (Klapp. Clifordsson,
& Gustafsson, 2014).
Den svenska skolan – från likvärdighet till
segregation
Under decennierna efter andra världskriget blev Sverige den mest
framträdande representanten för den Nordiska välfärdsmodellen.
En viktig aspekt i den nya välfärdsstaten var likvärdiga möjligheter
till utbildning, oavsett kön, klass, etnisk bakgrund eller geografisk
hemort (Lundahl, 2005). I de internationella IAE-undersökningar som
genomfördes av OECD från 1970-talet visade den svenska skolan upp
såväl en hög grad av likvärdighet som goda resultat (Fejan Ljunghill
& Svensson, 2006). Begreppet ’En skola för alla’ var vägledande
och skolan sågs som en mötesplats för elever från olika sociala
skikt på någorlunda likvärdiga villkor. Under de senare decennierna
har den svenska skolan genomgått förändringar mot målstyrning,
marknadsanpassning och införande av ett friskolesystem som har
urholkat den likvärdighet mellan skolor som var kännetecknande för
svensk skola. Vi har via det fria skolvalet fått en skola som sorterar
och skiktar såväl skolor som elever. Forskning visar att det som en
gång framställdes som ett sätt att bryta segregationen fått motsatt
effekt (Bunar, 2010: Östh, Andersson, & Malmberg, 2013). Skolan
kompenserar inte längre för de allt påtagligare socio-ekonomiska
skillnaderna i det svenska samhället, trots att det på policy nivå
fortfarande lever kvar en retorik om alla elevers lika möjligheter och
rättigheter.
Nationella prov
När den svenska skolan lämnade det relativa betygssystemet och
genom införandet av det målrelaterade betygssystemet har det skett
en omfattande ökning av antalet nationella prov i skolan. Dagens
10
EDUCARE 2015:2
nationella prov har två huvudsakliga syften. Dels ska de användas
för att främja en likvärdig och rättvis bedömning och betygssättning,
dels ska de ge underlag för betygssättning och bedömning av elevers
resultat i olika ämnen. På individnivå värderas den enskilda elevens
resultat och prestationen jämförs med andra elevers. Ett argument för de
nationella provens existens är att de bidrar till en likvärdig bedömning
och betygsättning (Hopmann, 2008). Det innebär att den enskilda
skolans bedömningspraktik ska stämma överens med nationella
kriterier. I det nuvarande betygssystemet ska likvärdighet i bedömning
nås med hjälp av tydliga kriterier och kunskapskrav. Studier pekar
dock på att de tydliga kriterierna inte alltid är så tydliga utan att det här
finns ett stort utrymme för tolkning (Hyltegren, 2014). Samtidigt som
likvärdighetsaspekterna under de senaste decennierna tonats ner har
fokus på bedömning av elevens individuella insatser förstärkts. Proven
mäter inte i första hand klassens kunskaper på gruppnivå utan det är
varje elevs individuella prestation som står i centrum.
Vad innehåller detta nummer av Educare?
I detta nummer av tidskriften Educare har vi samlat ett antal artiklar
som belyser skolans bedömnings- och dokumentationspraktiker ur
olika perspektiv. Inledningsvis behandlar Christina Osbeck, Olof
Franck, Annika Lilja och Annika Lindskog i artikeln ”Challenges of
Assessment in Ethics – Teachers’ reflections when assessing National
Tests” hur lärare resonerar vid bedömningen av nationella prov i etik
inom religionsundervisningen. Författarna beskriver det etiska fältet
som vagt och otydligt, bedömning av elevers insatser blir i detta
sammanhang särskilt komplicerat. I studien där sex lärares resonemang
analyseras i en så kallad ’think aloud study’ framkommer att lärarna
uppfattar det som problematiskt att uttyda provinstruktionerna på
grund av ämnets tvetydighet mellan etik som ämneskunskap och etik
som en del i skolans normativa projekt. De ibland motstridiga idéer
om vad som ska utgöra grund för höga betyg uppfattas också som en
utmaning, dessutom föreligger en svårighet att differentiera elevernas
prestationer utifrån deras provsvar. I diskussionen efterlyses en djupare
analys av vilka kompetenser som ska utgöra grund för bedömning av
elevers betygssättning i ämnet etik.
EDUCARE 2015:2
11
LISA ASP-ONSJÖ
Ytterligare en artikel tar sin utgångspunkt i skolans nationella prov.
Det är Frank Bach, Birgitta Frändberg, Mats Hagman, Eva West
och Ann Zetterqvist som i artikel ”De nationella proven i NO åk 6.
Skillnader i resultat mellan olika grupper” problematiserar aspekter av
de nationella provens tillämpning. Samtliga författare är involverade
i konstruktion av de nationella proven i NO. Studiens data utgörs av
provresultaten av en tredjedel av alla nationella provresultat i biologi,
fysik och kemi, det så kallade Urval 2013 med syftet att belysa aspekter
av likvärdighet i lägre åldrar. Resultaten visar att skillnaderna mellan
olika undervisningsgrupper har ökat och att variationen nu uppgår till
25 %. En fjärdedel av variationen i resultat härrör sig alltså från vilken
undervisningsgrupp som eleven går i, något som författarna menar
visar att skolans kompensatoriska uppdrag försvagats. Skillnaderna
mellan olika grupper blir också tydliga allt lägre ner i åldrarna. Studien
visar också att det finns stora skillnader mellan elever med svenska
som modersmål, respektive svenska som andra språk, och att dessa
skillnader inte bara beror på språkliga svårigheter utan är av mer
generell natur.
Komplexiteten i bedömning i musik på gymnasiets estetiska
program är temat för Johan Nybergs artikel ”Professionalism in
action. Music teachers on an assessment journey”. Artikeln redovisar
resultaten från en studie med aktionsforskningsansats med syftet
att utveckla kunskap om musiklärares erfarenheter av bedömning i
musikämnet. Utgångspunkten är en av Dewey inspirerad holistisk syn
på utbildning och de frågor som intresserar Nyberg är relaterade till
lärarens professionella ansvar. På vilket sätt förstår läraren musikaliskt
lärande, musikaliska färdigheter och kunskap och vad innebär denna
förståelse för de frågor som uppenbarar sig när betyg skall sättas?
Vilka kvaliteter i det musikaliska lärandet utgör grunden för lärarens
bedömning av eleverna? Undersökningens resultat visar att musiklärare
har en förmåga att se avgränsade delaspekter av lärandet utan att
förlora det holistiska perspektivet på elevens hela kommunikativa och
musikaliska förmåga ur sikte.
Artikeln ”Kan du tage pigen op av kufferten? En analys af sproglig
evaluering i dagisinstitutioner” springer ur en studie av språktester
på två förskolor i Köpenhamn. Texten är skriven av Lars Holm från
Universitetet i Århus. Studien är en analys av den gällande praktiken
för språktest. Den form för språktester som idag dominerar forskningen
12
EDUCARE 2015:2
har en stark laborativ karaktär och är därför oförmögen att läsa av
barnets språkliga kompetens utifrån den sociala vardagsvärld och
situation som barnet befinner sig i. Av denna anledning förbigår testerna
viktiga aspekter av barnets kreativa och produktiva potentialer som
språkproducenter. Holm förespråkar därför en vändning mot en mer
insider-orienterad och etnografiskt baserad undersökningspraktik. Han
påpekar vidare att den nu dominerade formen för språktester är grundad
i en strukturalistisk förståelse av språk och kommunikation. Holm
argumenterar för betydelsen av en förståelse av språk som ett dynamiskt,
socialt och interaktionellt fenomen där den meningsbärande aspekten är
förankrad i barnets sociala kontext och vardagsvärld.
Ytterligare en artikel handlar om språktest men nu i en internationell
kontext. Mats Oscarson beskriver i artikeln ”Bedömning på systemnivå”
ett arbete av Europarådet med syftet att identifiera nivåer och mål för
lärande i språk på ett tydligt och allmängiltigt sätt. Det resulterade
i definitionen av sex grundläggande kompetensnivåer (Levels) enligt
en beskrivningsmodell kallad Common European Framework of
Reference for Languages (Council of Europe, 2001). Resultaten av detta
arbete har fått internationellt genomslag och CEFR-konceptet används
både i Europa och i många andra delar av världen som ett hjälpmedel
vid kommunikation om mål och verksamheter i språktestnings- och
språkundervisningssammanhang. I artikeln, som har en textanalytisk
ansats, beskrivs en tidigare ej publicerad studie som undersöker hur de
sju språkstegen i svenska kursplaner innehållsmässigt och strukturellt
förhåller sig till det mer utvecklade CEFR-systemets sex nivåer.
Från ett annat av våra nordiska grannländer kommer artikeln
”Elevbedömning, motivation och uppförande. En studie av skolvisa
skillnader och diskrepans mellan vitsord och testresultat i årskurs 9 i
finlandssvenska skolor” av Camilla Svens-Liavåg, Johan Korhonens
och Karin Linnanmäkis. I artikeln behandlas skolvisa skillnader i
bedömning av modersmål och litteratur samt matematik i relation till
bedömning av elevens uppförande. I finlandssvenska skolor betygsätts
elevens förmåga att planera, genomföra och bedöma sitt eget arbete
så väl som ansvarskänsla och kapacitet till samarbete. I en longitudinell studie, följs 1152 elever från 14 skolor i Svenskfinland, från
nionde klass till arbetslivet. Studien visar att motivation i skolämnet är
den starkaste prediktorn för diskrepans mellan testresultat och vitsord.
Elevens motivation har stor inverkan på betygsättningen både i mate
EDUCARE 2015:2
13
LISA ASP-ONSJÖ
matik och modersmål och litteratur men på lite olika sätt. Det visar sig
att elever med höga uppförandebetyg ges högre betyg i modersmål och
litteratur än vad som är motiverat utifrån testresultaten. I matematik är
det motivationen för ämnet som sådant som är utslagsgivande snarare
än elevens uppförande. Intressant att notera är också att förhållandet
mellan pojkars och flickors prestationer är relativt jämlik.
För att motverka skillnader och öka likvärdigheten i bedömning
mellan olika lärare och skolor förespråkas ofta sambedömning, det
vill säga att lärare samarbetar i bedömningsprocessen. I artikeln
”Sambedömning för ökad likvärdighet?” gör Anders Jönsson och Pia
Thornberg en litteraturstudie av internationella, tidigare publicerade och
vetenskapligt granskade empiriska underökningar om sambedömning
i grundskola och gymnasium. Studien genomförs genom sökning av
kodord på internet som redovisas i en narrativ sammanställning över
23 studier som matchade de utvalda sökorden. Författarna visar att
resultaten inte ger något entydigt svar på om sambedömning verkligen
leder till ökad likvärdighet i bedömning och betygssättning. Men de
menar att sambedömning har en potential att bidra till ökad samsyn
såväl som ökad bedömarkompetens hos lärare. Om sambedömningen
ses som en process och görs i flera av tolkningsleden så ökar samsynen.
Författarna noterar att samsyn och samstämmighet inte är samma sak,
i vissa fall kan sambedömning snarast handla om att skillnader i olika
bedömares synsätt explicitgörs.
Det andra temat i denna volym handlar om dokumentation.
Skolans elevdokumentation är nära sammanlänkad med olika
bedömningspraktiker. Som underlag för betyg ska elevens prestationer
dokumenteras i skilda mer eller mindre formaliserade dokument. Flera
författare pekar på att dokumentationen i form av kartläggningar,
åtgärdsprogram och individuella utvecklingsplaner i den marknads
styrda svenska skolan har vuxit och antagit väldiga proportioner
och därigenom kommit att utgöra ett hinder snarare än en hjälp för
lärarkåren (Andreasson, Asp-Onsjö & Isaksson, 2013). På grund av
omfattande kritik från bland annat lärarnas fackliga organisationer har
restriktioner i kraven på dokumentation införts under det senaste året.
Individuella utvecklingsplaner ska nu utarbetas endast i skolår 1-5 och
då enbart en gång per läsår. Individuella utvecklingsplaner utarbetas
vanligen digitalt och att de digitala plattformarnas design får betydelse
14
EDUCARE 2015:2
för hur planerna utformas uppmärksammas i två artiklar som belyser
individuella utvecklingsplaner ur olika perspektiv.
I artikeln ”Bedömnings-, dokumentationspraktiker och pedagogiska
identiteter” diskuterar Ingela Andreasson, Maj Asplund Carlsson och
Marianne Dovemark hur uppfattningen att ökad dokumentation leder
till bättre skolprestationer har drivit fram en situation där kommersiella,
digitala plattformar fått betydande inflytande över bedömningsoch dokumentationspraktiker i dagens skola och förskola. Genom
analys av 118 slumpvis utvalda planer från årkurs fem i en svensk
kommun studeras dokumentens diskursiva funktion utifrån delar av
Bernsteins teoretiska begreppsapparat. Resultaten visar att en starkt
regulativ diskurs med ett uttalat individfokus är vanligt förekommande
i de digitala planerna. Bedömning av elevens sociala förmågor och
personlighet får en framträdande roll medan den pedagogiska
organiseringen av i klassrummet hamnar i skymundan. Genomgående
förs i stället ansvaret tillbaks till den enskilda eleven.
Även den sista artikeln i denna volym handlar om individuella
utvecklingsplaner. Åsa Hirsh har i artikeln ”IUP i praktiken: en
skolreforms formande i skärningspunkten mellan yttre styrning och
professionell autonomi” gjort en re-analys av 15 intervjuer och 30
individuella utvecklingsplaner med lärare i skolans tre stadier 2011.
Hirsh använder sig i sin analys av Wartofskys begrepp primära,
sekundära och tertiära artefakter. Hennes resultat indikerar att lärare
som själva varit med och utformat dokumentationsmallarna i samarbete
med sina rektorer, i högre utsträckning anser att dokumentationen bidrar
till att höja kvalitén på deras undervisning. Hirsh menar att lärares
bedömningspraktiker formas av hur lärare förstår sitt uppdrag och av
de förväntningar som finns i den organisation lärarna befinner sig i.
Hon menar vidare att användningen av individuella utvecklingsplaner
belyser skärningspunkten mellan nationell och lokal styrning å ena
sidan och lärares professionella autonomi å den andra
I den marknadsstyrda skolan spelar statistik en viktig roll för
möjligheterna att jämföra olika skolor med varandra. Höga betygsnivåer
påverkar skolans anseende och dess förmåga att attrahera elever och
få en gynnsam ekonomisk situation. Den ökande fokuseringen på
dokumentation, bedömning och betyg måste därför också ses i ljuset
av den tilltagande konkurrensen mellan skolor på dagens svenska
skolmarknad (Asp-Onsjö, 2014).
EDUCARE 2015:2
15
LISA ASP-ONSJÖ
Referenser
Alexander, Robin (2010). (Red.), Children, their World, their
Education. Final report and recommendations of the Cambridge
Primary Review. New York: Routledge.
Andreasson, Ingela, Asp-Onsjö, Lisa & Isaksson, Joakim (2013).
Lessons learned from research on individual educational plans in
Sweden: obstacles, opportunities and future challenges. European
Journal of Special Needs Education, 28(4), 413-426.
Asp-Onsjö, Lisa (2011). Dokumentation, styrning och kontroll i den
svenska skolan. Educare, 11(2), 39-56.
Asp-Onsjö, Lisa (2014). Dokumentation, åtgärdsprogram och
inkludering I en skola för alla eller I en skola på marknadens villkor?
I Olof Franck (Red.), Motbok. Kritiska perspektiv på styrdokument,
lärarutbildning och skola. Lund: Studentlitteratur.
Bunar, Nihad (2010). The Controlled School Market and Urban
Schools in Sweden. Journal of School Choice, 4(1), 47-73.
Erickson, Gudrun & Gustafsson, Jan-Eric (2014). Bedömningens
dubbla funktion – för lärande och likvärdighet. I Ulf Peder
Lundgren, Roger Säljö & Caroline Liberg (Red.), Lärande, skola,
bildning (s. 559-589). Stockholm: Natur & Kultur.
Fejan Ljunghill, Lena & Svensson, Sten (2006). Motbok – om det
ideologiska sveket mot skolan. Stockholm: Lärarförbundet.
Hall, Patrik (2013). Managementbyråkrati – organisatorisk makt i
svensk offentlig förvaltning. Stockholm: Liber.
Hopmann, Stefan (2008). No child, no school, no state left behind:
schooling in the age of accountability. Journal of Curriculum
Studies, 40(4), 417-456.
Hyltegren, Gunnar (2014). Vaghet och vanmakt - 20 år med
kunskapskrav i den svenska skolan. Göteborg: Acta Universitatis
Gothoburgensis.
Isling, Åke (1980). Kampen för och emot en demokratisk skola.
Stockholm: Sober.
16
EDUCARE 2015:2
Jönsson, Anders (2011). Formativ bedömning. I Agneta Hult & Anders
Olofsson (Red.), Utvärdering och bedömning i skolan (s. 212-227).
Stockholm: Natur & Kultur.
Klapp, Alli, Cliffordson, Christina & Gustafsson, Jan-Eric (2014). The
effect of being graded on later acheivements: evidence from 13year olds in Swedish compulsory school. Educational Psychology:
An International Journal of Experimental Educational Psychology.
Recieved from internet http://dx.doi.org/10.1080/01443410.2014.
933176
Liedman, Sven-Eric (2012). Hets: en bok om skolan. Stockholm:
Bonniers.
Lundahl, Lisbeth (2005). A matter of self-governance and control: The
reconstruction of Swedish education policy - 1980-2003. European
Education, 37(1), 10-25.
Lundahl, Christian (2011). Bedömning för lärande. Stockholm:
Norstedts.
Lundahl, Christian (2014). Bedömning – att veta vad andra vet. I Ulf
Peder Lundgren, Roger Säljö & Caroline Liberg (Red.), Lärande,
skola, bildning (s. 519-557). Stockholm: Natur & Kultur.
Lundgren, Ulf Peder (1979). Att organisera omvärlden. En introduktion
till läroplansteori. Stockholm: Liber.
Ozga, Jenny, Dahler-Larsen, Peter, Segerholm, Christina & Simola,
Hannu (Reds.), (2011). Fabricating quality in education: Data and
governance in Europe, London: Routledge.
Ravitch, Diane (2011). The death and life of the great American school
system. How testing and choice are undermining education. New
York: Basic Books.
SOU 1948:27. 1946-års skolkommissions betänkande med förslag
till riktlinjer för det svenska skolväsendets utveckling. Stockholm:
Ecklisiastikdepatementet.
Skolverket (2012). Betygsinflation – betygen och den faktiska
kunskapsutvecklingen. Stockholm: Skolverket.
Skolverket (2013). PISA 2012. 15-åringars kunskaper i matematik,
läsförståelse och naturvetenskap. Stockholm: Fritzes.
EDUCARE 2015:2
17
LISA ASP-ONSJÖ
Wyndhamn, Anna-Karin (2013). Tänka fritt, tänka rätt. En studie
om värdeöverföring och kritiskt tänkande i gymnasieskolans
undervisning. Göteborg: Acta Universitatis Gothoburgensis.
Östh, John, Andersson, Eva & Malmberg, Bo (2013). School choice and
Increasing Performance Difference: A Counterfactual Approach.
Urban Studies, 50(2), 407-425.
18
EDUCARE 2015:2
Challenges of Assessment in Ethics –
Teachers’ reflections when assessing
National Tests
Christina Osbeck, Olof Franck, Annika Lilja
and Annika Lindskog
The aim of this article is to identify and discuss challenges in assessing
pupils’ knowledge in Ethics. The background of the study is the
development of the knowledge field Ethics, a part of Religious Education
(RE) in Sweden which in the sixties went from being a Christian school
subject to a pluralistic and non-confessional one. The knowledge field
Ethics is, in this school context, marked by vagueness, due partly to its
indistinct frames and partly to a duality in the aims represented in the
directives of the curriculum. Methodologically, data was produced through
a think-aloud study where six teachers assessed pupil-responses in Ethics
within the National Test for RE. The teachers’ ongoing assessments
were audio recorded, transcribed and analysed in a qualitative text
analysis that focused on different kinds of challenges that the teachers
experienced. Since this kind of study has not been conducted before, the
analyses were explorative and, rather than being theory guided, were
guided by the aim and the research question of the study. The findings
show three groups of challenges related to the assessment processes.
The first group of challenges concerns interpretations of the assessment
instructions, the second regards competing ideas about what students
should be given credit for during assessment in Ethics and the third is
about being positioned between the pupils’ need for good grades and
the task of differentiating between students. The discussion distinguishes
between general challenges in assessment and challenges related to
Ethics and its partly unclear character in the RE school context. In such
a situation when the construction of a knowledge field is vague, the
influence of national tests can be assumed to be considerable and the
need for research regarding different conceptions of ethical competence
is therefore urgent.
EDUCARE 2015:2
19
CHRISTINA OSBECK, OLOF FRANCK, ANNIKA LILJA
AND ANNIKA LINDSKOG
Keywords: assessment, ethics, national tests, religious education, thinkaloud study
Christina Osbeck, Associate Professor, University of Gothenburg
christina.osbeck@gu.se
Olof Franck, Associate Professor, University of Gothenburg
olof.franck@gu.se
Annika Lilja, Senior Lecture, University of Gothenburg
annika.lilja@ped.gu.se
Annika Lindskog, PhD Student, University of Gothenburg
annika.lindskog@ped.gu.se
Introduction
By tradition Religious Education (RE), in a Swedish context, involves
teaching in Ethics. This tradition can be traced back to those days when
this subject´s predecessor, the school subject Christianity, was taught
in school, resting upon a confessionally defined ground. Christianity
was, in an era and in a society where Christian perceptions of life
and values were explicit and supposed to mark identity as well as
community, thought to be the most important school subject, making
sure that children and young people were educated to be prepared for
living in a spirit of Christian faith and Christian morals (Selander,
1993; Algotsson, 1975).
Since the middle of the 1960s when the subject of Christianity was
replaced by RE (see, for example, Osbeck, 2013), Ethics has continued
to be a central strand within the subject. Of course, RE is now shaped
and practised within a non-confessional context, but this fact has
not broken the connection built between, on the one hand, religious
and existential dimensions and, on the other, ethical and moral ones
(Olivestam, 2012). Furthermore, the subject seems to rest upon two
keystones that, although perhaps in a somewhat different way, were
also salient within the teaching in Christianity in older days.
First, relating to the task regarding the conducting and moulding
of the fundamental democratic values, especially highlighted in their
present form since the 1990s (Osbeck, 2004), one could, within RE
20
EDUCARE 2015:2
as well as in the educational context as a whole, identify what has
become known as values education, a label suggested as an umbrella
term including moral education, character education, civic education
and citizenship education (Taylor, 1994; Thornberg, 2004). Secondly,
in relation to this kind of education, one could identify what may
be called ethics education. This second kind could be conceptually
apprehended in terms of being formal and school based rather than
informal, explicit rather than implicit (ibid).
In relation to the subjects of both RE and of Christianity, it would be
possible to identify two kinds of education, one relating to transmitting
values and one relating to knowledge development. The borders do
not seem to be strict or clear-cut. At the core of values education are
educational ideals regarding personal development in children and
youngsters. Certainly this task, within the confessional subject, was
performed and developed with reference to at least partly different
premises than those from which the task of transmitting values is
carried out today (Selander, 1993). While the ideal distinguished by the
subject of Christianity seems to have been defined with regard to a life
lived by a spiritually conscious person, practising what was assumed
to be Christian ethics, the corresponding ideal that was presumed to
mark RE could be characterized in terms of a democratic approach,
applied within a pluralistic national and global society, focusing on
a deliberate reflection upon and practising of universal human rights,
rejecting various kinds of discrimination and harassment. The moral
and character education, however, as well as the civic and citizenship
one, seems to share evaluative visions of making judgments about what
are to be counted as right actions and a good life. In both cases an
ethical code or a moral canon works as a point of reference, in relation
to which issues concerning how to reason and how to act are discussed
and assessed (Franck, 2013a).
With regard to ethics education, similarities may also, consequently,
be observed. Here, however, one can identify differences that may have
relevance to the questions raised and treated in this article. While an
education within the subject of Christianity seems to have revolved
around the children´s and young people’s learning of fundamental
moral rules and concepts, signifying and expressing what was taken
to be ethics founded in Christian tradition and belief, today´s focus in
RE is not anchored in a confessional canon of presumably knowable
EDUCARE 2015:2
21
AND ANNIKA LINDSKOG
facts. Rather ethics education is directed towards the knowledge
requirements stated in the syllabus, highlighting skills of reasoning in
moral matters using a variety of ethical concepts (Franck, 2013b). The
meaning of ethical competence seems to have shifted from referring
to an understanding and an application of moral rules and concepts,
defined with reference to Christian fundamentals, to an interpretation
according to which such a competence is shown and expressed by the
use of the skill of ethical reasoning involving a relevant and correct
use of selected ethical concepts. In the first case, ethics education is
aimed at and believed to lead to knowledge about moral codes that
are regarded as right and praiseworthy. In the second case, such
an education is aimed at and believed to lead to knowledge about
moral codes in relation to which no definite opinion is prioritized as
universally preferable or tenable for moral choice and action.
This latter approach, practised and developed within RE, seems to
imply a rather open-ended field regarding how to define what kind
of skills and what kind of knowledge are to be focused on in order
to carry out ethics education, involving assessment in relation to the
knowledge requirements stated in the syllabus. A variety of conceptions
of “ethical competence” and “ethical knowledge” may here come
to mind – and with them a range of challenges mirroring different
approaches to, and within, relevant assessment procedures (Tillson,
2011). Research into these conceptions, and the challenges relating to
them, would presumably contribute to the shaping of knowledge about
ethics education in theory and practice, as well as to a development of
strategies for handling challenges facing teachers in RE.
Questions of ethics have, however, been researched comparatively
little in the field of RE. The National Tests in RE, involving items
relating to ethics education, may provide information that can be used
in relation to the aim of making the previously mentioned challenges
visible, creating space for analysis and discussion.
The empirical study presented in this article is thought to contribute
to this process. By an analysis of the ongoing assessments of the
teachers involved in the study, space is made for both identifying
challenges in the assessment of pupils´ knowledge in Ethics, and
relating these challenges to the teaching context characterized by the
indistinct frames of the school subject Ethics, and the duality apparent
in the aims of the curriculum.
22
EDUCARE 2015:2
Aim
The aim of this article is to identify and discuss challenges in assessing
pupils’ knowledge in Ethics. A description of analytical perspectives,
shaped with reference to curricular considerations, in relation to such
challenges, has to take into account the fact that ethics education
is obligatory in compulsory school in Sweden. Ethics is a field of
reflection, argumentation and analysis with a focus upon issues and
areas belonging to existential and moral dimensions of life, and it does
not seem possible, at least not at first sight, to place it among subjects
that make use of standard methods of assessment and grading. At the
same time, the curriculum for compulsory school contains specific and
seemingly strict knowledge requirements in order that pupils´ skills in
moral reasoning and their knowledge about ethical concepts may be
assessed in ways that are similar to ways of assessing more concrete
forms of knowledge regarding, for example, world religions. The
demand for teachers to make use of these requirements when assessing
pupils’ statements seems to create challenges which could perhaps be
difficult to trace and identify.
In order to investigate such challenges and make them explicit,
the authors have performed a think-aloud study where some teachers
evaluate certain tasks belonging to Ethics within the National Tests in
RE that were given in the spring of 2013.
The research question in focus for the following analysis can be
formulated in this way: Which challenges can be identified when six
teachers assess pupils’ responses in Ethics in the National Tests in RE?
Previous research
Research about assessment in school is a rather wide field. In this
study, attention is drawn towards assessment research that focuses on
instructions for assessment, and challenges that can arise when using
pre-set criteria as well as when assessing specifically within RE.
Challenges concerning pre-set criteria and instructions
for assessment
Regarding grading, the first distinction that has to be made is between
holistic grading and analytic grading (Sadler, 2009). In holistic grading
EDUCARE 2015:2
23
AND ANNIKA LINDSKOG
the assessor builds up a complex mental response to different parts
of a student’s work. In analytic grading the teacher makes separate
qualitative judgements on each of the pre-set criteria. The teacher
determines the criterion prior to marking. According to Sadler (ibid.)
the idea of focusing on criteria specifically related to quality was first
proposed in the 1920s.
The aim of analytic assessment is to achieve certain practical
ends, for example, to compare the quality of a student’s work with
fixed criteria, and this is educationally more defensible than making
comparisons with how other pupils perform. Another advantage is that
explicit criteria enable students to understand the assessment process.
A problem that comes with analytic marking is, however, that it is
not possible to take into account all the necessary nuances of expert
judgement in the same way as in a holistic grading process. In this
sense, analytic marking is deficient (ibid.). Sadler (1987) also notes that
the meaning of verbal descriptions is always, to some degree, vague
and fuzzy. The criteria need to be interpreted (Connolly, Klenowski
& Wyatt-Smith, 2012). These interpretations inevitably differ and
according to Smaill (2011), a number of conditions must be fulfilled
to help the teachers to develop a common understanding of the pre-set
criteria. Assessors need concrete examples demonstrating the levels
of achievement, and assessors also need opportunities to participate
in a social moderation process. A social moderation process involves
a comparison and alignment of participants’ judgement of pupils’
work in relation to the pre-set criteria. During the social moderation
process the teachers develop a shared understanding of the qualitative
descriptors (ibid.).
Instructions for assessment constitute an important part of the national
tests in Sweden. They express an interpretation of the knowledge
requirements, developed to support the teachers’ assessments. The
instructions can thereby be experienced as a disruption to intuitive
ways of working with the pupils (Gipps et al., 1996). However, when
studying the role of assessment criteria during teachers’ collaborative
assessment of pupils’ portfolios, van der Schaaf et al. (2011) found that
without assessment criteria, the teachers based their judgement more
on their personal opinion and less on the evidence found in the pupils´
24
EDUCARE 2015:2
work. But when the teachers used assessment criteria, they based their
judgements significantly less on personal characteristics of pupils. A
conclusion in this study is that the quality of the judgement process is
more construct valid when teachers use the assessment criteria.
It has also been observed that ways of working with assessment
and making professional judgements are dependent on the subject in
question (Wyatt-Smith & Klenowski, 2012). According to Wyatt-Smith
and Klenowski, teachers of mathematics tended to give emphasis to
stated standards. They regarded assessment as an objective process
and were part of an assessment-as-measurement tradition. Teachers of
English, on the other hand, had a more reflective and holistic approach
to assessment that was often intuitive and usually non-numerical. Both
approaches were found to be problematic in some ways. The teachers
who saw assessment as an objective process devalued their own firsthand assessment knowledge as subjective and not good enough, and
the teachers who assessed in a more holistic way lacked confidence in
their self-knowledge as assessors. Based on their findings and Sadler’s
criteria, which have enabled individual assessors to change or focus
their assessment method (Sadler, 1985), Wyatt-Smith and Klenowski
propose a strategy with three components to support teachers’ use of
subject standards. The first is elaborated guidelines about on-balance
judgement processes. The second is a suggestion to use examples of
pupils’ work that are indicative of the standards, i.e. illustrative of
a particular achievement. The third is about descriptive reports of
pupils’ achievements that accompany the exemplars to give insight
into the factors that influence the overall judgement. These reports are
supposed to be written during a period of time when particular subject
content is treated and they are then to be used by the teacher to make
an overall judgement.
An additional problem connected to assessing, which is illuminated
in a study from England (Radnor, 1995), is that teachers in compulsory
school believed that a tighter frame from the National Curriculum and
in particular the assessment arrangements that were implemented at
the time of this study, limited their course of action as teachers as well
as their working practices of administration and pupil organization.
EDUCARE 2015:2
25
AND ANNIKA LINDSKOG
Challenges in assessing subject matter knowledge in RE
To assess pupils´ work is a core task for teachers. Through assessments,
pupils get opportunities to learn more in relation to current goals but the
other side of the coin is that assessment also values and grades pupils’
work. This is a part of the work that can be particularly demanding and
associated with various difficulties.
Assessment and religious education is an area that has yet to
be researched and the same goes for assessment and ethics. In the
few studies that exist it has been argued that one of the compelling
challenges for RE professionals is to develop authentic, performancebased approaches to assessment, which clearly reject accountability.
This way of assessing offers RE teachers a route to a more challenging
curricular activity than when assessing achievements through measured
accomplishment (Baylock, 2000).
In another study, Grant and Matemba (2013) argue that in many
cases the assessment of RE is generally out of focus for teachers in
Scotland, largely due to the fact that the assessment is seldom based
on religion but rather on other issues, which are important, yet should
not, according to Grant and Matemba, be allowed to consume so
much of the limited time that RE is given. Examples of issues that
are assessed instead of the subject of RE are generic skills such as
listening, working in groups and enthusiasm. The same study reveals
that it is also evident that school practices in RE are failing to match
the ambitions of the curriculum. The teaching in RE has remained at a
lower cognitive level where the pupils are taught to identify, describe,
colour and so on instead of being taught to discover, critique and
challenge. A reason for this might be that the curriculum in Scotland
is in its early years of implementation, which is similar to the situation
in Sweden today. In Sweden, a corresponding implementation started
in 2011 and one could, regarding certain dimensions concerning, for
example, assessment issues, say that this implementation is in one
sense still being carried out.
Another aspect revealed is an ambiguity regarding how values are
to be assessed (ibid.). They suggest that teachers need to plan their
teaching in such a way that it is possible to assess controversial issues
such as values. An additional circumstance that might cause difficulties
when assessing pupils’ work is that the teachers are taking their pupils’
personal lives into account in different ways, for example when grading
26
EDUCARE 2015:2
them (Klapp Lekholm, 2010; Rinne, 2013). Similar findings have been
found in other studies. For instance Allal (2012) shows in her study
how the teachers, although they ensured a certain standardization of
their assessment procedures, also introduced adaptations to take into
account specific details about individual pupils. Also Brown et al.
(1997) state in a study on teachers’ views about the validity of national
testing that the teachers major concerns about the validity of their
assessment was about the unfairness of the tests to specific types of
pupils, and the poor match with classroom practice. For example, the
teachers sometimes decided not to take into account the result on one
test if it was not considered valid because of problems in the personal
life of the pupil.
Data and method
The empirical material of this article consists of transcripts from
audio recordings of teachers who have been asked to reassess pupilresponses to tasks in Ethics, which were part of the first National Test
(NT) in RE in Sweden (2013). This reassessment was organized by the
team commissioned by the National Agency of Education to conduct
the NT in RE, of which the research team conducting this study are
also members. The present study was done with a view to identifying
challenges for teachers in assessing pupils’ knowledge in Ethics, as it
is demonstrated in national tests. Two year-six teachers participated in
the study and assessed the same 15 pupil-responses and four year-nine
teachers assessed the same 12 pupil-responses. The teachers of year
six are referred to in the findings section of this article as 6a and 6b,
and the teachers of year nine are referred to as 9a-d. In the responses
of the pupils, whose identities were not known to the re-assessing
teachers, all grades that have knowledge requirements (E – lowest, C –
intermediate, A – highest) were represented, according to the previous
evaluation made by their ordinary teacher, and responses that had been
evaluated as failed, here called F, were also included. The re-assessing
teachers in the current study did their assessment in relation to the
assessment instructions and were asked to try to put their thoughts into
words while their worked. They could take breaks if they wanted to
but were asked to work with the task as an ongoing process. The study
can therefore be described as a “think-aloud study” in line with how
EDUCARE 2015:2
27
AND ANNIKA LINDSKOG
such studies are usually conducted (e.g. Charters, 2003), a method that
has been used successfully for studying difficulties with assessment
(e.g. Crisp, 2010). The transcription of the audio recordings were made
with the intention of being close to the speech of the participants in the
study, to indicate larger pauses but without the kinds of oral sounds that
may be present when one “thinks aloud”. The aim of the study was not
to conduct analyses where attention is paid to those kinds of utterances
and therefore a less detailed transcription was preferred.
Table 1. Analysed material, participating teachers and background material
Material analysed in this
article
2 transcriptions of year-six
teachers “thinking aloud”
while doing assessments of
15 responses
Participating
reassessing
teachers
Background material:
Responses that the teachers
worked with
2 year-six
teachers
15 responses of year-six
pupils
(the sweat dilemma)
•
6a about the 15
responses to the sweat
dilemma
•
6a
Originally the responses were
assessed with the following
grades:
•
6b about the 15
responses to the sweat
dilemma
•
6b
A: 4; C: 4; E: 4; F: 3
4 year-nine
teachers
12 responses of year-nine
pupils
(the forgiveness task)
4 transcriptions of year-nine
teachers “thinking aloud”
while doing assessments of
12 responses
•
9a about the 12
responses to the
forgiveness task
•
9a
Originally the responses were
assessed with the following
grades:
•
9b about the 12
responses to the
forgiveness task
•
9b
A: 3; C: 3; E: 3; F: 3
•
9c about the 12
responses to the
forgiveness task
•
9c
•
9d about the 12
responses to the
forgiveness task
•
9d
28
EDUCARE 2015:2
The curriculum requirement, pupil-tasks and assessment
instructions
The assessment instructions and the pupil-tasks of the NT are
directly related to the syllabus of RE in the curriculum Lgr11. In the
syllabus aims, core content and knowledge requirements draw on
each other. These connections are expressed in more detail in Table
2, in the appendix. Some central phrases in the syllabus concerning
Ethics express the aim that pupils should be given “…opportunities
to develop their ability to […] reason and discuss moral issues and
values based on ethical concepts and models.” The core content for
year 4-6 (age 10-12) states among other things that the teaching should
include some ethical concepts, daily moral questions and what it may
mean to do good. These issues are also central for year 7-9 (age 13-15)
but here more specific areas are also expressed such as consequential,
deontological and virtue ethics.
For this particular study one task in Ethics in year six and another in
year nine were chosen. The task from the year-six test included a short
story with an ethical dilemma in which a girl is asked by some friends
to tell her best friend that she smells of sweat and that she needs to do
something about it. The pupils were asked to write about what they
think that Keyla should do, why they think so, and what consequences
it may have for the different parties. The discussion should include
at least two of the following or similar concepts: responsibility,
wrong, right, duty and fair. The task was constructed in order to test
the knowledge requirement of the syllabus, which states (the separate
wordings for the grade levels E, C and A are written in italics):
Pupils can apply simple/developed/well-developed reasoning about
everyday moral issues, and what it might mean to do good. Pupils make
reflections that basically relate to the subject/carry the reasoning forward/
carry the reasoning forward and deepen or broaden it and use some
ethical concepts in a basically/relatively well/well functional/functioning
way (Swedish National Agency for Education, 2011, p. 185 f.).
In the task from the year 9 test, pupils were supposed to discuss why
forgiving can be important for the person that begs for forgiveness as
well as for the person who forgives. This task draws on the following
knowledge requirement:
EDUCARE 2015:2
29
AND ANNIKA LINDSKOG
Pupils can reason and argue about moral issues and values by applying
simple and to some extent/developed and relatively well/well-developed
and well-informed reasoning, and use ethical concepts and models in
a basically/relatively well/well functional/functioning way (Swedish
National Agency for Education, 2011, p. 187 f.).
These knowledge requirements were operationalized in assessment
instructions, presented in the Table 2.
Method reflection and data analyses
Since the aim of the study is to identify challenges in assessing pupils’
knowledge in Ethics, it was considered important to design situations
that were as close as possible to a real situation where a pupil-response
is assessed and where a teacher may experience different kinds of
challenges. Therefore the current think-aloud study was conducted.
Even if think-aloud studies are sometimes said to explore thought
processes (Charters, 2003), this seems to be an unrealistic expectation.
However, it is reasonable to maintain that this kind of study reveals
some of the reflections which occur to teachers while working with
pupil-responses, the kind of reflections which they are aware of, which
they want to share and are able to express verbally in their ongoing
work (see, for example, Crisp, 2010). Since the processes are authentic
in the sense that actual assessment is taking place, the method can be
assumed to give better answers to the aim of the study – to identify
challenges in assessing pupils’ knowledge in Ethics – than for instance
interviews would have done. In interviews, the time between actual
work and utterances about the work can be expected to limit the
scope of the challenges that the teachers are able to express. Even
though the samples of teacher- and pupil-responses in this study are
limited, the variation in the material (different kinds of teachers, tasks
and levels of pupil-responses) makes it reasonable to assume that the
main kinds of challenges that teachers experience while assessing
pupils’ knowledge in Ethics are captured in this study, especially in
relation to the knowledge requirements of the Swedish curriculum and
the national tests. The teachers participating in this study had had no
experience of reassessing pupil-responses before they conducted the
audio-recordings of the think-aloud study.
30
EDUCARE 2015:2
Since this kind of study is new in this particular knowledge area,
it has been important to maximize the scope of knowledge present
in the material and to conduct inductive and open analyses. The
focus of the hermeneutical close-readings of the material has been
the aim concerning the different kinds of challenges that the teachers
experience in assessing Ethics. All the challenges that were identified
have been given labels. Different kinds of challenges have been
carefully related to each other and a system of categories has emanated
from the material. The space or scope of findings is characterized in
three main and overarching categories of challenges that the teachers
can experience while assessing pupils’ knowledge in Ethics.
It is possible to understand the utterances of the assessing teachers
as utterances made up of different layers. First it is possible to identify
what the teachers are doing, how they for instance assess a task, what
grade they give, and compare this act with the acts of the other teachers
and the assessment instructions. The analysis can in that sense reveal
difficulties in the assessing processes that seem to have given rise to the
differences. Second one can also identify what the teachers explicitly
talk about as difficulties when they are in the process of evaluating
the tasks. Third, one can focus on the utterances of teachers that are
of a meta-nature, i.e. when the teachers take a step backwards and talk
about the process of evaluating the tasks more generally. The systematic
analysis of this article, described above, refers to the second level of
utterances, i.e. what the teachers explicitly talk about as challenges.
However a few illustrative examples from the other levels of analyses
are also shown.
Findings
Three kinds of challenges in assessing pupils’ knowledge in Ethics
have emanated from the close-readings of the “think-aloud material”.
The first group of challenges includes those challenges that are inherent
in interpreting the wording of the assessment instructions. The second
group of challenges is related to the fact that teachers can bring other
ideas into their assessment work about what should be valued when
it comes to Ethics and the kinds of tasks that the pupils have been
given. The third group of challenges regards the fact that the teacher
EDUCARE 2015:2
31
AND ANNIKA LINDSKOG
is a human being who has to navigate between his/her concern for the
well-being of the dependent young pupils and his/her commission from
the state to differentiate between the children.
Challenges regarding the assessment instructions
One conclusion that can be drawn from what the teachers say while
assessing the pupils’ tasks in Ethics is that qualities of knowledge in
Ethics, the qualities of the responses which the assessor on the basis of
the instructions should look for, are not obvious, are not something that
can be taken for granted. Quite a few of the difficulties that the teachers
experience are related to fact that the qualities that the assessment
instructions prescribe are not taken for granted by the assessing
teachers. The teachers who assess tasks for year six are struggling
with the meanings of “ethical concepts” and which concepts can be
accepted as “other similar concepts”, with the meaning of “description
of consequences” and how developed such a description must be in
order to count, and also with the meaning of “change of perspective”
and how developed such a change and its adherent descriptions have to
be (Skolverket, 2013b, p. 10, i.e. Assessment Instructions for year 6).
For the assessing year-nine teachers, the meanings of “problematize”
and “consequences” get most attention (Skolverket, 2013a, p.12, i.e.
Assessment Instructions for year 9). Furthermore, both teacher groups
are concerned about how they should interpret the requirement for the
pupils to “reason [resonera]” and how developed answers should be in
this respect in order to count.
The challenges that the assessing teachers experience with ethical
concepts are related to how specific the concepts must be and whether
highly colloquial words can be accepted. Is for instance being “sulky”
an ethical concept, is it possible to consider being an “asshole” equal
to being mean and is “not being a bitch” of ethical importance (6b)?
The assessment instructions do not give any clear answers to these
questions and the teachers do not have any previous knowledge on
this matter to guide them. The findings may show something important
about Ethics as a school knowledge field. In which other subject areas
of compulsory school are the concepts of the field so uncertain?
A description of consequence is, according to the assessment
instructions year six, something that characterizes an answer that
32
EDUCARE 2015:2
deserves at least a grade C. One might therefore imagine that any
utterance that describes a consequence should be interpreted as a
C. This is not, however, a foregone conclusion since the assessment
instructions exemplify an E-answer with an utterance that includes
consequences (Skolverket, 2013b, p.10). At the same time descriptions
of consequences are said to be something through which the pupil
develops his/her way of reasoning [our italics], which can be understood
as a remark about an expected quality. But what makes the required
quality of the descriptions of consequences more complicated to grasp
is that the assessment instructions for C-level first state “possible
consequences” and later a “relevant description of consequence” [our
italics]. The utterances of the assessing teachers show that they pay
attention to different parts of the assessment instructions but sometimes
they also express the contradictions in the instructions explicitly.
Furthermore, the teachers’ way of treating the instructions and the tasks
shows that the question occurs as to whether arguments have to be
added to a written consequence in order for it to constitute an approved
description of consequence. “There is a description of consequences,
the consequence is mentioned, that is true, but there is no description
of why they would stop being friends” (6a). How developed or
“exhaustive” (9d) an answer must be in order to count constitutes a
challenge also among the year-nine-teachers. Here the difficulty is
complicated by an unclearness in the assessment instructions as to
whether a grade C-response should include consequences concerning
both forgiving and being forgiven. The first part of the instructions
stresses that:
the pupil should in a developed way reason regarding forgiveness with
respect to both aspects… (Skolverket, 2013a, p. 12)
but a later part states that:
the reasoning concerning at least one of the aspects is relatively
developed… (Skolverket, 2013a, p. 12).
Different ways of interpreting what constitutes a reasonable description
of consequences seem to explain to some degree why the same answer
is given different grades by different teachers.
EDUCARE 2015:2
33
AND ANNIKA LINDSKOG
The difficulties in interpreting what characterises a change of
perspective or a developed way of reasoning are similar to the
difficulties described in relation to descriptions of consequences,
although one difference seems to be that it is easier to miss a change of
perspective than to miss a description of consequence. An unclearness
concerning change of perspective, not explicitly mentioned by the
teachers but which can be seen in the material, is whether a change of
perspective must mean that the pupils reason from the perspectives of
different actors or whether it can also mean that the pupils reason about
a particular act from different perspectives. Problematizing raises
similar uncertainties concerning how developed the answers must be.
However when it comes to problematizing, the think-aloud utterances
of the teachers reveal more specific ideas about what “problematize”
stands for. For instance, there is the opinion that problematizing
includes examining a phenomenon from different angles. One should
not only point out advantages of forgiving but should also emphasize
the difficulties inherent in forgiving (9b). The teachers also appear to
believe that it is advantageous to show what the opposite would mean,
e.g. “if one does not forgive” (9c), or to specify certain conditions in
relation to their perspective, for example, by showing that the good
effects of forgiving are also related to the time aspect: “that one should
be quick in forgiving” (9c).
Besides the fact that the assessment stresses competences that are
not taken for granted or easily understood by the teachers, the main
difficulty related to being commissioned by the assessment instructions
concerns the relation between part and whole in the responses. The
assessment instructions focus on individual aspects to be assessed and
thereby ignore the fact that answers in their entirety also communicate
different qualities, according to the teachers. One teacher in his/her
meta-discussion regrets that “you partly get caught up in counting”
(6a) that all aspects are present. Other teachers express that they are
sorry when a good answer gets a lower grade because it is lacking in
one part although it is excellent in other parts (9b; 9c). “I cannot give
more than – with these assessment instructions – an E since the answer
doesn’t consider both aspects” (9b).
34
EDUCARE 2015:2
Challenges related to having additional or alternative ideas
of qualities of knowledge in Ethics
Some of the assessing teachers have additional ideas or alternative
ideas to those in the assessment instructions regarding competences
in the knowledge field of ethics. Sometimes such ideas seem to have
consequences for the outcome of the assessment – the grades given –
but the ideas are also mentioned as merely frustrating to a greater or
lesser degree. These ideas concern the content but also the form of the
answers and the ideas can affect pupils’ grades in both a positive and
a negative way.
Content aspects of the pupil-responses that should be given credit,
according to the teachers, are altruism, ethical insights, and certain
precise and characterizing concepts. For instance one teacher states
as a positive quality of a response that the responsibility that the
pupil argues in favour of “not only [applies to you] as a friend but
also as a fellow human being“ (6b). The answer thereby expresses
the importance of altruism. In a similar way, another teacher stresses
as negative the fact that the pupil seems to argue for the importance
of forgiveness “from an egotistic angle” (9b). Occasionally assessing
teachers also emphasize a quality of a response that might tentatively
be called ethical insight. For instance, one teacher states that the
answer is good and has depth since it expresses that “when one asks
for forgiveness one forgives oneself at the same time” (9c). Another
teacher emphasizes as a “nice answer” how the pupil writes about
humbleness: “you swallow your pride and show yourself to be humble
towards the human being who actually manages to forgive you” (9d).
An answer that is evaluated as having been written in an “ethically
very nice way” expresses that the main character in the task “perhaps
has noticed it [herself]” and that there “may be a reason and an
explanation” (6a). The fact that some teachers associate good quality
in the field of Ethics with the use of distinct concepts may be related
to the RE syllabus, which explicitly stresses the importance of using
ethical concepts. For the pupils in year six it was also a part of the task
for which they were being assessed while neither the task instructions
for the year nine pupils required this nor the assessment instructions,
with the exception of the concept of forgiveness. Despite the fact that
the assessment instructions do not advocate giving credit for additional
EDUCARE 2015:2
35
AND ANNIKA LINDSKOG
concepts, some of the teachers in year nine stress the use of concepts as
a strength. The material does not reveal whether they consider the use
of concepts to be an important factor in the knowledge field of Ethics
in particular or whether they regard it as an important competence in
every academic field. In any case, some of the teachers consider it to
be particularly praiseworthy when the pupils characterize forgiveness
as something “strong” or “mature” (9d; 9c) and link forgiveness to
concepts such as “humbleness”, “remorse” and “liberation” (9d; 9c).
The use of these concepts is also said to contribute to an answer being
characterized as well-written (9b).
Something that should be researched further is the fact that some
of the year-nine teachers (9b, 9c, 9d) had difficulties with interpreting
religious explanations of why forgiveness is important, such as “in
order to avoid punishment from God”. The teachers assessed the
answers in different ways. One rejected the answer and considered it
not to be sufficiently developed (9d), but others expressed the religious
dimension as almost unfavourable “Yes, even if it is mostly about God,
that God should forgive, I think that the pupil shows that [he/she]
understand what it is about”. (9c).
When form aspects of answers were mentioned they were mainly
considered to be unfavourable factors even if exceptions occurred
where a form aspect also could work as a favourable factor: “A longer
answer. It does not always necessarily mean that it is a good one, but…”
(9d). Examples of unfavourable form aspects that the assessing teachers
stressed are shortness (e.g. 6b), lack of structure (e.g. 9d), unclearness
(e.g. 9b), presence of highly colloquial expressions, of which it is said
that it is “hard for a teacher to see beyond” (6a), bad language and
composition (e.g. 9a). In relation to many of these remarks concerning
unfavourable form aspects of answers, the conclusion is expressed that
it is hard to understand what is stated in an answer. But there are also
exceptions, such as when the assessing teacher concludes that “there
are thoughts which the person in question has difficulties writing down
but you can read the spirit…” (9b). The outcome of an assessment
sometimes seems to be related to the attitude of the assessor.
36
EDUCARE 2015:2
Challenges related to being squeezed between the
commissioner and a dependent pupil
Reading the “spirit” or the underlying intention of a student whose
written answer is hard to understand is one example of how the
assessing teachers indirectly express that they certainly want the very
best outcomes for the pupils. Even if this is a specific and researchrelated situation, the teachers express an everyday knowledge that
the pupils are dependent on the assessments. Some utterances of the
assessing teachers can be interpreted as expressions of ambivalence in
relation to their task. The teachers are in a sense squeezed between the
pupils and the commission by the state to differentiate between these
young people.
Empirically the ambivalence in relation to the commission is
revealed through, on the one hand, expressions of feeling for the
pupils and acts of loyalty to the pupils. On the other hand, there are
expressions of how the assessing teacher hesitates to give high grades,
which can be seen as an act of loyalty towards the commissioner. If
every pupil gets a high grade, the test will not be discriminating.
Examples of comments where the teachers apparently feel for the
pupils are “sometimes the work of the pupil can be helped by a more
developed reasoning concerning the context…”(6a [our italics]),
“Therefore, sadly, it will be after all an E for this pupil” (9c), ”So even
if there are a few linguistic misses and it is a bit difficult to interpret,
I do think, probably, that it is... pretty developed anyway, rather
developed through the work. And he mentions at least briefly one of
the aspects that make it a weak C. But if I give him the benefit of the
doubt I think... which is what one should do.” (9c). The last example
almost communicates a kind of suffering even if the teacher here does
not express it as explicitly as the next one “I feel terrible but I do not
think it is enough…” (9d).
The ambivalence in relation to the commission can be identified
in the same person. The teacher who felt terrible when he/she could
not accept the pupil’s response does, for instance, express doubts
when it comes to giving high grades as well. “I would give an A here
actually” [our italics]. “Now I am back with X to whom I will give an
A. Finally”. (9d). In such a hesitation, the assessment instructions can
EDUCARE 2015:2
37
AND ANNIKA LINDSKOG
be presented as a kind of alibi. “This pupil response I consider, on the
basis of the assessment instructions, as grade A.” (9b).
The challenges that we have identified in the utterances of the
assessing teachers are of different kinds; some are related to the
task and the assessment instructions, and others are related to the
specific challenges of the knowledge area of Ethics. But there are also
difficulties that are related to the very nature of being a teacher, of
being a teacher in general. The focus on the specific commission to
assess answers in ethics has surprisingly pointed towards the broader
difficulty of being a teacher. The profession includes both relational
and instrumental tasks, to both help pupils to obtain the necessary
qualifications and to differentiate among them.
Conclusions
The knowledge field Ethics in the Swedish school context has an
unclear character, partly due to the fact that the object for analysis
and reflection is what is considered to be right and praiseworthy. This
means that Ethics, on the one hand, is a school knowledge field like
most others that aims at developing young pupils’ formal skills. But on
the other hand, Ethics is to a larger degree than other subjects affected
by the normative project of Swedish compulsory school. There are
certain values that education shall impart and establish, values that the
curriculum describes as “fundamental”. In this way these values also
come to constitute the object for analysis and reflection in the subject
since these values are what all pupils are supposed to embrace and
consider “right and praiseworthy”. The Swedish curriculum seems on
an overarching level to prescribe values education of both a “critical”
and a “conservative” kind (see Jones, 2009).
Against the background of this ambiguous position of the subject, it
is not surprising that quite a few of the challenges that the teachers of
our empirical study express are particularly related to interpretations
and understandings of the knowledge field, even if there are also
challenges of a more general kind. Such general challenges have been
described in previous research. Teachers may experience, for instance,
a tension between their compassion for the children as fellow beings
and their task as assessing civil servants, something which often seems
38
EDUCARE 2015:2
to mean that teachers take into account more and wider aspects than
the ones that the assessment instructions stress (see e.g. Allal, 2012;
Grant & Matemba, 2013; Klapp Lekholm, 2010; Rinne, 2013;). One
variety of this overarching challenge is the tension between a wish
to conduct a more holistic assessment of the pupil-responses, and
the instructions to evaluate on the basis of specific aspects, to make
an analytic assessment (Sadler, 1985; 2009). According to previous
research, this is a tendency that may vary among different kinds of
teachers (Wyatt-Smith & Klenowski, 2012).
Something that has not been described in previous research before,
and therefore an important contribution to the research field, are the
special challenges that are related to assessing pupils’ responses in the
knowledge field of Ethics. Some of these can be interpreted with regard
to the ambiguous position concerning descriptivity and normativity
within Ethics. The ambiguity is not easy to resolve since it is certainly
difficult, or perhaps even impossible, to make a distinction between
reasoning concerning an object, what constitutes a good action for
instance, and the character that this object is given. When, for instance,
Lawrence Kohlberg, with reference to a Kantian tradition, stresses the
importance of the individual setting its own ethical principles to live
by, the perspective is still normative due to the fact that these principles
are supposed to be universal, altruistic, maintain the general social
order and protect human rights. These are the perspectives that are
considered to be most developed in this tradition (e.g. Bergling, 1982).
The teachers in this empirical study who seem to have other ideas of
creditable knowledge in the field of Ethics than those in the assessment
instructions, the ones who stress altruistic values in the responses of
the pupils and want to discourage egocentricity, can be understood as
belonging to this tradition. They resist separating reasoning concerning
an object from the character that the object is given.
With regard to the challenges in assessment that seem to be related
to teachers having ideas of what constitutes knowledge of the field that
differ from what is written in the instructions, another such idea is what
here has tentatively been called ethical insight. Such a competence can,
on the basis of the findings, be described as an ability to produce nuanced
interpretations of a situation, i.e. the different wishes and demands that
are in question in a situation, but also an ability to express this in a
EDUCARE 2015:2
39
AND ANNIKA LINDSKOG
way where the complexity and nuances of the situation are retained
in the utterance. Such an ability can be related to Løgstrup’s ethics
of closeness or situated ethics. Here the central ability of the ethical
subject is to grasp the silent ethical demand that is directed towards
me from the need of the other. But the central ability also includes
one’s own response, taking responsibility for the demand, the situation
and consequently for one’s neighbour (Løgstrup, 1994). Løgstrup’s
perspective here points towards an action-related understanding of
ethical competence with potential to widen the current discussion of
Ethics as a knowledge field further (see e.g. Almers, 2009).
The challenges that the teachers appear to experience most
frequently when assessing the responses of the pupils are unclearness
concerning the assessment instructions and the ethical qualities that
the assessment instructions commission the teachers to search for.
Here descriptions of consequences and changes in perspectives are
highlighted. Since the knowledge field is not very clearly staked out and
familiar in a Swedish school context, the teachers are not acquainted
with the qualities described in the instructions. They have not been
taught these competences when they were pupils themselves; they
have not been explicitly educated about them in teacher education. It
would be interesting to compare this with the situation concerning, for
example, the knowledge field of mathematics for instance. Vagueness
in the school subject of Ethics is, not, however, a specifically Swedish
phenomenon. The fuzzy character of the field has been a theme for
research debate in itself. In moral education the object of the field,
‘morality’, is said to be unclear. It can be disputed what it means to
be “good at” morality and thereby what a desirable progression in this
area means (Wilson, 2000).
National tests and assessment criteria are often said to influence
school practice since they define concretely what creditable knowledge
and perspectives in an area are. This influence can be considered larger
in a knowledge field with a fuzzy character. When the RE syllabus’s
rather general requirements concerning abilities to reason in a simple,
developed or well-developed way, are interpreted into pupil-tasks
and assessment instructions whose definitions are repeatedly used by
teachers, a process of constituting the knowledge field of Ethics in
school is clearly going on. In a situation where the knowledge field is
40
EDUCARE 2015:2
as vague as it is in Ethics, there is evidently a need for basic research
concerning different conceptions of ethical competence. Such a variety
of conceptions could be used for a critical discussion of competence
in this field. It seems important to visualize perspectives from other
countries and to show different perspectives within established ethical
theory. But it also seems important to find ways to emphasize valuable
qualities in pupils’ existing perspectives and to highlight teachers’
ideas regarding creditable knowledge in this field, as we have done in
this study by focusing on challenges for teachers in assessing pupils’
knowledge in Ethics.
EDUCARE 2015:2
41
42
EDUCARE 2015:2
Pupils can apply
simple reasoning
about everyday
moral issues, and
what it might
mean to do good.
Pupils make
reflections which
basically relate
to the subject
and use some
ethical concepts
in a basically
functional way.
Pupils can reason
and argue about
moral issues and
values by applying
well developed
and well informed
reasoning,
and use ethical
concepts and
models in a well
functioning way.
Pupils can reason and argue
about moral issues and values
by applying developed
and relatively well informed
reasoning, and use ethical
concepts and models in a
relatively well functioning way.
Pupils can reason
and argue about
moral issues
and values by
applying simple
and to some
extent informed
reasoning,
and use ethical
concepts and
models in
a basically
functioning way.
Pupils can apply
well developed
reasoning about
everyday moral
issues, and what
it might mean to
do good. Pupils
make reflections
which carry the
reasoning forward and deepen
or broaden it and
use some ethical
concepts in a well
functioning way.
(Table 2 continues on next page)
Grade level A
Grade level C
Grade level E
Grade level A
Pupils can apply
developed
reasoning about
everyday moral
issues, and what
it might mean to
do good. Pupils
make reflections
which carry the
reasoning forward
and use some
ethical concepts
in a relatively well
functioning way.
Knowledge requirements (ethics) year 9
Knowledge requirements (ethics) year 6
Grade level C
Daily moral dilemmas. Analysis and argumentation based on ethical
models, such as consequential and deontological ethics. Views of the
good life and the good person are linked to different kinds of ethical
reasoning, such as virtue ethics. Ethical questions and the view of people
in some religions and other outlooks on life. Ethical concepts which can
be linked to questions concerning sustainable development, human rights
and democratic values, such as freedom and responsibility.
Some ethical concepts such as right and wrong, equality and
solidarity. Daily moral question concerning the identities,
roles of girls and boys, and gender equality, sexuality,
sexual orientation, and exclusion and violation of rights.
Questions about what a good life can be, and what it may
mean to do good.
Grade level E
Core content (ethics) year 9
Core content (ethics) year 6
Table 2. Core content and knowledge requirements of the Swedish curriculum in relation to parts of
assessment instructions in the two National Tests in RE 2013.
EDUCARE 2015:2
43
The pupil discusses
the situation by
describing how
K could act. The
pupil uses at least
two concepts
in a basically
functioning way
by showing
an acceptable
understanding of
their meaning.
The pupil uses at
least two concepts
in a basically
functioning way
by showing
an acceptable
understanding of
their meaning.
The pupil discusses
the situation by
observing possible
consequences of
K’s actions. The
discussion must
contain a relevant
description of
consequences
or one or more
changes of
perspectives. The
pupil uses at least
two concepts in
a relatively well
functioning way
by partly showing
that the concepts
are relevant in the
situation.
The pupil discusses
the situation
by observing
both possible
consequences of
K’s actions and
how the situation
can be perceived
by different
people. The
discussion must
contain a relevant
description of
consequences
and one or
more changes of
perspectives. The
pupil uses at least
two concepts in
a relatively well
functioning way
by consistently
showing that the
concepts are
relevant in the
situation.
Instructions for assessment, item 3 (ethics), year 6
(Table 2 cont.)
The pupil holds a
simple discussion
of the concept
of forgiveness
in regard to
at least one of
the two aspects
mentioned in the
task: the active,
”to forgive”, and
the passive, ”to
be forgiven”,
for example by
clarifying the
meaning of this
aspect.
The pupil holds a developed
discussion of the concept of
forgiveness in regard to both
aspects mentioned in the task:
the active, ”to forgive”, and the
passive, ”to be forgiven”. The
discussion about one of the
aspects is relatively elaborate
concerning how the meaning
of forgiveness might be perceived. E.g., it may contain
a developed comment about
passive, ”to be forgiven”. The
discussion about one of the
aspects is relatively elaborate
concerning how the meaning
of forgiveness might be perceived. E.g., it may contain
a developed comment about
what the meaning of this aspect
might be, or about what consequences an application of
it may have concretely. The
discussion about one of the
aspects may be more brief
and expressed in a few words
or consist of a naming of an
example.
Instructions for assessment, item 12 (ethics), year 9
The pupil holds
a developed
discussion of
the concept of
forgiveness in
regard to both
aspects mentioned
in the task:
the active, ”to
forgive”, and the
passive, ”to be
forgiven”. The
discussion about
both aspects is
elaborate and
points at how
both aspects in a
more exhaustive
sense can be
problematized
and be related
to one another
concerning
meaning and
consequences.
AND ANNIKA LINDSKOG
References
Algotsson, Karl-Göran (1975). Från katekestvång till religionsfrihet:
debatten om religionsundervisningen i skolan under 1900-talet.
Diss. Uppsala. Uppsala Universitet.
Allal, Linda (2013). Teachers’ professional judgement in assessment:
A cognitive act and socially situated practice. Assessment in
Education: Principles, Policy & Practice, 20(1), 20-34.
Almers, Ellen (2009). Handlingskompetens för hållbar utveckling: tre
berättelser om vägen dit. Jönköping: Högskolan för lärande och
kommunikation.
Bergling, Kurt (1982). Moralutveckling: bedömning av rätt och orätt
från barndom till vuxen ålder. Stockholm: LiberFörlag.
Blaylock, Lat (2000). Issues in Achievement and Assessment in
Religious Education in England: Which Way Should We Turn?,
British Journal of Religious Education, 23(1), 45-58, DOI:
10.1080/0141620000230106
Brown, Margaret, McCallum, Bet, Taggart, Brenda & Gipps Caroline.
(1997). The Validity of National Testing at Age 11: The teacher’s
view, Assessment in Education: Principles, Policy & Practice, 4:2,
271-294, DOI: 10.1080/0969594970040205
Charters, Elizabeth (2003). The Use of Think-aloud Methods in
Qualitative Research. An introduction to Think-aloud Methods.
Brock Education, 12(2), 68-82.
Connolly, Stephen, Klenowski, Val, Wyatt-Smith, Claire (2012).
Moderation and consistency of teacher judgement: Teachers’
views. British Educational Research Journal, 38(4), 593-614.
Crisp, Victoria (2010). Judging the grade: Exploring the judgement
processes involved in examination grading decisions. Evaluation &
Research in Education, 23(1), 19-35.
Franck, Olof (2013a). Etisk litteracitet - om filosofiska förutsättningar för
att utveckla ämnesdidaktiska perspektiv med hänsyn till kursplanen
i religionskunskap (Lgr11). In Anders Marner & Hans Örtegren,
(Red), KLÄM. Konferenstexter om Lärande, Ämnesdidaktik och
Mediebruk (s. 178-197). Umeå: Umeå universitet.
44
EDUCARE 2015:2
Franck, Olof (2013b). Kunskapskrav och bedömning. In Olof Franck,
Magnus Hermansson Adler & Inger Björneloo, Samhällsämnenas
didaktik F-åk 3 (s. 127-136). Lund: Studentlitteratur.
Gipps, Caroline, McCallum, Bet, Brown, Margaret (1996).
Models of teacher assessment among primary school teachers
in England. The Curriculum Journal, 7(2), 167-183. DOI:
10.1080/0958517960070204
Grant, Lynne, Matemba, Yonah H (2013). Problems of assessment in
religious and moral education: The Scottish case. Journal of Beliefs
& Values: Studies in religion & Education, 34(1), 1-13.
Jones, Tiffany Mary (2009). Framing the framework: discourses in
Australia’s national values education policy. Educational Research
For Policy & Practice, 8(1), 35-57.
Klapp Lekholm, Alli (2010). Lärares betygsättningspraktik. Forskning
om undervisning och lärande, 3/2010, 20-29.
Lindskog, Annika (2013). Nationellt bedömningsstöd i
religionskunskap. I Falkevall, Björn. Att undervisa i
religionskunskap - en ämnesdidaktisk introduktion. (s. 162- 169).
Stockholm: Liber.
Lundgrén-Laine, Heljä, Salanterä, Sanna (2010). Think-Aloud
Technique and Protocol Analysis in Clinical Decision-Making
Research. Qualitative Health Research, 20(4), 565-575.
Løgstrup, Knud Ejler (1994). Det etiska kravet. Göteborg: Daidalos.
Osbeck, Christina (2004). Värdegrund i skolan. Uppdrag,
elevperspektiv och didaktiska reflektioner. I Gunnel Colnerud &
Solveig Hägglund (Red.), Etiska lärare – moraliska barn. Forskning
kring värdefrågor i skolans praktik (s. 9-27). Linköping: Linköpings
universitet, Institutionen för beteendevetenskap.
Osbeck, Christina (2013). Social Studies – A part of a Context
Constructing Central RE Knowledge in Sweden. In Geir Skeie,
Judith Everington, Ina ter Avest, Siebrem Miedema. Exploring
Context in Religious Education research, (s. 147-169). Münster:
Waxmann.
Olivestam, Carl-Eber (2012). Religionsdidaktik – om perspektiv, teori
och praktik i religionsundervisning. Stockholm: Remus.
EDUCARE 2015:2
45
AND ANNIKA LINDSKOG
Radnor, Hilary A, Poulson, Louise, Turner-Bisset, Rosie.(1995).
Assessment and teacher professionalism. The Curriculum Journal,
6(3), 325-342.
Rinne, Ilona. (2013). Att bedöma och bemöta. Nordic Studies in
Education, 33(3), 171-186.
Sadler, Royce D (1985). The origins and functions of evaluative
criteria. Educational Theory, 35(3), 285-297.
Sadler, Royce D (1987) Specifying and Promulgating Achievement
Standards, Oxford Review of Education, 13:2, 191-209, DOI:
10.1080/0305498870130207
Sadler, Royce D (2009) Indeterminacy in the use of preset criteria
for assessment and grading, Assessment & Evaluation in Higher
Education, 34(2), 159-179, DOI:10.1080/02602930801956059
Selander, Sven-Åke (1993). Undervisa i religionskunskap. Lund:
Studentlitteratur.
Skolverket
(2013a).
Ämnesprov
läsår
2012/2013,
Bedömningsanvisningar, Religionskunskap, Årskurs 9. Stockholm:
Skolverket. [WWW dokument]. URL http://www.sobedömning.se/
npsoportal/laddaner.html (2014-12-18).
Skolverket
(2013b).
Ämnesprov
läsår
2012/2013,
Bedömningsanvisningar, Religionskunskap, Årskurs 6. Stockholm:
Skolverket. [WWW dokument]. URL http://www.sobedömning.se/
npsoportal/laddaner.html (2014-12-18).
Skolverket (2013c). Ämnesprov läsår 2012/2013, Delprov A, Årskurs
6. Stockholm: Skolverket. [WWW dokument]. URL http://www.
sobedömning.se/npsoportal/laddaner.html (2014-12-18).
Skolverket (2013d). Ämnesprov läsår 2012/2013, Delprov A, Årskurs
9. Stockholm: Skolverket. [WWW dokument]. URL http://www.
sobedömning.se/npsoportal/laddaner.html (2014-12-18). Smaill, Esther (2013). Moderating New Zealand’s National Standards:
teacher learning and assessment outcomes, Assessment in
Education: Principles, Policy & Practice, 20(3), 250-265, DOI:
10.1080/0969594X.2012.696241
46
EDUCARE 2015:2
Swedish National Agency for Education (2011). Curriculum for
the compulsory school, preschool class and the leisure-time
centre. Stockholm: Swedish National Agency for Education.
Taylor, Monica (1994). Overview of values education in 26 European
countries. In Monica Taylor (Ed.), Values education in Europe:
A comparative overview of a survey of 26 countries in 1993 (pp.
1–66). Dundee: Scottish Consultative Council on the Curriculum.
Thornberg, Robert (2004). Grupprocesser och social påverkan:
socialpsykologi med fokus på skolan. Linköpings universitet,
Institutionen för beteendevetenskap, Vol. 237.
Tillson, John (2011). In Favour of Ethics Education, Against Religious
Education. Journal of Philosophy of Education, 45(4), 675-688.
Van der Schaaf, Marieke, Baartman, Liesbeth, Prins, Frans (2012).
Exploring the role of assessment criteria during teachers’
collaborative judgement processes of students’ portfolios.
Assessment & Evaluation in Higher Education, 37(7), 847-860.
Wilson, John (2000). Methodology and Moral Education. Oxford
Review of Education, 26(2), 255-62.
Wyatt-Smith, Claire, Klenowski, Val (2013). Explicit, latent and metacriteria: types of criteria at play in professional judgement practice.
Assessment in Education: Principles, Policy & Practice, 20(1),
35-52.
EDUCARE 2015:2
47
De nationella proven i NO åk 6
Skillnader i resultat mellan olika grupper
Frank Bach, Birgitta Frändberg, Mats Hagman, Eva West
och Ann Zetterqvist
In the spring of 2013 national tests in biology, physics and chemistry in
grade 6 were implemented for the first time in Sweden. Data collected
in connection to the tests are used to analyse student performance
at different levels. This paper reports on differences in performance
in biology, physics and chemistry between teaching groups, as well as
differences in results related to gender and Swedish / Swedish as a second
language. Comparisons are also made with results from TIMSS 2011,
which tested the same group of students. Analyses were carried out with
the aim to discuss equity in science education in Swedish schools. Overall,
the results indicate that differences in student performance related to
teaching group have increased since 2011 and that differences depending
on the linguistic background are considerable. Additionally, girls perform
better than boys in all science subjects. All these differences are large
enough to be paid attention to on political levels and by principals and
teachers. Both overall structural changes and changes in teaching and
learning activities in schools are needed to increase equity in science
education.
Nyckelord: Equity, science education, national tests, gender, linguistic
background
Frank Bach, fil. Dr., Göteborgs universitet
frank.bach@gu.se
Birgitta Frändberg, fil. Lic., Göteborgs universitet
birgitta.frandberg@ped.gu.se
Mats Hagman, fil. Dr, Göteborgs universitet
mats.hagman@ped.gu.se
48
EDUCARE 2015:2
Eva West, fil. Dr, Göteborgs universitet
eva.west@ped.gu.se
Ann Zetterqvist, fil. Dr, Göteborgs universitet
ann.zetterqvist@ped.gu.se
Inledning
Likvärdig utbildning anses vara en viktig komponent i demokratiska
samhällen (Biesta, 2011; Field, Kuczera, & Pont, 2007; Regeringen,
2014). Det är därför oroande att en rad studier under senare år pekar
på minskande likvärdighet i svensk skola (Bunar, 2010; Jacobsson,
2013; Osth, Andersson, & Malmberg, 2013)2013; Osth, Andersson, &
Malmberg, 2013.
Just när det gäller likvärdighet i den svenska skolan finns det två
absoluta krav uttryckta i skollagen (2010:800) och läroplanen (Lgr11):
att alla ska ha lika tillgång till utbildning och att utbildningen ska vara
av likvärdig kvalitet. Därtill finns ett kompensatoriskt uppdrag i det att
utbildningen ska ta hänsyn till barns och elevers olika behov, med en
strävan ”att uppväga skillnader i barnens och elevernas förutsättningar
att tillgodogöra sig utbildningen” (1 kap. 4§ skollagen). Eftersom det
kompensatoriska uppdraget uttrycks som en strävan, finns det inte
något absolut krav på utbildningsansvariga i hur långt man måste
nå i detta avseende. Det finns olika uppfattningar om hur väl det
kompensatoriska uppdraget genomförs, ofta kopplade till politiska
diskussioner. Det finns därför all anledning att undersöka hur det är
beskaffat med likvärdigheten i den svenska skolan.
Skillnader i elevers prestationer har undersökts på olika sätt: mellan
elever, mellan klasser, mellan skolor och i förhållande till kön, språklig
bakgrund och socioekonomisk status (Skolverket, 2012a). Resultaten
har tolkats som att likvärdigheten har minskat när det gäller hög- och
lågpresterande elever, mellan skolor och mellan undervisningsgrupper
i Sverige. Resultaten av dessa undersökningar är oroande. Då flertalet
av dem gäller slutet av grundskolan och det kompensatoriska uppdraget
gäller hela grundskolan är det viktigt att belysa hur det ser ut tidigare
i skolsystemet.
EDUCARE 2015:2
49
FRANK BACH, BIRGITTA FRÄNDBERG, MATS HAGMAN, EVA WEST
OCH ANN ZETTERQVIST
Våren 2013 genomfördes för första gången i Sverige nationella
prov i biologi, fysik och kemi i årskurs 6. I samband med dessa har
data samlats in i sådan omfattning att det ger möjlighet att analysera
elevresultat på olika nivåer. I den här artikeln redovisas skillnader
i resultat på nationella prov i biologi, fysik och kemi mellan
undervisningsgrupper. Därutöver redovisas skillnader i resultat med
avseende på kön och svenska/svenska som andraspråk. Jämförelser
görs också med resultat från TIMSS 2011 årskurs 4, eftersom det är
samma årskull som har testats i de båda undersökningarna. Analyserna
görs med ambitionen att diskutera likvärdighet i undervisning av de
naturorienterande ämnena för de aktuella åldrarna i den svenska skolan.
Bakgrund
Nationella prov i årskurs 6 i naturorienterande ämnen
Det främsta syftet med de nationella proven är att stödja en likvärdig
och rättvis bedömning av elevers kunskaper i olika ämnen1. Dessutom
ska de fungera som underlag för en analys av i hur stor utsträckning
kunskapskraven uppfylls på skolnivå, på huvudmannanivå och
på nationell nivå. De nationella proven är konstruerade utifrån
kursplanerna.
Kursplanerna i de naturorienterande ämnena biologi, fysik och kemi
är strukturellt mycket lika varandra. De definierar tre förmågor som
undervisningen skall hjälpa eleverna att utveckla:
•
använda kunskaper i biologi/fysik/kemi för att granska
information, kommunicera och ta ställning,
•
genomföra systematiska undersökningar, samt
•
använda naturvetenskapliga begrepp, modeller och teorier
för att beskriva och förklara naturvetenskapliga samband.
De nationella proven i biologi, fysik och kemi är uppdelade i tre
delprov vardera (A, B, C) som i huvudsak prövar var och en av de tre
förmågorna. I 2013 års prov bestod delprov A i alla tre NO-ämnena
av tre omfattande uppgifter som handlade om att granska information,
1 http://www.skolverket.se/bedomning/nationella-prov-bedomningsstod
50
EDUCARE 2015:2
kommunicera och ta ställning, delprov B bestod av 6-7 något mindre
omfattande uppgifter som handlade om systematiska undersökningar
och delprov C av 17-18 uppgifter där eleverna skulle avge svar på frågor
där naturvetenskaplig begreppsanvändning efterfrågas i beskrivningar,
förklaringar och kortare resonemang.
Varje skola genomför nationellt prov i endast ett av NO-ämnena. Av
de drygt 90 000 elever som gick i årskurs 6 våren 2013 har ca 30 000
gjort nationellt prov i varje NO-ämne (se Tabell 1).
Skillnader i prestationer
Sverige har under lång tid uppvisat liten variation mellan elevers
resultat i olika skolor jämfört med andra länder. Det tyder på att
kraven på likvärdighet som ställs i skollag och läroplan i relativt hög
utsträckning har varit uppfyllda. Likvärdigheten har dock under de
senaste decennierna förändrats till att ligga på samma nivå som andra
OECD-länder. Skillnaderna har ökat mellan hög- och lågpresterande
elever samtidigt som resultaten försämrats i förhållande till andra
länder (Davidsson, Karlsson, & Oskarsson, 2013; Martin, Mullis, &
Foy, 2008; Skolverket, 2008, 2010, 2013). En svensk kunskapsöversikt
(Gustafsson et al., 2009) visar också att skolprestationerna för de mest
lågpresterande eleverna har sjunkit mer än övriga elevers prestationer
i den svenska skolan.
Skolverket har analyserat variationen i betyg mellan olika skolor
och mellan klasser inom skolor fram till 2011 (Skolverket, 2012a).
Det framkommer att mellanskolvariationen har ökat från 8,8 % 1998
till 18,2 % år 2011, uttryckt som andel av den totala variationen i
elevers meritvärde vid utgången av årskurs 9. Det innebär att nästan
en femtedel av variationen numera kan hänföras till skillnader mellan
olika skolor. En del av ökningen kan förklaras av att variationen mellan
klasser inom samma skola har ökat, från fem procent 2006 till tio
procent 2010.
Flickor – pojkar
I internationella studier som TIMSS och PISA, presterar pojkar ofta
bättre än flickor i fysik och kemi medan könsskillnaderna är obefintliga
eller till flickornas fördel i biologi. I senare mätningar ser man
internationellt en tendens till utjämning för alla de tre naturvetenskapliga
EDUCARE 2015:2
51
OCH ANN ZETTERQVIST
ämnena (Beller & Gafni, 1996; Lee & Burkam, 1996; Martin et al.,
2000, 2008; Martin, Mullis, Gonzales, & Chrostowski, 2004; Mullis,
Martin, Fierros, Goldberg, & Stemler, 2000; Skolverket, 2012b).
Svenska elevers resultat sjunker i internationella undersökningar och
pojkars prestation har försämrats mer än flickornas (Skolverket, 2013).
I TIMSS 2011 presterar de svenska pojkarna och flickorna på samma
nivå i naturvetenskap förutom i årskurs 4 där de svenska pojkarna
presterar bättre i fysik/kemi (Martin, Mullis, Foy, & Stanco, 2012;
Skolverket, 2012b). I PISA 2012 är de svenska flickornas resultat i
naturvetenskap bättre än pojkarnas, och detsamma gäller resultaten
från de nationella proven i årskurs 9 (Skolverket, 2014).
En svensk studie av TIMSS-resultat har visat att uppgiftsformatet
har betydelse för både flickors och pojkars prestationer. Flickor
presterar relativt sett bättre på uppgifter där de ska skriva ett svar.
Pojkar presterar däremot bättre på uppgifter där det finns färdiga
svarsalternativ. (Eriksson, 2005)
Olika språklig bakgrund
Elevers bakgrund har i allmänhet visat sig ha stor betydelse för deras
skolprestationer. Det kan till exempel handla om socioekonomisk eller
språklig bakgrund. Elever födda i Sverige med minst en svenskfödd
förälder presterar i genomsnitt bättre i naturvetenskap i årskurs
4 i TIMSS 2011 än både utlandsfödda elever och elever med två
utlandsfödda föräldrar. Mellan elever i de sistnämnda två grupperna
finns inga signifikanta skillnader (Martin et al., 2012; Skolverket,
2012b). Inom grupperna finns en stor variation och detta gäller enligt
rapporten speciellt för utlandsfödda elever. I denna grupp finns det till
exempel många utlandsfödda elever som presterar på en högre nivå än
många elever som är födda i Sverige med minst en svenskfödd förälder.
En förklaring till skillnader i resultat mellan elevgrupperna är elevernas
olika socioekonomiska bakgrund, d.v.s. olika faktorer som kan kopplas
till föräldrarnas yrke, inkomst och utbildningsnivå. De skillnader som
finns är större i naturvetenskap än i matematik i motsvarande årskurs.
Enligt TIMSS 2011 skulle detta till viss del kunna förklaras av att
uppgifterna i naturvetenskap kräver en högre grad av läsförståelse än
vad matematikuppgifterna kräver.
52
EDUCARE 2015:2
Syfte
I samband med att det för första gången har genomförts nationella
prov i naturorienterande ämnen i årskurs 6 ges en möjlighet att studera
aspekter av likvärdighet i ett omfattande material med resultat från
svenska elever i lägre åldrar.
Syftet är att belysa några aspekter av likvärdighet i svensk
skola genom att undersöka skillnader i resultat på nationella prov i
naturorienterande ämnen i årskurs 6 mellan undervisningsgrupper2,
flickor och pojkar samt mellan elever med svenska och svenska som
andraspråk. I detta ingår också att undersöka olika gruppers prestationer
i olika delar av provet. Ytterligare ett syfte är att jämföra skillnader
i resultat mellan undervisningsgrupper i de nationella proven med
motsvarande skillnader i resultat från samma årskull i TIMSS 2011.
Metod
Data utgörs av nationella provresultat i biologi, fysik och kemi för
årskurs 6 från 29931 elever, nedan kallat Urval 2013, vilket utgör
en tredjedel av alla elever som gjorde proven. Informationen som
använts i analyserna har genererats genom att lärare frivilligt har
använt en webbplats för att beräkna provbetyg för elever i sina
undervisningsgrupper genom att lägga in resultaten för eleverna.
I materialet finns information om elevernas resultat på varje
uppgift och om kön, undervisningsgrupp samt Svenska (Sv) och
Svenska som andraspråk (SvA). Däremot finns det inte någon
information om skola eller socioekonomisk bakgrund hos eleverna.
Dessa begränsningar innebär till exempel att det inte är möjligt att
beräkna mellanskolvariation eller att kompensera för socioekonomisk
bakgrund. Däremot är det möjligt att beräkna den variation som kan
hänföras till undervisningsgrupper, vilket i de flesta fall handlar om
hela skolklasser.
Då informationen inte genererades genom ett slumpmässigt urval
så undersöktes i vilken utsträckning data är representativa för hela
2 I många av referenserna används ordet klasser. I resultat från denna undersökning används istället ordet undervisningsgrupper eftersom det inte
varit möjligt att få information om hur skolorna organiserar undervisningen
i NO-ämnena.
EDUCARE 2015:2
53
OCH ANN ZETTERQVIST
populationen som genomförde de nationella proven i biologi, fysik och
kemi. Detta gjordes genom att jämföra med Skolverkets totalinsamling
av provbetyg och fördelning mellan flickor och pojkar samt andelen
elever med SvA.
Skolverket redovisar ofta resultat genom att ange andelar av elever
som erhåller ett visst provbetyg, vilket utgörs av ett sammanvägt
omdöme (F-A) av en elevs prestation på ett nationellt prov. De använder
också provbetygspoäng för att översätta bokstavsbeteckningarna till
tal. Det sker genom följande omvandlingsnyckel: F=0, E=10, D=12,5,
C=15, B=17,5 och A=20 poäng.
Resultat från de nationella proven i de naturorienterande ämnena
beräknas som det procentuella medelvärdet av resultaten från de tre
delproven. Exempelvis erhåller en elev som når 45 % av de möjliga
beläggen (poängen) på delprov A, 50 % på delprov B och 49 % på
delprov C resultatet 48 % på hela provet.
Representativitet hos undersökningsgruppen
Urval 2013 är som tidigare nämnts inte slumpmässigt. För att få reda
på hur representativt urvalet är gjordes jämförelser med Skolverkets
uppgifter för samtliga elever som genomförde provet, nedan kallat
Totaldata 2013. Antal elever i Urval 2013 och Totaldata 2013 visas i
Tabell 1.
Tabell 1. Antal elever i de olika grupperna.
Grupp
Urval 2013
Totaldata 2013
Biologi
Fysik
Kemi
Totalt
9415
10849
9667
29931
31040
31713
29720
92474
En jämförelse av provbetyg och provbetygspoäng mellan Urval 2013
och Skolverkets totaldata visar att representativiteten, i termer av
provbetyg, är god (se Figur 1 och Tabell 2).
Tabell 2. Genomsnittlig provbetygspoäng i Urval 2013 och Totaldata 2013.
Biologi
Fysik
Kemi
Urval 2013
13,86
13,44
14,29
Totaldata 2013
13,82
13,41
14,12
54
EDUCARE 2015:2
Provbetygspoängen är något högre i Urval 2013 än i Totaldata 2013,
men skillnaderna är små.
Biologi
100%
90%
80%
3% 20% 3% 19% Fysik
2% Kemi
2% 17% 17% 41% 40% 70%
60%
50%
41% 42% 40%
30%
20%
10%
0%
18% 14% 4% 18% 15% 4% 18% 18% 16% 17% 6% 5% 4% 22% 43% 16% 12% 3% 4% 20% 42% 17% 13% A B C D E F 3% Urval 2013 Totaldata Urval 2013 Totaldata Urval 2013 Totaldata
2013
2013
2013
Figur 1. Fördelning av provbetyg i biologi, fysik och kemi, i Urval 2013
och Totaldata 2013
Figur 1 visar små skillnader mellan Urval 2013 och Totaldata 2013.
Fördelningen av de olika provbetygen är förhållandevis lika vilket
visar att de två datamängderna är lika varandra när det gäller variation
utöver de tidigare visade medelvärdena.
Fördelningen mellan flickor och pojkar i materialet från webbplatsen
stämmer också bra överens med totaldata från Skolverket (Tabell 3).
Tabell 3. Andel flickor och pojkar.
Flickor (%)
Pojkar (%)
Urval 2013
48,88
51,12
Totaldata 2013
48,78
51,21
Även andra jämförelser visar att data är representativa. Exempelvis
har lärarna ombetts ange om eleverna läser Svenska eller Svenska som
EDUCARE 2015:2
55
OCH ANN ZETTERQVIST
andraspråk (SvA), vilket kan jämföras med Skolverkets statistik över
terminsbetyg för vårterminen 2014. Andelen elever med SvA i Urval
2013 är 8,2 % vilket är i samma storleksordning som Skolverkets data,
9,0 %.
Slutsatsen blir att Urval 2013 är tillräckligt representativt för att göra
jämförelser mellan olika grupper på nationell nivå.
Analyser
Tillgängliga data gör det möjligt att belysa likvärdigheten i svensk
skola genom att jämföra resultaten för pojkar och flickor, elever
med Sv respektive SvA samt att analysera variationen mellan
undervisningsgrupper.
Då proven har olika antal poäng och olika resultatfördelningar har
skalorna likställts. För att jämföra två grupper sker likställandet mellan
olika prov genom normering mot standardavvikelsen. För att jämföra
många grupper beräknas den andel av totala variationen som går att
hänföra till variationen mellan undervisningsgrupper. Eftersom prov
och delprov har olika fördelningar och därför inte går att jämföra direkt
har standardiserade värden använts.
I huvudsak har tre statistiska storheter använts, medelvärde (m) och
två standardiserade mått på vilken effekt som kan relateras till skillnader
mellan grupper, här kallade effektstorlek (d) och effektstyrka (η2).
Effektstorlek har använts för att visa skillnad mellan två grupper.
Storheten utgår från skillnader i medelvärden mellan två grupper och
tar hänsyn till spridningen – standardavvikelserna – inom grupperna.
Standardavvikelsen (kan sägas vara medelavvikelsen från medelvärdet)
och beräknas enligt nedanstående formel där x står för aktuellt värde,
m för medelvärdet och N för antalet observationer:
𝑠𝑠 =
!
𝑥𝑥 − 𝑚𝑚
𝑁𝑁 − 1
Effektstorleken beräknas som skillnaden i medelvärden mellan
grupperna dividerat med kvadratroten ur medelskillnaden på
kvadraterna av standardavvikelserna för grupperna:
56
EDUCARE 2015:2
𝑑𝑑 =
𝑚𝑚! − 𝑚𝑚!
𝑠𝑠!! + 𝑠𝑠!!
2
Effektstorleken utgör den standardiserade skillnaden i förhållande till
standardavvikelserna. Det är således möjligt att jämföra skillnader
mellan två grupper som har genomfört tester med olika medelvärden
och standardavvikelser.
För att jämföra många grupper med varandra har istället effektstyrka
använts:
𝑆𝑆𝑆𝑆!"##$%
𝜂𝜂 =
=
𝑆𝑆𝑆𝑆!"#$%
!
𝑛𝑛! (𝑚𝑚.! − 𝑚𝑚.. )!
(𝑥𝑥!" − 𝑚𝑚.. )!
där nj står för antalet observationer (elever) i grupp j, m.j står för
medelvärdet av observationerna i grupp j och m.. står för medelvärdet
av alla observationer.
Resultat
Först redovisas skillnader mellan undervisningsgrupper. Därefter
redovisas skillnader mellan flickor och pojkar och sist skillnader
mellan de elever som har Sv och SvA på schemat. De skillnader som
redovisas är statistiskt signifikanta (p≤0,01). Urval 2013 utgör ungefär
en tredjedel av populationen vilket gör att också mycket små skillnader
blir signifikanta, varför storleken på skillnaderna ofta är mer intressanta
än att de är statistiskt signifikanta. Avslutningsvis redovisas skillnader
i resultat mellan undervisningsgrupper i de nationella proven med
motsvarande skillnader i resultat från samma årskull i TIMSS 2011.
Variation som hänger samman med undervisningsgrupp
I Urval 2013 kan man urskilja vilken undervisningsgrupp eleverna
tillhörde men däremot inte skola. Den totala mellangruppsvariationen
kan således beräknas, men inte mellanskolsvariationen eller variation
mellan undervisningsgrupper inom skolor separat. Variationen hos
provbetygspoängen vid nationella prov i de naturorienterande ämnena
för årskurs 6 beskrivs i Tabell 4.
EDUCARE 2015:2
57
OCH ANN ZETTERQVIST
Tabell 4. Total mellangruppsvariation, uttryckt som den andel av den
totala variationen i elevers provbetygspoäng som kan hänföras till vilken
undervisningsgrupp de tillhör.
Mellangruppsvariation (b2) (%)
N
Biologi
30,6
9415
Fysik
25,4
10849
Kemi
27,7
9667
Den variation som kan föras till vilken undervisningsgrupp som
eleverna tillhör uppgår alltså till 25 % eller mer i samtliga tre NO-ämnen
för de nationella proven 2013. Motsvarande mellangruppsvariation
två år tidigare för samma population i TIMSS 2011 är 23,5% för
biologi, 21,1% för fysik/kemi och 22,6% för naturvetenskap inklusive
geovetenskap. Mellangruppsvariationen har således ökat sedan
eleverna gick i fyran.
Ett annat sätt att få en bild av gruppskillnaderna i de nationella
proven är att jämföra resultaten i hög- och lågpresterande
undervisningsgrupper. I Tabell 5 redovisas resultat för de 10 % lägst
och de 10 % högst presterande undervisningsgrupperna. Vi benämner
dem i fortsättningen som låg- och högpresterande grupper.
Tabell 5. Resultat på de nationella proven för låg- och högpresterande grupper
i biologi, fysik och kemi
Medel alla
elever
Medel högst
presterande elever
Medel lägst
presterande elever
Biologi 10 % lägst
39,0
68,8
15,5
Biologi 10 % högst
72,0
89,8
45,5
Fysik 10 % lägst
35,2
63,7
11,4
Fysik 10 % högst
62,9
82,4
35,5
Kemi 10 % lägst
41,8
69,0
15,7
Kemi 10 % högst
71,4
91,1
43,6
De lägst presterande eleverna i de högpresterande grupperna ligger på
samma nivå som medelvärdet för samtliga elever i de lågpresterande
grupperna. Detta gäller i alla de tre NO-ämnena. Skillnaderna i
resultat är störst för de lägst presterande eleverna. I de lågpresterande
58
EDUCARE 2015:2
grupperna når dessa bara en tredjedel av resultaten för de lägst
presterande eleverna i de högpresterande grupperna. Däremot når
de högst presterande eleverna i de lågpresterande grupperna ungefär
75 % av vad de högst presterande eleverna i de högpresterande
grupperna uppnår. I genomsnitt når de lägst presterande eleverna i de
lågpresterande undervisningsgrupperna drygt 25 % av medelvärdet
för samtliga elever, medan de lägst presterande eleverna i de högst
presterande undervisningsgrupperna når, i genomsnitt över ämnena,
knappt 75 % av medelresultaten.
Skillnader mellan flickor och pojkar.
Resultaten från proven 2013 visar att flickorna överlag presterar bättre
än pojkarna i alla tre ämnena. Skillnaden är störst i biologi, mindre i
kemi och minst i fysik (Figur 2).
Biologi
100%
4%
16%
90%
80%
2%
24%
Fysik
2%
20%
Kemi 2%
3%
5%
14%
19%
25%
70%
40%
60%
50%
40%
42%
42%
43%
43%
19%
20%
18%
19%
20%
15%
10%
11%
0%
3%
5%
5%
6%
Flickor
Pojkar
Flickor
Pojkar
18%
13%
19%
14%
E F 4%
Pojkar
Figur 2. Flickors och pojkars provbetyg i de tre NO-ämnena
EDUCARE 2015:2
C 13%
10%
2%
Flickor
B D 40%
30%
A 59
OCH ANN ZETTERQVIST
Om man istället analyserar resultaten från de tre delproven i varje ämne
framträder ett något annorlunda mönster (Tabellerna 6 och 7).
Tabell 6. Resultat för flickor och pojkar på de tre delproven uttryckta i
delprovsresultat och skillnaden som effektstorlek (d)
Delprov A
Delprov B
Delprov C
Flickor
Pojkar
d
Flickor
Pojkar
d
Flickor
Pojkar
Biologi
59,8
52,7
0,29
57,5
51,5
0,31
58,7
54,9
0,26
d
Fysik
58,9
50,7
0,34
62,7
58,6
0,18
45,8
46,9
-0,08
Kemi
64,3
54,7
0,42
58,7
53,6
0,28
58,2
59,4
-0,06
I biologi presterar flickorna något bättre i alla delproven, men i
delprov C i fysik och kemi har pojkarna ett något högre resultat än
flickorna. Delproven skiljer sig från varandra genom att delprov C
innehåller en större andel uppgifter med strukturerade svarsformat.
Med strukturerade svarsformat avses t.ex. flervalsfrågor och uppgifter
där eleverna ombeds fylla i luckor i en text. Resultaten redovisade
i Tabell 6 pekar på att svarsformaten kan ha betydelse för flickors
respektive pojkars prestationer. Därför analyseras resultaten på
uppgifter med strukturerade svarsformat och öppna uppgifter var för
sig, för att jämföra flickors och pojkars relativa förmåga att hantera de
olika svarsformaten.
Tabell 7. Resultat för flickor och pojkar på uppgifter med öppna eller strukturerade
svarsformat och skillnader i effektstorlek (d)
Biologi
Fysik
Kemi
60
Flickor
Pojkar
d
Öppna
51,4
45,6
0,36
Strukturerade
69,7
68,1
0,11
Hela provet
58,7
53,1
0,34
Öppna
52,5
47,9
0,25
Strukturerade
57,5
60,3
-0,18
Hela provet
55,8
53,9
0,11
Öppna
55,7
51,0
0,27
Strukturerade
69,7
71,5
-0,10
Hela provet
60,4
55,9
0,27
EDUCARE 2015:2
Flickorna presterar betydligt bättre än pojkarna på uppgifter med
öppna svarsformat medan skillnaderna är avsevärt mindre för uppgifter
med strukturerade svarsformat. Pojkarna presterar i förhållande till
flickor bättre på uppgifter med strukturerade svarsformat i fysik.
Samma mönster som i fysik återfinns i kemi, men uppgifterna med
strukturerade svarsformat gör inte riktigt lika stor skillnad i kemiprovet
som i fysikprovet.
Resultatet är entydigt för de tre nationella proven i NO-ämnena,
flickor presterar relativt pojkarna bättre på öppna uppgifter och
pojkar presterar förhållandevis bättre på uppgifter med strukturerade
svarsformat.
Skillnader mellan elever med svenska respektive svenska
som andraspråk.
Förutom elevernas kön, ombads lärarna att lämna information om vilka
elever som läser Svenska som andraspråk (SvA) när de rapporterade
in elevernas resultat. I Urval 2013 är det knappt tio procent som har
rapporterats läsa SvA, vilket är i samma storleksordning som i officiell
statistik från Skolverket. Skillnaderna i resultat mellan de elever som
läser SvA och övriga elever är stora (Figur 3).
Andelen elever med SvA som erhåller provbetyg F är lika stor
eller större än andelen övriga elever som får provbetyg F och E
tillsammans. Mycket få elever med SvA når upp till provbetyget A
i något av ämnena (avrundat till 0 % i Figur 3). En fjärdedel så stor
andel av elever med SvA jämfört med övriga elever får provbetyget
B. Omfattningen av skillnaderna mellan elever med SvA och Sv
motiverar en jämförelse mellan hur elever med SvA respektive Sv
presterar i undervisningsgrupper med stor respektive låg andel elever
SvA. Presterar elever med olika språkbakgrund lika bra oberoende
av undervisningsgruppernas sammansättning? Resultaten av sådana
jämförelser i de tre NO-ämnena redovisas i tabellerna 8 och 9.
EDUCARE 2015:2
61
OCH ANN ZETTERQVIST
Biologi 100%
90%
3%
22%
80%
0%
5%
Fysik
2%
18%
27%
Kemi 0%
4%
5%
24%
24%
0%
6%
31%
70%
60%
50%
43%
22%
42%
44%
40%
B 22%
C D 30%
32%
30%
20%
A 18%
17%
10%
13%
0%
3%
18%
F 16%
15%
15%
24%
10%
14%
2%
Sv
SvA
4%
Sv
E 28%
SvA
Sv
SvA
Figur 3. Jämförelse av provbetyg mellan elever som läser SvA och Sv
Tabell 8. Skillnad i resultat mellan elever med SvA och Sv för elever i
undervisningsgrupper med större andel elever med SvA än 25 % uttryckt i
resultat och effektstorlek (d)
Biologi
Fysik
Kemi
62
Delprov A
Delprov B
Delprov C
Biologiprov
Sv
Medel
56,7 %
54,0 %
57,7 %
56,1 %
SvA
Medel
42,2 %
39,6 %
44,7 %
42,1 %
d
0,61
0,74
0,8
0,83
Sv
Medel
53,1 %
56,8 %
44,6 %
51,5 %
SvA
Medel
38,1 %
39,7 %
36,9 %
38,2 %
d
0,62
0,78
0,51
0,77
Sv
Medel
56,2 %
51,9 %
56,0 %
54,7 %
SvA
Medel
44,0 %
41,7 %
44,6 %
43,4 %
d
0,50
0,57
0,58
0,62
EDUCARE 2015:2
I samtliga tre delprov i biologi, och i provet som helhet, ligger
effektstorleken över 0,6 vilket är att betrakta som en relativt stor
skillnad. I fysik ligger effektstorleken över 0,6 i delprov A och B,
medan den ligger något under i delprov C. I kemi är skillnaderna i
genomsnitt något mindre än i biologi och fysik.
Tabell 9. Skillnad i resultat mellan elever med SvA och Sv för elever i
undervisningsgrupper med mindre andel elever med SvA än 25 % uttryckt i
andelar och effektstorlek (d)
Biologi
Fysik
Kemi
Delprov A
Delprov B
Delprov C
Biologiprov
Sv
Medel
57,8 %
56,0 %
58,2 %
57,3 %
SvA
Medel
43,4 %
41,3 %
43,2 %
42,6 %
d
0,61
0,78
1,01
0,90
Sv
Medel
56,1 %
62,4 %
47,2 %
55,2 %
SvA
Medel
39,0 %
44,8 %
37,2 %
40,3 %
d
0,71
0,79
0,69
0,88
Sv
Medel
60,9 %
57,4 %
60,3 %
59,5 %
SvA
Medel
46,11 %
43,49 %
43,73 %
44,45 %
d
0,65
0,78
0,93
0,93
Gemensamt för alla tre ämnesproven är att skillnaden är större mellan
elever med SvA och elever med Sv på schemat i undervisningsgrupper
där det är en mindre andel än 25 % av eleverna som har SvA.
Gemensamt är också att elever i undervisningsgrupper med större
andel elever med SvA än 25 % har lägre resultat oavsett om de har
SvA eller inte.
Råder det på liknande sätt som för flickor och pojkar skillnader
i prestation i relation till öppna och strukturerade svarsformat? När
det gäller skillnaden i prestation mellan elever med Sv och SvA med
avseende på strukturerade eller öppna svarsformat är denna liten i
biologi och kemi, men något större i fysik (Tabell 10).
EDUCARE 2015:2
63
OCH ANN ZETTERQVIST
Tabell 10. Resultat för elever med Sv och SvA på uppgifter med öppna eller
strukturerade svarsformat i biologi och skillnad i effektstorlek (d)
Sv
Biologi
Fysik
Kemi
SvA
d
Öppna
49,8
36,0
0,88
Strukturerade
70,3
55,5
0,90
Öppna
51,4
35,3
0,90
Strukturerade
60,9
49,1
0,73
Öppna
54,5
39,2
0,91
Strukturerade
72,0
55,5
0,86
Skillnaden mellan elever som läser Sv och SvA uppvisar inte ett lika
entydigt mönster när det gäller svarsformaten som för flickor och
pojkar. Möjligen finns det en tendens till att elever med SvA presterar
något högre, i förhållande till elever med Sv, på uppgifter med
strukturerade svarsformat.
Diskussion
Våren 2013 genomfördes för första gången i Sverige nationella prov
i biologi, fysik och kemi i årskurs 6. Data som insamlats i samband
med dessa prov gör det möjligt att analysera skillnader i resultat
mellan undervisningsgrupper. Data gör det också möjligt att jämföra
prestationer mellan flickor och pojkar samt att undersöka hur elever
med svenska som andraspråk presterar i relation till elever med
svenska. Syftet var att belysa aspekter av likvärdighet i yngre åldrar
vilket inte har varit möjligt tidigare.
Resultaten indikerar att skillnaderna mellan undervisningsgrupper
har ökat något i både biologi, fysik och kemi för den aktuella årskullen
under de två åren mellan TIMSS 2011 och de nationella proven 2013.
Numera är minst 25 % av variationen i elevernas resultat relaterad
till den undervisningsgrupp som de tillhör. Variationen för årskurs
sex är alltså i samma storleksordning som tidigare har visats för
14-15-åringar (Davidsson et al., 2013; Martin et al., 2000, 2008, 2012,
2004; Skolverket, 2007, 2008, 2012a, 2012b, 2013). Man kan fråga sig
om dryga 25 % är ett högt eller ett lågt värde, d.v.s. om det är rimligt
att drygt 25 % av variationen hos resultaten på de nationella proven
går att föra till vilken undervisningsgrupp eleverna befinner sig i. Ett
64
EDUCARE 2015:2
sätt att belysa frågan är att närmare undersöka hur prestationerna ser
ut i de lågpresterande grupperna och jämföra med de högpresterande
undervisningsgrupperna. I alla de tre ämnena är medelvärdet för de
lägst presterande eleverna i de högpresterande grupperna lika med eller
högre än medelvärdet för alla elever i de lågpresterande grupperna.
Skillnaderna mellan de lägst presterande eleverna i de båda kategorierna
av undervisningsgrupper är stora. De lägst presterande eleverna presterar
relativt sett lägre i de lågpresterande undervisningsgrupperna än de
lägst presterande eleverna i de högpresterande undervisningsgrupperna.
Dessa skillnader motiverar en fråga om hur skolsystemet lyckas med
det kompensatoriska uppdraget och är ett tecken på liknande mönster i
årskurs 6 som tidigare har visats för årskurs 9 (Davidsson et al., 2013).
Ett annat mönster är att de högst presterande eleverna i de lågpresterande
grupperna inte är så långt efter de högst presterande eleverna i de
högpresterande grupperna. Spridningen i elevernas prestationer är
således större i de lågpresterande grupperna, de är mer heterogena.
De lägst presterande eleverna i de lågpresterande grupperna når
ungefär en tredjedel av resultatet för de lägst presterande eleverna i de
högpresterande grupperna. Samtidigt når de högst presterande eleverna
i de lågpresterande grupperna drygt tre fjärdedelar av resultatet för de
högst presterande eleverna i de högpresterande grupperna.
I delprov C, som prövar elevernas förmåga att använda
naturvetenskapliga begrepp i beskrivningar, förklaringar och
resonemang, presterar pojkarna bättre än flickorna i fysik och kemi.
Detta överensstämmer med resultaten i TIMSS 2011 årskurs 4
(Skolverket, 2012b). Delprov C är också det delprov som liknar
TIMSS mest, till exempel genom sin kombination av uppgifter med
olika svarsformat. Vid en jämförelse mellan flickors respektive pojkars
resultat på frågor med strukturerade svarsformat presterar flickorna
något bättre än pojkarna i biologi. I fysik och kemi ligger pojkarnas
resultat högre. Däremot ser bilden annorlunda ut vid en jämförelse av
resultat på uppgifter med öppna svarformat där flickorna presterar bättre
i de nationella proven i samtliga naturvetenskapliga ämnen. Resultat
från nationella prov i svenska och engelska visar att flickorna presterar
bättre framförallt i de delar som benämns skriftlig förmåga3. Liknande
3 http://siris.skolverket.se/reports/rwservlet?cmdkey=common&notgeo=&p_verksamhetsar=2013&p_hm_kod=&report=gr_ap6_2013&p_lan_
kod=&p_kommun_kod=&p_skolkod=
EDUCARE 2015:2
65
OCH ANN ZETTERQVIST
resultat har visats i språk och matematik (Bolger & Kellaghan, 1990).
Det skulle alltså kunna vara så att skillnaden mellan pojkar och flickor
på öppna uppgifter i naturvetenskapliga ämnen framför allt gäller
förmåga och intresse för att skriva (Merisuo‐Storm, 2006), men när det
gäller att läsa och förstå det lästa är inte skillnaderna lika avgörande.
Det finns stora skillnader i resultat mellan elever som har svenska
(Sv) och svenska som andraspråk (SvA). Dessa är betydligt större
än de skillnader som tidigare har diskuterats beträffande flickor och
pojkar. Det finns inga tydliga tecken på att vissa typer av frågor
eller svarsformat bidrar till att elever med SvA skulle svara bättre
eller sämre i förhållande till andra elever. Medan skillnaden mellan
flickor och pojkar mest tycks ha att göra med den skriftliga förmågan
så verkar skillnaden vara av mer generell natur för elever med Sv
respektive SvA. Sannolikt har SvA-eleverna som grupp ett sämre
utgångsläge beträffande skolbakgrund och kunskaper i svenska som
leder till ett lägre resultat överlag. Dessutom visar resultaten att i
undervisningsgrupper med hög andel elever med SvA är prestationerna
generellt sämre oberoende av språkbakgrund.
Sammantaget visar resultaten från de nationella proven 2013
att skillnaderna i elevernas prestationer beroende på vilken
undervisningsgrupp de tillhör sannolikt har ökat sedan 2011 och att
skillnaderna beroende på språklig bakgrund är avsevärda. Dessutom
presterar flickor bättre än pojkar i alla NO-ämnen. Enligt svenska
skollagen (2010:800) och den nya läroplanen (Lgr11) är målsättningen
att skolan skall fungera kompensatoriskt och att alla elever skall ha
likvärdiga möjligheter till utbildning. De första nationella proven i
biologi, fysik och kemi visar dock på relativt stora skillnader i årskurs 6
för dessa tre skolämnen. Det är rimligt att ställa frågan om det svenska
skolsystemet i tillräckligt stor utsträckning lyckas utjämna skillnader
mellan elever med olika förutsättningar och därmed om graden av
likvärdighet är tillräcklig för att uppfylla skollagen.
De redovisade skillnaderna är tillräckligt stora för att uppmärksammas
politiskt, bland huvudmän och i skolor. Sannolikt behövs såväl
övergripande strukturella förändringar för att öka likvärdigheten
som förändringar i den dagliga verksamheten så att kvaliteten i NOundervisningen ökar och att skillnaderna i prestation minskar mellan
olika undervisningsgrupper.
66
EDUCARE 2015:2
Tack
Vi vill tacka för värdefulla kommentarer på tidigare manus från
kolleger i projektgruppen för nationella prov i religionskunskap samt
från de anonyma granskarna och redaktionen för Educare.
Referenser
Beller, Michal, & Gafni, Naomi (1996). 1991 International
Assessment of Educational Progress in Mathematics and
Sciences: The gender differences perspective. Journal of
Educational Psychology, 88(2), 365–377. doi:http://dx.doi.org.
ezproxy.ub.gu.se/10.1037/0022-0663.88.2.365
Biesta, Gert (2011). Learning Democracy in School and
Society: Education, Lifelong Learning, and the Politics
of Citizenship. Hämtad från http://www.springer.com/
new+%26+forthcoming+titles+%28default%29/book/978-946091-512-3
Bolger, Niall, & Kellaghan, Thomas (1990). Method of Measurement
and Gender Differences i Scholastic Achievemnt. Journal of
Educational Measurment, 27(2), 165–174.
Bunar, Nihad (2010). Choosing for quality or inequality: current
perspectives on the implementation of school choice policy
in Sweden. Journal of Education Policy, 25(1), 1–18.
doi:10.1080/02680930903377415
Davidsson, Eva, Karlsson, Karl-Göran, & Oskarsson, Magnus
(2013). Trender och likvärdighet – Svenska elevers resultat på
PISA naturvetenskap i en internationell jämförelse. Utbildning
och demokrati, 22(3), 37–52.
Eriksson, Niklas (2005). Prestationsskillnader mellan flickor och
pojkar i NO: En studie av uppgiftsformatets betydelse i TIMSS
2003 (No. 15) (p. 25). Umeå: Enheten för beteendevetenskapliga
mätningar.
Field, Simon, Kuczera, Ma-gorzata, & Pont, Beatriz (2007). No
More Failures – Ten Steps to Equity in Education (No. 91 2007
04 1 P). Paris: OECD PUBLICATIONS. Hämtad från www.
sourceoecd.org/education/9789264032590
EDUCARE 2015:2
67
OCH ANN ZETTERQVIST
Gustafsson, Jan-Eric, Myrberg, Eva, Rosén, Monica, YangHansen, Kajsa., Roman, Henrik, Håkansson, Jan, & Sundberg,
Daniel (2009). Vad påverkar resultaten i svensk grundskola?
Kunskapsöversikt om betydelsen av olika faktorer. (p. 268).
Stockholm: Skolverket. Hämtad från http://www.skolverket.se/
publikationer?id=2260
Jacobsson, Anders (2013). Att undersöka kunskapstrender med hjälp
av PISA – Likvärdighet, förståelse och kunskapssyn. Utbildning
och demokrati, 22(3), 13–36.
Lee, Valerie E., & Burkam, David T. (1996). Gender differences
in middle grade science achievement: Subject domain, ability
level, and course emphasis. Science Education, 80(6), 613–650.
doi:10.1002/(SICI)1098-237X(199611)80:6<613::AIDSCE1>3.0.CO;2-M
Martin, M. O., Mullis, I. V. S., & Foy, P. (2008). TIMSS 2007
International Science Report: Findings from IEA’s Trends in
International Mathematics and Science Study at the Fourth
and Eighth Grades. Chestnut Hill, MA: TIMSS & PIRLS
International Study Center, Boston College.
Martin, Michael O., Mullis, Ina V. S., Foy, Pierre, & Stanco,
Gabrielle M. (2012). TIMSS 2011: International results
in science. Chestnut Hill, MA, USA: TIMSS & PIRLS
International Study Center, Lynch School of Education, Boston
College.
Martin, Michael. O., Mullis, Ina V. S., Gonzales, Eugenio J., &
Chrostowski, Steven J. (2004). Findings From IEA’s Trends in
International Mathematics and Science Study at the Fourth and
Eighth Grades. Boston, USA: Chestnut Hill, MA: TIMSS &
PIRLS International Study Center, Boston College.
Martin, Michael O., Mullis, Ina. V. S., Gonzales, Eugenio J.,
Gregory, Kelvin D., Smith, Teresa A., Chrostowski, Steven J.,
& O’Connor, Kathleen M. (2000). TIMSS 1999 International
Science Report (p. 397). Boston: International Study Center:
Lynch School of Education: Boston College.
68
EDUCARE 2015:2
Merisuo-Storm, Tuula (2006). Girls and Boys Like to Read and
Write Different Texts. Scandinavian Journal of Educational
Research, 50(2), 111–125. doi:10.1080/00313830600576039
Mullis, Ina. V. S., Martin, Michael. O., Fierros, Edward G.,
Goldberg, Arnie L., & Stemler, Steven E. (2000). Gender
Differences in Achievement: IEA’s Third International
Mathematics and Science Study (TIMSS). Chestnut Hill, MA:
Boston College.
Osth, John, Andersson, Eva, & Malmberg, Bo (2013). School Choice
and Increasing Performance Difference: A Counterfactual
Approach. Urban Studies, 50(2), 407–425.
Regeringen (2014). Gustav Fridolin och Aida Hadzialic tar emot
OECD:s skolgranskning. Hämtad från
http://www.regeringen.se/sb/d/19679/a/250950
Skolverket (2007). PISA 2006 - 15-åringars förmåga att förstå, tolka
och reflektera - naturvetenskap, matematik och läsförståelse
(No. 306) (p. 124). Stockholm. Hämtad från http://www.
skolverket.se/publikationer?id=1760
Skolverket (2008). TIMSS 2007: Svenska grundskoleelevers
kunskaper i matematik och naturvetenskap i ett internationellt
perspektiv. (No. 323). Stockholm: Skolverket. Retrieved from
http://www.skolverket.se/publikationer?id=2127
Skolverket (2010). Rustad att möta framtiden? PISA 2009 om
15-åringars läsförståelse och kunskaper i matematik och
naturvetenskap - Resultaten i koncentrat. Stockholm:
Skolverket. Hämtad från http://www.skolverket.se/
Skolverket (2012a). Likvärdig utbildning i svensk grundskola? En
kvantitativ analys av likvärdighet över tid. (No. 374) (p. 102).
Stockholm: Skolverket. Hämtad från http://www.skolverket.se/
EDUCARE 2015:2
69
OCH ANN ZETTERQVIST
Skolverket (2012b). TIMSS 2011: Svenska grundskoleelevers
kunskaper i matematik och naturvetenskap i ett internationellt
perspektiv (No. 380) (p. 150). Stockholm: Skolverket.
Hämtad från http://www.skolverket.se/publikationer?id=2942
Skolverket (2013). PISA 2012 - 15-åringars kunskaper i matematik,
läsförståelse och naturvetenskap (p. 160). Stockholm:
Skolverket. Retrieved from http://www.skolverket.se/
Skolverket (2014). Resultat från ämnesproven i årskurs 9,
vårterminen 2014 (PM) (p. 13). Stockholm.
Hämtad från http://www.skolverket.se/publikationer?id=3351
70
EDUCARE 2015:2
Professionalism in action – Music
teachers on an assessment journey
Johan Nyberg
The points of departure in this article are questions regarding assessment
in music education. These are related to issues of professional
responsibility and accountability as well as a holistic view on education as
conceptualized in Deweyean pragmatism and concern the risk of criteria
compliance. A participatory action research project in a Swedish Upper
secondary school focusing on assessment of music is presented, where the
purpose of the research was to develop knowledge about music teachers’
experience and conceptualizations regarding assessment practices within
the frame of the National Arts Programme. This is enabled by asking the
following research questions: In what ways do teachers conceptualize
musical knowledge and learning and educational communication in
relation to assessment? What qualities appear within the teachers’
conceptualizations regarding knowledge, learning, communication and
assessment of students’ knowledge? Aims from the field of praxis were
integrated in the project, with focus on equivalent assessment and legal
certainty. Results from the research project show the music teachers’
ability to shift between atomistic and holistic perspectives but at the same
time keep their holistic view of assessment and learning. Equivalence
is according to the teachers something different than uniformity, and is
only possible through reflection and collaboration, internally as well as
externally with other practitioners.
Keywords: assessment, John Dewey, music education, participatory
action research, upper secondary school
Johan Nyberg, PhD student, Faculty of Art, Communication and
Learning, Piteå School of Music, Luleå University of Technology.
johan.nyberg@ltu.se
EDUCARE 2015:2
71
JOHAN NYBERG
Introduction
Student 1: But what score did I get?
Teacher: As we talked about beforehand, I haven’t given you scores.
Instead, I have given you written responses. We will do a ’walk-through’
of the test all of us together, and after that, we’ll do it again – this time
individually.
Student 2: But did I pass the test!?
Teacher: You won’t get a grading until you have finished the course. This
time I want to know in what ways you have been thinking to reach your
conclusions. In those places, I have given you written comments.
Student 3: I counted myself! I got 38 points out of 47! I think… Depends
on how many points you get for each answer. But that should at least
amount to an E!?
The above conversation took place during a Music Theory class, where
a group of students attending the national Arts programme in a Swedish
upper secondary school1 got a test returned. In this situation, different
experiences of assessment are conceptualized2, i.e. experiences
of assessment communicated quantitatively or qualitatively. It
also highlights the obstacles the teacher has to face attempting the
chosen approach of assessment, conceptualizing and communicating
knowledge in words rather than in numbers. The possible impact of
this is not only connected to sharing of experiences internally within a
music education, but also to external demands upon such praxis as part
of the shaping of a democratic society (Dewey, 1916; Englund, 2000).
Strong demands on educational accountability have an impact on
teaching and learning (cf. Apple, 2004; Liedman, 2011). One aspect
of controlling education by means of such a demand is the risk of
deprofessionalization (Beach et al., 2014; Broady, 2012; Solbrekke
& Englund, 2011; Lilja, 2014) as well as criteria compliance, i.e.
“achievement without understanding” (Torrance, 2007, p. 293). The
issue of compliance concerns students as well as teachers’ learning, the
1 The national Arts programme is one of six higher education preparatory
programmes within Swedish, non-compulsory upper secondary education.
2 In this text, conceptualization encompasses describing, explaining, putting
into words, text, gestures or sound how something is apprehended and understood. e.g. musical qualities in an educational setting.
72
EDUCARE 2015:2
Professionalism in action
– Music teachers on an assessment journey
latter for instance through professional development efforts. Another
aspect is the confusion between quality and quantity for measuring
educational “outcomes”. This leads to a use of what Liedman (2011)
calls pseudo quantities, i.e. carriers of all external traits connected to
a quantity but lacking its “defining positive character” which is “to
more exactly than any other attempt of verbal description characterize
an object or the relation between objects” (ibid., p. 62, author’s
translation).3 Demands for accountability also concern the issue of
equivalent education4 becoming one of standardization. This affects
both teachers and students since such a development “can limit teachers’
ability to make pedagogical decisions that accommodate the wide range
of learning needs of diverse student populations” (Smylie, 1996, p. 9).
Therefore, questions regarding equivalence and quality in relation
to assessment as a part of the teaching profession are of interest for
research in music education as well as for practitioners. The topics of
quality concepts in syllabi and equivalent assessment caught the interest
of a group of Swedish upper secondary school music teachers, deciding
to embark on an assessment journey by initiating a research and
development (RD) project.5 This project was connected to a research
study in music education regarding music teachers’ conceptualizations
of knowledge and learning by the use of participatory action research
(PAR) as method.6 In this article, the results of this joint RD/PAR
project will be presented and related to John Dewey’s philosophy
regarding education and the area of assessment in music education.
With focus on music teachers’ process of communication within the
RD/PAR project, the specific research purpose is to develop knowledge
about music teachers’ experience and conceptualizations regarding
assessment practices within the frame of the national Arts programme.
3 As an example, the latest grading system in Swedish upper secondary education can be mentioned, where qualities in the knowledge requirements
(i.e. criteria) are summarized by the use of letters (from F to A) (The Swedish
Agency for Education, 2011).
4 In Sweden, equivalence of public education is legislated in the Education
Act (SFS2010:800).
5 This was part of a municipal effort aimed at developing teachers’ assessment practices, in which schools were able to apply for funding of projects
connecting professional development with research/scientific knowledge.
6 See Method and design of the empirical study.
EDUCARE 2015:2
73
JOHAN NYBERG
This is enabled by asking the following research questions: In what
ways do teachers conceptualize musical knowledge and learning and
educational communication in relation to assessment? What qualities
appear within the teachers’ conceptualizations regarding knowledge,
learning, communication and assessment of students’ knowledge?
Background
Focus in this article lies on music education as an assessment practice,
which is connected to, and therefore influenced and affected by, the
prevailing educational policy and politics and those executing it –
teachers themselves included. Therefore, aspects of assessment of
music and the surroundings in which assessment is taking place within
the project – including questions of professionalism – will be presented
along with the participant travellers on the assessment journey. To
conclude the background, the theoretical framework of the research
will be presented and connected to the issue of teacher agency.
Assessment
Educational assessment is a hot topic, where aspects of qualities in
relation to quantities are in focus (Liedman, 2011). This is in no way
a novelty. The roots of assessment within the Swedish educational
system can be traced back to the progressive movement of the late
19th and early 20th centuries, pending between pedagogical and
psychometric views on educational progress as represented by Dewey
and Edward L Thorndike (Lundahl, 2011; Sandberg, 1996). The interest
for assessment within music education is partly due to the intrinsic
quality aspects of music (Davidson, 1980) – that could be considered
as secondary qualities, i.e. connected with human, sensory perception
(Liedman, 2011) – but also to the notion of teacher professionalism in
relation to accountability (Zandén, 2011, 2013). Regardless of subject
matter, the interest for assessment in education has boomed, leading
to research efforts as well as educational debates regarding types of
assessment and their impact on learning and knowledge.
74
EDUCARE 2015:2
Educational assessment
The view of learning and assessment found within the Swedish upper
secondary school curriculum is holistic (The Swedish National Agency
for Education, 2011). With an increasing demand on educational
accountability and measuring of learning outcome, such a view is at
the risk of being replaced by an atomistic counterpart (Fautley, 2010;
Liedman, 2011; Lundahl, 2011; Vinge, 2014).7 The impact of this shift
from holism towards atomism regarding educational assessment is
therefore of interest.
Later research on assessment in music education highlights the
risks of criteria compliance with such a shift – e.g. ticking of criteria
using tick-box forms – leading to assessment as learning and thereby
a fragmented understanding of a phenomenon (cf. Ferm Thorgersen
et al., 2014). This can even lead to assessment for teaching, focusing
more on teacher than student agency (Fautley, 2010; Wiliam, 2011).
Other aspects of concern when it comes to assessing (musical) quality
in an educational setting are related to curricula and teachers’ role as
officials. Here, legal certainty8 as well as equivalence, standardization
and the risk of uniformity is of importance – the latter aspects put
forward not least by Dewey (1916, 1938a) in relation to education and
democracy.
Professional assessment and assessment of music
What does it take to make professional assessments in an educational
system built upon a holistic view? Sadler (2009) puts it like this:
Determining the quality of complex works requires skilled, qualitative
judgments. A qualitative judgment is one made directly by the appraiser, the
person’s brain being both the source and the instrument for the appraisal.
The judgment is not reducible to a set of measures or formal procedures
that a non-expert could apply to arrive at the ‘correct’ appraisal. (p. 160)
7 One axample being the weight put on reports like the OECD’s Program for
International Student Assessment (PISA).
8 Legal certainty concerns assessments being performed in accordance with
educational legislation, but also making teachers’ assessment and grading
practices “as transparent as possible” (Klapp Lekholm, 2010, p. 23) regarding
what teachers base their assessments on and how.
EDUCARE 2015:2
75
JOHAN NYBERG
As an art form, music is closely connected to assessment, e.g. in the form
rankings and reviews. Unlike performance measurements including
sheer quantities, assessment of music concerns qualities that include
both issues of taste (i.e. secondary qualities) and existential dimensions
(Ferm Thorgersen, 2011; Franzén, 1959; Nielsen, 2002; Varkøy, 2007).
To aid assessment of music, Fautley (2010) suggests thinking of quality
as “centred within three interlocking domains” (p. 80): technical,
conceptual and aesthetic qualities. These appertain to the area of
skills, notions of musical structures and aspects of “expressiveness
[and] musicality” (p. 80) respectively. Therefore, music education
as an assessment practice is a professional arena different from for
instance music reviewing. It demands professionally trained assessors
with adequate, esoteric knowledge of both the subject and the area of
assessment – including communication of exoteric matter (Regelski,
2009; Sadler, 1989; Zandén, 2013). What does this arena look like for
the participating teachers of the joint RD/PAR project?
The surroundings, pt. 1 – the national Arts programme
In 2011, a new curriculum for upper secondary education was
introduced in Sweden including a new grading scale (The Swedish
National Agency for Education, 2011). Assessment is goal-related, and
subjects and courses are hierarchically constructed from subject specific
Aims and Goals, via course specific Core contents to Knowledge
requirements. In relation to the curriculum, the Education Act (SFS
2010:800) stipulates that all school education in Sweden “shall
rest upon a scientific base and proven and established experience”
(§5, author’s translation). The attempts being made to uphold this
paragraph are connected to both external control (e.g. the creation of
the Swedish Schools Inspectorate) and internal development of the
teaching profession and its status – one example being the possibility
for municipal funding like the one for the joint RD/PAR project.
The surroundings, pt. 2 – educational policy and politics
The question of professionalism and professional development within
education is a topic of great societal interest, and has been so for some
time (cf. Apple, 2004; Stedt, 2013; Timperley et al., 2007). Assessment
76
EDUCARE 2015:2
is one aspect of teachers’ professional tasks, which has been widely
discussed within media and political debate but seldom in dialogue
with but rather about the profession. What, then, can be done by
professionals to come to terms with this? Regarding research literature
on assessment in music, Colwell (2003) goes as far as comparing “the
actions by professional organizations [to a] series of fig leaves adopted
to hide our nakedness”, thereby finding “ourselves without substantial
clothing and appropriate tools necessary to detail what constitutes valid
assessment of teaching and learning” (p. 12). He raises the question of
resistance and unwillingness to participate in an open discussion and
thereby avoiding “serious questions and discussion” (p. 12). According
to Stanley (2009), the latter is sometimes related to an avoidance of
”pragmatically messier [professional development models]” (p. 22) –
including practitioners as well as authorities and policy makers.
Regarding assessment in Swedish music education, Davidson (1980)
and Sandberg (1996) trace the demand for professional assessment
to the 1950s and the need of selection and how this could be made
equal and fair. Regardless of a pedagogic or behaviourist view on
assessment, this problem was put in relation to the assessor (Davidson,
1980; Franzén, 1959). In Davidson’s (1980) words:
It is possible that [the problem of equal and fair assessment] stems from
us [educators] not knowing how to define the criteria for the goals of
education, and being uncertain of what we really wish for regarding our
musical lives. (p. 152, author’s translation)
This then overlaps the differences in educational assessment as
pedagogical and/or psychometric/behaviourist – historically being the
two prevailing views of the Swedish educational system (Liedman,
2011; Lundahl, 2011).
Within the frame of said system of today, Zandén (2011) puts it
equally blunt as Colwell by proposing music teachers to professionalize
or to perish, not caving in to what he labels as a doctrine of verbal clarity
(Zandén, 2013). This is related to the shift towards accountability
mentioned earlier, e.g. labelling professional interpretation as a threat to
equivalent assessment (The Swedish Schools Inspectorate, 2012). The
research project described in this article can therefore be placed among
the attempts to balance professional responsibility with the prevailing
EDUCARE 2015:2
77
JOHAN NYBERG
demands on accountability (Allsup & Westerlund, 2012; Liedman,
2011; Nordin, 2012; Solbrekke & Englund, 2011; Zandén 2011) – the
latter leading to a deprofessionalization within the educational system
(Englund, 2011; Oxenswärdh, 2011; Torrance, 2007; Zandén, 2011).
Theoretical base: a Deweyan perspective on education
and its implications for participatory action research
According to Dewey, the goal of education is human growth. The
pioneering trait of this notion was his formulation of education as
communication, as opposed to mediation (Boman, Ljunggren &
von Wright, 2007). Since Dewey considers human growth to be a
question of transformation where the fruits of education lie not only
in the present but also in the future, it is something he finds difficult to
measure (Dewey, 1916, 1929; Lundahl, 2011, Väkevä, 2007; Väkevä
& Westerlund, 2007). Dewey criticizes the use of assessment in the
form of rewards or punishments within an educational setting, i.e. as
means to gain interest from the assessed, particularly if the purpose is to
”induce the person who has a mind (much as his clothes have a pocket)
to apply that mind to the truths to be known” (Dewey, 1916, p. 208).9
The “truths” Dewey describes are seen as the stagnated criteria for
learning, used in public education for separation between knowledge
as either theoretical or practical and therefore as an instrument for
labelling and dividing citizens. Dewey is not opposed to assessment
in relation to value per se, but argues that the underlying theory of
educational assessment is one of critique, ”a method of discriminating
among goods on the basis of the conditions of their appearance, and of
their consequences” (1958, p. 396), i.e. an examination of possibilities,
prerequisites and limits connected to a phenomenon (Burman, 2014).
He sees values as values alone. We always experience intrinsic values
and qualities, depending upon previous experiences and the situation in
which things are experienced and put into action. Judgment of values
is according to Dewey also an act of transformation,
9 This is a theme currently surfacing in the Swedish educational debate regarding grading in early years of compulsory schooling, but is also relevant
in the case of teacher accountability and teachers’ professional development
– i.e. teachers as learners and the types of effort connected to this (cf. Carlgren,
2013).
78
EDUCARE 2015:2
[transforming] an antecedent existentially indeterminate or unsettled
situation into a determinate one. As such, judgment is always individual
in a sense in which individual is distinguished from both particular and
singular, in that it refers to a total qualitative situation. (1938b, s. 220)
Therefore, he concludes, there are no different kinds of judgement,
only distinguishable phases or emphases of the same in relation to
what is being assessed and in what context. Quality and quantity in
judgment, for instance, can according to Dewey only be distinguished
by discourse, but not be fully separated.
When it comes to education, Dewey acknowledges and emphasizes
that there is value also in processes and not only in final achievements:
”It is self-contradictory to suppose that when a fulfilment possesses
immediate value, its means of attainment do not” (1958, p. 397). For to
reach the full potential of growth in such a process, there needs to be a
type of action on behalf of the participants that is not purely mechanical
or physical but also reflective. Therefore, Dewey developed the concept
of intelligent action, where physical and reflective actions are seen as
interconnected and balanced (Dewey, 1915, 1929, 1938b). In relation
to this, Bresler (1995/2006) sees action research as an opportunity for
music teachers (as professionals) to be aware of reflection “because the
act of teaching is […] oriented toward doing as opposed to reflecting”
(p. 19). This view of teaching music, where a separation between
“doing” and “reflecting” is a kind of standard procedure, is important.
It could also be problematic. Who is deciding how to balance these
aspects? Why is there such a separation? This is also a reason why
Dewey’s holism and notion of intelligent action are important when
conducting PAR, as is his view of education based on such a type of
action as a foundation of a democratic society (1916, 2004).
Another aspect of using intelligent action is that the confusion of
impulses with purposes can be avoided. According to Dewey (1938a)
there is no purpose if an immediate execution is not postponed until
you can anticipate the consequences of the impulse being realized.
This anticipation is not possible without observation, information and
assessment (Dewey, 1987, 2004). To create enough “moving force”
(Dewey, 1938a, p. 490) for an idea to be carried out, there not only
needs to be an intellectual action to form it into a plan but also an
executional force such as desire and impulse. Therefore, a dismissal
EDUCARE 2015:2
79
JOHAN NYBERG
of interest in educational settings is devastating for the individual’s
possibility to reach her full potential (Dewey 1916). These thoughts
are valid not only when it comes to different types of assessment or
assessment as a professional educational practice. It could also be
applied to the apprehension of teachers as learners and ownership of
and designs for teachers’ professional development.
Teacher agency
In relation to professional development, Allsup and Westerlund (2012)
call for a “revitalized notion of teacher as neither scapegoat nor saviour,
but as agent, a person who does adapt to change […] but who can
flourish in the moving landscapes of learning” (p. 127, italics original).
This notion mainly regards classroom activity. Improving assessment
as a professional practice by agency needs to be regarded also as a
communicative act outside the classroom since connecting with
professional peers – and others operating in significant role-relationships
to these – is crucial for teachers to significantly improve their practice
(Handal, 1999). This is also a way for teachers to become agents from
within their own profession. Without teacher agency, external input and
control also risk compromising the professional notion of quality in
education (Biesta, 2007; Carlgren, 2013; Liedman, 2011) – for instance
when it comes to assessment of music (Zandén, 2010).
In order for learning to be meaningful, Dewey (1916, 1958) argues
the need for learners’ experiences, prerequisites and interests to be
known. Communication enables a balance between these aspects and
the demands that surround an educational practice. If teachers in their
striving for change through professional development do not want to
end up as rogue agents, to paraphrase Allsup and Westerlund (2012),
such a development needs to be a communicative one including the
sharing of experiences with peers as well as others included in forming
the school practice. Where assessment is in focus, the sharing of values
and views on quality concepts – personal as well as curricular – is also
of importance.
80
EDUCARE 2015:2
Methodology
In the previous parts, the environment surrounding the teacher
profession, a Deweyan perspective on education and aspects of
teacher agency has been outlined. What tools can be used address these
aspects and help bridge a practice/research divide that mainly seems
to emanate from either a lack of communication or an unwillingness
to communicate – thereby not understanding, or trying to understand,
“the other” (Ferm Thorgersen & Schwieler, 2014)? In what way can
a theory of science emanating from and within the practice of music
education be developed? To shed a light on these issues, such a tool
must be of a type that not only acknowledge teachers’ as creators
of professional knowledge, but also allows and challenges them to
conceptualize and communicate to and with others what they see as
important.
Method and design of the empirical study
One tool for teachers and researchers to use that covers the necessary
aspects for a mutual professional development as presented above is
interactive, collaborative practice-based research. As such, participatory
action research (PAR) is a possible link between the fields of practice,
research and employers/government. PAR creates a possibility for
research to aid and strengthen issues concerning a professional practice
where the fields of practice and research converge, and at the same time
preserve as well as guard its independence and objectivity (Evaldsson,
2003; Irwin & Chalmers, 2007; Phillips et al., 2013; Reason, 2006;
Svensson, 2002). Where assessment is in focus, the sharing of values
and views on quality concepts – personal as well as curricular – is also
of importance. Through PAR, teachers can in some ways be seen as
learners – learning from each other or from others. Continuing along
Dewey’s line of thought concerning education, a researcher within a
PAR project in music education needs to understand and learn about the
participating teachers’ experiences and views on value and conceptions
of quality and their interests in professional development. This is also
true about the researchers’ own experiences and motives.
EDUCARE 2015:2
81
JOHAN NYBERG
Participatory action research – an orientation to inquiry
In this part, the orientation to inquiry of PAR (Reason, 2003) will be
outlined in relation to Deweyan pragmatism as well as the design of
the joint RD/PAR project described in the introduction. The type of
inquiry labelled action research (including PAR) can be described as
“a comparative research on the conditions and effects of various forms
of social action and research leading to social action” (Lewin, 1946,
p. 35). As an orientation to inquiry, it is “of great importance in the
exploration of day-to-day school practice from ‘within’ [pointing to]
meanings, structures and built-in dilemmas that we often assume to
know beforehand” (Evaldsson, 2003, p. 26, author’s translation). This
puts demands on researchers to look beyond an academic, traditional
and maybe even hierarchical environment, i.e. to conduct research
on or about a practice, and instead see the possibilities of (and strive
for) researching with the practice and the degree to which researchers
relinquish and share control of the knowledge production process
(Lewin, 1946; Phillips et al., 2013; Rönnerman, 2000). Inherent in
the addition of “participatory” to action research (Holmstrand, 2006),
this also alludes to the aspect of (teacher) agency as described earlier.
PAR brings out a process with contents that enable participants
to become aware of their own practice. This demands that they
conceptualize and share their experiences and opinions, but also
allowing them to do this over a longer period of time (cf. Winther
Jørgensen, 2008). According to Winther Jørgensen (2008), by
sharing experiences and knowledge gained within the practice in
interactive research, different types of knowledge are integrated in
the development process. Equal cooperation between researchers and
other participants are necessary, and hence the researcher must not be
regarded – or regard him- or herself – as the one with (all) the answers.
The research initiative shall contribute to processes of change, which
calls for participants to conceptualize issues they regard as problematic
within their practice. An expressed striving for change also contributes
to the taking of responsibility within a project – practitioners and
researchers alike. Depending on type of project, this can be done with
multiple aims as long as the process is collaborative.10
10 One example is the joining of research and development and music education research purposes by the use of PAR method as described in this article.
82
EDUCARE 2015:2
Action research can be described as an approach or an attitude,
where apprehension and action appears in an iterative, cyclic process
(Reason, 2006). This traditionally includes four steps: plan – act –
evaluate – reflect (Cain, 2008; Rönnerman, 2004).11 This process has
no finite end, and therefore offer the practical conditions to enable
intelligent action as described earlier. Thereby, new questions can arise
and cause the researcher and participants to focus on the need of further
actions, which makes the input of time from all participants crucial.
Design of the empirical study
In relation to the project aims, funding demands, time limitations and
the choice of PAR, the length of the RD project was set to a school year
(autumn 2013 to spring 2014). The action research cycle span was set
roughly to a month, allowing participants time to reflect and prepare
for the next cycle.
Within the project, the music teacher staff and I together chose a
set of questions and connected these to the curriculum and some of
the overall goals of the school: to enhance and develop students’ goalrelated achievements, reach a higher level of inter-rater reliability and
working with pedagogical development in relation to subject(s) and
scientific knowledge. The main focus fell on equivalent assessment
within the courses Instrument and singing 1 and 2 – being shared
syllabi for all instrument choices (The Swedish National Agency for
Education, 2011).12
The next step was to create a core group of music teachers.
Participation was decided to be voluntary, adhering to aspects of
collaborative, interactive and participatory research as well as
organizational development (cf. Carlgren, 2013; Timperley, 2011).13
11 Therefore it is compatible with the Deweyan notion of purpose as being
dependent on anticipation by the sequence of observation, information and
assessment (Dewey, 1987, 2004).
12 These are two of several courses within one of two subjects, Music, connected to the national Arts programme (the other being Music theory). The
curriculum and course syllabi are the same regardless of choice of instrument.
13 To minimize the risk of causing a division into “us and them” within the
staff and getting the opportunity to gain valuable peer-feedback and information, teachers opting not to participate actively within the project were updat-
EDUCARE 2015:2
83
JOHAN NYBERG
The aims and plan for the RD/PAR project were presented for the staff,
including a call for issues regarding assessment and information on
the responsibilities connected to participation: to set aside time and
allowing the researcher access to information.
In addition to two coordinating teachers, five music teachers
volunteered. The core group thereby included seven out of thirteen
music faculty members, representing the instruments voice, guitar and
bass.14 All participants were informed about the aspects of participating
in a research project, and signed an agreement to let me as the
researcher record and collect data in accordance with research ethics
(The Swedish Research Council, 2002). A total of eight core-group and
eight administrative meetings were held.15
As a method example, the first core group meeting will be described
a little more in detail. The aim was to set a first goal in relation to
curriculum and assessment, thereby setting the stage for intra-rater
reliability, i.e. to use commonly agreed upon criteria “to be in agreement
with oneself” (Sjöberg, 2010, p. 7, author’s translation).16 The tools for
this were to create a dialogue within the group of participants, decide
upon a subject matter and then make written reflections to be shared
with the researcher before the next meeting.
During the first PAR cycles, it became clear that the balance between
the what and the how of the teachers’ assessment practice was lopsided. There was also a risk of getting stuck in details, veering away
from a holistic view of learning as intended in the curriculum, heading
towards the atomistic and the earlier described criteria compliance.
ed about, and welcome to inquire into the project development. This entailed
the participating teachers to keep eventual information from the core group
anonymous. The purpose was to be able to share knowledge and learning related to the profession, and not specifically to other participants. Regarding
the research data, getting input from “inside” as well as “outside” of the project
could be of interest.
14 For further information regarding participants and instrument groups,
see Fig. 1.
15 Two external presentations of the project were also performed. Public
publishing and/or presentation were one of the demands for funding. The
coordinating music teachers and I held these presentations together.
16 In this case, the term was included and used by the teachers, alluding to
them understanding each other.
84
EDUCARE 2015:2
Although the dialogues were always constructive and described as
rewarding by the participants, the project goal was at risk of being
lost. Therefore I mapped a suggestion that was discussed, altered and
then accepted by the core group. This contained a core of equivalence,
setting of E-levels17 and reaching legal certainty with connections to
aspects of what and how to assess, and other aspects planned and/or
performed (see Fig. 1).
Figure 1. Overview of RD/PAR project – planning, execution and participation18
17 I.e. course criteria for the grade pass.
18 Dotted lines in the What section mark planned but not performed/non-existent actions/interconnections. The names of the teachers are fictitious.
EDUCARE 2015:2
85
JOHAN NYBERG
To enable a focus on how assessment was performed and on student
inclusion, the group opted for participatory observation using
logbooks. The decision fell upon two types: triple and quadruple logs.
These were built upon observations in combination with dual or triple
reflections (Björk & Johansson, 1996) where an observer takes notes
on actions and events during a lesson and then makes reflections upon
these. The observed in turn make their own reflections and finally,
students reflect upon the observer’s notations.19 Besides the logbooks,
empirical material has been produced through audio recordings (music
staff meetings and lessons only) and field notes.
Analysis
All core group and staff meetings were recorded in audio. The data
is qualitative and was processed and seen as individual utterances
as intersubjective actions (cf. Lerner, 2004). The latter means that
consideration has been taken to the type of dialogue (Denscombe,
2014). The recordings were transcribed during the course of the RD/
PAR project, using Jefferson’s (2004) transcription model. To be able
to switch between micro and macro focus, the transcription work was
intertwined with listening to the recordings, making written reflections
cross-referenced with field notes and logbooks. The data was also fed
back continuously to the participants, e.g. as questions, suggestions or
explanations and thereby creating new data for analysis. Using musical
knowledge and learning as core concepts, gradually a refined set of
themes occurred.
Results
The joint RD/PAR project has its roots in long-term development goals
regarding student achievement. These are interpreted and realized
through perceived and communicated needs of the music teachers
regarding their assessment practices – expressed in the work of the
core group. During the project, the teachers’ conceptions of musical
19 The latter was performed through semi-structured interviews in direct relation to lessons and based around the following questions: When were you
assessed? What are your reflections on that assessment? What is your reflection on the teacher’s actions and the observations?
86
EDUCARE 2015:2
qualities, learning, knowledge and assessment as well as didactical
issues have been brought to the fore. These have proven to be complex
and multifaceted, and in this part the results will be presented in relation
to themes from the analysis related to the knowledge requirement
“decode and realise a simple notation”, meaning making through
different modes of communication and teachers’ approaches towards
student abilities.
Simple notation – plain and simple?
One example showing the complexity of the teachers’ conceptions was
the issue of “simple notation”. Taken from the knowledge requirements
of Instrument or singing 1, the group agreed on every participant
preparing an example in relation to their own instrument. Reflections
on these then formed a background from which a discussion evolved.
The examples ranged from short, monophonic pieces to lead sheets of
popular songs via etudes. Their level of complexity thereby differed
considerably, and the teachers concluded that what they had brought
forth as “simple” represented several aspects of knowledge and learning
and also of teaching: from difficulty levels of reading, via instrument
specific and familiarity aspects to pedagogical considerations regarding
the functions of notation in education.
Musical knowledge and learning as instrument specific
All aspects of notation were discussed in relation to assessment and
aesthetic qualities by posing the question “What is important in
relation to my instrument?” This connected not solely to the notational
examples, but also to the knowledge contents to which “simple
notation” belong.
Tom: I think about the definition of ”simple”, and that it must be
something that is familiar and that you have preconceptions of. To be
able to experience something as simple, in all likelihood you have to have
done it before.
Astrid: It’s easy when you know how to do it?
Tom: It’s easy when you know how to do it. For the students if they have
done it before. And then there is another aspect too. What do we expect
EDUCARE 2015:2
87
JOHAN NYBERG
of the students when it comes to something being simple? If I myself
am supposed to play something, then it’s like “I recognise [it], I’m in a
familiar landscape, I have done this before so I know how to navigate in
this landscape”.
Other reflections that arose in connection to the notation examples
were what makes a notation simple for a student, and how do teachers
know, and what do teachers expect to be simple for a student?
While the aspect of experience which Dewey would call undergoing
something (Dewey, 1934, 1987), teachers’ expectations on student
ability – what Tom talks about as being the ”expected” – could be
seen as setting the stage for a relative and not criteria-based assessment
practice. From Tom’s thought, Samuel proceeded to shift and elaborate
upon ”simple” as an experience of performing: ”After a course
completion, hopefully we will have elevated [the students] to the level
of what we define as being simple”.
The discussion led the teachers into what type of information the
students are supposed to be able to decode and realise and in what
context: pitch (chords/melodies), rhythm, dynamics, phrasing, form;
during solo or ensemble performances? Regardless of how many,
all of these parameters and aspects, the teachers concluded, need to
be considered when teaching and assessing. Simplicity of notation
as a phenomenon was thereby connected to instrument tradition and
function as well as possible contexts, e.g. where playing one of the
examples on bass – a four bar melody with half and quarter notes
in treble clef – was not considered simple nor related to the primary
function of the instrument. Chord sequences were seen as possible
examples of notation for chord or bass instruments, but not a primary
form of notation for singers at this level.20 The conclusion in the
group was that they would probably be able to agree upon a piece of
“traditional notation” as an example, but that instrument specifics call
for different but equivalent examples of simple notation. This also had
to do with different types of reading skills and the didactical functions
of a “simple notation”.
20 The school offers students to apply on any instrument, but at the time
there was only one wind instrument represented (tenor tuba). The main instruments taught are guitar, bass, drums, keyboards and voice.
88
EDUCARE 2015:2
To decode and realise – functions of music notation for learning
Initially, some teachers consequently connected decoding and
realisation to sight-reading.21 Others brought forth the ability to decode
and realise as a tool for learning a piece of music over time, as well as
expected skill level after course completion. Although conceptualized
as a requirement related to a technical, skill domain of musical quality
(cf. Fautley, 2010), this was another explanation for the diversity of
notation examples.
While focusing on decoding and realisation, the teachers concluded
that the former was a prerequisite for the latter, and therefore also for
musical expression when reading music. They saw it as done first by
deconstruction and then “putting it together in a passable fashion”,
consequently (maybe) leading to an expressive, sounding result.
A comparison was made to reading. Decoding then means that the
student comprehends “what sound [the notations] symbolize”, which
was considered “the first step of reading”:
Tom: To realise, to me that’s to read the words somehow, to be able to read
the word. But not reading out loud [fluently], rather like […] no pulse at
first, just breaking it down [and] sounding “the word”. […] A prima vista,
that’s [like] reading aloud from a novel.
Astrid: The sounding then comes between decoding and realizing.
Vera: Exactly, you take it in steps.
Tom: Decoding is to be able to break it down, seeing what tones are there
[and realising] is to play them.
The teachers agreed that for to perceive a musical expression, some
form of continuity aspect and fluency was necessary. As an assessment
area, this aspect was seen as dependent on course, i.e. skill, level.
Meaning making through modes of communication
While continuity in student and teacher interaction (e.g. regular
lessons) was seen as important for learning, attendance in itself was
never conceptualized as an assessment quality. Although considered
an important prerequisite, it was not seen as the sole key to learning
21 A knowledge requirement for the highest grade of the course (A) only.
EDUCARE 2015:2
89
JOHAN NYBERG
music. The teachers put much more weight into the importance of
communicating with their students. But in connection to assessment,
they expressed different approaches towards communication with
their students regarding aims and knowledge requirements, ranging
from use of separate occasions to continuous inclusion during lessons.
Understanding and interpreting the design and layout of the syllabi
documents was a first introduction to this theme. The aspect of layout
and transformation of syllabi (for pedagogical purposes) thereby
became one aspect they connected to both their own understanding
and students’ learning. One example agreed upon was progression
being easier to fathom with the grades in columns, a change from the
original layout.22
The importance of text and language as different modes of
communication was something the teachers expanded upon. One
aspect of meaning making was that of aesthetic quality, as described
when realising notation – or as Thomas put it: can simple notation
really be or represent ”real” music? This was seen as possible if the
piece of music had some sort of narrative importance for the performer
(or listener). The teachers thereby conceptualized music as a sounding
as well as written language. Together with the written language of
the curriculum, the teachers agreed that this put demands on teachers
when communicating – with each other as well as with students – e.g.
in monitoring of the students’ development.
In relation to assessment, the teachers’ conceptualizations on
communication when teaching can be described as connected roughly
to two types: communicating to and with the students – the former
stemming from a master/apprentice approach and the latter to a more
collaborative ditto. It is not clear though what effects this has in getting
students to reach set goals. Sometimes the teachers, regardless of
approach, described the results as similar. Clara brought one example
forth when she and her students collaboratively deconstructed a
course syllabus to be able to decide what aims, goals and knowledge
requirements could be examined and assessed in a written test.
Although the students themselves had come to the conclusion that
22 The importance of this for the students cannot be assessed by analysing
this empirical material, but seems to be dependent on the teachers’ approaches towards student abilities as described in the next paragraph.
90
EDUCARE 2015:2
such an examination could only concern E level knowledge, afterwards
“they still came to me and asked ‘what grade did I get?’” (Clara).23
It should be noted that regardless of type of communication, the
teachers agree upon their responsibilities as professionals, adhering the
responsibility to learn to the students’ while the responsibility for the
education – i.e. the prerequisites for learning – lies on the teachers and
the rest of the school. Every teacher saw it as part of their professional
duty to communicate syllabi actively. Not doing so, or disregarding
any aims or goals in their teaching was fully rejected as unprofessional
and unethical – even though they had different experiences of students’
abilities to understand and reflect upon syllabic content. An example
relating to this can be found when the teachers and I talked about
what the students actually perceive when communicating goals and
knowledge criteria through the syllabi:
Clara: I think it depends on how we present it. Those [students] I have
worked with, they got sort of like a week [to read and reflect upon the
knowledge requirements] and they have really looked at it. Many of them
have deconstructed it, “[This] I can do, and the other not. For example I’m
a monster learning by ear, but suck at it by notation”. So they made these
type of divisions most of them, when given the time.
This approach differs in relation to the conceptualizations foremost
made by Samuel and Vera, where they take on a more explanatory and
instructive role as teachers. This was based upon the notion of students’
abilities to understand and conceptualize the written language of the
syllabi.
While some teachers express that communicating syllabi content
with students connects to overall learning, others connect it foremost
to grading and dialogues regarding assessment and grading. What kind
of knowledge this results in was not elaborated upon, only that the
goal was to make the students’ understand enough to be able to start a
reflection process. What became clear was the difference in perceived
need of guidance, yet another aspect connected to students’ abilities
and how the teachers approached these.
23 This was not a case of the students investigating whether they got an F or
E, but of the higher grades D, C, B or A.
EDUCARE 2015:2
91
JOHAN NYBERG
Approaches towards students’ abilities
The notation examples brought forth regarding the knowledge
requirement ”decoding and realizing a simple notation” was in one
case deliberately made simple ”because you have learnt what type of
students you have”, i.e. it was not constructed in relation to knowledge
criteria but to experience of student abilities, and as such representing
one of several approaches. This division into approaches is one of
interconnectedness and can be seen as having one main category:
students’ ability to learn. Echoing the modes of communication, this
can also be seen as connected to master/apprentice and collaborative
approaches – an example of the former as expressed by Samuel:
Samuel: But I think, initially if they get to look at the knowledge
requirements themselves not many would be able to say, “this means this”.
But if I go in and explain every sentence, then hopefully – otherwise I
would not do it – many more will understand. But initially when they look
at this mass of text, they think, “I will never get an A”.
Samuel’s conception is one of having to take on an explanatory role,
to present the students with an optional explanation instead of the
students first trying themselves. At the other end of the continuum
you find Clara’s approach when communicating syllabic contents as
described earlier. According to her, students have some independent
ability to conceptualize aspects regarding their own learning. She also
expressed learning of, and knowledge on, an instrument as holistic,
i.e. musical aspects are possible to practice in different learning and
musical contexts.
The core group members also had different views of students’
abilities to learn in relation to taking responsibility and to reflect.
Samuel, for instance, had the notion of his students mostly being “not
overly analytic” when reflecting on their own practicing. Sometimes
it was also a question of what was seen as “correct” in relation to
knowledge requirements and when to address this, as exemplified by
the following exchange regarding learning and performing by notation
during vocal lessons:
92
EDUCARE 2015:2
Samuel: You have to remind them all the time, “Hey you, this is the same
note you just sang, in that sequence”. It’s like two completely separate
worlds, where they during music theory class at least can sort of follow.
Clara: But I think about what a student said to me today, that, “when
Sinatra sings, he sings ‘bouncy’, but in the notation it’s these kind of
‘trios’. And I feel it’s better with the ‘trios’ than the dots Sinatra does, so I
want to sing as it’s written here”. It’s ((laughs)) it’s hilarious, the language
is fantastic but it’s perfectly clear […] that a reflection has taken place.
Again, it is a difference between (teacher) instruction and (student)
reflection but also one of (separation of) contexts and learning goals.
The important learning goal in this case seems to be the ability to
reflect: in the first case related to contexts, and in the second to
musical expression. Samuel’s frustration regards the difference his
students’ show in ability to connect courses and lessons – the result
of an atomistic understanding, so to speak – while in Clara’s case, a
“fantastic” language is used as opposed to a more musically correct
equivalent.
Discussion
The specific research purpose addressed in this article was to develop
knowledge about music teachers’ experience and conceptualizations
regarding assessment practices within the national Arts programme.
As opposed to the results shown by Zandén (2010), this group of upper
secondary school music teachers focus on and discuss all aspects of the
curriculum contents, including visual as well as sounding aspects of
student performance as well as didactical issues concerning assessment.
This was enabled by creating a reflective practice through constructive
dialogues inside as well as outside the core group (cf. Isaacs, 1993,
2001; Stanley, 2009; Timperley et al., 2007).
Moving between atomistic and holistic perspectives, the latter was
always being considered the goal of music education, knowledge and
learning. What can be noticed is a difference within the core group when
it comes to experiences of this type of sharing of conceptualizations
on musical qualities and assessment of music. Although they not
always agreed on ideas or ideals, the music teachers kept a strict
focus on the subject at hand and its relations to concepts and contexts.
EDUCARE 2015:2
93
JOHAN NYBERG
Instead of defining how teaching and assessment should be organized
it is according to the teachers more a question of how this could be
organized in relation to criteria and students’ experiences and goals.
Like Dewey’s (1916, 1958) notion of communication, the teachers’
have exchanged experiences based on curiosity and enabled conflicting
opinions to surface and be examined. This way, a mutual understanding
has been achieved where different interpretations can exist and be
regarded as equal when it comes to assessment.
The teachers in this article are as of today not part of a permanent,
fixed group. Neither was the project set in every detail. This is part
of what Cain et al. (2007) describe as giving the participants the
opportunity to reflect upon purposes and theories within a project
in relation to their needs. It is also a way to be open for a kind of
educational thought. This not to be regarded as similar to an “anything
goes” attitude – on the contrary, the big picture along with the frames
were set. Or to continue the assessment journey metaphor: the compass
was on-board, the vehicle’s checklist ticked off, the map unfolded
and the route set for the goals. Speaking with Dewey (1916, 2004),
choosing tools within PAR that call for intelligent action in the form
of reflection, conceptualization and communication has helped pave
the way for professional development. This is one way to reach a more
balanced level of professionalism in relation to accountability and its
deprofessionalizing effects (Englund, 2011; Torrance, 2007; Zandén,
2011, 2013). Or to speak with Allsup and Westerlund (2012): as agents,
the teachers are ready to set their professionalism into (further) action.
94
EDUCARE 2015:2
References
Allsup, Randall E. & Westerlund, Heidi (2012). Methods and situational
ethics in music education. Action, Criticism, and Theory for Music
Education, 11(1), 124–148. http://act.maydaygroup.org/articles/
Allsup Westerlund11_1. pdf
Apple, Michael W. (2004). Creating Difference: Neo-Liberalism, NeoConservatism and the Politics of Educational Reform. Educational
Policy, 18(Jan./March), 12-44.
Biesta, Gert (2007). Why “What Works” Won’t Work: Evidencebased Prac-tice and Democratic Deficit in Educational Research.
Educational The-ory, 57(1), 1-22.
Beach, Dennis, Bagley, Carl, Eriksson, Anita, Player-Koro, Catarina
(2014). Changing teacher education in Sweden: Using metaethnographicanalysis to understand and describe policy making and
educational changes. Teaching and Teacher Education, 44 (2014),
160-167.
Björk, Maj & Johansson, Monica (1996). Dubbellogg – ett redskap
förreflektion och lärande. In Birgit Lendahls & U. Runesson (Eds.),
Vägar till lärares lärande (pp. 52-67). Lund: Studentlitteratur.
Boman, Ylva, Ljunggren, Carsten & von Wright, Moira (2007).
Variationer av pragmatism. In Ylva Boman, C. Ljunggren & M.
von Wright (Eds.), Erfarenheter av pragmatism (pp. 13-22). Lund:
Studentlitteratur.
Bresler, Liora (1995/2006). Ethnography, Phenomenology And Action
Research In Music Education. Quarterly Journal of Music Teaching
and Learning, 6(3), 4-16. Reprinted with permission in Visions of
Research in Music Education, 16(6), Autumn, 2010.
Broady, Donald (2012). Bildningstankens krumbukter. Några blad
ur historien från 1970-tal till 2010-tal. In Anders Burman & P.
Sundgren (Eds.), Svenska bildningstraditioner (pp. 285-308).
Daidalos, Göteborg.
Burman, Anders (2014). Dewey och den reflekterade erfarenheten.
InAnders Burman (Ed.), Den reflekterade erfarenheten. John Dewey
omdemokrati, utbildning och tänkande (pp. 13-36). Huddinge:
Södertörns högskola.
EDUCARE 2015:2
95
JOHAN NYBERG
Cain, Tim, Holmes, Melanie, Larrett, Alison & Mattock, Joanna (2007).
Literature-Informed, One-Turn Action Research: Three Cases and a
Commentary. British Educational Research Journal, 33(1), 91-106.
Cain, Tim (2008). The characteristics of action research in music
education. British Journal of Music Education, 25(3), 283–
313.
Carlgren, Ingrid (2013). Hur lärare ska få kunskap bestäms uppifrån.
Rev. September 16, 2013. Online: http://www.skolaochsamhalle.se/
flode/skolpolitik/ingrid-carlgren-kunskapsimplementering-genompabjuden-kollegialitet/ September 18.
Colwell, Richard (2003). The Status of Arts Assessment: Examples
from Music. Arts Education Policy Review, 105(2), 11-18.
Davidson, Rolf (1980). Svensk musikundervisning på 1950-talet
– Några personliga reflektioner kring det som blev tänkt och gjort.
Svensk Tidskrift för Musikforskning, 1980(1), 141-157.
Denscombe, Martyn. (2014). The Good Research Guide. For smallscale social research projects. Berkshire: Open University Press.
Dewey, John (1915). The Logic of Judgments of Practise. The Journal
of Philosophy, Psychology and Scientific Methods, 12(20), 533-543.
Dewey, John (1916). Democracy and Education: An Introduction to
the Philosophy of Education. Web-edition. New York: Columbia
University.
Dewey, John (1929). The Quest for Certainty. A Study of the Relation
of Knowledge and Action. London: George Allen & Unwin Ltd.
Dewey, John (1934). Art As Experience. New York: Perigree/Penguin
Group.
Dewey, John (1938a). Experience and Education. New York:
Touchstone.
Dewey, John (1938b). Logic – The Theory of Inquiry. New York: Henry
Holt and Company.
Dewey, John (1958). Experience and nature. New York: Dover
Publications.
96
EDUCARE 2015:2
Dewey, John (1987). The later works of John Dewey, 1925–1953.
Essays, Reviews, Trotsky Inquiry, Miscellany and Liberalism and
Social Action, J. A. Boydston (Ed.), vol. 11, Carbondale: Southern
Illinois University Press.
Dewey, John (2004). Individ, skola och samhälle. Utbildningsfilosofiska
texter. Sven Hartman, U. P. Lundgren & R. M. Hartman (Eds.).
Stockholm: Natur & Kultur.
Englund, Tomas (2000). Rethinking democracy and education: towards
an education of deliberative citizens. Journal of Curriculum Studies,
32(2), 305–313.
Englund, Tomas (2011). The linguistic turn within curriculum theory.
Pedagogy, Culture and Society, 19(2), 193-206.
Evaldsson, Ann-Carita (2003). Mångkulturalitet och jämställdhet
i vardaglig skolverksamhet. In Ingrid Carlgren, I. Josefson & C.
Liberg (Eds.), Forskning av denna världen – praxisnära forskning
inom utbildningsvetenskap (pp. 27-34). Stockholm: The Swedish
Research Council.
Fautley, Martin (2010). Assessment in Music Education. Oxford:
Oxford University Press.
Ferm Thorgersen, Cecilia (2011). Assessment of musical knowledge
from a life-world-phenomenological perspective – challenges of
conceptualising and communication. Hellenic Journal of Music,
Education and Culture, 2(1), 37-45.
Ferm Thorgersen, Cecilia & Schwieler, Elias (2014). Translating
the impossible: listening, learning, and art. Journal of Aesthetic
Education, 47(4), in press.
Ferm Thorgersen, Cecilia, Zandén, Olle, Vinge, John, Väkevä, Lauri,
Andersson, Ninnie & Nyberg, Johan (2014). Assessment as learning
in music education – the risk of ‘criteria compliance’ replacing
’learning’ in the Scandinavian countries. Conference symposium on
assessment, Knowledge Formation in Music. NNMPF Conference,
23-25 April 2014, the Royal College of Music, Stockholm.
Franzén, Bengt (1959). Att bedöma musikelever. Stockholm: Nordiska
musikförlaget.
EDUCARE 2015:2
97
JOHAN NYBERG
Handal, Gunnar (1999). Consultation Using Critical Friends.
New Directions For Teaching and Learning, 79(fall), 59-70.
Holmstrand, Lars (2006). Deltagarorienterad aktionsforskning – ett
nytt paradigm. In Birgitta Wingård (Ed.), Livslång nyfikenhet.
En vänbok till Gunilla Härnsten (pp. 125-139). Stockholm: HLS
förlag.
Irwin, Rita L. & Chalmers, F. Graeme (2007). Experiencing the
visual and visualizing the experiences. In Liora Bresler (Ed.),
International Hand-book of Research in Arts Education (pp. 178194). Dordrecht: Springer.
Isaacs, William N. (1993). Taking Flight: Dialogue, Collective
Thinking, and Organizational Learning. Organizational Dynamics,
22(2), 24-39.
Isaacs, William N. (2001) Toward an Action Theory of Dialogue,
International Journal of Public Administration, 24(7-8), 709-748,
Jefferson, Gail (2004). Glossary of transcript symbols with an
introduction. In Gene H. Lerner (Ed.), Conversation Analysis
– Studies from the first generation (pp. 13-34). Amsterdam:
John Benjamins B.V.
Klapp Lekholm, Alli (2010). Lärares betygsättningspraktik. Forskning
om undervisning och lärande. Bedömning för lärande – en grund
för ökat kunnande, 3(Jan.). Stockholm: Stiftelsen SAF i samverkan
med Lärarförbundet.
Lerner, Gene H. (2004). Introductory remarks. In Gene H. Lerner
(Ed.), Conversation Analysis – Studies from the first generation
(pp. 13-34). Amsterdam: John Benjamins B.V.
Lewin, Kurt (1946). Action Research and Minority Problems. Journal
of Social Issues, 4(2), 34-46.
Liedman, Sven-Eric (2011). Hets! En bok om skolan. Falun: Albert
Bonniers förlag.
Lilja, Peter (2014). Negotiating Teacher Professionalism. On the
Symbolic Politics of Sweden’s Teacher Unions. Malmö: Malmö
University, Faculty of Education and Society
Norstedts.
98
EDUCARE 2015:2
Nielsen, Frede V. (2002). Quality and Value in the Interpretation of
Music from a Phenomenological Point of View – a Draft. Zeitschrift
für Kritische Musikpädagogik, http://home.arcor.de/zf/zfkm/
nielsen1.pdf
Nordin, Andreas (2012). Kunskapens politik – en studie av kunskapsdiskurser i svensk och europeisk utbildningspolicy. Växjö: Linnaeus
University Press.
Oxenswärdh, Anette (2011). Ansvarsförhållanden vid skolutveckling.
Stockholm: Institutionen för pedagogik och didaktik, Stockholms
universitet.
Phillips, Louise J., Kristiansen, Marianne, Vehviläinen, Marja
& Gunnarsson, Ewa (2013). Tackling the Tensions of Dialogue and
Participation – Reflexive Strategies for Collaborative Research.
In Louise J. Phillips, M. Kristiansen, M. Vehviläinen &
E. Gunnarsson (Eds.), Knowledge and Power in Collaborative Research
– A Reflexive Approach (pp. 1-18). New York: Routledge.
Reason, Peter (2003). Pragmatist Philosophy and Action Research:
Readings and Conversation with Richard Rorty. Action Research,
1(1), 103-123.
Reason, Peter (2006). Choice and Quality in Action Research Practice.
Journal of Management Inquiry, 15(June), 187-203.
Regelski, Thomas A. (2009). Curriculum Reform: Reclaiming “Music”
as Social Praxis. Action, Criticism, and Theory for Music Education,
8(1), 66-84. http://act.maydaygroup.org/articles/Regelski8_1.pdf
Rönnerman, Karin (2000). Att växa som pedagog. Utvärdering av
ett aktionsforskningsprojekt i förskolan. Göteborg: Göteborgs
universitet.
Rönnerman, Karin (2004). Aktionsforskning i praktiken. Lund:
Studentlitteratur.
Sadler, D. Royce (1989). Formative assessment and the design of
instruc-tional systems. Instructional Science, 18(2), 119-144.
Sadler, D. Royce (2009). Indeterminacy in the use of preset criteria
for assessment and grading. Assessment & Evaluation in Higher
Education, 34(2), 159–179.
EDUCARE 2015:2
99
JOHAN NYBERG
Sandberg, Ralf (1996). Musikundervisningens yttre villkor och inre
liv. Några variationer över ett läroplansteoretiskt tema. Stockholm:
HLS förlag.
SFS 2010:800 Skollag. Utbildningsdepartementet.
Sjöberg, Robert (2010). Balansakten bedömning – kontinuitet
och transformation. Svenska språklärares bedömning och
betygssättning som uppdrag, praktik och kompetens i förändring.
Göteborg: Göteborgs universitet.
Smylie, Mark A. (1996). From Bureaucratic Control to Building
Human Capital: The Importance of Teacher Learning in Education
Reform Educational Researcher, 25(9), 9-11.
Solbrekke, Tone Dyrdal & Englund, Tomas (2011). Bringing
professional responsibility back in, Studies In Higher Education,
36(Jan.), 847-861.
Stanley, Anne Marie (2009). The experiences of elementary music
teachers in a collaborative teacher study group. Michigan: UMI
Publishing.
Stedt, Lisbeth (2013). Samarbete och lärande. Om friktion, uppgifters
komplexitet och erfarenhetsutbyten i samarbete. Stockholm:
Stockholms universitet.
Svensson, Lennart (2002). Bakgrund och utgångspunkter. In Lennart
Svensson, G. Brulin, P-E. Ellström & Ö. Widegren (Eds.), Arbetsliv
i omvandling. Interaktiv forskning – för utveckling av teori och
praktik (pp. 1-22). Stockholm: Arbetslivsinstitutet.
The Swedish National Agency for Education (2011). Programstruktur,
Estetiska programmet. Online: www.skolverket.se. January 9.
The Swedish Research Council (2002). Online: www.codex.vr.se/texts/
HSFR.pdf, May 3.
The Swedish Schools Inspectorate. (2012). Nationella prov med
upp-satsskrivning stöder inte likvärdig betygssättning. Press
announcement 8/31/12. Online: http://www.skolinspektionen.se/sv/
Om-oss/Press/Pressmeddelanden/Nationella-prov-med-uppsatsskrivning-stoder-inte-likvardig-betygssattning/ October 3.
100
EDUCARE 2015:2
Timperley, Helen, Wilson, Aaron, Barrar, Heather & Fung, Irene
(2007). Teacher Professional Learning and Development – Best
Evidence Synthesis Iteration [BES]. Auckland: New Zealand
Ministry of Education.
Timperley, Helen (2011). Knowledge and the Leadership of Learning,
Leadership and Policy in Schools, 10(2), 145-170.
Torrance, Harry (2007). Assessment as learning? Assessment in
Education: Principles, Policy & Practice, 14(3), 281-294.
Varkøy, Øivind (2007). Instrumentalism in the Field of Music
Education: Are We All Humanists? Philosophy of Music Education
Review, 15(1), 37-52.
Vinge, John (2014). Vurdering i musikkfag – En deskriptiv, analytisk
studieav musikklæreres vurderingspraksis i ungdomsskolen. Oslo:
Norgesmusikkhøgskole.
Väkevä, Lauri (2007). Art Education, The Art of Education and the Art
of Life. Considering the Implications of Dewey’s Later Philosophy
to Art and music Education. Action, Criticism, and Theory for
MusicEducation, 6(1), 2-15. http://act.maydaygroup.org/articles/
Vakeva6_1.pdf
Väkevä, Lauri & Westerlund, Heidi (2007). The ”Method” of
Democracy in Music Education, Action, Criticism, and Theory for
Music Education, 6(4), 96-108.
Wiliam, Dylan (2011). Embedded Formative Assessment. Bloomington:
Solution tree.
Winther Jørgensen, Marianne (2008). På framkant: Interaktiv
forskning och vetenskapens plats i samhället. In Bengt Johannisson,
E. Gunnarsson & T. Stjernberg (Eds.), Gemensamt kunskapande
– den interaktiva forskningens praktik (pp. 349-366). Växjö: Växjö
University Press.
Zandén, Olle (2010). Samtal om samspel. Kvalitetsuppfattningar i
musiklärares dialoger om ensemblespel på gymnasiet. Göteborg:
Nämnden för konstnärligt utvecklingsarbete, Konstnärliga
fakulteten, Göteborgs universitet.
EDUCARE 2015:2
101
JOHAN NYBERG
Zandén, Olle (2011). Professionalise or perish. A case for heightened
educational quality through collegiate cooperation. In Sven-Erik
Holgersen & S. Graabræk Nielsen (Eds.), Nordisk musikpedagogisk
forskning (pp. 117-134). Oslo: Norges musikkhøgskole.
Zandén, Olle (2013). Till en kritik av tydlighetsdoktrinen. Conference
presentation Nordiskt nätverk för musikpedagogisk forskning
(NNMPF), Feb. 27-March 1. Bergen, Norway.
102
EDUCARE 2015:2
En analyse af sproglig evaluering i
daginstitutioner
Lars Holm
The article presents results from a study in language testing of children
in two kindergartens in Copenhagen. Closely related to poor PISA-results
in reading in the Danish schools language testing in Danish kindergartens
have been vastly extended. This has caused an intense and heated debate
among scholars, in which the extended language testing in Kindergartens
are supported or opposed, based on either generalized perspectives on
expected school progress or on generalized perspectives on the harm
testing practices might do children in kindergartens. The study reported
in this article goes beyond these generalized perspectives from “the
outside”, and points to the necessity of an ethnographic-oriented “insideperspective” in which kindergartens language testing is researched
empirically as a local and social practice. A theoretical framework
for researching language testing as a social practice is developed and
applied to ethnographic date from fieldwork in two kindergartens in
Copenhagen. The study shows that the view of language and the view of
measurement and knowledge embedded in the language test results in
specific institutional practices in which the interaction between the child
and the preschool-teacher focusses on children’s receptive knowledge
of structural components of language. Furthermore the practices appear
to be based on highly normative assumptions about children´s language
development and everyday life. The analysis shows that the social
practices around language testing are placing children in a position in
which their potential as creative and productive producers of language in
interaction is absent from the agenda. The implications of this for the ongoing development of kindergarten practices and for pre-school teachers
are discussed.
Keywords: Language evaluation, kindergarten, institutional practices,
testing as social practice.
Lars Holm, Associate Professor, Ph. D, Department of Education,
Aarhus University, Campus Emdrup @larsh@dpu.dk
EDUCARE 2015:2
103
LARS HOLM
Indledning
Som pædagogisk institution er det en integreret del af daginstitutioners
virksomhed at forholde sig evaluerende til børns sproglige udvikling.
Det sker typisk på to forskellige måder. Der er dels tale om en
løbende, uformel evaluering, der er indlejret i hverdagens almindelige
interaktion mellem barn og pædagog. Gennem sproglige såvel som
kropslige udtryk forholder pædagogerne i daginstitutionen sig eksplicit
eller implicit evaluerende til børns sprogbrug. Et smil, et nik, en
rynket pande, en understøttende eller korrigerende bemærkning er
eksempler på denne form for evaluering. Ved siden af denne uformelle
evaluering har der gennem mange år også været en formel sproglig
evaluering af specialpædagogisk karakter, der har haft til formål
at identificere karakteren af problemer hos børn med forskellige
typer af indlæringsvanskelighed. Som oftest er denne formelle,
specialpædagogiske evaluering blevet varetaget af særligt uddannet
personale med udgangspunkt i forskellige evalueringsredskaber.
Denne situation har i Danmark ændret sig markant inden for de seneste
årtier, idet pædagoger nu i vid udstrækning gennemfører formelle
sproglige evalueringer af alle børns sproglige udvikling fra 3-års
alderen og opefter (Holm, 2010). I denne artikel belyses det, hvordan
lokale aktører i en daginstitution konstruerer et niveau for sproglig
dygtighed, og hvad det er for normer, værdier, relationer og processer,
der kommer i spil i forbindelse med den institutionelle anvendelse af
bestemte evalueringsredskaber.
Den intensiverede sproglige evaluering i daginstitutioner er fra
politisk hold blevet motiveret med et behov for at styrke børns sproglige
udvikling (Bundgaard & Gulløv, 2008). Ser man nærmere på de mange
politiske initiativer, der er taget med dette mål for øje, fremgår det, at
styrkelsen af børns sproglig udvikling har en særlig baggrund og en
særlig retning (Holm & Laursen, 2011). Baggrunden for den stærkt
udvidede sproglige evaluering i daginstitutioner er et politisk ønske om
bedre resultater i PISA-målingerne af danske elevers læsefærdighed, og
som konsekvens heraf rettes den sproglige evaluering i daginstitutioner
mod læsning i grundskolen. I ”Sprogpakken”, der er et omfattende
efteruddannelsesprogram udarbejdet af Servicestyrelsen under
Socialministeriet, argumenteres der fx på følgende måde:
104
EDUCARE 2015:2
Forskningen kan således dokumentere sammenhæng mellem barnets tidlige
sprogtilegnelse og senere uddannelsesmæssige succes. Dette skyldes især,
at barnets tidlige sprogtilegnelse kan kædes sammen med læsefærdigheder
som spiller en vigtig rolle i grundskolen. (Servicestyrelsen, 2011, s. 3).
Centralt i dette uddrag er, at der etableres en kausalitet mellem tidlig
sprogtilegnelse, læsefærdigheder og uddannelsesmæssig succes.
Denne forståelse udbygges gennem en eksplicitering af følgende
grundantagelse om, hvad læsefærdighed er:
At læse kræver dels afkodningsfærdigheder (at kunne identificere skrevne
ord), dels læseforståelse (at forstå det man læser) (Servicestyrelsen, 2011,
s.3).
Den politiske ambition om at styrke børns sproglige udvikling er
således tæt relateret til et politisk ønske om bedre læsefærdighed, hvor
læsefærdigheder forstås som noget, der konstitueres af afkodning
og læseforståelse. I argumentationen i ”Sprogpakken” etableres der
således af en kausal relation mellem målbare resultater i læsefærdighed
og udvidet sproglig evaluering i daginstitutioner, og på baggrund heraf
skabes et rationale, hvor det bliver oplagt at fastlægge karakteren af
den sproglige evaluering ud fra det, der anses for at være centrale
forudsætninger for at børn bliver bedre til at læse.
Fra flere sider har der været rettet skarp kritik mod den øgede
sproglige evalueringer i daginstitutioner. Professor Per Schultz
Jørgensen fremhæver fx, at pædagoger i mange daginstitutioner
gennem den formelle institutionelle evalueringspraksis besvarer
6-700 spørgsmål om det enkelte barns færdigheder inden skolestart.
Schultz Jørgensen ser denne udvikling som udtryk for en fremvækst
af en forestilling om ”det målbare barn”, hvor afvigelser fra den
standardiserede udvikling skal dokumenteres og rettes til – ud fra en
tro på, at det er til barnets og samfundets bedste (Jørgensen, 2014). På
linje med Pettersvold og Østrem (2012) ser Schultz Jørgensen denne
”måleiver” som et resultat af en New Public Management tænkning,
hvor en bred iagttagelse af barnets udvikling erstattes af eksakte
målinger baseret på evalueringsredskaber. Børneforsker og tidligere
venstrefløjspolitiker Erik Sigsgaard ser i sin analyse af den aktuelle
situation i de danske pædagogiske institutioner sproglige evalueringer
EDUCARE 2015:2
105
LARS HOLM
som et udtryk for en øget overvågning og for en udvikling i autoritær
retning (Sigsgaard, 2014).
Den danske diskurs om sproglig evaluering i daginstitutioner er
præget af skarpe modsætninger. Overordnet betragtet ses sproglig
evaluering enten som et nødvendigt gode for det enkelte barns
sproglige udvikling, fordi evalueringen antages at være et nyttigt
redskab for det sprogpædagogiske arbejde i forhold til det enkelte barn
(Kjærbæk, L. m.fl.,2014), eller som en uhensigtsmæssig foranstaltning
med overvejende negative konsekvenser, fordi der gennem testen sker
en tilsidesættelse af opmærksomhed på det enkelte barns autonome
udvikling (Klitmøller & Sommer, 2014). Andersen (2009) fortolker
modsætningerne som en kamp om hvilken viden, der skal/bør
produceres om det enkelte barn og om den institutionelle praksis,
mens Pettersvold og Østrem (2012) taler om den diskursive kamp som
en kamp om ”godhedsmagten”, der handler om at fastlægge, hvilken
institutionel praksis der er ”bedst” for ”barnet”.
Det er et karakteristisk træk ved diskursen, både fra tilhængeres
og modstanderes side, at der er fokus på den sproglige evaluerings
forventede positive eller negative effekt i et overordnet
samfundsmæssigt perspektiv. Herigennem rejses der centrale og
væsentlige spørgsmål af pædagogisk og etisk karakter, men i den faglige
diskurs savnes der empirisk forskning, der retter opmærksomheden
mod den lokale praksis, der opstår, når et bestemt sprogligt
evalueringsmateriale bringes i anvendelse i en daginstitution. For at
kvalificere diskurserne om sproglig evaluering i daginstitutioner er der
behov for en forskningsmæssig tilgang, der retter opmærksomheden
mod de konkrete handlinger, værdier og normer, der kommer i spil, når
der gennemføres sproglig evaluering i en daginstitution. De centrale
forskningsspørgsmål, der søges besvaret i denne artikel gennem en
empirisk analyse af den lokale praksis er, hvad det er for vurderende
perspektiver, der løftes frem i forhold til børns sproglige udvikling,
hvad det er for roller og relationer, der skabes mellem børn og
pædagoger, og hvordan de sproglige evalueringer rammesætter vilkår
for børneliv og pædagogisk virksomhed.
106
EDUCARE 2015:2
Teoretisk udgangspunkt
Når man kaster et blik på det internationale forskningsfelt, der
beskæftiger sig med sproglig evaluering, kan der overordnet
betragtet identificeres tre forskellige paradigmer med hver deres
teoretiske forståelse af sproglige evalueringsredskaber, med hver
deres forskningsmæssige interesser, og med hver deres foretrukne
videnskabelige metoder.
For det første er der tale om et forskningsparadigme, hvor den
sproglige evaluering primært ses som et måleinstrument, der har
til formål at være samfundsmæssigt behjælpelig med at generere
sammenlignelig viden om individers, institutioners og nationers
dygtighedsniveau. Det teoretiske udgangspunkt for dette paradigme
er grundlæggende validitetsteori og psykometrisk teori, herunder
item-response-theory, og der anvendes typisk kvantitative metoder
til at tilvejebringe data (McNamara & Roever, 2006). Centralt
inden for forskningsparadigmet er teoretiske diskussioner om
kvalitetsudvikling af evalueringsredskaber samt empiriske analyser af
evalueringsredskabers validitet og reliabilitet (McNamara & Roever,
2006; Gogolin, Neumann & Roth, 2005; Weir, 2005; Bachman &
Palmer, 1996).
For det andet ses der et paradigme, hvor den sproglige evaluering
betragtes som et politisk magt- og styringsinstrument (Pettersvold
& Østrem, 2012; Menken, 2008; Shohamy, 2001; Spolsky, 1995).
Det teoretiske udgangspunkt for dette forskningsfelt er typisk
sociologisk teori – især Bourdieu og Foucault (McNamara & Roever,
2006; Shohamy, 2001). Den forskningsmæssige interesse er først og
fremmest rettet mod at afdække de generelle logikker og værdier, der
er indlejret i de politiske processer omkring sproglig evaluering og
mod at afsøge mere generelle såvel tilsigtede som utilsigtede effekter
af den sproglige evaluering, herunder deres funktion i forhold til at
kategorisere individer og konstruere social identitet (McNamara &
Roever, 2006). Den sproglige evaluering relateres først og fremmest til
dominans- og magtrelationer og indskrives i den diskursive kamp om
samfundsmæssige værdier og normer (Andersen, 2009). I forskningen
inden for dette paradigme ses der en bred vifte af kvalitative metoder,
ikke mindst diskursanalyse.
EDUCARE 2015:2
107
LARS HOLM
Karakteristisk for begge disse paradigmer er, at den sproglige
evaluering grundlæggende ses som et instrument, der fungerer i en
given samfundsmæssig struktur, enten som et måleinstrument eller som
et politisk instrument. Dette instrumentelle blik på sproglig evaluering
medfører en tendens til udgrænsning af samspillet mellem test og
aktører på mikro-niveau, således at den lokale praksis og den lokale
fortolkning og forståelse af normer og værdier i sproglig evaluering
ikke kommer i fokus.
Det tredje forskningsparadigme, som skal omtales her, og som
er udgangspunktet for analysen af den sproglige evaluering i denne
artikel, er et etnografisk forskningsparadigme, hvor sproglig evaluering
ses som en social praksis. Etnografi er ifølge Blommaert og Jie
(2010) karakteriseret ved en særlig ontologi, hvor sprog ses som en
ressource, der inddrages, anvendes og udnyttes af mennesker i et
socialt rum og under mange forskellige omstændigheder, men altid på
en måde, der har sociale konsekvenser. Etnografi er således ikke kun
en metode, men et ”full intellectual programme” (Blommaert & Jie,
2010:5). Etnografi er desuden karakteriseret ved at være en induktiv
videnskab med en induktiv analysestrategi, hvad der grundlæggende
indebærer, at forskeren følger data i sit feltarbejde, og at data peger på
bestemte teoretiske problemstillinger (Blommaert & Jie, 2010). Den
forskningsmæssige interesse i relation til sproglig evaluering er inden
for dette paradigme rettet mod at afdække mønstre i den institutionelle
praksis, nærmere bestemt de værdier og normer, processer og relationer,
der vokser frem, når et bestemt sprogligt evalueringsmateriale bringes
i anvendelse (Se fx Monsen, 2014; Schmidt, 2013; Kousholt, 2010;
Martin-Beltrán, 2010, Holm, 2009b). Det etnografiske paradigme retter
med andre ord opmærksomheden mod, hvordan folk ”gør” sproglig
evaluering, og mod hvad den sproglige evaluering gør med folk (Holm,
2009b). Feltarbejde, interviews og datanalyse er de centrale metoder,
og der arbejdes frem mod analytiske generaliseringer, hvormed der
forstås en type af generaliseringer, der indebærer en bedømmelse af, i
hvilken grad resultaterne af undersøgelsen kan være vejledende, hvis
der kastes et blik på andre lignende ”sites” (Kvale 1997:228)
108
EDUCARE 2015:2
Metode og data
Det empiriske grundlag for denne artikel udgøres af data fra
feltarbejde i to daginstitutioner i Københavns Kommune. I begge
institutioner er der mange børn af migranter, og man har i den ene
institution valgt at benytte et kommunalt evalueringsmateriale, der
er udarbejdet af Københavns Kommune til sproglig vurdering af
”tosprogede børn” (Københavns Kommune, u.å), mens man i den
anden institution anvender det ministerielle evalueringsmateriale
”Sprogvurderingsmateriale til 3-årige”, der er udarbejdet af Ministeriet
for Familie- og forbrugeranliggender i 2007.
”Sprogvurderingsmateriale til 3-årige” består af et registreringsskema
og et forældreskema. Registreringsskemaet, der udfyldes af en
pædagog, er opdelt efter køn, således at der er et registreringsskema
til 3-årige drenge og et til 3-årige piger. Det begrundes med, at
”der er stor forskel på drenges og pigers sproglige udvikling i
3-års alderen” (Ministeriet for Familie- og Forbrugeranliggender,
2007:5). Registreringsskemaet til 3-årige drenge, der indgår i denne
undersøgelse, omfatter en række delaktiviteter, der er domineret af to
forskellige typer af interaktionsmønstre. Den ene type af interaktion,
som illustreres af eksempel 1, er karakteriseret ved, at barnet skal vise
forståelse ved at udføre de handlinger, som det bliver bedt om.
Eksempel 1:
Hanne: Så har vi tog og bog. Kan du pege på tog?
Omar:
[Barnet peger på billedet af et tog]
Hanne:Ja. Det var sørme rigtigt. Så skal du vende igen. Så har vi
bil og pil.
Kan du pege på bil?
I den anden type af interaktionsmønster, der illustreres i eksempel
2, fordres der i interaktionen mellem barn og pædagog en sproglig
(re)produktion fra barnets side.
Eksempel 2:
Hanne: Omar: Hanne: EDUCARE 2015:2
Kan du så sige: lampe-bamse-sut?
Lampe-bamse-sut.
Hold da op, hvor er du bare god.
109
LARS HOLM
I forældreskemaet er der tre rubrikker, der handler om henholdsvis
ordforråd, ords endelser og sætningsopbygning. Forældrene bliver bedt
om at afkrydse, om de har hørt deres barn sige 100 forskellige ord.
De skal tage stilling til, om de har bemærket, at deres barn er begyndt
at anvende flertalsformer af navneord, genitiv samt datidsformer
af udsagnsord, og de skal tage stilling til, hvilke af seks forskellige
sproglige muligheder, der bedst beskriver deres barns sprogbrug i en
given situation. Det er et særligt træk ved ”Sprogvurderingsmateriale
til 3-årige”, som ikke ses i andre evalueringsredskaber, at det inddrager
forældre i produktion af viden om deres barns sproglige udvikling.
Københavns Kommunes evalueringsmateriale er inddelt i seks
overordnede rubrikker med følgende overskrifter 1) barnet og dets
verden og omverden; 2) barnets modersmål (førstesproget); 3) barnets
tilegnelse af dansk (andetsproget); 4) barnets sprogforståelse og brug
af dansk 5) barnets øvrige udvikling; 6) institutionens bemærkninger
til barnets generelle udvikling.
En meget stor del af rubrikkerne udfyldes ved at afkrydse udsagn,
der er baseret på generel viden og vurdering af forhold omkring barnet.
Det er primært i relation til besvarelsen af rubrik fire, at der indgår
en særligt tilrettelagt sproglig interaktion mellem pædagog og barn.
I denne interaktion vurderes barnets sprogforståelse og brug af dansk
med udgangspunkt i en række spørgsmål som f.eks: Kan barnet svare
på simple hv-spørgsmål? Forstår barnet danske tillægsord og biord?
Kan barnet fortælle om sin alder? Eksempel tre er et typisk eksempel
på den sproglige interaktion, der er central i dette evalueringsmateriale.
Eksempel 3:
Ida: Amir: Ida: Amir:
Ida:
Hvad er det her for en bil?
En ambulance
Hvad farve har den?
Grøn
Ja, det er rigtigt. Nu skal du høre..
Ud over observationer af ni sproglige evalueringer gennemført med
disse to evalueringsmaterialer er dategrundlaget for undersøgelsen
tilvejebragt gennem interviews med institutionsledere og/eller de
ansvarlige for den sproglige evaluering, gennem samtaler om de
110
EDUCARE 2015:2
observerede sproglige evalueringer med de personer, der gennemfører
dem, gennem indsamling af information om de anvendte sproglige
evalueringsredskaber og gennem indsamling af informationer, der
belyser lovgrundlag og politiske beslutninger i relation til sproglig
vurdering. Dataindsamlingen fandt sted i en periode fra oktober 2008
til februar 2009.
De sproglige evalueringsmaterialers formål
Når en formel sproglig evaluering ses som social praksis rettes
opmærksomheden blandt andet mod, hvordan evalueringsmaterialet
rammesætter den sproglige interaktion. Set i dette perspektiv er der flere
karakteristiske fællestræk ved de to anvendte evalueringsredskaber.
Det forventes i begge evalueringsredskaber, at den sproglige
evaluering foregår i et roligt og afskærmet rum og har karakter af
en sproglig interaktion mellem et barn og en pædagog (Schmidt,
2013). Denne rammesætning af den sproglige evaluering indebærer,
at det bliver pædagogernes opgave at gøre børnene målbare og
sammenlignelige og at producere den viden om børns sprog, som evalueringsmaterialet fordrer. Det er desuden et karakteristisk fællestræk, at
evalueringsredskaberne rummer flere forskellige evalueringsformål. I
informationsmaterialet til ”Sprogvurderingsmateriale til 3-årige” kan
man læse at formålet med at sprogvurdere 3-årige børn:
både er at finde ud af, om barnet har de sproglige redskaber, det har
brug for som 3-årig, og at give en støtte til de børn, der har brug for det.
Sprogvurderingen skal herudover bidrage til, at daginstitutionen generelt
kan øge fokus på børnenes sprogudvikling”(MFF, 2007)
Af informationsmaterialet fremgår det videre, at evalueringen med dette
materiale forventes at resultere i, at 85 % af børnene vil få anbefalet
en ”generel indsats”, 5-15 % af børnene ”en fokuseret indsats”,
og 5 % af børnene ”en særlig indsats” (Ministeriet for Familie- og
Forbrugeranliggender, 2007).
En række formål er således indlejret i det ministerielle sproglige
evalueringsmateriale (Holm, 2009, 2010). Det skal give grundlag
for en vurdering af, om det enkelte barn har et såkaldt aldersvarende
sprogligt niveau, og i forlængelse heraf skal det danne udgangspunkt
EDUCARE 2015:2
111
LARS HOLM
for en kategorisering af børn i tre grupper. Herudover skal resultatet
af den sproglige evaluering anvendes til en differentiering af en
sprogpædagogisk praksis, og endelig er det hensigten med den
sproglige evaluering af 3-årige, at den skal bidrage til at daginstitutioner
får et skarpere fokus på børns sproglige udvikling. Den sproglige
evaluering af de 3-årige børn er således tænkt som en måling, der
kan danne grundlag såvel for en kategorisering af et barn som for en
sprogpædagogisk indsats.
En lignende kombination af flere formål ses også i relation til
Københavns Kommunes evalueringsmateriale. Det fremgår af
procedurerne for anvendelsen af materialet, at den sproglige evaluering
har to formål. For det første skal resultatet af den sproglige vurdering
anvendes til en kategorisering af det tosprogede barn, enten som
tilhørende den gruppe af tosprogede børn, der har behov for særlig
sprogstimulering, eller som en del af en gruppe, hvor sprogstøtten kan
finde sted inden for institutionens almindelige praksis. For det andet
fremgår det af vejledningen, at en besvarelse af sprogvurderingens
rubrikker kan fortælle noget om ”barnets stærke sider, der kan arbejdes
ud fra efterfølgende” (Vurderingsskema til 3-årige, s.4). Den sproglige
evaluering er således også i dette tilfælde tænkt som et redskab, der
kan danne grundlag for udvikling af sprogpædagogiske initiativer, der
er målrettet det enkelte barn.
De sproglige evalueringers teorigrundlag
For at kunne måle og veje et barns sprog og sproglige udvikling har et
sprogligt evalueringsmateriale altid en teoretisk forankring. Der må for
det første defineres et sprogsyn, der giver svar på, hvilke aspekter af
sprog, der skal evalueres. For det andet må der udvikles et målingssyn,
der rummer en vurderende skala, som barnets sprog kan relateres til,
og for det tredje vil evalueringsmaterialet fastlægge et kundskabssyn,
idet det sproglige evalueringsmateriale stiller krav til barnet om viden
om bestemte forhold og om at formidle denne viden gennem bestemte
måder at bruge sprog på (Holm, 2010). På baggrund af disse træk
bliver det relevant at se på samspillet mellem sprogsyn, målingssyn
og kundskabssyn på den ene side og evalueringens mange formål på
den anden.
112
EDUCARE 2015:2
Sprogsyn
Med sprogsyn forstås de grundlæggende teoretiske antagelser om
sprog, der kommer til udtryk i det sproglige evalueringsredskab.
Det er altså forståelsen af fænomenet sprog, der er fokus på, når
sprogsynet i et sprogligt evalueringsredskab analyseres. Inden for
sprogvidenskaben kan der identificeres to overordnede forståelse af
sprog. Med udgangspunkt i den schweiziske sprogvidenskabsmand
Saussure ses der en strukturalistisk tradition, hvor sprog betragtes
som et alment-abstrakt system for betydningsdannelse, og som en
forudsætning for kommunikation i det hele taget (Widdowson, 1996).
Det strukturalistiske paradigme indebærer, at sprog ses som noget, der
konstitueres af bestemte delelementer som udtale, ordforråd, morfologi
og syntaks. På baggrund af denne teoretiske forståelse af sprog rettes
den evalueringsmæssige opmærksom typisk mod bestemte sproglige
delelementer som evnen til at skelne lyde, mod det receptive ordforråd
og mod kendskab til udsagnsords bøjninger, navneords flertalsformer
og sætningsopbygning. Det er endvidere et karakteristisk træk, at
der i det strukturelle paradigme er indlejret et perspektiv på sprog og
sprogligt niveau som en individuel attribut – som noget det enkelte
individ enten har eller ikke har.
Det strukturalistiske paradigme er blevet udfordret siden 1920´erne
af flere forskellige sprogvidenskabelige retninger, der har det tilfælles,
at de arbejder ud fra en grundantagelse om, at sprog hverken kan
adskilles fra de personer, der frembringer det, eller fra de situationer,
som de frembringer det i. Det drejer sig for eksempel om retninger
som antropologisk lingvistik, interaktionel sociolingvistik og
konversationsanalyse (Davis & Taylor, 1990/2014; Spolsky, 1998).
Inden for denne forståelsesramme, der ofte benævnes et interaktionelt
paradigme, ses sprog ses som et dynamisk, socialt fænomen, hvor
betydningsdannelsen er forankret i interaktionen i den enkelte situation
(Goffman, 1959; Silverstein, 1992). Overføres denne forståelse
til sproglig evaluering indebærer det, at den evalueringsmæssige
opmærksomhed i væsentlig grad rettes mod, hvordan et individ
bruger sprog og andre kommunikationskanaler til betydningsdannelse
i interaktion med andre. Set i relation til en daginstitution vil et
interaktionelt syn på sprog medføre, at den evalueringsmæssige
opmærksomhed især retter sig mod, hvordan det enkelte barn indgår
EDUCARE 2015:2
113
LARS HOLM
i forskellige sprogbrugssituationer – både i interaktion med voksne
og ikke mindst i interaktion med andre børn, fordi der i interaktion
mellem børn typisk vil være en mere symmetrisk fælles produktion af
betydning, end når interaktionen finder sted mellem barn og voksen.
Den konkrete sproglige evalueringspraksis i daginstitutionerne
indledes med, at pædagogen bringer barnet til et særligt rum, hvor
kun barn og pædagog normalt er til stede. Pædagogen italesætter i
mange tilfælde den sproglige evaluering som en leg, som barnet
skal deltage i. Når selve evalueringen er begyndt, er forløbet stramt
styret af anvisningerne og rubrikkerne i evalueringsmaterialets
evalueringsskema, som pædagogen udfylder undervejs i interaktionen
(Holm, 2009b). De følgende eksempler illustrerer nogle typiske
træk ved den sproglige interaktion, der opstår. Eksempel 4 mellem
pædagogen Ida og den 3-årige dreng Amir har udgangspunkt i
”København Kommunes vurderingsmateriale til tosprogede børn”,
mens eksempel 5 og 6 mellem pædagogen Hanne og den 3-årige pige
Yasmin har afsæt i ”Sprogvurderingsmateriale til 3-årige” (Holm,
2009b).
Eksempel 4:
Ida: Amir: Ida: Amir: Ida: Hvor er dine ryg henne?
Her.
Ja. Og hvor er numsen?
Der.
Den er der. Godt.
Eksempel 5:
Hanne: Så har vi tog og bog. Kan du pege på tog?
Yasmin:
[Barnet peger på billedet af et tog]
Hanne:Ja. Det var sørme rigtigt. Så skal du vende igen. Så har vi
bil og pil.
Kan du pege på bil?
114
EDUCARE 2015:2
Eksempel 6:
Hanne: Hvor er pigen henne?
Yasmin: [Yasmin peger på en lege-kuffert, hvori der ligge en pigeog en drengedukke]
Hanne: Kan du tage pigen op af kufferten?
Yasmin:
[Yasmin tager pigen op af kufferten]
Hanne: Ja, det var godt. Og hvor er drengen henne?
Som det fremgår af disse eksempler medfører evalueringsmaterialets
opbygning, at pædagogen bliver den styrende og mest talende, men
også at barnet hverken forventes eller levnes mulighed for at bidrage
til opbygning eller udvikling af en samtale eller en interaktion.
Eksemplerne viser klart, at evalueringsredskaberne er udformet
således, at de grundlæggende skaber en interaktion med en initiativrespons og en initiativ-respons-feedback struktur, hvor der kun fordres
en minimalrespons fra barnets side.
Det er dog ikke alle børn og pædagoger, der uden videre følger
evalueringsmaterialernes stramme styring. Sekvensen nedenfor er den
afsluttende aktivitet i den sproglige evaluering, som sigter mod gennem
en tegneaktivitet at undersøge, om barnet kan benævne genstande på
legepladsen.
Eksempel 7:
Nete: Den allersidste ting. Kunne du ikke tænke dig at tegne? Hvad er
der vi har ude på legepladsen?
Yasir: En legeborg.
Nete: Prøv at se om du kan tegne legeborgen. Nu skal jeg hjælpe dig med
den der drillesko. [Der er tale om skoen til en dukke, der har været
en del af en tidligere aktivitet]
Yasir:
Måske har jeg sat den forkert på.
Nete: Vil du tegne for mig?
Yasir: Jeg vil tegne den der pige.
Nete: Jeg synes du skal tegne legepladsen og børne haven, og hvad der
ellers er derude.
[Yasir begynder at tegne]
Yasir: Det er en sh- sh- ismand.
Nete: En snemand.
EDUCARE 2015:2
115
LARS HOLM
Yasir: En snemand. Og det er hans arme.
Nete: Hold da op. Den bliver flot.
Yasir: Og det er hans øjner, og der er hans mave og hans ben. Og det
her er legepladsen. Man kan ikke slå sig.
Nete: Man kan ikke slå sig? Der ligger sne måske?
Yasir: Ja. Så kan man kælte.
Nete: Hvad er det, du tegner der?
Yasir: Det er så.. Det er hans mund, der er faldet ned.
Nete: Hans mund, der er faldet ned. Nå, okay.
Yasir: Ja. Og det er hans cykel, der er gået i stykker.
Nete: Det var ærgerligt, for så kan han ikke cykle på den, vel?
I dette eksemplet vælger barnet ikke at følge pædagogens opfordring til
at tegne legepladsen, men beslutter sig for at tegne noget andet - først en
pige og så senere en snemand. Pædagogen forsøger at fastholde barnet
på den obligatoriske opgave, men barnet fastholder sin beslutning om
selv at bestemme motivet på sin tegning. Meningsudvekslingen mellem
barn og pædagog finder sted i et neutralt og ikke konfliktfyldt toneleje,
hvad der kan bidrage til at forklare både barnets lyst til at tegne og til at
inddrage den voksne pædagog i en samtale om sin tegning. Pædagogen
vælger at tage imod invitationen og bidrager herigennem til en sproglig
interaktion, der giver interessante informationer om barnets sproglige
formåen, men ikke om barnets sproglige kapacitet til at benævne
ting på en legeplads. Sammenlignes eksempel 7 med eksempel 4-6
illustrerer disse eksempler, hvordan et henholdsvis strukturelt og et
interaktionelt paradigme grundlæggende skaber vidt forskellige typer
af evaluerende interaktioner mellem barn og pædagog. Eksempel 7
belyser desuden det forhold, at et barns sprogbrug vil være afhængig
af, at der opstår en vellykket interaktion mellem barn og pædagog
(Daugaard, 2009). Derudover belyser eksempel 7, at en sproglig
evaluering kan skabe dilemmaer for pædagogen, der må vælge enten
at følge evalueringsmaterialets fordring og logik og afvise et barns
invitation til samtale eller være imødekommende over for barnets
ønske om at være medskaber af interaktionen.
I evalueringsmaterialerne findes der enkelte elementer, der afspejler
et interaktionelt orienteret sprogsyn, men ud fra en helhedsbetragtning
fremstår et strukturelt orienteret sprogsyn klart som det dominerende.
Det skyldes, at det først og fremmest er resultatet af den sproglige
116
EDUCARE 2015:2
evaluering mellem barn og pædagog, der er det centrale grundlag for
kategoriseringen af barnet og for den intenderede sprogpædagogiske
opfølgning.
Som det fremgår af eksempel 4, 5 og 6, medfører det strukturelle
sprogsyns dominans og dets fokus på bestemte sproglige træk
et lukket og stærkt styret initiativ-respons-feedback (I-R-F)
interaktionsmønster mellem barn og pædagog, og det er desuden i
meget væsentlig grad barnets forståelse – eller ikke-forståelse – af
enkeltord og dekontekstualiserede sætninger, der kommer i fokus.
Set i et bredere perspektiv indebærer det strukturelle sprogsyn i
evalueringsmaterialerne, at den evalueringsmæssige opmærksomhed
først og fremmest rettes mod bestemte prædefinerede sproglige
kategorier og kun i ringe grad mod barnets produktive sproglige
kapacitet eller sproglige kompetencer i bred forstand. Det har som
konsekvens, at barnet grundlæggende ikke ses som en kompetent
samtalepartner, der kan bidrage konstruktivt til at udforme og
forhandle forløb og indhold i en sproglig interaktion med en voksen.
Inden for rammerne af den observerede evalueringspraksis vil
selvstændige initiativer til at etablere en samtale om noget, barnet selv
finder relevant, fremstå som et forstyrrende indslag i den evaluerende
interaktion (Holm, 2010).
Det fremgår af feltarbejdet og af interviews med aktører i
institutionen, at de sproglige evalueringsredskaber i betydelig grad
kommer til at præge den institutionelle forståelse af sprog og af børns
sproglige udvikling samt den pædagogiske praksis. Pædagogerne tager
i meget høj grad evalueringsmaterialernes sprogsyn, kategoriseringer
og vurderinger til sig og formidler evalueringsresultater til forældre og
til hinanden som objektive sandheder. Samtidig ses der en tydelig moddiskurs, idet en del pædagoger giver udtryk for, at den mere omfattende
sproglige evaluering er spild af tid, hvilket de begrunder med, at de
i forvejen har tilstrækkelig viden om det enkelte barns sproglige
udvikling (Holm, 2009b).
Der ses således en noget modsætningsfuld situation, hvor der på den
ene side høres kritiske røster blandt pædagogerne, og på den anden side
ses der samtidig en tendens i retning mod, at evalueringsredskabernes
vurderende perspektiver bliver den dominerende norm for, hvordan
børns sproglige udvikling italesættes. Sker det, kan det ifølge
EDUCARE 2015:2
117
LARS HOLM
Pettersvold og Østrem (2012) medføre en tilsidesættelse af andre måder
at italesætte børns sproglige udvikling på – herunder vurderinger af
børns sproglige udvikling, der hviler på et professionelt skøn fx med
afsæt i en interaktionel forståelse af sprog (Pettersvold & Østrem,
2012). De sproglige evalueringsredskaber ses også at have den effekt,
at det i institutionerne bliver en del af den daglige praksis at ”træne” og
”øve” de delaktiviteter og ord, der indgår i den evaluerende interaktion
mellem barn og pædagog, og at artefakter, der er en del af den sproglige
evaluering, bliver en del af institutionernes arsenal af ”legetøj” (Holm,
2009b).
Målingssyn og kundskabssyn
Målingssynet i de sproglige evalueringsredskaber, der analyseres
i denne artikel er normrelateret (Guba & Lincoln, 1998). I relation
til en sproglig evaluering betyder det, at normen typisk er baseret
på en undersøgelse og statistisk bearbejdning af et sprogligt aspekt,
som for eksempel ordforråd – hos et større antal børn i samme alder.
Undersøgelsesresultater af denne type anvendes typisk til at fastlægge
en norm for det, der kaldes alderssvarende sprog. Det er endvidere et
centralt træk, at den statistiske bearbejdning af data indebærer, at den
evaluerende opmærksomhed i normrelaterede sproglige evalueringer
retter sig mod de aspekter af sprog, der lader sig kvantificere.
Sproglige træk, der kun vanskeligt eller slet ikke kan indfri dette
krav, indgår derfor ikke i den sproglige evaluering. Derudover er
det et karakteristisk for de normrelaterede evalueringsredskabet, at
de undersøger børns sproglige kompetence kontekstuafhængigt (se
eksempel 1-6). Heri ligger en markant forskel set i relation til de
interaktionelt orienterede sprogvidenskabelige paradigmer, hvor det
er en central grundantagelse, at børn ikke lærer sprog for sprogets egen
skyld, men for at kunne gøre noget med sprog – for at kunne handle
i deres liv i den situation, de befinder sig i (Karrebæk, 2009). Ud fra
denne position forstås sprog som et kontekstafhængigt fænomen, og på
baggrund heraf rettes der kritik mod norm- og aldersrelaterede sproglige
evalueringer og kategoriseringer, fordi de hviler på antagelser om at
alle børn gennemløber de samme udviklingstrin i samme rækkefølge
og derigennem bidrager til at producere et stærkt generaliseret og dekontekstualiseret syn på børns sproglige udvikling (Holm, 2009).
118
EDUCARE 2015:2
Når den sproglige evaluering er rettet mod en prædefineret norm
om det alderssvarende og ikke mod en bred undersøgelse af, hvad
et barn kan gøre med sprog, kan det have som konsekvens, at det
evaluerende blik bliver rettet mod, hvad barnet ikke kan i forhold til
den prædefinerede norm. Dette kommer tydeligt til udtryk i en af de
observerede sproglige evalueringer mellem barn og pædagog, hvor et
barn i løbet af en interaktion på 9 minutter siger ”Det ved jeg ikke”,
”Det kan jeg ikke” og ”Det vil jeg ikke” 18 gange (Holm, 2009b).
Normrelateringen i de sproglige evalueringer indebærer ikke kun
en tendens til, at den evaluerende opmærksomhed rettes mod det,
barnet ikke kan i forhold til en prædefineret norm. Anvendes den
normrelaterede evaluering som afsæt for en sprogpædagogisk indsats,
vil der desuden være en betydelig risiko for, at indsatsen vil orientere
sig mod at bringe barnets sprog i overensstemmelse med bestemte
prædefinerede forestillinger om, hvad der er alderssvarende sprog, og
fx ikke mod de sproglige behov som fremstår som centrale i barnets
hverdag i institutionen.
Normrelaterede evalueringsredskaber rummer desuden særlige
problemstillinger i forhold til flersprogede børn. Normen om et
alderssvarende sprog er i de anvendte evalueringsredskaber udviklet
med udgangspunkt i etsprogede børns sproglige udvikling og er derfor
udtryk for, at flersprogede børn måles med etsprogede børns alen
(Gogolin, Neumann & Roth, 2005; Holm, 2009b). Som konsekvens heraf
vil en normrelateret evaluering typisk resultere i, at mange flersprogede
børn bliver kategoriseret som børn med et ikke-alderssvarende sprog.
Den sproglige evaluerings monolinguale perspektiv medfører således
en tendens til en generel negativ kategorisering af flersprogede
børn, fordi det sproglige evalueringsredskab kun forholder sig til det
flersprogede barns sproglige udvikling på dets andetsprog og ikke til
kompleksiteten og sammensatheden i et flersproget barns sproglige
udvikling på flere sprog.
En sproglig evaluering rummer også et kundskabssyn, der
manifesterer sig i, at der i evalueringen er foretaget en prioritering af,
hvilke kundskaber man ønsker at værdsætte institutionelt. Hvilke ord
er det fx der værdsættes, og hvilke måder at vise viden på har prioritet?
I de normrelaterede evalueringsredskaber værdsættes det typisk, at
børn kan de ord, som de fleste andre børn kan, men ikke at de kan
EDUCARE 2015:2
119
LARS HOLM
ord, som kun få børn kan. Det tillægges således ikke værdi, hvis et
3-årigt barn har magt over en række specifikke ord fra barnets hverdag
og fx kan skelne mellem en kajak og en kano. Set i dette perspektiv
bliver det klart, at de normrelaterede sproglige evalueringsredskaber
afspejler en forestilling om et fælles dansk børneliv, hvor børn
forventes at møde nogenlunde de samme ting i deres hverdag og
derfor forventes at tilegne sig nogenlunde de samme ord. Bag den
normrelaterede tankegang ligger der tydeligvis en antagelse om, at alle
børn møder de samme sproglige udfordringer, har de samme sproglige
behov på det samme sprog og på samme tidspunkt i deres opvækst.
Forskelle fx mellem opvækst i land og by, mellem børn med mange
eller ingen søskende, mellem et- og flersprogede børns sproglige
udvikling elimineres af den logik, der er indlejret i en forestilling
om et alderssvarende sprog. I de sproglige evalueringsredskaber ses
således stærke normalitetsforestillinger, der medfører, at børn med
en anden socialisering end den dominerende allerede i 3-års alderen
kategoriseres som ”behind schedule” (Anderson-Levitt, 1996) og
dermed som problembørn og som potentielle tabere (jf. Pettervold &
Østrem, 2012).
Konklusion
Enhver institutionel evaluering har en effekt på normer, værdier og
praksis (Cheng m.fl., 2004). Denne effekt kan være større eller mindre
og mere eller mindre direkte og tilsigtet. I relation til de sproglige
evalueringer, der indgår i denne analyse, er der forventninger om
en betydelig direkte effekt, idet de sproglige evalueringer ikke kun
er tænkt som et måle- og kategoriseringsredskab, men også som et
vidensgrundlag for udformning af en sprogpædagogisk praksis, og
dermed som et redskab med en betydelig normsættende virkning.
Gennem en værdsættelse af særligt udvalgte sproglige træk fungerer
den sproglige evaluering som et udtryk for en officiel standard for
vurdering af børns sprog og som et udsagn om, hvilke former for
børnesprog der er passende i den institutionelle kontekst. De sproglige
evalueringer sætter desuden rammer om den institutionelle praksis på
en række områder, idet de fordrer en bestemt praksis, hvor pædagoger
og børn forventes at foretage bestemte handlinger og at påtage sig
særlige roller og positioner.
120
EDUCARE 2015:2
Det fremgår af data i denne undersøgelse, at evalueringsmaterialernes
fokus på bestemte aspekter af barnets sprog resulterer i en praksis,
hvor den sproglige interaktion mellem barn og pædagog er lukket,
prædefineret og stærkt styret, fordi pædagogerne i langt de fleste
tilfælde føler sig bunder til evalueringsmaterialets fordring om at gøre
ganske bestemte ting for at producere viden af en ganske bestemt
karakter. I forbindelse med langt de fleste items i evalueringsmaterialer
forventes det ikke, og der levnes ikke mulighed for, at barnet kan/skal
bidrage til opbygning eller udvikling af en samtale eller en interaktion.
Det generelle billede er, at den sproglige interaktion mellem barn og
pædagog får karakter af en kontrol af, om barnet kender og forstår
bestemte sproglyd, ord og sætninger.
Den faglige og politiske diskurs om sproglig evaluering af
småbørn er grundlæggende en ideologisk kamp, der drejer sig om,
hvilken forståelse af sprog og sproglig udvikling, der skal prioriteres
i daginstitutioner. I de analyserede daginstitutioner er den sproglige
evalueringspraksis domineret af et strukturelt sprogsyn. Det medfører,
at den evaluerende opmærksomhed især rettes mod kendskab til
frekvente enkeltord og mod fonetiske forhold. Denne prioritering af
bestemte dekontekstualiserede sproglige træk ses primært at være
begrundet i et hensyn til en faglig forståelse af læseindlæring, hvor
netop ordforråd og fonetisk kompetence betragtes som de mest
betydningsfulde forudsætninger for at børn bliver gode til at afkode
tekster (Holm & Laursen, 2011).
Analysen af evalueringsmaterialernes sprogsyn, målingssyn og
kundskabssyn viser desuden, at den sproglige evalueringspraksis er
præget af en tung monolingual normativitet, der synes at være baseret på
en grundlæggende antagelse om, at alle børn i danske daginstitutioner
socialiseres på samme måde, på dansk og gennemløber de samme
sproglige udviklingstrin i samme rækkefølge. Denne normativitet
medfører, at der stilles flere og flere krav til at være et ”normalt”
barn, samt at det kun er den dansksprogede del af flersprogede børns
sproglige repertoire, der evalueres og værdsættes.
EDUCARE 2015:2
121
LARS HOLM
Diskussion og perspektivering
En daginstitution er en pædagogisk institution, hvor man vil noget med
børnene – blandt andet udvikle deres sprog. Visse former for sprog
og sprogbrug anses for at være bedre end andre, og derfor er det – og
har altid været – en del af en daginstitutions virksomhed at anlægge
vurderende perspektiver på børns sprog og sproglige udvikling. Det
centrale spørgsmål er derfor ikke, om der skal foretages sproglig
evaluering i daginstitutioner, men hvordan den skal foretages. Den
øgede politiske opmærksomhed på sproglig evaluering i daginstitutioner
kan derfor ses som udtryk for et ønske om at ændre en institutionel
praksis ved at installerer et andet sæt af normer og perspektiver på
børns sproglige udvikling. Som det fremgår af denne artikel, har
installeringen af de sproglige evalueringsredskaber i daginstitutionerne
vidtrækkende betydning for normer og værdier, relationer og processer.
Praksis omkring de sproglige evalueringer i daginstitutioner
forudsætter, at barnet er villig til at indgå i den sociale praksis, som
konstrueres i den sproglige evaluering. Eksempel 7 nedenfor, hvor
pædagogen Trine har hentet den 3-årige dreng Hamza på stuen og bragt
ham til et særligt lokale, hvor den sproglige evaluering skal foregå,
belyser dette.
Eksempel 8:
Trine: Hamza: Trine: Hamza: Trine: Hamza: Trine: Hamza: Trine: Hamza: Trine: Hamza: Trine: Hamza:
Trine: Hamza: 122
Sæt dig lige herop, så vi kan lege.
Nej.
Du skal sætte dig herop – ved siden af mig.
Det vil jeg ikke.
Jo, det skal du. Kom!
Jeg [uforståeligt udsagn]
Hvad siger du, skat? Prøv at kigge på mig.
Jeg vil høre historie.
Ja, men vi hører historie bagefter.
Nej.
Du vil slet ikke?
Nej, jeg..
Vi har biler her, du kan lege med.
[Ryster på hovedet og ser ned i bordet]
Du vil ikke lege med biler?
Nej, jeg vil have historie.
EDUCARE 2015:2
Her afsluttes samtalen i denne omgang, og drengen og pædagogen
forlader lokalet. Sekvensen viser, hvordan intentionen om at
gennemføre en sproglig vurdering af denne dreng på dette tidspunkt
giver anledning til en ganske betydelig magtkamp og konfrontation
mellem barn og pædagog.
Ikke alle børn ønsker at deltage i den særlige ”leg” med pædagogen,
når de bliver bedt om det, og ikke alle børn virker motiverede og opsatte
på at ”lege med”. Eksemplerne i artiklen viser klart, at barnet skal
være parat til at følge evalueringens logik og præmisser og parat til at
acceptere, at det er pædagogen, der styrer interaktionen. De sproglige
evalueringer forudsætter således et veltilpasset og velsocialiseret barn
for at kunne lykkes efter hensigten.
Set i et sprogpædagogisk perspektiv skaber det betydelige
problemer, at de sproglige evalueringsredskaber er domineret af et
strukturelt sprogsyn, hvor sprog ses som en individuel egenskab,
der grundlæggende konstitueres af ord og en række sproglige
delkomponenter af stigende sværhedsgrad, som børn forventes at
tilegne sig først og fremmest receptivt og i mindre grad produktivt. Et
sådant syn på sprog og sproglig udvikling kan bidrage til unuancerede
og forsimplede forestillinger hos pædagoger, forældre og børn om,
hvad sprog og sprogbrug er for et fænomen. Derudover vil det være
problematisk, hvis de sproglige evalueringers strukturelle sprogsyn
kommer til at danne grundlag for udviklingen af den sprogpædagogiske
praksis, fordi det vil betyde, at den sprogpædagogiske indsats ikke
funderes i nyere teorier om sprog, hvor sprog og sprogbrug ses
som en interaktionel betydningsdannelse, som en kontekstualiseret
social praksis og som et multilingualt repertoire (Holm, 2009b). Den
sproglige evaluerings monolinguale perspektiv kan endvidere bidrage
væsentligt til at cementere eller etablere en” monolingual habitus”
(Gogolin, Neumann & Roth, 2005) i institutionen med vidtrækkende
konsekvenser såvel for flersprogede børn og deres familier som for
pædagogers perspektiver på flersprogede børn.
De seneste års udvidelse af den sproglige evalueringspraksis i
daginstitutioner gør det relevant i fremtidige undersøgelser at se
nærmere på, i hvilket omfang evalueringsmaterialernes syn på sprog,
måling og kundskab kommer til at præge den sprogpædagogiske
praksis. Gennem sproglige evalueringer i daginstitutioner konstrueres
EDUCARE 2015:2
123
LARS HOLM
en praksis, der rummer bestemte teoretiske forståelser af sprog og af
børns sproglige udvikling, og indlejret i denne praksis er bestemte
typer af relationer og processer mellem daginstitutionens aktører.
En etnografisk orienteret tilgang til sproglig evaluering med fokus
på sprogsyn, målingssyn og kundskabssyn forekommer at være et
relevant og produktivt udgangspunkt for at analysere de dynamikker,
der skabes, når et bestemt sprogligt evalueringsmateriale bringes
i anvendelse i en daginstitution, fordi en tilgang af denne karakter
åbner for og bidrager med en viden om hverdagsliv og social praksis i
daginstitutioner, der ikke indfanges af andre forskningsmæssige tilgange
til sproglig evaluering. Der er med andre ord behov for en løbende
etnografisk orienteret forskning i den sproglige evalueringspraksis
i daginstitutioner, ikke mindst når denne praksis udvides gennem
introduktion af nye sproglige evalueringsredskaber.
124
EDUCARE 2015:2
Referenser
Andersen, Peter Østergaard (2009). Dokumentation og evaluering
betragtet som kamp om viden. Dansk Pædagogisk Tidsskrift 1, 6071.
Anderson-Levitt, Karen (1996). Behind Schedule: Batch-Produced
Children in French and U.S. Classrooms. In Bradley A. Levinson,
Douglas E. Foley & Dorothy C. Holland (Eds.) The cultural
production of the educated person: critical ethnographies of
schooling and local practice. Albany: State University of New
York Press.
Bachman, Lyle F. & Palmer, Adrian S. (1996). Language testing in
practice. Oxford: Oxford University Press.
Blommaert, Jan & Jie, Dong (2010). Ethnographic Fieldwork. Bristol:
Multilingual Matters.
Bundgaard, Helle & Gulløv, Eva (2008). Forskel og fællesskab.
Minoritetsbørn i daginstitutioner. København: Hans Reitzels
Forlag.
Cheng, Liying, Watanabe, Yoshinori & Curtis, Andy (2004). Washback
in language testing: Research contexts and Methods. Mahwah, NJ:
Lawrence Erlbaum Associates.
Davis, Hayley G. & Taylor, Talbot J. (1990/2014). Redefining
Linguistics. London: Routledge.
Goffman, Erving (1981) Forms of Talk. Philadelphia: University of
Pennsylvania Press.
Gogolin, Ingrid, Neumann, Ursula & Roth, Hans-Joachim (2005).
Sprachdiagnostik im Kontext sprachlicher Vielfalt. In Ingrid Gogolin,
Ursula Neumann & Hans-Joachim Roth (Eds.) Sprachdiagnostik
bei Kinder und Jugendlichen mit Migrationshintergrund. Münster:
Waxmann Verlag.
Guba, Egon G. & Lincoln, Yvonna S. (1989): Fourth generation
evaluation. Thousand Oaks: Sage.
Holm, Lars & Laursen, Helle Pia (2011). Migrants and Literacy Crises.
Apples – Journal of Applied Language Studies 5(2), 3-16.
EDUCARE 2015:2
125
LARS HOLM
Holm, Lars (2010). Språklig utvärdering i förskolan. In Lars Holm &
Helle Pia Laursen (Red.) Språklig praxis i Förskolan. (ss. 73-90).
Lund: Studentlitteratur.
Holm, Lars (2009a). Who evaluates the evaluation? An analysis of
computer-adaptive testing using literacy as an example. Nordic
Educational Research 29, 137-148.
Holm, Lars (2009b). Evaluering af sprogvurderingsmaterialer i
daginstitutioner. En undersøgelse af sproglig evalueringspraksis
i daginstitutioner i Københavns Kommune. Onlinepublikation på
www.dpu.dk/om/larsh
Jørgensen, Per Schultz. (2014). Barnet i systemets tjeneste. Information
15. januar 2014, s. 18-19.
Karrebæk, Martha Sif (2009). Den prutter: Deltagelse og sproglig
forhandling i børnehavebørns leg. In Lars Holm & Helle Pia
Laursen (Eds.) En bog om sprog – i daginstitutioner. København:
Danmarks Pædagogiske Universitetsforlag.
Kjærbæk, Laila, Rasmussen, Sissal & Clausen, Marit (2014). Børn bør
sprogtestes, men ikke for at klare sig bedre i PISA-test. Information
26. februar 2014, s.18-19.
Klitmøller, Jakob & Sommer, Dion (2014). Læring, dannelse og
udvikling: Kvalificering til fremtiden i daginstitution og skole.
København: Hans Reitzel.
Kousholt, Kristine (2010). Børneperspektiver, læring og
evalueringspraksis. Pædagogisk Psykologisk Tidsskrift 47(6), 485498.
Kvale, Steiner (1997). InterView. En introduktion til det kvalitative
forskningsinterview. København: Hans Reitzel.
Københavns Kommune (u.å): Individuel vurdering af det tosprogede
3-årige barns tilegnelse af dansk. København.
Martin-Beltrán, Melinda (2010). Positioning proficiency: How
students and teachers (de)construct language proficiency at school.
Linguistics and Education 21, 257-281.
McNamara, Tim & Roever, Carsten (2006). Language Testing: The
Social Dimension. Oxford: Blackwell Publishing.
126
EDUCARE 2015:2
Menken, Kate (2008). English learners left behind: Standardized
testing as language policy. Clevedon: Multilingual Matters.
Ministeriet for Familie- og Forbrugeranliggender (2007).
Sprogvurderingsmateriale til 3-årige. København.
Monsen, Marte (2014). Store forventninger? Læreropfatninger om
eksterne leseprøver. Oslo: Universitetet i Oslo.
Pettersvold, Mari & Østrem, Solveig (2012). Mestrer – mestrer ikke.
Jakten på det normale barnet. Oslo: Res Publica.
Schmidt, Lene (2013). Nationale statistikker, sprogkuffert og andre
kuriositeter til test af børn. Dansk Pædagogisk Tidsskrift 1(13),
50-59.
Servicestyrelsen (2011). Forskningskortlægning af behov for
sprogvurdering, effektive sprogindsatser og pædagogisk
efteruddannelse. Udarbejdet at Bleses, D, Højen, A., Lum, J.,
Markussen-Brown, J. & Andersen, M. K. for Servicestyrelsen.
Shohamy, Elana (2001). The power of tests. Harlow: Longman.
Sigsgaard, Erik (2014). Om børn og unges NEJ. København: Tiderne
Skifter.
Silverstein, Michael (1992). The indeterminacy of contextualisation:
When is enough enough? In Adrian DiLuzio & Peter Auer (Eds.).
The contextualization of Language. Amsterdam: John Benjamins.
Spolsky, Bernhard (1995). Measured words: The development of
objective language testing. Oxford: Oxford University Press.
Spolsky, Bernhard (1998). Sociolinguistics. Oxford: Oxford University
Press.
Weir, Cyril J.(2005): Language Testing and Validation. An Evidencebased Approach. Basingstoke: palgrave/macmillan
Widdowson, Henry G. (1996). Linguistics. Oxford: Oxford University
Press.
EDUCARE 2015:2
127
Bedömning på systemnivå
- En komparativ studie av stegsystemet
i språk i den svenska skolan och
språknivåer i Europarådets Common
European Framework of Reference
for Languages (CEFR)
Mats Oscarson
In the early 1970’s, the Council of Europe commenced work that aimed
at identifying levels of language learning in a transparent and generally
applicable way. The project resulted in the definition of six cardinal levels
of competence according to a descriptive model called the Common
European Framework of Reference for Languages. This made a strong
and lasting impact and the CEFR concept is now being employed both in
Europe and beyond as an important tool in the communication about goals
and activities in language teaching and assessment. The highly influential
work inspired the Swedish National Agency for Education (Skolverket) to
transpose the curricular goals for languages into an approximate CEFR
model encompassing 7 levels, or stages (steg), which would thereby,
among other things, enable comparison of features of language education
across cultural and national boundaries.This article describes a previously
unpublished study that investigated the conceptual relationship between
the 7 stages of language ability laid out in Swedish school curricula and
the 6-level CEFR system (Oscarson 2002). Against the background of the
increasingly strong interest in the latter system, the purpose of the article
is to update and review the analytical procedure and the results of this
study. A text analytics method for stepwise comparison of the systems
was devised and used in the alignment. Areas of competence were
matched for content, and descriptions of abilities in the Swedish curricula
close in meaning to descriptors in the CEFR system were identified.
Conclusions were drawn about the interrelationships that exist between
128
EDUCARE 2015:2
- En komparativ studie av stegsystemet i språk i den svenska skolan och...
the systems and points on the two scales. The results indicate where
any given stage in a Swedish language curriculum is located on the CEFR
scale. The general conditions for the work undertaken, as well as possible
further research, are discussed.
Keywords: Common European Framework, CEFR, GERS, language
assessment, language proficiency scales
Mats Oscarson, Professor emeritus
Department of Pedagogical, Curricular and Professional Studies,
University of Gothenburg
Mats.Oscarson@ped.gu.se
Inledning och bakgrund
I kursplanereformen år 2000 i den svenska skolan infördes ett nytt
system för beskrivning av kurser och mål i språk i den svenska
skolan (Skolverket 2000). Systemet består av sju successiva
språkfärdighetsnivåer, kallade Steg (1-7), som kurser i ämnena
engelska, moderna språk och teckenspråk för hörande relateras till.
Stegen visar på ett konkret och enhetligt sätt hur eleverna avancerar
i sina studier genom grundskolan och vidare genom den gymnasiala
utbildningen. Reformen ökade möjligheterna att se på lärandet av olika
språk i olika skolformer i ett gemensamt övergripande perspektiv.
Också de nyare kurs- och ämnesplaner som kom 2011 har denna
formella struktur, som framgår av ”Kommentarmaterial till kursplanen
i engelska”:
Grundskolans nya kursplan ingår liksom tidigare, tillsammans med
gymnasieskolan, i ett gemensamt system med generella och påbyggbara
språknivåer, så kallade steg. Utgångspunkten för detta system är
Europarådets ”Gemensam europeisk referensram för språk, lärande,
undervisning och bedömning” (GERS). Detta är ett vedertaget europeiskt
system med generella språknivåer.
EDUCARE 2015:2
129
MATS OSCARSON
Den nya kursplanen i engelska har ytterligare harmoniserats gentemot den
europeiska referensramen. Bland annat omfattar det centrala innehållet
de texttyper och kontexter för språkanvändning som förekommer i den
europeiska referensramen.
(Skolverket, 2011a, s 6)
I Skolverket (2011c, s 5) meddelas det vidare: ”Språknivåerna i stegen
är i princip desamma som tidigare” (dvs desamma som i Kursplaner
2000).
Stegindelningen bygger alltså på CEFR (på svenska GERS,
Gemensam europeisk referensram för språk), ett referenssystem som
har sin grund i ett långsiktigt målbeskrivningsarbete i språk organiserat
av Europarådet fr.o.m. början av 1970-talet samt i en till det arbetet
kopplad empirisk undersökning om sekvensering av språkkunskaper på
en nivåskala. Denna verksamhet resulterade så småningom i rapporten
Common European Framework of Reference for Languages: Learning,
teaching, assessment (Council of Europe, 2001), vilken också finns
översatt till svenska (Skolverket, 2009). CEFR berör flera olika aspekter
av organisation och lärande av språk, men det allmänna intresset för
arbetet har främst kommit att gälla definitionen av kunskapsnivåer
(levels of proficiency).
I den här artikeln beskrivs ett uppdrag för Skolverket som
genomfördes 2001-2002 och som främst gick ut på att undersöka hur
de sju språkstegen i Kursplaner 2000 innehållsmässigt och strukturellt
förhåller sig till CEFR-systemets sex Levels (Oscarson, 2002). I grunden
var det fråga om en text-analytiskt baserad jämförelse som utgick från
tolkningar av innebörden i beskrivningarna av mål i de två systemen
och som redovisades fortlöpande i skriftliga och muntliga rapporter
till uppdragsgivaren. Resultat angavs första gången i en preliminär
översättningstabell i publikationen Europeisk språkportfolio 16+
(Uppsala universitet, 2001). De mera slutgiltiga resultaten har därefter
använts (med endast marginella ändringar) av både Skolverket och
andra för att informera om relationen mellan Steg och CEFR-nivåer,
ofta med hjälp tabeller och figurer som anger de direkta sambanden
(jämför t.ex. Skolverket 2005; Skolverket 2011c, s. 7; Skolverket,
2012, s 28-29; Erickson, 2011, s 35; Stenberg, 2013, s 9). De slutsatser
som den föreliggande studien resulterade i har alltså anammats av
uppdragsgivaren och är väl kända i den språkdidaktiska diskussionen.
130
EDUCARE 2015:2
Beskrivningen av tillvägagångssättet vid fastställandet av dessa
samband har däremot inte publicerats tidigare (och har heller inte
refererats). Det har dock visat sig att det finns ett mer allmänt intresse
för undersökningen och för den grundläggande frågan om hur
kopplingen mellan språkstegen och CEFR faktiskt har åstadkommits
(vilket bl.a. framgått av förfrågningar till författaren). Samtidigt kan
nämnas att det är brukligt att grunden för uppgifter om kända test- och
kursnivåers förhållande till CEFR motiveras och beskrivs tydligt, men
uppenbarligen har sådan redovisning inte skett i tillräcklig omfattning
i det här fallet.1
Bristen på bekräftande undersöknings- och sambandsdata har också
påtalats i ett vidare forum. I EU-rapporten The Implementation of The
Common European Framework for Languages in European Education
System noteras att “several legal documents of the Swedish education
system are based on the CEFR” och sägs samtidigt att ”there are some
concerns about the implementation of the CEFR in Sweden: The
relation between the legal documents for education and the CEFR is
not empirically substantiated by any research study” (European Union,
2013, Section 4.5).
Syften
Det allmänna syftet med den här artikeln är därför att bidra med mer
information av det slag som efterfrågas. Det sker främst genom att för en
vidare krets aktualisera och uppdatera den ursprungliga redovisningen
av studien. Avsikten är främst att ge ett fortsatt tolkningsstöd för lärare
och andra som vill få en närmare uppfattning om vad kursplanernas
1 När det gäller test- och examinationsförhållanden finns det detaljerade anvisningar om hur man bör gå tillväga i denna sorts validering av de uppgifter
man lämnar. Se t.ex.Council of Europe (2009), som är en manual “specifically
focused on procedures involved in the justification of a claim that a certain
examination or test is linked to the CEFR” (sid 1). Det nämns också att manualen har använts på många olika sätt, bl.a. “to assist schools to develop procedures to relate their assessments to the CEFR” (s 2) och då mot bakgrund
av att “There are many contexts in which the examination or test leading to
a significant qualification is set by the teacher or school staff rather than an
external body” (s 3). Se också North (2009) om möjligheten att använda bl.a.
lärarbedömningar i studier av den här typen.
EDUCARE 2015:2
131
MATS OSCARSON
Steg i språk uttrycker i förhållande till det internationellt välbekanta
europeiska ramverket för språkstudier.
Ett annat syfte är av mera metodisk art, nämligen att uppmärksamma
proceduren för jämförelsen (som inte har beskrivits i tryck tidigare).
Den visar på en möjlig väg att gå om man vill länka nivåindelade
målbeskrivningar i olika studie- eller inlärningssystem till varandra.
En förutsättning för att metoden ska kunna tillämpas är bland annat att
målen är någorlunda konkret och tydligt specificerade. En del övriga
villkor för tillämpningen av metoden på det föreliggande materialet
anges i avsnittet Förutsättningar för studien och tillvägagångssätt
nedan.
Det empiriska underlaget till CEFR-skalorna
Konstruktionen av den europeiska referensramen bygger i huvudsak
på resultat från ett schweiziskt forskningsprojekt som genomfördes
vid mitten av 1990-talet och som har beskrivits utförligt i en
doktorsavhandling framlagd av Brian North (1995). Forskningen
finns också sammanfattad i Council of Europe (2001, Appendix B)
och Council of Europe (2002, kap 7).
Kortfattat och mycket förenklat uttryckt innebar Norths arbete följande.
Ett 30-tal språkfärdighetsskalor (med beskrivna nivåer) som
användes i olika undervisnings- och utvärderingssammanhang
samlades in och kategoriserades. Skalorna delades sedan upp i sina
beståndsdelar, dvs i de enskilda satser och meningar som tillsammans
utgör definitionerna av förmåga. Dessa enskilda uttryck refererade
man i arbetet till som deskriptorer (eng. descriptors). Exempel, i
svensk översättning, är: ‘Förstår tydligt långsamt tal i vardaglig
enkel konversation’, ‘Uttrycker sig flytande och spontant, nästan utan
ansträngning’, ‘Kan skriva ett personligt brev med beskrivningar av
erfarenheter, känslor och händelser’.
De tydligaste och mest relevanta av de samlade deskriptorerna
granskades, bearbetades och nivågrupperades sedan för att användas
i olika försök som gick ut på en validering av hela materialet. I denna
process fick lärare göra bedömningar av i vilken mån de enskilda
deskriptorerna stämde som beskrivningar på studerande vars färdigheter
132
EDUCARE 2015:2
de väl kände till. Lärarnas bedömningar analyserades sedan enligt en
speciell statistisk metod (s.k. Rasch-analys) som gjorde det möjligt att
fastställa slutliga skalnivåer för deskriptorerna och att eliminera sådana
som inte entydigt kunde inordnas på en skala. Slutprodukten blev
ett antal språkfärdighetsskalor uppbyggda av ”påståenden, utsagor”
(statements) på kända färdighetsnivåer.
Ett mycket stort antal lärare och studerande deltog i detta
utvecklingsarbete. Resultatet har som antytts tidigare fått mycket stor
användning, främst i Europa men också i andra delar av världen (se
t.ex. North, 2014; European Union, 2013).
På basis av detta arbete beskrivs i Europarådsrapporten bl.a. sex
grundläggande färdighetsnivåer i språk, s.k. Common Reference
Levels, inordnade under tre klassiska benämningar på stadier av
språkutveckling (nybörjare, fortsättare och avancerade). Systemet
betecknas på följande sätt:
C2
Mastery
C1
Effective operational proficiency
B2
Vantage
B1
Threshold
A2
Waystage
A1
Breakthrough
Proficient user
(Avancerat stadium)
Independent user
(Fortsättarstadium)
Basic user
(Nybörjarstadium)
Varje nivå beskrivs i ett antal termer av förmåga i språket (s.k.’Can Do’
statements). Exempel: ”Can deal with most situations likely to arise
whilst travelling in an area where the language is spoken.” Sammantaget
bildar CEFR-nivåerna en beskrivningsskala som kan användas av
myndigheter, språkutbildningsanordnare, läromedelsproducenter,
testföretag m.fl. för att informera om och tolka färdighetsnivåer i bl. a
kurser, läromedel och certifikat av olika slag.
CEFR omfattar ett stort antal skalor avseende skilda
färdighetsområden. Förutom de många skilda skalorna finns också
en generell skala kallad The global scale (se Appendix). Denna har
dessutom transformerats till en övergripande självbedömningsmatris
(a self-assessment tool) som fått mycket utbredd användning.
EDUCARE 2015:2
133
MATS OSCARSON
För närmare information om CEFR (GERS) hänvisas till Council of
Europe (2001) och Skolverket (2009). I den senare finns alla skalorna
översatta till svenska.
I rapporteringen använder jag en del förkortningar, enligt följande.
CEFR
GERS
SV
EV
hög
låg
HF
MI
MP
LF
SP
Common European Framework of Reference for Languages
Gemensam europeisk referensram för språk
Språkval (dvs i grundskolan)
Elevens val (dvs i grundskolan)
Övre delen av nivån (inom vissa Scales och Levels;
jfr avsnittet ”En närmare jämförelse”)
Nedre delen av nivån (dito)
Hörförståelse
Muntlig interaktion
Muntlig produktion
Läsförståelse
Skriftlig produktion
Andra tillämpningar av CEFR
CEFR-konceptet har på kort tid fått stort genomslag som ett
värdefullt referenssystem på områdena undervisningsplanering,
materialproduktion och färdighetsbedömning. Tillämpningarna
är många.2 Bland annat i utvecklingen av bedömnings- och
dokumentationsmodellen The European Language Portfolio (ELP),
som nu existerar i över ett hundratal språk- och målgruppsspecifika
versioner, har CEFR-nivåerna spelat en central roll.3 De används
till exempel, i lätt omredigerad form, som underlag för elevers
självbedömningar. Det sker dels med hjälp av en övergripande nivåoch färdighetstabell i s.k. Can do-form (”I can recognise familiar words
and very basic phrases concerning myself, my family and immediate
concrete surroundings when people speak slowly and clearly”
o.likn.), dels med hjälp av avsevärt mer omfattande checklistor med
2 Se t.ex. North (2014) samt rapporten Case Studies från Europarådet (Council of Europe, 2002) som beskriver användningen av CEFR i ett flertal länder.
3 Närmare information om The European Language Portfolio finns på Europarådets hemsida http://www.coe.int/t/dg4/education/elp/
134
EDUCARE 2015:2
motsvarande innehåll. Också dessa är organiserade i de sex nivåerna
(A1-C2) med fördelning över ett antal färdighetsområden.
En annan mycket stor satsning, i vilken CEFR-skalorna används
som ett praktiskt orienteringsinstrument, är det internetbaserade
bedömningssystemet DIALANG (Diagnosis of Language Skills) (se
Huhta m.fl. 2002; Alderson, 2005). Här erbjuds kostnadsfria test i 14
olika europeiska språk (danska, engelska, finska, franska, grekiska,
iriska, isländska, italienska, nederländska, norska, portugisiska,
spanska, svenska och, tyska). Resultaten rapporteras i form av
uppnådda CEFR-nivåer, från A1-C2.4
Förutsättningar för studien, tillvägagångssätt
och resultat
Av självklara skäl kunde jag bara ta in i den här jämförande analysen
sådana färdighetskategorier som återfinns i båda nivåsystemen (Steg
och Levels). Därför fick exempelvis beskrivningarna av kulturmål
utgå, eftersom de saknas i CEFR. Mål som närmast är aktuella för
lite äldre språkanvändare, t.ex. ‘Note-taking (Lectures, seminars,
etc)’ och ’Goal-oriented co-operation (e.g. Repairing a car, discussing
a document, organising an event)’, liksom sådana som inte finns
uttryckligen representerade bland Steg-systemets Mål, t.ex. förståelse
av ’Public announcements’ och ‘Watching TV and film’, fick av samma
anledning lämnas åt sidan.
En generell skillnad mellan systemen är att i Stegen intar de s.k.
metakognitiva aspekterna på inlärningen (“medvetandemålen”,
reflektionen kring de egna studierna och lärandet) en bestämd plats
i beskrivningarna (vilket de inte gör i CEFR). Utvecklingen av det
viktiga självständiga tänkandet tas in som en komponent redan från
början och hela vägen upp t.o.m. Steg 7. Detta speglas i formuleringar
som “kunna reflektera över hur den egna inlärningen av t.ex. ord och
fraser går till” (Steg 1), “kunna reflektera över och dra slutsatser om
sitt sätt att lära sig språket” (Steg 4), “kunna utvärdera sitt arbete
som ett led i att förändra och förbättra sitt lärande” (Steg 6). Sådana
4 Programmet kan laddas ner gratis på projektets hemsida: http://www.
lancs.ac.uk/researchenterprise/dialang/about
EDUCARE 2015:2
135
MATS OSCARSON
metakognitiva färdigheter är inte inkluderade i CEFR Levels och jag
har alltså inte kunnat ta hänsyn till dem i min jämförelse.
Jag började mitt sorteringsarbete med att bryta ner var och en av de
sju enskilda Stegens ”Mål som eleverna skall ha uppnått efter avslutad
kurs” i sina skilda kategorier av deskriptorer (beskrivningar), dvs i sina
delfärdigheter (hörförståelse, muntlig interaktion, muntlig produktion,
läsförståelse, skriftlig produktion). Detta var lätt gjort, eftersom de
återkommer i en given ordningsföljd i de olika Stegen.
Sedan matchade jag de beskrivna delfärdighetsområdena i Stegen
mot de motsvarande områdena i skilda CEFR-skalor. På grund av att
inte alla skalor är direkt relevanta (jfr ovan), och dessutom på grund
av att de är så många, fick jag göra ett urval enligt Tabell 1. Alla de
som enligt min bedömning är centrala på varje färdighetsområde är
dock med. Beteckningarna till vänster är mina egna (dvs de är inte
betecknade så i Steg-beskrivningarna). Färdigheterna listas i den
ordning de beskrivs inom de olika Stegen.
I fråga om delfärdigheten Skriftlig produktion (SP) har jag, som
framgår av tabellen, också gjort en del jämförelser med beskrivningar
i två skalor i CEFR-kategorin Written interaction, närmare bestämt
Overall written inter-action och Correspondence. Dessa innehåller
också bestämningar av den rent produktiva förmågan, vilket gav mig
en något bredare bas för jämförelserna. Annars är det ju så att ‘Skriftlig
interaktion’ inte specificeras på något mer explicit sätt bland målen i
Steg-systemet (medan ‘Muntlig interaktion’ gör det). Beskrivningarna
av skriftlig förmåga i Steg-systemet är ganska konsekvent fokuserade
på produktionen (dvs snarare än interaktionen). Exempel: “kunna göra
sig förstådd i skrift i mycket enkel form för att meddela något” (Steg 1),
“kunna uttrycka sig i enkel form i skrift för att berätta, beskriva eller
informera om något” (Steg 3), “kunna begära och ge information i
skrift samt berätta och beskriva något” (Steg 4), “kunna sammanställa
och skriftligt redovisa ett arbete …” (Steg 7). Written interaction
exemplifieras allmänt i CEFR med bland annat sådana numera
vanliga språkliga aktiviteter som “passing and exchanging notes,
memos etc. when spoken interaction is impossible and inappropriate”,
“correspondence by letter, fax, email etc”, “participating in on-line
or off-line computer conferences” (Council of Europe, 2001, avsnitt
4.4.3.2).
136
EDUCARE 2015:2
Tabell 1. Delfärdigheter i Steg-beskrivningar och motsvarande delfärdighetsskalor
i CEFR-systemet
Delfärdighet i Stegbeskrivningar
Delfärdighetsskala i CEFR
Hörförståelse (HF)
Aural reception (listening)
Overall Listening Comprehension
Understanding conversation between native
speakers
Listening as a member of a live audience
Listening to announcements and instructions
Listening to audio media and recordings
Muntlig interaktion (MI) Spoken interaction
Overall spoken interaction
Understanding a native speaker interlocutor
Conversation
Informal discussion (with friends)
Formal discussion and meetings
Informal exchange
Muntlig produktion (MP) Oral production (speaking)
Overall oral production
Sustained monologue: Describing experience
Sustained monologue: Putting a case
Läsförståelse (LF)
Visual reception (reading)
Overall reading comprehension
Reading correspondence
Reading for orientation
Reading for information and argument
Reading instructions
Skriftlig produktion (SP) Written production
Overall written production
Creative writing
Reports and essays
Written interaction
Overall written interaction
Correspondence
EDUCARE 2015:2
137
MATS OSCARSON
Efter matchningen av färdighetsområden gick jag vidare till att
försöka avgöra hur beskrivningarna i Steg-systemet betydelse- och
innehållsmässigt förhöll sig till enskilda deskriptorer i CEFR-systemet.
Eftersom det knappast i något enda fall finns en direkt jämförbarhet
mellan systemen i det här avseendet, blev det ofta fråga om tolkningar
av inbördes förhållanden mellan formuleringar på svenska och
engelska. I många fall var avgörandena svåra och det var ofta så att
jag hellre fick avstå från att pricka in förmodade motsvarigheter än att
ta fasta på dem och därmed riskera att dra felaktiga slutsatser. På det
hela taget kändes det dock fullt möjligt att hitta det antal länkar som
behövdes för en någorlunda pålitlig skattning.
För att försöka åstadkomma så oberoende och neutrala jämförelser
som möjligt analyserade jag Stegen i slumpvis ordning. Om jag hade
tagit Stegen i strikt ordningsföljd hade jag antagligen anpassat mig –
successivt – efter mina egna närmaste föregående serie bedömningar.
I grunden analyserade jag också Stegen ett i taget (i jämförelse med
Levels) men tog i viss mån hänsyn till att de, som det sägs i kursplanerna,
bygger på varandra. På samma sätt gick jag tillväga när det gäller
Levels. Anledningen till att det inte är möjligt att fullt ut analysera
”kumulativt” är att ingendera skaltypen är endimensionell, dvs de är
inte uppbyggda med utgångspunkt i definierade färdighetskategorier
som återkommer längs hela skalan. Rent praktiskt är det heller knappast
möjligt att åstadkomma detta i ett kursplanesammanhang. Se vidare
kommentarerna efter resultatredovisningen (avsnittet ”Skalornas
uppbyggnad”).
Till att börja med gjorde jag en mycket allmän bedömning av hur
de två skalsystemen förhåller sig till varandra. Den är baserad på en
jämförelse mellan beskrivningarna av de sju Stegen och den globala
CEFR-skalan, dvs Common Reference Levels: global scale (Council
of Europe, 2001, sid 24; se också Appendix).
Resultatet framgår av Tabell 2. Observera att det är de i förhållande till
Stegen närmast skattade CEFR-nivåerna som anges i högerkolumnen,
inte nödvändigtvis nivåer som exakt motsvarar Stegen. Detta framgår
också av att olika steg kan stå mittemot en och samma CEFR-nivå (dvs
i den här preliminära skattningen). Det är ett ganska brett register av
färdigheter som ryms inom varje sådan nivå.
138
EDUCARE 2015:2
Tabell 2. Översiktlig skattning av samband mellan Steg (kurser) och Levels,
baserad på en jämförelse mellan Steg (kurskoder inom parentes) och den
globala CEFR-skalan
S
T
E
G
Kurser (kurskoder)
Lpl 2000
Kurskoder
Engelska/Moderna språk
Lpl 2011
Preliminärt
skattad
CEFR Level
7
Eng C (MSPR1207)
ENG7 / MOD7
C1
6
Eng B (MSPR1206)
ENG6 / MOD6
B2
5
Eng A (MSPR1205)
ENG5 / MOD5
B1
4
Eng 9 (MSPR1204)
Åk 9 / MOD4
B1
3
Mod.spr. (MSPR1203)
MOD3
A2
2
Mod.spr. (SV)9 (MSPR1202)
Åk 6 / Åk 9 SV MOD2
A2
1
Eng 5, Mod.spr. (EV)9
(MSPR1201)
-- / Åk 9 EV MOD1
A1/A2
Det här blev naturligtvis en mycket grov jämförelse, men den
visar genast på det förhållandet att Stegen inte täcker in hela den
mycket vida CEFR-skalan. Denna sträcker sig ju från en allra lägsta
fungerande språknivå, där man t.ex. bara kan ”understand and use
familiar everyday expressions and very basic phrases...” (A1) upp
till den synnerligen avancerade nivå där man exempelvis “Can
understand with ease virtually everything heard or read” (C2). I den
här översiktliga jämförelsen tycks kursplanernas sju utbildningssteg
svara mot 3.5 nivåer på CEFR-skalan. Därmed skulle man på det hela
taget kunna säga att eleven behöver ta två Steg i skolan för att förflytta
sig en nivå på CEFR-skalan. (Jämför också redovisningen nedan i
avsnittet Utvidgad jämförelse.)
En närmare jämförelse
Jag behövde förstås tränga lite djupare in i underlagen för att kunna
göra en säkrare bedömning och fortsatte då med att granska ytterligare
material i CEFR som kan belysa relationen till Steg-definitionerna.
Utgångspunkten är i det här fallet de ytterligare kalibrerade
deskriptorer (‘scaled illustrative descriptors’) som togs fram i det
schweiziska forskningsprojektet (North, 1995) och som resulterade i
EDUCARE 2015:2
139
MATS OSCARSON
det utvecklade skalsystem som beskrivs i Council of Europe (2001),
kap 4 och Appendix B.
De skalor jag i första hand kunde använda, dvs med tanke på deras
inriktning i förhållande till Steg-definitionerna, är de som anges i
Tabell 1 ovan.
För att det skulle bli möjligt att göra direkta jämförelser mellan
Steg och Levels (CEFR-nivåer) var det nödvändigt att göra vissa
sammanvägningar av beskrivningar i vartdera systemet. Behovet av
sådan sammanvägning i CEFR beror på att detta system totalt sett är
avsevärt mer utvecklat än Stegen. För att ta ett exempel: Kategorin
Hörförståelse sammanfattas kort på ett ställe (omfattande 1-3 rader) i
varje Steg, medan den i CEFR karakteriseras i flera olika skalor och
med betydligt mer text. Jag jämförde alltså i mitt fall den enskilda
hörförståelsebeskrivningen i varje Steg med motsvarande färdighet
som den beskrivs i fyra olika skalor i CEFR.
För att jag skulle kunna komma fram till en sorts generell CEFRnivå som svarar mot ett givet Steg fick jag därför väga samman fem
Level-skattningar för färdigheterna HF, MI, MP, LF och SP i varje
Steg (jämför Tabell 3) till en genomsnittlig Level (angiven i kolumnen
längst till höger). Det är alltså denna som blir den generella CEFR-nivå
som kan sägas motsvara det givna Steg som jag utgick från.
Tabell 3 sammanfattar resultaten av den fördjupade jämförelsen.
Angivelse av två nivåer med bindestreck emellan (t.ex. A1-A2) innebär
att den skattade sammanvägda nivån ligger i registret mellan de två,
dvs i det här fallet i registret A1 (hög)-B1 (låg).
I vissa CEFR-skalor finns en delningslinje mellan lägre och högre
beskrivningar inom nivån.5 Uppdelningen förekommer dock bara i
5 I Council of Europe (2001) använder man beteckningen ’criterion level’ för
exempelvis A2, dvs om nivån inte är uppdelad. Beskrivningarna kan då tolkas
som minimikraven för hela nivån (jfr Andered, 2001, s. 31: ”De definitioner
som används för de olika nivåerna i CEF är att betrakta som ’godkändkrav’
för dessa nivåer”). Om A2 är uppdelad på A2.1 och A2.2 kallar man den förra
för ’criterion level’ och den senare för ’plus level’. A2.1 får alltså tolkas som en
beskrivning av vad man lägst ska ha uppnått för att ligga på nivå A2. A2.2 innebär hög prestationsnivå inom densamma. Obs att skalnivåerna A1, C1 och
C2 inte har denna uppdelning beroende på att det bara finns empiriska resultat för de sammanlagt 9 nivåerna (dvs inkl A2.2, B1.2 och B2.2). För närmare
detaljer om dessa förhållanden, se avsnitt 3.5 i Council of Europe (2001) resp
North (1995), avsnitt 12.1.2 och passim.
140
EDUCARE 2015:2
mittregistret av dessa skalor (nivåerna A2, B1 och B2) och är inte
heller där systematiskt genomförd. I en del skalor finns den, i andra
inte. I Tabell 3 markerar jag denna i vissa fall möjliga preciseringen
med ’låg’ resp ’hög’ inom parentes.
Tabell 3. Preliminär skattning av samband mellan Steg och CEFR Levels:
Per enskilt färdighetsområde och sammanvägt
S
T
E
G
CEFR Level per färdighetsområde
SammanKurs
vägd
HörMuntlig
Muntlig
LäsSkriftlig
(exempel)
preliminär
förståelse interaktion produktion förståelse produktion
CEFR level
7
Eng C
B2 (hög)
B2 (hög)
B2 (hög)
B2
B2
B2 (hög)
6
Eng B
B2 (hög)
B1 (hög)
B1
[B1-B2]
B2 (låg)
B1-B2 *
5
Eng A
B2 (låg)
B1 (hög)
B1
[B1]
B1
B1 (hög)
4
Eng 9
B1-B2
B1 (låg)
A2-B1
B1
B1 (låg)
B1 (låg)
3
Mod.spr
B1
A2 (hög)
A2
A2–B1
A2-B1
A2-B1 **
2
Mod spr
B1 (låg)
A2 (hög)
A2 (låg)
A2
A2
A2
1
Eng 5
A1-A2
A2 (låg)
A2 (låg)
A1-A2
A1-A2
A1-A2***
* Dvs medelnivån för de två, som är B1 (hög)-B2 (låg)
** Dvs medelnivån för de två, som är A2 (hög)-B1 (låg)
*** Dvs medelnivån för de två, som är A1 (hög)-A2 (låg)
Den fördjupade analysen ger en mer nyanserad bild av sambanden än
den jag antydde i det föregående avsnittet (”Översiktlig jämförelse”).
Skattningarna är lite mer exakta och visar tydligare att det inte är så
enkelt att direkt översätta de sju stegen till nivåer på CEFR-skalan.
Skalpunkter ligger inte mitt emot varandra i de flesta fall. Det var ju
heller inte väntat att de skulle göra det, bl.a. av det skälet att det inte
är samma antal punkter på de två skalorna. Stegen faller alltså på lite
olika sätt i förhållande till Levels som de är definierade.
Det kan vara befogat att återigen påpeka att jämförelserna inte
kan uttryckas i exakta kvantitativa mått, eftersom de är baserade på
tolkningar av textinnehåll. I viss mån har jag försökt markera detta
genom att sätta de något mer osäkra skattningarna inom hakparentes.
EDUCARE 2015:2
141
MATS OSCARSON
Utvidgad jämförelse
Bedömningarna har hittills blivit ganska allmänna och ungefärliga. För
att få ytterligare underlag för jämförelsen beslöt jag mig därför för att
gå utanför de egentliga Steg-beskrivningarna (Målen) och också titta
på de färdighetsdefinitioner som finns i Betygskriterier för varje Steg.
Detta är möjligt av två skäl. För det första uttrycks kriterierna i absoluta
termer, dvs de beskriver konkreta kompetenser (som i CEFR) och inte
relativ kompetens, som i det gamla normrelaterade betygsystemet. För
det andra talar Målen om vad ”eleverna skall ha uppnått efter avslutad
kurs” och därför bör åtminstone betyget Godkänd, men strängt taget
inget annat betyg (och motsvarande för betyget E enligt 2011 års
kursplaner och Skolverket 2012, s 28), också kunna ses som ett uttryck
för var nivån ligger förmågemässigt. Högre betyg som Väl godkänd
och Mycket väl godkänd bör logiskt sett markera ”delsteg” på vägen
till nästa nivå (Steg). Det vore således inte rimligt att i stället ta fasta på
färdighetskriterierna (kunskapskraven) för den andel av eleverna som
”väl” uppnått nivån – och särskilt inte bara för den ganska lilla andel
som ”mycket väl” uppnått nivån.
Argumentet för att ta in ett betygskriterium i måldiskussionen och
skaljämförelsen är alltså helt enkelt det att betyget uttrycker grad
av måluppfyllelse, dvs nivå. Kriterierna är direkta härledningar ur
kursplanernas målbeskrivningar och presenteras t.ex. i Skolverket
(2000) som en underavdelning till det övergripande avsnittet Mål.
Jag fogade således kriterierna för betyget Godkänd till det underlag
som jag utgått ifrån i analyserna ovan, dvs de rena målbeskrivningarna
per Steg. Stegbeskrivningar plus Kriterier för betyget Godkänd blev
därmed det nya något utvidgade underlaget. Kriterierna blev i princip
en ny kategori som jag tolkade innebörden av för sig.
Jag summerar resultaten av denna utvidgade jämförelse i Tabell
4. Den förändring som denna innebär i förhållande till uppgifterna i
Tabell 3 anger jag så här:
142
/+
/–
/=
/?
Den angivna bedömningen ska höjas
Den angivna bedömningen ska sänkas
Bedömningen ändras inte
Osäkerhet om bedömningen ska ändras
EDUCARE 2015:2
Tabell 4. Slutlig skattning av samband mellan Steg, inkl. kriterier för betyget
Godkänd, och CEFR Levels: Per enskilt färdighetsområde och totalt (sammanvägt)
S
T
E
G
CEFR Level per färdighetsområde
SammanKurs
vägd
HörMuntlig
Muntlig
LäsSkriftlig
(exempel)
slutlig
förståelse interaktion produktion förståelse produktion
CEFR level
7
Eng C
B2(hög)
/=
B2 (hög)
/?
B2 (hög)
/-
B2
/=
B2
/=
B2 (hög)
6
Eng B
B2(hög)
/=
B1 (hög)
/+
B1
/+
[B1-B2]
/+
B2 (låg)
/+
B2
5
Eng A
B2 (låg)
/=
B1 (hög)
/=?
B1
/=?
[B1]
/+
B1
/=?
B1 (hög)
4
Eng 9
B1-B2
/+
B1 (låg)
/=
A2-B1
/?
B1
/–
B1 (låg)
/=
B1 (låg)
3
Mod.spr
B1
/=
A2 (hög)
/–
A2
/=
A2–B1
/?
A2-B1
/+
A2 (hög)
2
Mod spr
B1 (låg)
/-
A2 (hög)
/–
A2 (låg)
/=
A2
/=
A2
/+
A2
1
Eng 5
A1-A2
/=
A2 (låg)
/+
A2 (låg)
/=
A1-A2
/-
A1-A2
/+
A1-A2 *
* Dvs medelnivån för de två, som är A1 (hög)-A2 (låg)
Som framgår av tabellen påverkas inte de tidigare resultaten mycket
efter tillägget av betygskriterierna. Det blir dock en liten förändring
(dragning uppåt) när det gäller Steg 6, som får en något tydligare B2profil. Annars är det många likhetstecken, och plus- och minustecknen
tenderar att ta ut varandra. För övrigt var heller inte mycket annat
att vänta. Definitionen av betyget Godkänd bör ju ligga i linje med
målbeskrivningen för resp Steg (och som ju kan betraktas som
”minimimålet” för steget i fråga).
De sju stegen i språk i svensk skola sträcker sig alltså från hög A1nivå till hög B2-nivå. Spännvidden är, i CEFR-termer, ungefär 3.5
nivåer. Detta motsvarar drygt hälften av de sammanlagt sex ’common
reference levels’ som är definierade i Council of Europe (2001).
Med endast obetydliga justeringar har denna skattning gällt under de
två senaste läroplanerna. I den senaste sägs t.ex.: ”Skolverkets officiella
beskrivning av 2011 års kursplaners relation till referensramen är
följande, sett till ingångsnivåer/betygssteget E i respektive språksteg:
Steg 1–A1 (hög); Steg 2–A2; Steg 3–A2 (hög); Steg 4–B1; Steg 5–B1
EDUCARE 2015:2
143
MATS OSCARSON
(hög); Steg 6–B2; Steg 7–B2 (hög).” (Skolverket, 2012, s 28). (Se
också Skolverket, 2011a, s 7).
En nederländsk undersökning
Från Nederländerna (CITO, Arnhem, och The Netherlands Institute
for Curriculum Development, SLO) har rapporterats en studie med
ungefär samma syfte som den föreliggande och som jag därför kort
refererar här (för detaljer, se van Hest 2002 och van Hest, de Jong
& Stoks, 2001). Uppgiften gick ut på att länka nationella mål i språk
(’foreign languages’) till CEFR-nivåerna, dvs skalan A1-C2. Man
gjorde bl.a. en innehållsanalys av målbeskrivningarna för följande
gymnasieutbildningar (program) i det nederländska skolsystemet:
VWO
HAVO
VMBO
Pre-university education
Senior general secondary education
Pre-vocational secondary education
1 Basic vocational program
2 Middle-management vocational program
3 Theoretical or combined program
Innehållsanalyserna gjordes med utgångspunkt i beskrivningar av varje
programs olika övergripande mål, till vilka också kopplas mer konkreta
exemplifierande kommentarer i form av en s.k. ”niveaumeter” (”level
indicator”) med uppgifter om språkliga innehåll, svårighetsnivåer m.m.
De undersökta färdighetsområdena var bl.a. engelsk läsförståelse,
hörförståelse och muntlig förmåga (de tyska och franska språken
undersöktes också men redovisas inte här). Några resultat av direkt
intresse för oss ges i Tabell 5. CEFR-nivåangivelserna avser det lägre
resp det högre skiktet inom nivån, motsvarande mina beteckningar
(låg) resp (hög) i avsnitten ”En närmare jämförelse” och ”Utvidgad
jämförelse” ovan.
144
EDUCARE 2015:2
Tabell 5. Sambandet mellan kunskapsnivåer i nederländska programmål i
engelska för secondary education och CEFR-nivåer enligt van Hest, de Jong &
Stoks (2001)
Reading
Listening
Speaking
VWO
Pre-university education
B2 (hög)
B2 (hög)
B2 (låg)
HAVO
Senior general secondary
education
B2 (låg)
B2 (låg)
B1 (hög)
VMBO
Pre-vocational secondary
Education
1. Basic vocational program
B1 (låg)
-
-
2. Middle management voc
progr
B1 (låg)
A2 (hög)
A2 (låg)
3. Theoretical/combined
program
B1 (hög)
B1 (låg)
A2 (hög)
Med tanke på att svenska och nederländska utbildningsmål i språk är
ganska likartade kan man säga att utfallet överensstämmer ganska väl
med de resultat jag kom fram till för våra svenska Stegs del (jämför
Tabell 4). Resultatet är också i linje med erfarenheterna från en empirisk
studie som vi tidigare genomförde i ett svensk-holländskt samarbete
och som bl.a. gick ut på att göra vissa jämförelser mellan provdata
genererade i våra två utbildningssystem (de Jong och Oscarson, 1990).
Programmet VWO (högskoleförberedande) ligger i sin målbeskrivning
på hög B2-nivå, dvs lika med vårt Steg 7 enligt resultaten i den här
rapporten. Dock förefaller det som om målen för HAVO och VMBO,
som ligger närmare våra yrkesprogram, är något lågt satta i förhållande
till motsvarande svenska målangivelser.
Sammanfattningsvis torde man kunna säga att den nederländska
studien ger visst stöd för de resultat som kommit fram i den föreliggande
svenska undersökningen.
Diskussion
Avslutningsvis vill jag nämna något om en del iakttagelser och
erfarenheter som jag gjort under arbetets gång och som kan vara till
hjälp vid försök att värdera och använda resultaten. Först några ord om
de skalsystem som jämförts (CEFR och Steg).
EDUCARE 2015:2
145
MATS OSCARSON
Ej helt jämförbara skalor
Innehållsligt skiljer sig de två bedömningssystemen åt i vissa
avseenden. Så innefattar till exempel definitionerna av Steg också ‘den
kulturella komponenten’ (kulturmålen), liksom förmåga till reflektion
kring och organisation av inlärningsarbetet (metakognitiva mål). Dessa
typer av mål saknas på det hela taget i CEFR. Å andra sidan bygger
CEFR på vissa språkliga och kommunikativa kategorier som inte ingår
i specifikationerna av Stegen (t.ex. Note-taking, Audiovisual reception
och Orthographic control). Det är således viktigt att komma ihåg att
ingetdera systemet har kunnat tas in i sin helhet i jämförelsen. Både
Stegen och CEFR innehåller mer än vad som har varit rimligt eller
möjligt att väga in här.
Otydlighet i beskrivningarna
En del deskriptorer visade sig egentligen vara lite för korta och vaga för
att de skulle kunna tolkas och användas i den här jämförelsen. Exempel
i Steg-systemet är “kunna informera muntligt på ett strukturerat sätt”
(Steg 7, Muntlig produktion) och ”Eleven talar begripligt och med
sammanhang” (Steg 4, muntlig produktion, betyget G). I Levels
finns exempel som ‘Can agree and disagree with others’ (Informal
discussion, A2) och “Can narrate a story” (Sustained monologue, B1).
Sådana beskrivningar ger egentligen inte tillräcklig information om
innehållet i de mål som avses. CEFR saknar dessutom deskriptorer för
vissa nivåer i en del skalor (”No descriptor available”). Detta bidrar
också till en viss osäkerhet i jämförelsen totalt sett.
Skalornas uppbyggnad
Det bör vidare observeras att ingetdera skalsystemet är helt logiskt eller
konsekvent uppbyggt om man strikt beaktar de begreppskategorier
som legat till grund för utformningen av deskriptorerna, eller om
man ser till systematiken i användningen av dem. Detta har förstås
sina förklaringar men kan göra jämförelser ganska svåra. Det blir vid
läsningen av skaltexterna ibland inte helt klart vad konstruktörerna
tagit fasta på i sina formuleringar. Några exempel:
146
EDUCARE 2015:2
I de svenska Stegen refereras bara i något enstaka fall till det viktiga
och ofta betonade målet “vilja och våga” (dvs att använda språket). Ett
omnämnande förekommer i Steg 5, under muntlig interaktion (“vilja, våga
och kunna utan förberedelse delta i samtal…”), men inte under någon
annan interaktiv färdighet finns det med. Ett annat centralt färdighetsmål,
“ha förmåga att bearbeta och förbättra den egna produktionen”, anknyts
det till i en färdighet (Steg 5, skriftlig produktion), men det förekommer
inte med avseende på någon annan färdighet.
Brist på konsekvens i det här avseendet kännetecknar i högre grad
Levels. Där beror den dock på den speciella vetenskapliga metod
man använde vid konstruktionen av hela skalsystemet. Levelsbeskrivningarna kom att bestämmas genom en empirisk urvalsprocess
där bara de deskriptorer som i praktiska studier visat sig fungera bra
som nivåangivare (oavsett begreppslig typ) togs med i de slutgiltiga
skalorna. Därför blev det också en ganska varierad blandning av
språkliga dimensioner och förmågor som kom att ingå i CEFR-skalorna.
Även om det på det hela taget finns en tydlig allmän struktur i de
två skalsystemen så är inget av dem helt systematiskt uppbyggt och de
är naturligtvis heller inte kongruenta till innehållet. Det är snarare så
att det finns vissa grundläggande överensstämmelser mellan dem, men
att de samtidigt uppvisar vissa strukturella och innehållsliga skillnader
som gör att försök till kalibrering av det slag som jag rapporterat här
blir svåra och relativt ungefärliga. Andra författare har gjort liknande
påpekanden (van Hest & Staatsen, 2002).
Avgränsning och möjlig uppföljning
I det här arbetet har jag jämfört åsyftade färdighetsnivåer som de
beskrivs i dokumenten Council of Europe (2001) och Skolverket
(2000; 2011a; 2011b). Det är här alltså inte fråga om en studie av de
facto uppnådda nivåer, vare sig i ett CEFR- eller Steg-perspektiv. I
fråga om Steg-beskrivningarna har jag utgått ifrån att dessa så att säga
stämmer med verkligheten, dvs att elever som klarat de olika kurserna
med godkänt betyg på det hela taget (genomsnittligen) också behärskar
det som anges som mål för de motsvarande Stegen. Om det i realiteten
förhåller sig på det sättet kan dock inte med säkerhet avgöras av den
här eller liknande studier. I den nederländska undersökningen refererad
ovan fann man t.ex. att de faktiskt uppnådda färdighetsnivåerna,
EDUCARE 2015:2
147
MATS OSCARSON
undersökta med hjälp av de reguljära nederländska examensproven
(språktest), rätt ofta avvek från programmens beskrivningar av målen,
”the intended levels”. Avvikelserna gick både uppåt och nedåt. Engelsk
läs- och hörförståelse tenderade att vara bättre i verkligheten än ”på
papperet”, den muntliga förmågan däremot svagare.
En angelägen uppföljning är därför att t.ex. med hjälp av erfarna
lärares bedömningar, och/eller med hjälp av existerande eller särskilda
för syftet insamlade provdata, empiriskt fastställa uppnådda kursmål
i CEFR-termer. Vi skulle då på ett någorlunda säkert sätt kunna
bestämma hur olika genomgångna kurser med godkända elevresultat
typiskt förhåller sig kunskapsmässigt till sekvensen av Common
Reference Levels (A1-C2). Anvisningar för hur sådan validering av
korrespondensen mellan stegangivelser och CEFR-nivåer kan göras
har utarbetats av Europarådet.6 Med tanke på att CEFR fått en mycket
snabb spridning, och av allt att döma kommer att få en allt större
betydelse framöver som en internationellt erkänd referensram, är det
viktigt att få en sådan studie genomförd.
I en ytterligare vidareutveckling av undersökningen skulle man
kunna gå in på en granskning av de statistiska egenskaperna hos
de deskriptorer som i slutändan kom att ingå i de olika CEFRskalorna och som på något sätt kan kopplas till målformuleringar i
Steg-systemet. På så sätt kunde ett bättre underlag för jämförelser
skapas. Utgångspunkten vore lämpligen den fylliga beskrivning av
det grundläggande utvecklingsarbetet med skalmodellen som ges i
North (1995). Samtidigt kunde man jämföra med tillvägagångssättet
i liknande arbete inom språkbedömningsprojektet DIALANG, som i
mycket är anknutet till utarbetade principer och framtagna material i
CEFR-projektet. (Jämför beskrivningar i Huhta m.fl., 2002.)
6 Se Council of Europe (2009) och fotnot 1 ovan.
148
EDUCARE 2015:2
Sammanfattning
En textbaserad nivåjämförelse har gjorts mellan beskrivningar av
successiva kursmål i språk i den svenska skolan (Stegsystemet,
7 nivåer) och beskrivningar av kunskaper i språk enligt den europeiska
CEFR-skalan (6 nivåer). Jämförelsen gav bl.a. följande resultat i starkt
sammandrag:
• En CEFR-nivå svarar mot knappt två Steg i den
svenska progressions-modellen.
• Nivåerna för godkänt kursbetyg sträcker sig över c 3.5
CEFR-nivåer (från övre delen av A1 till övre delen av B2).
• Nivåer i de två systemen korresponderar enligt följande tabell
(beträffande kurser och kurskoder, se Tabell 2):
Tabell 6. Sammanfattning av samband mellan Steg/kurser i språk
och CEFR-nivåer
STEG
CEFR level
7
B2 (hög)
6
B2
5
B1 (hög)
4
B1 (låg)
3
A2 (hög)
2
A2
1
A1 (hög)-A2 (låg)
Analysen visade att det finns vissa innehållsliga och begreppsliga
skillnader mellan skalsystemen som gör strikt jämförelse mellan
dem något svåra. Slutsatsen är dock att språkstegen tills vidare kan
tolkas på CEFR-skalan i en mer allmän betydelse, i enlighet med
utfallet av den här studien. För säkrare länkning rekommenderas
kompletterande forsknings- och utvecklingsarbete, främst sådant som
innebär kontrollerad mätning och kontroll av elevers faktiskt uppnådda
kunskaper på de 7 kursnivåerna.
EDUCARE 2015:2
149
MATS OSCARSON
Efterskrift
Den här komparativa studien startade först som ett forskningsuppdrag
från Skolverket år 2001 (Beslut, Dnr 37-2001-773). Genomförandet
samt preliminära resultat och delrapporter diskuterades vid arbetsmöten
på Skolverket 10/6 2002 och 19/12 2002 (sammankallande i båda var
undervisningsrådet Ingela Nyman). Vid båda antogs vissa förslag till
komplettering av arbetet och ändringar i en preliminär rapporttext
infördes. Året därpå (18/8 2003) hölls ett heldagsmöte på Skolverket
under rubriken ”Jämförelser mellan svenska språkkursplaner och
Common European Framework of Reference” med syfte att ”diskutera
fortsatt arbete med jämförelser mellan kursplanerna i språk och
Framework” (sammankallande var undervisningsråden Eva Jönsson
och Tommy Lagergren). Till detta möte var en reviderad version av
rapporten (Oscarson 2002) utskickad som underlag för diskussionen.
På grund av ett sedan dess starkt ökande intresse för CEFR-konceptet
och dess tillämpningar, både här hemma och internationellt, har
originalrapporten i vissa delar vidarebearbetats och sammanfattats
under 2014 (på eget initiativ). Referenser har också uppdaterats och
kompletterats. Den föreliggande artikeltexten är resultatet av detta
arbete.
150
EDUCARE 2015:2
Referenser
Alderson, Charles (2005). Diagnosing foreign language proficiency:
the interface between learning and assessment. London: Continuum.
Andered, Bror (2001). Europarådets Framework – en inspirationskälla
för de nya kursplanerna. I Skolverket (2001). Språkboken. En
antologi om språkundervisning och språkinlärning. Stockholm:
Liber distribution.
Council of Europe (2001). Common European Framework of Reference
for Languages: Learning, teaching, assessment. Cambridge:
Cambridge University Press and Council of Europe.
Council of Europe (2002). Common European Framework of
Reference for Languages: Learning, Teaching, Assessment. Case
Studies. Strasbourg: Council of Europe Publishing.
Council of Europe (2009). Relating language examinations to the
Common European Framework of Reference for Languages:
learning, teaching, assessment (CEFR). A Manual. Strasbourg:
Council of Europe, Language Policy Division. Tillgänglig 201501-16 på: http://www.coe.int/t/dg4/.
Council of Europe (2013). The European Language Portfolio.
Strasbourg: Council of Europe, Language Policy Division.
Tillgänglig 2015-02-01 på http://www.coe.int/t/dg4/education/elp/.
Erickson, Gudrun (2011). Handle with care. Om referensramen och
bedömning av språklig kompetens. I Språklärarens stora blå?
En samling texter om Gemensam europeisk referensram för
språk. Uppsala universitet, Fortbildningsavdelningen för skolans
internationalisering.
European Union (2013). The Implementation of the Common European
Framework for Languages in European Education Systems. Study.
Brussels: European Parliament, Policy Department B: Structural
and Cohesion Policies. (Tillgänglig 2015-01-16 på: http://www.
europarl.europa.eu/studies ).
EDUCARE 2015:2
151
MATS OSCARSON
Huhta, Ari, Luoma, Sari, Oscarson, Mats, Sajavaara, Kari, Takala, Sauli
& Teasdale, Alex. (2002). DIALANG – A Diagnostic Language
Assessment System for Learners. I Council of Europe (2002).
Common European Framework of Reference for Languages:
Learning, Teaching, Assessment. Case Studies. Strasbourg: Council
of Europe Publishing.
de Jong, John & Oscarson, Mats (1990). Cross-National Standards:
A Dutch-Swedish Collaborative Effort in National Standardized
Testing. AILA Review, 7, 1990, s 62-78.
North, Brian (1995). The Development of a Common Framework Scale
of Language Proficiency: Based on a Theory of Measurement. PhD
thesis. Thames Valley University.
North, Brian (1995). Relating Language Examinations to the Common
European Framework of Reference for Languages: Learning,
Teaching, Assessment (CEFR). Further Material on Maintaining
Standards across Languages, Contexts and Administrations by
exploiting Teacher Judgment and IRT Scaling. Strasbourg: Council
of Europe Publishing.
North, Brian (2014). The CEFR in Practice. Cambridge: Cambridge
University Press, English Profile Studies 4.
Oscarson, Mats (2002). En Steg/CEFR-jämförelse. Skolverket,
Stockholm, och Institutionen för didaktik och pedagogisk
profession, Göteborgs universitet. Opublicerad rapport.
Skolverket (2000). Språk: Kursplaner, betygskriterier och kommentarer.
Stockholm: Fritzes.
Skolverket (2009). Gemensam europeisk referensram för språk:
lärande, undervisning och bedömning. Stockholm: Skolverket
Fritzes. Tillgänglig 2015-02-02 på http://www.skolverket.se/
publikationer?id=2144.
Skolverket (2011a). Kommentarmaterial till kursplanen i engelska.
Stockholm: Skolverket (Fritzes). Tillgänglig 2015-02-02 på: http://
www.skolverket.se/2.5248?page=search&website=&q=Kommentarmaterial+till+kursplanen+i+engelska&search=S%C3%B6k.
Skolverket (2011b). Läroplan för grundskolan, förskoleklassen och
fritidshemmet 2011. Stockholm: Skolverket (Fritzes).
152
EDUCARE 2015:2
Skolverket (2011c). Om ämnet moderna språk. Bakgrund och motiv.
Tillgänglig 2015-02-02 på http://www.skolverket.se/laroplaneramnen-ochkurser/gymnasieutbildning/ (se Alla kommentarer).
Skolverket (2012). Bedömning av språklig kompetens – En studie av
samstämmigheten mellan Internationella språkstudien 2011 och
svenska styrdokument. Skolverkets aktuella analyser. Stockholm:
Skolverket.
Stenberg, Gunnar (2013). Bedömningsaspekter i språk – vad och hur?
LMS Lingua 3/2013, s 9-13.
Uppsala universitet (2001). Europeisk språkportfolio 16+. Uppsala:
Uppsala universitet, Fortbildningsavdelningen för skolans
internationalisering.
van Hest, Erna, de Jong, John & Stoks, G. (2001). Relating the CEF
with school leaving exams in the Netherlands. Cito group & SLO
(Specialisten in leerprocessen): Enschede, Nederländerna.
van Hest, Erna & Staatsen, Francis (2002). Dutch language
qualifications in a European perspective. Summary. Cito group &
SLO (Specialisten in leerprocessen): Enschede, Nederländerna.
EDUCARE 2015:2
153
Elevbedömning, motivation och
uppförande. En studie av skolvisa
skillnader i bedömning och diskrepans
mellan vitsord och testresultat i årskurs
9 i finlandssvenska skolor
Camilla Svens-Liavåg
Johan Korhonen
Karin Linnanmäki
This study investigated differences in assessment in mathematics, Swedish
and behavior between schools and how the students’ motivation and
behavior can explain the discrepancy between grades and test results.
The sample consisted of grade nine students (N = 1152) in 14 lower
secondary schools in the Swedish speaking parts of Finland. Standardized
tests for reading and writing skills, and mathematical performance were
used. Grades in mathematics, Swedish and behavior were collected
from the schools. No differences were found between schools in the
assessment of mathematics and Swedish, but there were differences
between schools in the assessment of behavior. Students with high
motivation and high behavior grades got better grades than their test
results would indicate in Swedish. High motivation for the subject raised
the grades in mathematics, but the grades in behavior had no impact.
Hence, motivation influences grades in mathematics and Swedish.
Keywords: assessment, basic education, mathematics, Swedish
Camilla Svens-Liavåg, Master in Education, Åbo Akademi University,
Finland. camilla.svens-liavag@abo.fi
Johan Korhonen, Master in Special education, Åbo Akademi
University, Finland. johan.korhonen@abo.fi
Karin Linnanmäki, PhD, Åbo Akademi University, Finland
karin.linnanmaki@abo.fi
154
EDUCARE 2015:2
Elevbedömning, motivation och uppförande. En studie av skolvisa skillnader i
bedömning och diskrepans mellan vitsord och testresultat i årskurs 9...
Utvärdering inom den grundläggande
undervisningen/grundskolan
Utvärdering är en viktig del av den grundläggande utbildningen
(grundskolan). Den grundläggande utbildningen utvärderas såväl
regionalt som nationellt i Finland. Bestämmelser om den regionala
utvärderingen finns både i den finländska kommunallagstiftningen
och i utbildningslagstiftningen. Dessa ålägger utbildningsanordnaren
att utvärdera den utbildning som ordnats och bedöma vilken verkan
utbildningen har (Niemi, 2006). Utbildningsstyrelsen1 utvärderar
undervisningen nationellt genom uppföljningsutvärderingar.
Deltagandet i dessa baseras på slumpvist urval. Avsikten med
uppföljningsutvärderingarna är att generera kunskap om hur väl de
uppställda målen för utbildningen uppnåtts. Vidare ger de också
utbildningsanordnare information om hur elevernas genomsnittliga
kunnande och skolans allmänna linje gällande elevbedömningen
förhåller sig till den nationella nivån (Ouakrim-Soivio & Kuusela
2012).
Bedömning i en utbildningskontext innehåller bestämmande,
insamlande och beslutsfattande om bevis relaterade till de uppställda
målen för lärandet som bedöms (Harlen, 2012). Bedömningen har
en fastställande, motiverande, handledande och prognosticerande
uppgift (Atjonen 2007). I det finländska utbildningssystemet är
elevbedömningen en process som stöder elevens lärande och ger
feedback om lärandet redan från starten av grundläggande utbildning
(Ouakrim-Soivio, 2013). Den enskilda elevens kunskaper och framsteg
utvärderas och bedöms regelbundet. Enligt Lag om grundläggande
utbildning (21.8.1999/628) är syftet med elevbedömningen bland annat
att leda och sporra eleverna i deras studier. Elevens inlärning, arbete
och uppförande ska bedömas mångsidigt (22§). Uppförandet bedöms
med ett separat vitsord2. Syftet med bedömningen är dels att utreda i
1 Utbildningsstyrelsen i Finland motsvaras av Skolverket i Sverige.
2 Vid all sifferbedömning används skalan 4-10, där vitsordet 10 anger utmärkta, 9 berömliga, 8 goda, 7 nöjaktiga, 6 försvarliga, 5 hjälpliga kunskaper
och färdigheter. Vitsordet 4 anger underkänd prestation (Förordning om
grundläggande utbildning 20.11.1998/852, 10§). Denna skala används vid
bedömning av såväl enskilda skolämnen som uppförande. Begreppet ”vitsord” motsvaras i Sverige av ”betyg”.
EDUCARE 2015:2
155
CAMILLA SVENS-LIAVÅG, JOHAN KORHONEN OCH KARIN LINNANMÄKI
vilken mån de uppställda målen för den grundläggande utbildningen
uppnås, dels att ge eleverna mångsidig respons. Elevernas framsteg,
arbete och uppförande bedöms i relation till läroplanens mål och
profiler för goda kunskaper. Bedömningen grundar sig på mångsidigt
kunnande. (Utbildningsstyrelsen, 2004). Respons på elevernas lärande
och framsteg kan under läsårets gång ges genom betyg och fritt
formulerad information samt genom samtal.
I Förordning om grundläggande utbildning (20.11.1998/852)
beskrivs närmare hur bedömningen ska verkställas. Bedömningen i
varje enskilt läroämne görs av elevens lärare. Uppförandet bedöms av
elevens lärare, eller om lärarna är många, av lärarna gemensamt (13§).
I slutet av den grundläggande utbildningen görs en slutbedömning
för att fastställa hur väl eleven har nått målen i den grundläggande
utbildningens olika läroämnen då studierna avslutas. Slutbedömningen
görs utgående från givna kriterier för respektive ämne och den grundar
sig på elevens kunskaper i årskurserna 8 och 9. Bedömningen ska vara
nationellt jämförbar och behandla eleverna på lika villkor i hela landet.
(Utbildningsstyrelsen, 2010).
I de finländska läroplansgrunderna ingår kriterier för goda kunskaper
(vitsordet 8) i samtliga ämnen och eleverna bedöms i förhållande till
dessa. Kriterierna är nationella. I bedömningen av respektive skolämne
ingår en bedömning av elevens arbete. Denna omfattar elevens förmåga
att planera, reglera, genomföra och bedöma sitt eget arbete. Dessutom
beaktas hur ansvarsfullt eleven arbetar och hur eleven fungerar i
samarbete med andra. I modersmål och litteratur (svenska) i årskurs
6-9 bedöms elevens prestationer och förmågor inom delområdena
kommunikation, att tolka och bruka olika slags texter, att producera och
bruka olika slags texter samt språk, litteratur och kultur. I matematik
i årskurs 6-9 bedöms eleven inom delområdena tankeförmåga och
tankemetoder, tal och räkneoperationer, algebra, funktioner, geometri
samt sannolikhet och statistik (Utbildningsstyrelsen, 2004). I Finland
betygsätts också elevens uppförande. När det gäller bedömningen
av uppförande finns inga nationella kriterier för gott uppförande.
Läroplansgrunderna anger att bedömningen av uppförandet ska
fokusera på elevens sätt att ta hänsyn till andra människor och till
omgivningen samt hur eleven följer regler. Målen för elevens
156
EDUCARE 2015:2
uppförande bör ingå i den lokala läroplanen, där de mål som skolan
ställt upp för fostran beaktas (Utbildningsstyrelsen, 2004).
I Sverige ska betyget visa i vilken mån en enskild elev har nått
de nationella kunskapskraven för respektive ämne och läraren ska
utnyttja all tillgänglig information om elevens kunskaper i förhållande
till kunskapskraven och göra en mångsidig bedömning av dessa
(Skolverket, 2011). Samtidigt ska bedömningen vara nationellt
jämförbar. De nationella proven i svenska, engelska och matematik som
ordnas i årskurserna 3, 6 och 9 i Sverige hjälper lärare att identifiera
standarder och att justera sin skala för att göra bedömningen likvärdig
oberoende av kontext (Wikström, 2006; Törnvall, 2001). Vidare ger
dessa underlag för analys av i vilken omfattning kunskapskraven
uppfylls på skolnivå, på huvudmannanivå och på nationell nivå
(Skolverket, 2014).
Bedömningen av eleven omfattar mer än enbart själva
betygsgivningen. Elevbedömningen omfattar egentligen hela den
process, vars syfte är att undersöka elevens lärande och ge eleven, läraren
och föräldrarna information om elevens framsteg. Bedömingen ska ge
en realistisk, men uppmuntrande bild av elevens kunskap, framsteg
och förmågor (Ouakrim-Soivio, 2013). Effektiv bedömningspraxis
är beroende av utbildarnas kunskaps- och värderingssystem (Scott,
Webber, Lupart, Aitken & Scott, 2014). Det finländska betygssystemet
är mycket decentraliserat, där enskilda lärare har det primära ansvaret
för instruktion, bedömning och betygsgivning. Forskning har visat
att lärarens bedömning av elevers prestationer kan ha samband med
elevers individuella karakteristika och att det förekommer grader
av subjektivitet i betygssättningsprocessen (Klapp Lekholm &
Cliffordsson, 2008, 2009; Klapp Lekholm, 2011).
Betyget speglar inte enbart elevens ämneskunskaper utan också
icke-kognitiva förmågor som intresse och motivation. Denna
bedömningspraxis vidkänns inte i våra styrdokument3, vilket skymmer
3 Klapp Lekholms (2011) och Klapp Lekholms & Cliffordssons (2008, 2009)
studier gäller de svenska styrdokumenten, där inget nämns om bedömningens ”dubbla” funktion. Inte heller de finländska styrdokumenten vidkänner
detta fenomen. I Finland ger man ett separat vitsord för uppförande, men eftersom bedömningen även omfattar elevens arbete är det troligt att icke-kognitiva förmågor avspeglas i ämnesvitsorden.
EDUCARE 2015:2
157
genomskinligheten gällande vad betygen egentligen mäter och
försvårar möjligheterna att utvärdera bedömningssystemets funktion.
Etiska aspekter
Bedömning i utbildning måste framför allt betjäna syftet att främja
lärande (Black & Wiliam 2012a). Bedömningen av elevers prestationer,
kunskaper och resultat görs av enskilda lärare. Lärarna är ålagda att
bedöma eleverna och bedömmarens ställning och auktoritet innebär
alltid en möjlighet att utöva makt (Jakku-Sihvonen & Heinonen, 2001).
Även om betygssättningen baseras på givna kriterier för varje ämne är
betygsättningsprocessen i sig själv komplex och varierar mellan lärare
och ämnen (Wikström, 2006). Läraren undervisar eleverna och dryftar
etiska problemställningar i ljuset av sina värderingar, föreställningar och
känslor. Bedömningen har alltid följder, som påverkar den som bedöms
och läraren bör därför vara klar över bedömningens ansvarfrågor och
etiska känslighet (Tirri, 1999; Jakku-Sihvonen & Heinonen, 2001).
Etiska problemställningar rör bland annat bedömningens grunder,
alltså på vilka kriterier inlärningsresultat bedöms och bedömningens
konsekvenser.
Validitet är central i all bedömning. Det handlar om bedömningens
ändamål, huruvida bedömningsformen är lämplig för ändamålet och
huruvida den når sitt mål. Validitet innefattar också hur resultaten från
en bedömning tolkas och används (Stobart, 2012). Bedömning bör
alltid designas så att användarna av resultaten kan lita på resultaten. Det
faktum att lärare kan vara omedvetna om tests begränsade reliabilitet
är en allvarlig fråga, något som gäller all bedömning lärarna företar
(Black & Wiliam 2012b). Reliabilitet reflekterar den följdriktighet
med vilken bedömningar görs mellan bedömare, mellan tillfällen och
mellan kontexter (Crisp & Novaković, 2009). Huruvida bedömarna
har och tillämpar samma förståelse av bedömningskrav och samma
uppfattningar av kompetens kan påverka om det går att uppnå en
konsekvent bedömning.
Bedömning är aldrig värdeneutral. I utbildningssammanhang hör
omsorg till bedömningsetiken. Läraren ska handleda och uppmuntra
eleven och då har läraren en sporrande funktion. Samtidigt ska
läraren bedöma elevens kunskapsnivå. Omsorg och bedömning står
158
EDUCARE 2015:2
då i ett motsatsförhållande, något som lärare kanske inte tänker på
medvetet. Bedömmaren bör hålla sig till några viktiga huvudprinciper.
En sådan är att undvika skada. En negativ bedömning kan uppfattas
som sårande av eleverna och påverka deras uppfattning om sig själva
och om skolarbetet. En annan är att bedömningen ska vara rättvis.
Den ska omfatta elevens arbete i sin helhet och läraren ska väga in
alla aspekter i bedömningen. Vidare ska bedömningen vara pålitlig.
Bedömningsprocessen ska vara genomskinlig så att eleverna vet vad
som bedöms och på vilka grunder. (Atjonen, 2007).
Nationella utvärderingar i matematik och i
modersmål och litteratur (svenska)
Utbildningsstyrelsens utvärderingar av olika ämnen inom den
grundläggande utbildningen har producerat och producerar
kriteriegrundade fakta, genom vilka man framför allt utvärderar
om finländska elever uppnår likadana allmänbildande kunskaper
och färdigheter oberoende av till exempel bostadsort, kön och
socioekonomisk bakgrund. Man betonar vikten av en jämställd
utbildning regionalt, mellan könen och mellan olika samhällsgrupper.
Vidare granskar man elevernas jämbördiga möjligheter för fortsatta
studier efter avslutad grundläggande utbildning. Mest systematiskt har
man i Finland följt resultaten i matematik och modersmål och litteratur
(Ouakrim-Soivio, 2013).
Utbildningsstyrelsens uppföljningsutvärderingar visar att elever
som bedömts med exakt samma modersmålsvitsord (betyg i
svenska) uppvisar mycket varierande kunskaper och färdigheter i
utvärderingsprovet. Utvärderingar gjorda 2010 visar att ju högre
betyg eleven hade i ämnet, desto högre var korrelationen mellan
betyg och provresultat. Flickornas och pojkarnas modersmålsbetyg
och skrivfärdigheter motsvarade inte heller varandra. I fråga om de
högsta betygen (vitsorden 9 och 10) fanns knappt några könsskillnader,
men i övrigt har flickor genomgående klarat sig bättre än pojkar med
samma betyg. Flickornas kunskaper och provresultat är aningen
bättre än pojkarnas, då de ställs i förhållande till elevernas betyg.
Utbildningsstyrelsens studier visar att flickor och pojkar med samma
modersmålsvitsord inte har motsvarande kunskaper och färdigheter.
EDUCARE 2015:2
159
En pojke med vitsordet sju har alltså inte motsvarande kunskaper som
en flicka med vitsordet sju. Utvärderingarna omfattade tre centrala
delområden av modersmålsämnet (skrivande, språkkännedom och
läsning samt litteratur och textkännedom) och flickorna dominerade
inom alla tre. Snedfördelningen har sin förklaring i att elevernas betyg
bygger på en mer omfattande grund än detta. Resultaten visade en
relativt stor variation mellan skolornas resultat nationellt. Skillnaden
mellan ytterlighetsskolorna inom delområdet skrivande var 24
procentenheter och inom delområdet språkkännedom och läsning 23
procentenheter. Den minsta variationen fann man inom delområdet
litteratur och textkännedom, där variationen var 13 procentenheter. De
tydligaste skillnaderna mellan skolors resultat framträdde alltså inom
de två förstnämnda delområdena. Inga nämnvärda skillnader kunde
dock skönjas inom Svenskfinland4. De största skillnaderna mellan
de svenskspråkiga skolorna fann man i elevernas skrivfärdigheter.
Utbildningsstyrelsen lyfter fram de stora variationerna i elevernas
kunskaper och färdigheter, könsskillnaderna i resultaten och bristerna
i elevbedömningen som problemområden inom modersmålsämnet
nationellt. (Hellgren, 2011)
I Utbildningsstyrelsens utvärdering av matematikkunskaperna 2012
fick eleverna i genomsnitt 52% av totalt 86 poäng. Det skiljde cirka två
procentenheter mellan pojkarnas och flickornas resultat till pojkarnas
fördel. Pojkarna klarade sig bättre än flickorna inom flera delområden,
till exempel funktioner, sannolikhetslära och statistik. I algebra och
geometri klarade sig flickorna och pojkarna lika bra. Procenträkning
var det delområde där resultaten var allra svagast. Lösningsprocenten
var endast 37, ett resultat som också är klart svagare än vid den
föregående mätningen 2011. Pojkarna klarade procenträkningen
klart bättre än flickorna (pojkarna löste 42% av uppgifterna korrekt,
flickorna 34%). Sett till den totala lösningsprocenten i matematiktestet
höll pojkarnas och flickornas kunnande jämn nivå. I gruppen med de
svagaste resultaten var andelen pojkar och flickor lika stor. Bland
eleverna med klart bättre resultat än genomsnittet var andelen pojkar
4 Svenskfinland utgörs av de geografiska områden där merparten av befolkningen med svenska som modersmål bor. Det handlar om kustområdena i
Österbotten, Åboland och Nyland. Ibland räknas också Åland till Svenskfinland.
160
EDUCARE 2015:2
högre än andelen flickor. Andelen flickor var oroande liten bland
eleverna med utmärkta resultat. De största könsskillnaderna gällande
lösningsprocent fanns inom delområdet huvudräkning, där pojkarnas
resultat låg 10 procentenheter över flickornas. Några skillnader mellan
de svensk- och finskspråkiga skolorna förekom inte. (Hirvonen &
Rautopuro, 2012).
Även om skillnaderna mellan skolorna i utvärderingar av
matematikkunskaper är små i Finland i ett internationellt perspektiv,
håller de på att växa en aning. Resultaten från studien 2012
visar att även om elevernas kunskapsnivå var densamma kunde
betygsmedeltalet avvika med upp till två vitsord. Ju högre betyg
en elev har, desto större kunnande visar eleven i testen. Flickorna
fick bättre skolvitsord än pojkarna, men i utvärderingsprovet nådde
fler pojkar än flickor goda eller utmärkta resultat. Detta visar att
skolorna har olika bedömningspraxis. Det finns också ett samband
mellan lärarens behörighet och inlärningsresultaten. Eleverna i de
skolor där undervisningen sköttes av en behörig ämneslärare hade i
gensomsnitt en högre lösningsprocent än eleverna som undervisades
av en obehörig lärare. Skillnaden låg på cirka fyra procentenheter
(Mattila & Rautopuro, 2012b). Resultaten i denna studie gällde
elevernas avgångsbetyg från grundskolan. Avgångsbetyget ligger till
grund för fördelningen av studieplatser på följande utbildningsstadium
och elevernas betyg påverkar också deras utbildningsmålsättningar
framöver (Savolainen, Ahonen, Aro, Tolvanen, & Holopainen, 2008).
En rättvis och jämlik bedömning är därför av största vikt. (Mattila &
Rautopuro, 2012a).
I Sverige visar Skolverkets studie (2007) att de genomsnittliga
provbetygen i svenska och matematik överstiger de genomsnittliga
provbetygen på nationell nivå varje år sedan de nationella proven
infördes 1998. Det är betydligt vanligare att lärare höjer en elevs
slutbetyg i förhållande till provbetyget i dessa ämnen. Många skolors
slutbetyg var betydligt högre än deras genomsnittliga provbetyg.
Samtidigt var situationen den omvända i ett antal skolor. På skolnivå
var dessa resultat stabila, vilket innebär att det var samma skolor som
år efter år betygsätter eleverna högre respektive lägre än provresultaten
skulle medge. Det är framför allt elever med underkända provresultat
som får högre betyg vid slutbedömningen. Detta förekommer i störst
EDUCARE 2015:2
161
grad i matematik, men även i svenska. Variationerna mellan skolorna är
stora även gällande denna praxis. Resultaten indikerade att man tolkar
betygskriterierna olika, vilket i sin tur kan innebära att likvärdigheten
i betygsättningen brister. Vidare visar Skolstyrelsens resultat att flickor
får högre vitsord än pojkar i förhållande till resultaten i nationella
proven. En viktig mekanism bakom flickornas fördel verkar vara att
de visar en högre grad av intresse och motivation för skolarbetet än
pojkarna (Klapp Lekholm & Cliffordsson, 2009).
Motivation, elevkarakteristika och bedömning
Lärarna bör uppmärksamma de sociala och emotionella aspekterna i
lärandet. När klassrumsklimatet karakteriseras av varma, respektfulla
och emotionella stödande relationer presterar studerande bättre
akademiskt beroende på ett högre engagemang i lärandeprocessen
(Reyes, Brackett, Rivers, White & Salovey, 2012). Testningar och
provsituationer är vanliga stressmoment i skolan. Testningar kan ha
en generell negativ inverkan på inre motivation. Omfattande testningar
kan leda till att eleverna gör dem för sakens skull istället för att vara
motiverade av personligt intresse (Coutts, Gilleard & Baglin, 2011;
Thuen & Bru, 2004). Frågor associerade med elevbedömning kan
underminera rättvis och opartisk praxis för elever som av olika orsaker
inte passar in i det allmänna skolgenomsnittet. Studier visar att kön
regelbundet kopplades till beteende, så att pojkar uppfattades som
mer sannolikt vara störande och mindre medgörliga, något som i sin
tur påverkade betygen lärarna gav till pojkarna. Det fanns även en
uppfattning att förväntningarna på elever med specialbehov i allmänhet
var för låga och att begåvade elever inte utmanades tillräckligt. (Scott,
Webber, Lupart, Aitken, & Scott, 2014).
Lärare förväntar sig att eleverna ska vara motiverade för och
engagerade i skolarbetet. För att uppnå goda prestationer hos eleverna
behöver lärarna hitta vägar för att motivera o engagera eleverna.
Lärare och elever har nödvändigtvis inte samma uppfattning om
vilka faktorer som fungerar motiverande. Studerande motiverades av
möjligheten att skapa sig en bra framtid, att se sitt arbete förbättras, av
att vara bra på något, att få bra betyg och av att ha lärare man tycker
om. Lärarna å sin sida knöt elevmotivation i mycket högre grad till
162
EDUCARE 2015:2
sin egen personlighet och till egna tilltag. Man antog att studerande
motiveras av att de gillar sin lärare, av lärarens personliga engagemang
i studeranden och av lärarens entusiasm (Wiesman, 2012). En elev
som upplever en god kognitiv kompetens har en känsla av att klara sig
bra i skolan. Denna upplevda kognitiva kompetens kan försvagas om
eleven upplever misslyckanden i skolan. Introduktionen av betyg som
ett utvärderingssystem kan stimulera social jämförelse och reducera
den allmänna känslan av kognitiv kompetens hos eleverna. Specifika
skolrelaterade stressmoment inkluderar bland annat testning och
vitsord (Thuen & Bru, 2004). En norsk studie (Bru, 2006) visar att
en rätt stor procent av eleverna i årskurs nio upplever skolarbetet som
relevant. Elever som upplever misslyckanden kan försöka minska
konsekvenserna av dessa genom att minska relevansen man tillskriver
skolarbetet. Att investera mer ansträngning är inget alternativ för
att återställa ett misslyckande, eftersom det kan bli ytterligare en
indikation på bristande förmåga (Stornes, Bru & Idsoe, 2008).
Stimulans och engagemang från lärarnas sida verkar leda till stabilt
engagemang hos studerande. Hög grad av engagemang verkar ha ett
samband med minimal förekomst av skolavbrott, medan låg motivation
för skolan i kombination med låga vitsord eller fallande resultat kan
vara indikatorer för potentiell skolavbrott. (Archambault, Janosz, Fallu,
Pagani, 2009; Korhonen, Linnanmäki, & Aunio, 2014). Ett minskat
intresse för skolan, bristande motivation och svag vilja att lära leder
till att eleven fjärmar sig från skolan och uppför sig dåligt. (Janosz,
Leblanc, Boulerice & Tremblay, 1997; Janosz, Archambault, Morizot,
Pagani, 2008; Archambault, Janosz, Fallu, Pagani, 2009).
Forskning visar att elevers karakteristika och lärares olika
bedömningspraxis utövar ett inflytande på betygsgivningen (Klapp
Lekholm & Cliffordsson 2008; Wikström 2006). Lärarna ger betyg,
primärt baserade på klassrumsutvärdering, där elevernas prestationer
bedöms på daglig basis och genom användningen av lärargjorda prov.
Utbildningssystemet litar på att lärarnas bedömning av elevernas
prestationer är rättvis. Eftersom betygen används i urvalssyfte till
exempel vid inträde till följande utbildningsnivå är sambandet
mellan bedömning, betygspraxis och validitet av största vikt (Klapp
Lekholm & Cliffordsson, 2009). I studier gjorda av Klapp Lekholm
& Cliffordsson (2008) identifierades två dimensioner i betygen
EDUCARE 2015:2
163
inom och mellan skolor: en ämnesspecifik dimension relaterad till
elevernas akademiska prestationer mätta i nationella prov och betyg
och en generell dimension relaterad enbart till betyg. Den generella
dimensionen tolkades ha samband med icke-kognitiva faktorer, som
till exempel motivation, intresse och sociala färdigheter. Den generella
betygsdimensionen antyder att betygsgivning är influerad av andra
faktorer är prestation. På individuell nivå förklarade den generella
betygsdimensionen 3-5% av variationen inom olika ämnesbetyg
(Klapp Lekholm & Cliffordsson, 2009).
Syfte och forskningsfrågor
Syftet med denna studie är att undersöka skolvisa skillnader i
bedömning samt hur elevernas motivation och uppförande kan förklara
diskrepansen mellan vitsord och testresultat.
Forskningsfrågorna är följande:
Hur mycket av variationen i vitsorden i modersmål och litteratur,
matematik samt uppförande kan förklaras på skolnivå?
Hur kan elevernas motivation och uppförande förklara diskrepansen
mellan vitsord och testresultat?
Finns det könsskillnader gällande hur elevernas motivation och uppförande
förklarar diskrepansen mellan vitsord och testresultat?
Metod
Deltagare och procedur
I studien deltog 1152 elever (pojkar N = 576) från 14 skolor i
Svenskfinland, vilket utgör cirka en tredjedel av hela åldersgruppen
svenskspråkiga elever i årskurs nio. Denna studie är del av ”Vem väljer
vad?”- projektet som genomförs vid Åbo Akademis specialpedagogiska
enhet. Studien, som är longitudinell, följer finlandssvenska ungdomar
från grundskolans nionde årskurs till tredje stadiet/arbetslivet. Syftet
med detta projekt är att undersöka samband mellan inlärningssvårigheter,
utbildning och skolavbrott. Datainsamlingen utfördes våren 2008 av
forskare och utbildade forskningsassistenter inom projektet.
164
EDUCARE 2015:2
Mätinstrument
Elevernas matematikfärdigheter mättes med KTLT-testet (Räsänen &
Leino, 2005) som är ett standardiserat test för årskurserna 7-9 samt
andra stadiet. Testet mäter elevernas färdigheter i grundläggande
aritmetik, problemlösning, algebra, geometri och enhetsomvandlingar.
Testet består av 40 frågor och finns tillgängligt i fyra parallellversioner.
Studerande har 40 minuter tid att besvara frågorna. Utöver detta
samlades information om elevernas vitsord i matematik in från
skolorna.
LS-klassdiagnoser (Johansson, 2005) användes för att mäta elevernas
färdigheter i läsförståelse, ordförståelse och rättstavning. Testet
är avsett för elever i årskurserna 7-9 samt första året i gymnasiet. I
läsförståelsedelen skall eleven välja rätt rubrik för fem texter samt svara
på flervalsfrågor angående innehållet i texterna. Ordförståelsedelen
består av 40 meningar där det sista ordet saknas. Eleven skall välja det
ord som passar in i meningen bland fem alternativ. Rättstavning mäts
genom att testledaren läser en mening högt (50 st) och upprepar det
ord som eleven skall skriva ner. Utöver detta samlades information om
elevernas vitsord i modersmål och litteratur in från skolorna.
Elevernas ämneslärare i modersmål och litteratur samt i matematik
ombads skatta sina elevers motivation till sitt undervisningsämne på
en skala 1 till 5 där 1=mycket omotiverad och 5=mycket motiverad.
Elevernas uppförandevitsord erhölls direkt från skolorna.
Deskriptiv statistik, korrelationer och reliabilitetsvärden för samtliga
mätinstrument hittas i tabell 1.
Analys av data
Alla analyser utfördes med statistikprogrammet SPSS 21. För att svara
på forskningsfråga 1 användes flernivåregressionsanalyser för att
portionera variansen i elevernas vitsord i matematik, modersmål och
litteratur samt uppförande mellan elevnivå och skolnivå. Diskrepansen
mellan elevernas vitsord och testresultat räknades ut genom att utföra
regressionsanalyser där vitsordet predicerades av elevernas testresultat
och de ostandardiserade residualerna sparades för att erhålla ett värde
för diskrepansen för samtliga elever. Dessa residualer användes sedan
som beroendevariabler i fortsatta regressionsanalyser där denna
diskrepans försökte förklaras med relevanta faktorer på basen av
EDUCARE 2015:2
165
166
EDUCARE 2015:2
litteraturen. För att svara på forskningsfråga 3 utfördes ovannämnda
regressionsanalyser skilt för pojkar och flickor.
Resultat
För att svara på forskningsfrågan om hur mycket av variationen i
vitsorden i modersmål och litteratur, matematik samt uppförande kan
förklaras på skolnivå, specificerades tre flernivåregressionsmodeller, en
för varje vitsord där variationen portionerades mellan skol och elevnivå
(Tabell 2). Beträffande variationen i matematikvitsordet återfinns 99,0
% av variationen på elevnivå medan skolnivån endast kan förklara 1,0
% (p = ns.) av variationen i elevernas matematikvitsord. Samma trend
kan ses i vitsordet i modersmål och litteratur där 95,6 % av variationen
finns på elevnivån och 4,4 % på skolnivån % (p = ns.). Detta betyder
att det inte överlag finns skolvisa skillnader i elevernas bedömning
beträffande matematik och modersmål. I uppförandevitsordet finns
dock skolvisa skillnader eftersom 16,1 % av variationen finns på
skolnivå (p < 0,05). Bedömingen av elevernas uppförande varierar
som en funktion av skola.
Hur kan elevernas motivation och uppförande förklara diskrepansen
mellan vitsord och testresultat?
För att skapa variablerna diskrepans för matematik och diskrepans för
modersmål och litteratur utfördes bivariata regressionsanalyser (skilt
för respektive ämne) där elevernas vitsord i matematik predicerades
av KTLT-testet och elevernas vitsord i modersmål och litteratur
predicerades av det viktade medelvärdet av LS-klassdiagnoser.
Modellerna förklarade en signifikant andel varians i vitsord både för
matematik och modersmål och litteratur (Tabell 3). De ostandardiserade
residualerna sparades från analyserna som två nya variabler (diskr_
matematik; diskr_modersmål). Ett positivt diskrepansvärde innebär
att en elev får bättre vitsord än vad man kunde förvänta sig på basen
av testresultaten medan ett negativt värde innebär att eleven erhållit
ett sämre vitsord än vad man kunnat förvänta sig på basen av elevens
testresultat. Dessa variabler användes sedan i fortsatta analyser.
EDUCARE 2015:2
167
168
EDUCARE 2015:2
EDUCARE 2015:2
169
För att förklara diskrepansen mellan vitsord och testresultat utfördes
multipla regressionsanalyser. Först specifiserades en modell där diskr_
modersmål predicerades med uppförandevitsord och motivation för
ämnet modersmål. Modellen förklarade en signifikant andel varians av
diskr_modersmål (Tabell 4). Motivation till ämnet modersmål var den
starkaste prediktorn men också uppförandevitsordet kunde förklara en
del av diskrepansen mellan vitsord och testresultat. Ju mer motiverad
och ju högre uppförandevitsord en elev hade, desto positivare
diskrepansvärde. Den andra modellen där diskr_matematik var den
beroende variabeln kunde också motivation till ämnet matematik och
uppförandevitsord förklara en signifikant andel varians i diskrepansen
mellan vitsord och testresultat i matematik. I denna modell var dock
endast motivationen en signifikant prediktor, ju högre motivation en
elev hade, desto högre diskrepansvärde. Uppförandevitsordet kunde
inte i sig predicera diskrepansen mellan vitsord och testresultat i
matematik.
Finns det könsskillnader gällande hur elevernas motivation och
uppförande förklarar diskrepansen mellan vitsord och testresultat?
De två modellerna testades också skilt för pojkar och flickor för att
undersöka eventuella könsskillnader i sambanden mellan diskrepansen
(mellan vitsord och testresultat i modersmål och matematik) och
motivation och uppförandevitsord. Resultaten var liknande för
pojkar och flickor (tabell 4). Pojkars uppförande predicerade aningen
starkare diskrepansen i modersmål men skillnaderna var inte särskilt
stora. Överlag var resultaten liknande för pojkar och flickor. Pojkars
uppförande predicerade aningen starkare (β = 0,26) diskrepansen i
modersmål än vad det gjorde för flickorna (β = 0,14) men skillnaderna
var inte särskilt stora.
170
EDUCARE 2015:2
EDUCARE 2015:2
171
Diskussion
Resultaten i denna studie visar att det inte förkommer några skolvisa
skillnader i bedömningen av eleverna i matematik eller i modersmål
och litteratur i Svenskfinland. Resultaten är i linje med resultaten i
utvärderingsstudierna gjorda av Utbildningsstyrelsen (Mattila &
Rautopuro, 2012b; Hellgren, 2011). Detta visar att de finlandssvenska
lärarna har en enhetlig uppfattning om och tolkning av de nationella
bedömningskriterierna i dessa ämnen. Kravet på en nationellt jämlik
och jämförbar bedömning av eleverna verkar uppfyllas i modersmål
och litteratur och i matematik i slutskedet av den svenskspråkiga
grundläggande utbildningen i Svenskfinland. Detta skiljer sig från
resultaten i Sverige (Skolverket, 2007), som visar stora variationer
mellan skolorna framför allt i bedömningen i matematik, men
också i svenska. Orsakerna till denna skillnad kan kanske finnas i
formuleringen och tolkningen av bedömningskriterierna i dessa länder
(Utbildningsstyrelsen, 2004; Skolverket, 2011). Eventuellt kan också
kulturella olikheter gällande syn på och förhållningssätt till bedömning
överlag förklara dessa olikheter mellan länderna.
När det gäller bedömningen av uppförandet förekommer skolvisa
skillnader i Svenskfinland. Det finns inga nationella kriterier för den
bedömningen, utan kriterierna definieras i de lokala läroplanerna
i kommunerna (Utbildningsstyrelsen, 2004). Detta torde vara en
av förklaringarna till variationerna mellan skolorna. Bedömning
av uppförande kan inte baseras på några direkt mätbara fakta, utan
lärarnas uppfattningar och tolkningar av de lokala kriterierna ligger till
grund för bedömningen, något som försvårar en enhetlig bedömning.
De test som respondenterna i studien gjorde täcker på intet sätt
det totala innehållet i lärokurserna i modersmål och litteratur eller
matematik i årskurs nio. Ämnena omfattar fler delområden än de som
testades (Utbildningsstyrelsen, 2004). Det är därför inte överraskande
att elevernas testresultat och deras ämnesvitsord inte alltid motsvarar
varandra. I vår studie är motivation i skolämnet den starkaste
prediktorn för diskrepans mellan testresultat och vitsord. Detta gäller
såväl matematik som modersmål och litteratur. Elever med hög grad
av motivation och höga uppförandebetyg ges högre betyg i modersmål
och litteratur än testresultaten skulle antyda. På motsvarande sätt ger
låg motivation i kombination med låga uppförandebetyg lägre betyg
172
EDUCARE 2015:2
i ämnet än testresultaten skulle antyda. Här finner vi en skillnad
mellan modersmål och litteratur och matematik. Motivationsgraden
ger högre respektive lägre betyg i matematik än testresultaten skulle
antyda på samma sätt som i modersmålsämnet, men här inverkar inte
uppförandebetyget. I matematik är följaktligen motivation för ämnet
av större vikt än uppförandet. Detta kan bero på att det är lättare att
göra en objektiv bedömning av matematikfärdigheter, då dessa är
enklare att mäta än många av de färdigheter som ingår i bedömningen
av modersmålsämnet. Styrdokumenten anger att läraren förutom de
direkta kunskapsprestationerna också ska bedöma elevens arbete
(Utbildningsstyrelsen, 2004). Detta ger eventuellt ett större utslag i
modersmålsämnet än i matematiken eftersom ämnena till sin karaktär
skiljer sig från varandra. Medan modersmål och litteratur är ett ämne
där eleven i hög grad förväntas åstadkomma personliga tolkningar och
där elevens mognadsnivå och uttrycksförmåga spelar en viktig roll för
prestationerna (och därmed för bedömningen), finns det inte lika stort
utrymme för personliga tolkningar i matematiken.
Några större könsskillnader förekommer inte i sambanden mellan
diskrepansen mellan betyg och testresultat i modersmål och matematik
och motivation och uppförandevitsord. Situationen är överlag rätt
jämlik för flickor och pojkar i den finlandssvenska grundläggande
utbildningen. Pojkarnas uppförande påverkar i lite större grad
modersmålsbetyget än flickornas, men skillnaderna är små.
Klapp Lekholm och Cliffordsson (2008) fann två dimensioner i
bedömningen: en ämnesspecifik dimension som baserades på elevens
kunskapsnivå och en generell dimension, som baseras på icke-kognitiva
förmågor. En av dessa icke-kognitiva förmågor är motivation. I Finland
bedöms alla elevers uppförande med ett separat vitsord, baserat på
elevens förmåga att ta hänsyn till andra människor och till omgivningen
samt hur eleven följer regler. Uppförandevitsordets inverkan på
modersmålsvitsordet väcker frågan huruvida lärare i Svenskfinland
i någon mån väger in icke-kognitiva förmågor i bedömningen av
ämnet. Finns det en generell dimension i den finländska bedömningen
av modersmålsämnet trots att vi har uppförandevitsord? För att
kunna besvara denna fråga behövs ytterligare forskning. En annan
begränsning i denna studie var att den endast omfattade 14 skolor.
Simuleringsstudier har visat att man helst skall ha över 50 observationer
EDUCARE 2015:2
173
på nivå 2 (i detta fall skolnivån). Lyckligtvis påverkar ett litet sampel
främst standardfelen och inte variansproportionerna som primärt
användes för att tolka resultaten i denna studie (Maas & Hox, 2005).
I denna studie förekom det inte några skolvisa skillnader i
bedömningen av eleverna i matematik eller i modersmålsämnet i
Svenskfinland. Däremot förekom skolvisa skillnader i bedömningen
av uppförandet. Motivation var den starkaste prediktorn för skillnader
mellan testresultat och betyg. Hög motivation och gott uppförande gav
höga betyg i modersmålsämnet. Motivationsgraden inverkade också
på matematikbetyget, men där inverkade inte uppförandet. Resultaten
skall ses i ljuset av studiens begränsade omfattning.
Referenser
Archambault, Isabelle, Janosz, Michel, Fallu, Jean-Sébastien & Pagani,
Linda S. (2009). Student engagement and its relationship with early
high school dropout. Journal of adolescence, (32), 651-670.
Atjonen, Päivi (2007). Hyvä, paha arviointi.[Bra, dålig bedömning].
Helsinki: Tammi.
Black, Paul & Wiliam, Dylan (2012a). Assessment for learning in the
classroom. I John Gardner (Red.), Assessment and learning (ss.
11-32). 2nd edition. London: Sage.
Black, Paul & Wiliam, Dylan (2012b). The reliability of assessments.
I John Gardner (Red.), Assessment and learning (ss. 243-263). 2nd
edition. London: Sage.
Bru, Edvin (2006). Factors associated with disruptive behaviour in the
classroom. Scandinavian Journal of Educational Research, 50 (1),
23-43.
Coutts, Rosanne, Gilleard, Wendy & Baglin, Robert (2011). Evidence
for the impact of assessment on mood and motivation in first-year
students. Studies in higher education, 36 (3), 291-300.
174
EDUCARE 2015:2
Crisp, Victoria & Novaković, Nadežda (2009). Are all assessment
equal? The comparability of demands of college-based assessments
in a vocationally related qualification. Research in Post-Compulsory
Education, 14 (1), 1-18.
Förordning om grundläggande utbildning 20.11.1998/852
Harlen, Wynne (2012). On the relationship between assessment
for formative and summative purposes. I John Gardner (Red.),
Assessment and learning (ss. 87-102). 2nd edition. London: Sage.
Hellgren, Jan (2011). Modersmål och litteratur i årskurs 9. En
utvärdering av inlärningsresultat i modersmål och litteratur i
årskurs 9 våren 2010. Utbildningsstyrelsen, uppföljningsrapporter
2011:1. Tammerfors: Juvenes Print – Tampereen Yliopistopaino Oy.
Hirvonen, Kati & Rautopuro, Juhani (2012). Arvioinnin tuloksia. I
Rautopuro, Juhani (Red.). Hyödyllinen pakkolasku. Matematiikan
oppimistulokset peruskoulun päättövaiheessa (ss. 33-54). .
[Utvärderingens resultat. I Nyttig tvångsräkning. Matematikens
inlärningsresultat i slutet av den grundläggande utbildningen]
Opetushallitus, Koulutuksen seurantaraportit 2013:3. Tampere:
Juvenes print – Suomen Yliopistopaino Oy
Jakku-Sihvonen, Ritva & Heinonen, Sari (2001). Johdatus koulutuksen
uudistvaan arviointikulttuuriin. Opetushallitus, Arviointi 2/2001.
Janosz, Michel, Archambault, Isabelle, Morizot, Julien & Pagani, Linda
S. (2008). School engagement trajectories and their differential
predictive relations to dropout. Journal of social issues, 64 (1), 2140.
Janosz, Michel, LeBlanc, Marc, Boulerice, Bernard & Tremblay,
Richard E. (1997). Disentangling the weight of school dropout
predictors: a test on two longitudinal samples. Journal of youth
and adolescence, 26 (6), 733-762.
Johansson, Maj-Gun (2005). LS. Handledning. Klassdiagnoseri
läsning och skrivningför högstadiet och gymnasiet. M-G Johansson
& Psykologiförlaget AB. Stockholm: Psykologiförlaget.
Klapp Lekholm, Alli (2011). Effects of school charateristics on
grades in compulsory school. Scandinavian journal of educational
research, 55 (6), 587-608.
EDUCARE 2015:2
175
Klapp Lekholm, Alli & Cliffordsson, Christina (2008). Discrepancies
between school grades and test scores at individual and school level:
effects of gender and family background. Educational Research
and Evaluation, 14 (2), 181-199.
Klapp Lekholm, Alli & Cliffordsson, Christina (2009). Effects of
student characteristics on grades in compulsory school. Educational
Research and Evaluation, 15 (12), 1-23.
Korhonen, Johan, Linnanmäki, Karin & Aunio, Pirjo (2014). Learning
difficulties, academic well-being and educational dropuot: A personcentred approach. Learning and individual differences, 31 (3), 1-10.
Lag om grundläggande utbildning 21.8.1999/628
Maas, Coora J. M., & Hox, Joop J. (2005). Sufficient Sample Sizes for
Multilevel Modeling. Methodology: European Journal of Research
Methods for the Behavioral and Social Sciences, 1(3), 86-92.
Mattila, Leena & Rautopuro, Juhani (2012a). Koulukohtaisia tuloksia .
I Rautopuro, Juhani (Red.). Hyödyllinen pakkolasku. Matematiikan
oppimistulokset peruskoulun päättövaiheessa (ss. 55-64). [Skolvisa
resultat. I Nyttig tvångsräkning. Matematikens inlärningsresultat
i slutet av den grundläggande utbildningen] Opetushallitus,
Koulutuksen seurantaraportit 2013:3. Tampere: Juvenes print –
Suomen Yliopistopaino Oy.
Mattila, Leena & Rautopuro, Juhani (2012b). Taustatietoja oppilaista
ja opetuksesta. I Rautopuro, Juhani (Red.). Hyödyllinen pakkolasku.
Matematiikan oppimistulokset peruskoulun päättövaiheessa (ss.
87-117). [Bakgrundsinformation om eleverna och undervisningen.
I Nyttig tvångsräkning. Matematikens inlärningsresultat i slutet
av den grundläggande utbildningen] Opetushallitus, Koulutuksen
seurantaraportit 2013:3. Tampere: Juvenes print – Suomen
Yliopistopaino Oy.
Niemi, Eero K. (Red.), (2006). Arvioinnilla laatua koulutukseen.
Ajatuksia paikalliseen ja seudulliseen arviointiin. . [Kvalitet i
utbildningen genom utvärdering. Tankar om lokal och regional
utvärdering.] Opetushallitus, Arviointi 1/2006. Helsinki:
Yliopistopaino
176
EDUCARE 2015:2
Ouakrim-Soivio, Najat (2013). Toimivatko päättöarvioinnin
kriteerit? Oppilaiden saamat arvosanat ja Opetushallituksen
oppimistulosten seuranta-arviointi koulujen välisten osaamiserojen
mittareina. [Fungerar avgångsbedömningens kriterier? De vitsord
eleverna fått och Utbildningsstyrelsens uppföljningsstudie av
inlärningsresultaten som en mätare för kunskapsskillnader mellan
skolorna] Opetushallitus, Raportit ja selvitykset 2013:9. Tampere:
Juvenes Print – Suomen Yliopistopaino Oy.
Ouakrim-Soivio, Najat. & Kuusela, Jorma (2012). Historian ja
yhteikuntaopin oppimistulokset perusopetuksen päättövaiheessa
2011. [Inlärningsresultat i historia och samhällslära i slutskedet
av den grundläggande utbildningen 2011.] Koulutuksen
seurantaraportit, no. 2012:3. Helsinki: Opetushallitus.
Reyes, Maria R., Brackett, Marc A., Rivers, Susan E., White, Mark
& Salovey, Peter (2012). Classroom emotional climate, student
engagement, and academic achievement. Journal of educational
psychology, 104 (3), 700-712.
Räsänen, Pekka & Leino, Leila (2005). KTLT. Laskutaidon testi.
Opas yksilö- tai ryhmämuotoista arviointia varten. [KTLT. Test
av räkneförmågan. Manual för individuell eller grupptestning].
Jyväskylä: NMI.
Savolainen, Hannu, Ahonen, Timo, Aro, Mikko, Tolvanen, Asko &
Holopainen, Leena (2008). Reading comprehension, word reading,
and spelling as predictors of school achievement and choice of
secondary education. Learning and Instruction, (18), 201–210.
Scott, Shelleyann, Webber, Charles F., Lupart, Judy L., Aitken, Nola
& Scott, Donald E. (2014). Fair and equitable assessment practices
for all students. Assessment in Education: Principles, Policy &
Practice, 21 (1), 52-70.
Skolverket (2007). Provbetyg – slutbetyg – Likvärdig bedömning?
En statistisk analys av sambandet mellan nationella prov och
slutbetyg i grundskolan 1998-2006. Sammanfattning av rapport
300. Stockholm: Skolverket.
Skolverket (2011). Läroplan för grundskolan, förskoleklassen och
fritidshemmet.
EDUCARE 2015:2
177
Skolverket (2014). Nationella prov & Bedömningsstöd. http://
www.skolverket.se/bedomning/nationella-prov-bedomningsstod.
Nerladdat 31.1.2014.
Stobart, Gordon (2012). Validity in formative assessment. I John
Gardner (Red.), Assessment and learning (ss. 233-242). 2nd
edition. London: Sage.
Stornes, Tor, Bru, Edvin & Idsoe, Thormod (2008). Classroom social
structure and motivational climates: On the influence of teachers’
involvment, teachers’ autonomy support and regulation in relation
to motivational climates in school classrooms. Scandinavian
journal of educational research, 52 (3), 315-329.
Thuen, Elin & Bru, Edvin (2004). Coping styles and emotional
and behavioural problems among Norwegian grade 9 students.
Scandinavian journal of Educational research, 48 (5), 493-510.
Tirri, Kirsi (1999). Opettajan ammattietiikka. [Lärarens yrkesetik]
Juva: WSOY.
Törnvall, Maj (2001). Uppfattningar och upplevelser av bedömning
i grundskolan. Pedagogisk-psykologiska problem, 677. Malmö
högskola: Institutionen för pedagogik.
Utbildningsstyrelsen (2004). Grunderna för läroplanen för den
grundläggande utbildningen. Föreskrift 1/011/2004.
Utbildningsstyrelsen (2010). Ändringar och kompletteringar av
grunderna för läroplanen för den grundläggande utbildningen.
Föreskrift 29.10.2010.
Wiesman, Jeff (2012). Student motivation and the alignment of teacher
beliefs. The clearing house, (85), 102-108.
Wikström, Christina (2006). Education and assessment in Sweden.
Assessment in Education, 13 (1), 113-128.
178
EDUCARE 2015:2
Pia Thornberg & Anders Jönsson
Teachers’ assessment and grading of student achievement is often
charged for not being reliable. Various suggestions of how to reach
higher levels of reliability are advocated in different contexts, and one
suggestion is “social moderation”. Social moderation involves teachers
working together when assessing and grading student performance.
Although the claim is often made that moderation practices lead to higher
levels of reliability in teachers’ assessment and grading, such claims
often lack scientific support. In this study, a literature review has been
carried out in order to gain knowledge about the potential effects that
moderation may have and whether these effects may in fact lead to more
reliable assessment and grading. The results indicate that moderation
practices do have an effect, which may ultimately lead to higher levels
of reliability if these practices involve several levels in the assessment
process. Moderation is also a process that can be affected by several
factors, such as the organization of the moderation meetings and the
selection of student performance.
Keywords: grading, moderation, reliability, teacher assessment
Pia Thornberg, Lecturer in Mathematics Education, Högskolan
Kristianstad.
pia.thornberg@hkr.se
Anders Jönsson, Associate Professor in Science Education Research,
Högskolan Kristianstad.
anders.jonsson@hkr.se
EDUCARE 2015:2
179
PIA THORNBERG OCH ANDERS JÖNSSON
Inledning
Skolverket och Skolinspektionen har i flera granskningar påvisat
att bedömningen och betygssättningen i den svenska skolan brister
i likvärdighet (ex Skolinspektionen, 2012, 2013; Skolverket, 2012b,
2012c, 2012d). Att lärares bedömning och betygssättning uppvisar
sådana brister är problematiskt bland annat eftersom elevers betyg
används som urvalsinstrument och som konkurrensmedel när eleverna
senare söker anställning eller till högre utbildningar. Bristande
likvärdighet vid bedömning och betygssättning kan därmed få
betydande konsekvenser för den enskilde eleven.
Olika förslag att åstadkomma en ökad likvärdighet vid bedömning
och betygssättning förs fram i olika sammanhang. Skolverket (2004)
föreslår i en handlingsplan att de nationella provens stödjande roll
vid betygssättning ska förbättras, att lärar- och rektorsutbildningarna
får en stärkt roll samt att stödmaterial som förtydligar hanteringen av
styrdokumenten ska tillhandahållas. Liknande förslag lyfts fram av
Gustavsson, Måhl och Sundblad (2012) vilka menar att de som kan
vidta åtgärder för att bättre garantera att betygssättningen blir ”rimligt
likvärdig”, det vill säga att ”elever med samma betyg har samma slags
kunskaper/förmågor på ungefär samma kvalitetsnivåer” (sid. 97) är
lärarutbildningen, Skolverket samt rektorer och huvudmän.
På senare tid har sambedömning, det vill säga lärare som
tillsammans genomför eller diskuterar bedömning, förts fram som en
möjlighet att skapa förutsättningar för en mer likvärdig bedömning
och betygssättning. Skolverket (2009a) skriver till exempel i ett
missiv till regeringskansliet att ”ökade krav på sambedömning skulle
leda till ökad bedömaröverensstämmelse bland lärare och vara ett
effektivt sätt att höja kvaliteten på lärares bedömning av nationella
prov” (sid. 17). Sambedömning förs även fram i andra rapporter som
ett sätt att nå en ökad samsyn och samstämmighet bland lärare (se
till exempel Erickson, 2009; Skolinspektionen, 2013; Skolverket,
2009b). Ett exempel är en analys utifrån lärarenkäter och omrättningar
av de nationella proven som Skolinspektionen (2012) genomfört som
visar att högstadie- och gymnasielärare som ensambedömer elevers
prov sätter högre provbetyg relativt externa bedömare jämfört med
lärare som sambedömer proven. Den analys som är gjord visar även
att flertalet av de systematiska skillnader som återfinns i lärarnas
180
EDUCARE 2015:2
bedömningar är mindre uttalade när proven sambedömts än när de
bedömts av enskilda lärare. Även om sambedömning lyfts fram som
ett sätt att öka likvärdigheten vid bedömning och betygssättning är
detta ofta ett antagande som inte är särskilt väl vetenskapligt förankrat
och slutsatser och rekommendationer grundas ofta på intervjuer med
lärare om deras upplevelser av sambedömning. Det finns således ett
behov av mer kunskap inom området och syftet med denna studie är
därför att undersöka och förstå hur sambedömning kan bidra till en mer
samstämmig och likvärdig bedömning och betygssättning.
Likvärdighet
Likvärdig bedömning och betygssättning innebär i grunden att samma
elevprestation förväntas ge samma bedömning och betyg oberoende
av vem som bedömer eller hur prestationen bedöms, samt att det sker i
linje med gällande styrdokument. I dagens mål- och kriterierelaterade
bedömningssystem jämförs elevers prestationer med på förhand
uppställda mål och kriterier, det vill säga kunskapskraven i nuvarande
kurs- och ämnesplaner (Skolverket, 2011a, 2011b). De ämnesspecifika
långsiktiga mål som formulerats i kurs- och ämnesplaner anger vad
undervisningen ska leda fram till och beskriver elevers kunskaper så
som de ska komma till uttryck i handling. Kunskapskraven, i förhållande
till vilka elevers prestationer ska bedömas och betygssättas, utgår i sin
tur ifrån de långsiktiga målen och beskriver hur dessa kan uttryckas på
olika kvalitativa nivåer. Det blir därför centralt att undervisning och
bedömning verkligen bygger på att eleverna får visa sitt kunnande så
som det beskrivs i kurs- och ämnesplaner och att resultaten tolkas och
värderas i enlighet med dessa.
En likvärdig bedömning av elevers prestationer ställer därför
stora krav på bedömaren eftersom det krävs tolkning i flera olika
led. Allal (2013) beskriver professionell bedömning som en process
vilken omfattar tre olika tolkningsled, se Figur 1. I ett första led
ska kurs- och ämnesplaner tolkas och omsättas i undervisning och
bedömningsuppgifter. Elevernas prestationer ska sedan tolkas och
värderas utifrån bedömningsanvisningar och/eller kunskapskrav och
slutligen ska elevers olika prestationer sammanvägas till ett betyg eller
till ett kunskapsomdöme. Utifrån en sådan modell räcker det inte att
EDUCARE 2015:2
181
beskriva bedömning och betygssättning som en process som startar i och
med att elevers prestationer ska bedömas utan bedömningsprocessen
behöver ha en tydlig linje som förbinder ett ämnes mål och syfte med
undervisning, kunskapskrav och bedömning, så kallad ”alignment”
(Biggs & Tang, 2007).
Figur 1. Modellen beskriver hur bedömningsprocessen omfattar flera olika
tolkningsled. (1) Tolkning av styrdokument för planering av undervisning och
för konstruktion av bedömningsuppgifter, (2) tolkning och värdering av enskilda
elevprestationer samt (3) sammanvägning av flera elevprestationer till betyg eller
kunskapsomdöme. För en likvärdig bedömning krävs samsyn mellan lärare i
samtliga dessa led. Modellen är anpassad med utgångspunkt från Allal (2013).
För en likvärdighet i det första tolkningsledet krävs att lärare gör en
gemensam tolkning av kurs- och ämnesplaner för sedan kunna planera
undervisning och konstruera bedömningsuppgifter i linje med dessa.
Harlen (2004) menar att hur konsekventa lärare är vid bedömningen
182
EDUCARE 2015:2
av elevprestationer hör samman med i vilken utsträckning de har
förstått styrdokumenten och i vilken utsträckning detta sedan omsätts
i undervisning. Det innebär även att lärare måste göra tolkningar av
vad som är utmärkande för prestationer på olika nivåer och vad som
skiljer prestationer på olika nivåer ifrån varandra.
I det andra tolkningsledet handlar det om att tolka och värdera
elevers prestationer på bedömningsuppgifter. Sadler (1998) beskriver
detta som en process i tre steg vilken innebär att lärare (1) riktar
uppmärksamhet mot elevprestationen (2) värderar denna mot till
exempel ett ramverk och (3) ger ett explicit svar, som till exempel att
ge prestationen en poäng, ett omdöme eller ett betyg. Att ha en samsyn
kring bedömningen omfattar de två första stegen i Sadlers beskrivning,
vilket kan innebära att lärarna har en gemensam uppfattning om vad
det är som ska bedömas och vad som kännetecknar olika kvaliteter i
elevernas visade kunnande. Att lärare har en samsyn behöver däremot
inte nödvändigtvis innebära att de sedan avger samma omdöme i
steg tre, det vill säga att de har en samstämmighet i sin bedömning.
Sadler (1998) ger även exempel på faktorer som påverkar lärare vid
bedömning. Sådana faktorer kan vara egna ämneskunskaper, kunskap
om de kriterier och kravnivåer som används vid bedömningen,
kunskap om eleven som bedöms eller erfarenhet av att ha bedömt
liknande uppgifter tidigare. Det finns därför goda skäl att anta att det
kan finnas en stor variation i hur olika lärare tolkar och värderar elevers
prestationer.
I det tredje tolkningsledet ska olika elevprestationer sammanvägas
till ett betyg eller till ett kunskapsomdöme utifrån kurs- eller
ämnesplanernas kunskapskrav. För att betygssättningen ska vara
likvärdig krävs att kunskapskraven tolkas på samma sätt av olika
lärare. I kunskapskraven används ett antal värdeord som i viss
utsträckning är gemensamma och återfinns i flera ämnen. Skolverket
(2012a) menar att värdeorden får ”sin betydelse i de sammanhang
de används” och att det därför inte är möjligt att göra generella
definitioner av dessa. Ett värdeords innebörd kan dessutom skilja
mellan olika situationer och mellan olika uppgifter. Allal (2013) har
studerat lärares betygssättningspraktik samt de överväganden som
görs vid betygssättning och hon beskriver att denna praktik omfattar
två huvudsakliga operationer: (1) insamlande av information utifrån
EDUCARE 2015:2
183
varierade källor och (2) hur denna information tolkas och sammanvägs
till ett betyg. Hur det samlade underlaget används vid sammanvägning
till ett betyg beskrivs av Allal som en tolkningsprocess som kan se
olika ut för olika elever.
Sammantaget kan man konstatera att de tre tolkningsleden kan
utgöra en osäkerhet i bedömningen och betygssättningen, vilket kan
beskrivas i termer av bristande likvärdighet. För en ökad likvärdighet
krävs därför en samsyn i samtliga tolkningsled och att lärare värderar
liknande prestationer på ett likvärdigt sätt.
I Sverige har lärare stort förtroende när det kommer till bedömning
och betygssättning. Ofta är det samma lärare som både bedömer, rättar
nationella prov och sätter betyg. Fördelarna med ett sådant system där
summativa bedömningar utförs av samma lärare som också undervisar
eleverna är bland annat att lärare har möjlighet att bedöma utifrån ett
bredare underlag och utifrån fler lärandemål än när bedömning sker
utifrån enstaka tester utförda vid särskilda tillfällen (Harlen, 2005).
Lärares bedömningar anses därför ha hög validitet (Crooks, 1988).
Däremot anses de ofta ha lägre reliabilitet, främst eftersom lärare har
en förförståelse om enskilda elever samt om den undervisning eleverna
fått. Ur ett internationellt perspektiv är det förhållandevis ovanligt att
summativa bedömningar med stor betydelse för elever utförs av den
undervisande läraren. Eftersom lärare i det svenska skolsystemet har ett
stort inflytande över både undervisning, bedömning och betygssättning,
trots de brister det kan medföra ur ett likvärdighetsperspektiv, blir det
angeläget att finna metoder för att stärka likvärdigheten. Detta görs på
olika sätt genom bland annat tillhandahållandet av nationella prov och
bedömningsstöd av olika slag.
Sambedömning
En strategi som ofta lyfts fram i forskningslitteratur och i andra
sammanhang som ett sätt att få valida och reliabla bedömningar
är sambedömning. Sambedömning har till exempel föreslagits av
Skolverket (2009a) att ingå som ett sätt att öka likvärdigheten i lärarnas
bedömning och betygssättning, tillsammans med nationella prov och
övrigt bedömningsstöd. Sambedömning används även i länder som inte
har nationella prov då det därmed finns behov av andra sätt att stödja
184
EDUCARE 2015:2
en likvärdig bedömning. Ett känt exempel är i delstaten Queensland,
Australien, där man har mångårig erfarenhet av sambedömning på
olika nivåer, både lokalt, regionalt och på delstatsnivå (Klenowski,
2012).
En vetenskaplig definition av sambedömning är inte tydligt
etablerad. I forskningsstudier är det vanligt att man undersöker
”inter-rater reliability” där olika bedömare, oberoende av varandra,
bedömer samma elevprestationer för att se hur dessa överensstämmer
med varandra. Det är även vanligt att bedömare i sådana studier fått
speciell träning för uppdraget. Ett annat begrepp är ”co-assessment”
som innebär att lärare och elever eller studenter samverkar kring
bedömning. Sambedömning, så som begreppet används i denna studie,
har en annan innebörd och fokus ligger istället på hur lärare samverkar
med varandra kring frågor om bedömning.
Ett begrepp som återkommer i forskningslitteraturen är ”moderation”.
”Moderation ” kan innebära en extern inspektion där särskilt utvalda
inspektörer kontrollerar hur bedömningen genomförs (Harlen, 1994).
En annan form kan vara att lärares bedömning jämförs med något
referenstest eller kalibreras mot något annat bedömningsinstrument
(Gipps, 1994) genom så kallad ”statistical moderation”. Det begrepp
som bäst fångar sambedömning i detta sammanhang är den beskrivning
av ”moderation” som benämns ”social moderation” eller ”consensus
moderation” (Gipps, 1994; Linn, 1993) och innebär att olika bedömare
försöker nå konsensus i hur bedömning och betygssättning ska
genomföras (Gipps, 1994). Begreppet ”moderation” kommer av
”att reglera” eller ”att plana ut” (Sadler, 2013). En sådan reglering
kan åstadkommas genom att medelvärden av flera olika bedömares
bedömningar beräknas, men då kommer man inte åt de underliggande
orsakerna till olikheterna. Syftet med ”social moderation” är att få
högre reliabilitet och validitet i lärares bedömningar så att de både
stämmer överens med intentioner i styrdokumenten och att de är
jämförbara på olika nivåer (Wilson, 2004). Eftersom sambedömning
ger förutsättningar för diskussioner, som kan leda till en ökad samsyn
kring styrdokument, samtidigt som det ger möjligheter för lärare att
kalibrera sin bedömning gentemot andra lärares bedömningar, förs
sambedömning ofta fram som en väg för att nå ökad samstämmighet
vid bedömning.
EDUCARE 2015:2
185
Begreppet ”moderation” används i vid bemärkelse i forsknings
litteraturen och kan innebära att lärare träffas vid särskilda möten,
antingen inom den egna skolan eller mellan olika skolor och har
med sig exempel på elevarbeten på olika nivåer. ”Moderation” kan
även genomföras ”on-line” vilket gör att lärare från geografiskt
skilda skolor kan komma i kontakt med varandra (se till exempel
Adie, 2010). ”Moderation” kan utföras före, under och efter själva
bedömningstillfället och är även genomförbart som en fortlöpande
process (Maxwell, 2002). Bedömningen kan ske med eller utan explicita
bedömningsanvisningar eller direkt utifrån kriterier och kravnivåer.
Vid sådana möten ges lärare tillfälle att diskutera olika exempel på
elevarbeten och gå igenom hur de motsvarar specificerade kravnivåer.
Genom sådan diskussion och klassificering ges förutsättningar för
lärare att kalibrera sin bedömning mot andra vilket kan leda till en
högre reliabilitet (Klenowski & Wyatt-Smith, 2010).
Klenowski och Adie (2009) beskriver tre olika typer av ”social
moderation”:
186
•
”The calibration model”. Denna modell innebär att lärare först
bedömer ett antal elevarbeten från olika klasser eller skolor
individuellt. Bedömningen diskuteras sedan gemensamt i syfte
att nå konsensus och gemensam förståelse för kravnivåer.
Därefter bedömer varje lärare sina egna elevers arbeten.
•
”The conferencing model”. Denna modell innebär att lärare
först bedömer sina egna elevers prestationer. Därefter
diskuteras ett representativt urval gemensamt med målet att
nå konsensus och gemensam förståelse. Eventuell görs sedan
en omvärdering av den ursprungliga bedömningen.
•
”The expert model”. Modellen innebär att lärare bedömer
elevarbeten som sedan lämnas vidare till en expert. Lärarna
får sedan tillbaka feedback på sin bedömning kring hur
konsekvent de använt sig av angivna kravnivåer.
EDUCARE 2015:2
Begreppet sambedömning så som det används och definieras i den
här beskrivna studien avser lärare som tillsammans genomför eller
diskuterar bedömning och/eller betygssättning och kan sägas omfatta
de två första beskrivningarna av ”social moderation”. I båda dessa
modeller är målet att nå konsensus kring bedömningen. I definitionen av
sambedömning som avses i denna studie behöver målet nödvändigtvis
inte vara konsensus utan kan även omfatta att synliggöra skilda synsätt
vid bedömning och betygssättning av elevers prestationer.
Studiens upplägg och genomförande
Då likvärdighet vid bedömning och betygssättning är en process som
kan påverkas i flera led blir det viktigt att förstå var i denna process som
sambedömning kan ge effekter och om det finns andra faktorer som
kan påverka, så kallade modererande faktorer. För att kunna diskutera
på vilket sätt sambedömning kan bidra till en mer samstämmig och
likvärdig bedömning och betygssättning blir de frågor som denna
studie söker svar på därför:
•
Vilka effekter kan sambedömning ge?
•
Vilka faktorer kan påverka sambedömningsprocessen?
För att få en översikt över det aktuella kunskapsläget kring
sambedömning och dess eventuella effekter har en systematisk
litteraturstudie valts som vetenskaplig metod (jfr Forsberg &
Wengström, 2008), vilket innebär att sökningar efter kvalitativa och
kvantitativa studier genomförs. Dessa studier granskas sedan och
resultaten sammanförs till en ny helhet. Genom att använda resultaten
från vetenskapliga studier kan en djupare förståelse och en bredare
bild skapas samtidigt som det ger möjlighet att identifiera eventuella
kunskapsluckor (ibid). Då de vetenskapliga studier och resultat som
ligger till grund för denna litteraturstudie är rapporterade på olika sätt
samt i stort sett saknar rapportering av kvantitativa data, har vi valt
att inte göra en meta-studie utan istället en narrativ beskrivning av
resultaten.
EDUCARE 2015:2
187
Litteratursökning
Studier söktes primärt under september 2012 i olika databaser. Följande
sökord användes och kombinerades på olika sätt: teacher, assessment,
teacher-based assessment, national test, moderation, marking,
reliability, consensus, validity. Exempel på sökordskombinationer
var teacher, assessment, moderation och teacher-based assessment,
reliability. Den primära sökningen resulterade i ett stort antal sökträffar
vilka utgjorde ett första urval. Efter genomläsning och katalogisering
gjordes ett andra urval. Ett fåtal studier gick av olika anledningar inte
att få fram eller var bortplockade ifrån de adresser som angavs. Även
manuella sökningar utfördes utifrån referenslistor i syfte att utvidga
det möjliga resultatet. Under arbetets gång gav tidskriften ”Assessment
in Education: Principles, Policy & Practice” ut ett temanummer om
”Moderation practice and teacher judgement”. Även dessa artiklar
lästes igenom och relevanta artiklar inkluderades i denna studie.
Urvalskriterier
För att en studie skulle anses relevant och inkluderas i det andra urvalet
sattes följande urvalskriterier upp:
1. Studien skulle vara empirisk, det vill säga den skulle ha
studerat lärare som sambedömer, antingen som studiens
huvudfokus eller som en delstudie.
2. Studien skulle avse sambedömning i grundskola, gymnasium
eller vuxenutbildning (på grundskole- eller gymnasienivå)
eller motsvarande. Inte förskola eller högre utbildning. Vilket
skolämne sambedömningen utfördes i var inte begränsande.
3. Studien skulle vara publicerad och vetenskapligt granskad.
Urval
Urvalet av studier genomfördes i olika steg. I det första urvalet ingick
62 studier. Efter genomläsning föll ett antal studier ifrån, främst
eftersom det inte handlade om sambedömning i bemärkelsen att lärarna
utförde bedömningen tillsammans eller för att de inte var empiriska.
188
EDUCARE 2015:2
Efter en slutlig genomläsning återstod 23 studier vilka ligger till grund
för denna litteraturstudie.
Analys
I studien har en kvalitativ innehållsanalys (se till exempel Graneheim &
Lundman, 2004) genomförts. Innehållsanalysen inleddes genom att de
studier som föll inom ramen för urvalskriterierna lästes igenom ett flertal
gånger och därefter valdes meningsbärande enheter, meaning units, ut
och fördes in i en tabell. Meningsbärande enheter är ord, meningar
eller delar av texter som innehåller aspekter vilka relaterar till varandra
genom innehåll och kontext (Graneheim & Lundman, 2004). Detta
urval är en kritisk process (ibid.) och utfördes i två steg. Inledningsvis
markerades delar av texterna och först efter ytterligare genomläsningar
valdes enheterna ut och fördes in i en tabell. Kategorier skapades
genom att de meningsbärande enheterna kodades och grupperades i
gemensamma teman. I den genomförda studien skapades preliminära
kategorier som efter diskussioner reviderades. Krippendorf (1980)
menar att de kategorier som skapas måste vara både uttömmande och
ömsesidigt uteslutande för att skapa tillförlitlighet. I något fall innebär
kategoriseringen att data passade in i mer än en kategori. Graneheim
och Lundman (2004) menar dock att det inte alltid är möjligt att skapa
sådana ömsesidigt uteslutande kategorier när de texter studien baseras
på innefattar människors erfarenheter, vilket är fallet i denna studie.
Resultat
Kontext och forskningsdesign
Av de 23 studierna har sju genomförts i Australien, främst i delstaten
Queensland, sju i Storbritannien, sex i USA och en studie vardera från
Portugal och Nya Zealand. En av studierna har genomförts som en
komparativ studie mellan Australien (Melbourne) och Hong Kong. De
flesta studierna (17) innefattar lärare från olika nivåer i skolsystemet
med en tonvikt mot grundskolan. Tre studier har omfattat lärare från
motsvarande vårt gymnasium, två från högstadiet och en studie från
lågstadiet. Merparten av studierna har varit huvudsakligen kvalitativa
och inneburit att lärare som deltagit i sambedömning blivit intervjuade
EDUCARE 2015:2
189
före, under och efter sambedömningsinsatsen. Observationer av
sambedömningsmöten har ibland genomförts och ibland har olika
typer av dokument och andra underlag samlats in. En del studier
har kompletterat sådana data med enkäter. Lärare och rektorer är de
huvudsakliga informanterna, men även personer med särskild kunskap
eller ansvar för bedömningsfrågor har ingått som informanter. Få studier
är experimentella, där effekter av sambedömningsinsatser studerats
och mätts på ett systematiskt sätt. Tre studier har varit kvantitativa
i bemärkelsen att de använt data för att avgöra i vilken omfattning
sambedömningen leder till en ökad bedömaröverensstämmelse.
Resultaten i denna studie baseras därmed till betydande del på lärares
uppfattningar av sambedömning. Lärare kan till exempel uppfatta att
likvärdigheten i bedömningen på en skola har ökat utan att man faktiskt
har belägg för att det också förhåller sig på detta vis.
Vilka effekter kan sambedömning ge?
Analysen av den forskning som ligger till grund för litteraturöversikten
resulterade i att fyra kategorier av effekter kunde urskiljas:
•
•
•
•
Effekter på lärares förståelse för kriterier och kvaliteter i
elevers prestationer
Effekter på samstämmighet vid bedömning
Effekter på lärares kompetens
Effekter på de kollegiala relationerna
Gränserna mellan dessa kategorier är inte skarpa vilket medför att
resultat som kan sorteras in under en kategori eventuellt även kan
höra hemma i en annan. Till exempel kan man anta att om en grupp
lärare får en djupare förståelse för vad bedömningskriterierna innebär
så ökar även kompetensen hos den enskilde läraren att bedöma sina
elevers prestationer i förhållande till dessa. Resultaten i varje kategori
kommer att redovisas genom att först ge en beskrivning av vad som är
utmärkande för respektive kategori åtföljt av resultaten och exempel
på någon eller några studier.
190
EDUCARE 2015:2
Effekter på lärares förståelse för kriterier och kvaliteter i elevers
prestationer
Resultat inom denna kategori innebär att lärares förståelse för och
uppfattning av de kriterier och kravnivåer som elevers prestationer ska
bedömas utifrån vid sambedömning påverkas. Sådana uppfattningar
blir synliga vid diskussioner utifrån konkreta elevprestationer varför
även lärares förståelse för och uppfattning av olika kvaliteter i elevers
prestationer hamnar inom denna kategori. Att lärare tillsammans
diskuterar bedömning av elevers prestationer i förhållande till kriterier
och kravnivåer verkar resultera i en ökad samsyn kring vad dessa
kriterier och kravnivåer innebär och hur de kan användas (Connolly,
Klenowski & Wyatt-Smith, 2012; Hall & Harding, 2002; Reid, 2007;
Roberts, Wilson & Draney, 1997). Davison (2004) visar till exempel i en
studie att lärare med erfarenhet av sambedömning har en större samsyn
vid bedömning än lärare utan sådana erfarenheter. Trots det finns det
variationer i hur lärare uppfattar och använder bedömningskriterier
vilket kan tolkas som att även om bedömningar på ett ytligt plan är att
betrakta som samstämmiga så kan de underliggande avvägningarna
som ligger bakom ändå skilja sig åt (ibid.).
Effekter på samstämmighet vid bedömning
Till denna kategori räknas studier som ger belägg för att lärares
samstämmighet vid bedömning av elevers prestationer påverkas
vid sambedömning. I de studier som litteraturöversikten omfattar
har detta uttryckts på olika sätt, till exempel i termer av reliabilitet,
överensstämmelse och likvärdighet. Att lärares bedömning av elevers
prestationer blir mer samstämmig som en direkt följd av sambedömning
finns inte tydligt dokumenterat. I tre studier (de Eca & Torres, 2005;
Falk & Ort, 1998; Syverson, 2009) rapporteras att lärares bedömningar
överensstämmer till mellan 80 och 90 procent efter att de deltagit i
sambedömning. Däremot är resultaten i samtliga dessa studier inte
redovisade på ett sådant sätt att data kunnat verifieras. Det finns även
studier som pekar på att sambedömning inte har någon större påverkan
på lärares samstämmighet vid bedömning (Baird, Greatorex & Bell,
2004) och att lärare utan erfarenhet av sambedömning gör bedömningar
som är jämförbara med bedömningar utförda av lärare med erfarenhet
av sambedömning (Connolly et al., 2012; Morgan & Watson, 2002).
EDUCARE 2015:2
191
Att samstämmigheten vid bedömning ökar lyfts däremot fram i några
studier som en trolig effekt av sambedömning (Adie, Klenowski
& Wyatt-Smith, 2012; Clarke & Gipps, 2000), men det poängteras
samtidigt att sådana antaganden behöver styrkas genom ytterligare
studier. Det finns alltså inga tydliga resultat, varken för eller emot,
som pekar på att sambedömning skulle leda till en mer samstämmig
bedömning av elevers prestationer.
Effekter på lärares kompetens
När lärare sambedömer elevers prestationer kan det ge effekter som
påverkar den enskilde lärarens kompetens i dennes yrkesutövning.
Sådana effekter som kunde urskiljas i de genomgångna studierna
var: en ökad kompetens hos lärare i att tolka styrdokument och
att omsätta dessa i undervisning, ökad kompetens att urskilja
kvaliteter i elevers prestationer, ökad kompetens att på ett tydligt sätt
kommunicera kriterier och kravnivåer till elever samt ökad ämnes- och
ämnesdidaktisk kunskap hos lärarna. I en studie av Bolt (2011) uppgav
till exempel lärare att de genom sambedömning blivit bättre på att
finna belägg för elevers kunnande och att sedan använda dessa för att
förbättra undervisningen.
Effekter på de kollegiala relationerna
Att samarbeta med andra lärare genom sambedömning kan också ge
effekter som påverkar de kollegiala relationerna på olika sätt. Till
denna kategori räknas därför resultat som pekar på att till exempel
känslan av gemenskap och tillhörighet ökar eller att lärare får stöd att
hantera olika situationer i det dagliga arbetet. Även om detta inte är
en faktor som har en direkt påverkan på bedömningens likvärdighet så
har det betydelse för enskilda lärares upplevelse av att sambedöma och
därmed för på vilket sätt dessa lärare deltar i sambedömningen. Roberts
et al. (1997) visar till exempel på att en stark kollegialitet bidrar till
framgång vid sambedömning medan Adie (2012) varnar för att framför
allt oerfarna lärare kan vara särskilt känsliga för meningsskiljaktigheter
och för att uttrycka en avvikande åsikt.
192
EDUCARE 2015:2
Vilka faktorer kan påverka sambedömningsprocessen?
Det finns även en rad olika faktorer som kan påverka
sambedömningsprocessen och därmed även indirekt bedömningens
och betygssättningens likvärdighet. I analysen identifierades ett antal
sådana faktorer vilka delades in i tre olika kategorier: (1) faktorer
som kopplas till struktur och organisation; (2) faktorer kopplade till
sambedömningssituationen och (3) faktorer kopplade till deltagarna i
sambedömningsprocessen.
Struktur och organisation
Att ha en tydlig och noga genomtänkt struktur och organisation kring
sambedömningen tycks vara en avgörande faktor för utfallet och i
denna kategori finns tre faktorer som är särskilt viktiga att beakta. Den
första är att det finns en god struktur och ett tydligt ledarskap eftersom
detta bidrar till att hålla fokus och att fördjupa diskussionerna på ett
utvecklande sätt (Little, Gearhart, Curry & Kafka, 2003). För det andra
är det av vikt att ta ställning till om syftet med sambedömningen är att
nå konsensus eller inte. Det verkar som att det är när lärare har olika
uppfattningar kring hur en prestation ska bedömas som det ges störst
möjlighet till lärande (Adie, 2012). Den tredje faktorn kopplad till
denna kategori berör hur gruppen som ska sambedöma är sammansatt.
I studier där lärare intervjuats om sin uppfattning om sambedömning
värderar de ofta sambedömning tillsammans med kollegor på den egna
skolan eller i det egna skolområdet högst (se exempelvis Bolt, 2011).
I andra studier argumenteras för värdet av att sambedömning sker
mellan lärare från olika skolor eller distrikt eftersom det innebär ökade
möjligheter att tillföra nya perspektiv i diskussionerna (se exempelvis
Reid, 2007).
Bedömningssituationen
När lärare sambedömer så kan bedömningssituationen utformas på
olika sätt. Till denna kategori räknas därför faktorer som kan påverkas
av hur bedömningssituationen utformas som till exempel vilket
bedömningsunderlag som används, hur underlaget är utvalt samt vilka
eventuella bedömningsanvisningar som används. Sådana val kan få
betydelse för utfallet av sambedömningen. Till exempel så tenderar
EDUCARE 2015:2
193
bedömningen att få en mer formativ karaktär om man utgår ifrån en
icke-färdig prestation eftersom man då fokuserar på vad som kan
bli nästa steg i elevens lärande (Reid, 2007). En viktig faktor för att
sambedömningen ska bli framgångsrik är att det finns en variation
och bredd bland de elevprestationer som väljs ut som underlag. En
stor bredd av prestationer från elever med olika bakgrund är centralt
för att lärare ska kunna göra mer nyanserade bedömningar av olika
kvaliteter i elevernas prestationer och för att kunna ta med sig sina
erfarenheter i nya situationer (Falk & Ort, 1998). Att kunna använda
tillgängligt bedömningsmaterial, så som bedömningsanvisningar och
kravnivåer, på ett flexibelt sätt är ytterligare en central faktor eftersom
det hjälper lärare att hålla fokus på elevprestationerna och att fördjupa
diskussionerna (Little et al., 2003).
Bedömarna
Till denna kategori räknas faktorer som kan knytas till deltagarna
och det sätt på vilket de deltar. Det kan till exempel handla om
den påverkan den ursprungliga bedömaren eller den undervisande
läraren har om denne deltar i sambedömningen. Ett annat exempel är
deltagarnas olika erfarenheter. Oerfarna lärare verkar ha särskilt stort
utbyte av sambedömning (Baird et al., 2004; Crisp, 2013) eftersom det
kan vara ett sätt att få stöd i att utföra bedömningar och att få ta del av
mer erfarna kollegors kunskaper. Det kan emellertid vara svårt för en
oerfaren lärare som har en avvikande uppfattning att göra sin röst hörd
i förhållande till mer erfarna kollegor (Adie, 2012), vilket i sin tur kan
påverka både diskussionerna och hur man ställer sig till att fortsätta
delta i sambedömning (Adie, 2012; Adie et al., 2012; Black, Harrison,
Hodgen, Marshall & Serret, 2010).
Resultatdiskussion
Studien har syftat till att förstå på vilket sätt sambedömning kan bidra
till en likvärdig bedömning och betygssättning av elevers prestationer
genom att söka svar på vilka dokumenterade effekter sambedömning
kan ha samt hur denna process kan påverkas av olika faktorer. Resultaten
pekar på att sambedömning kan bidra till en ökad likvärdighet främst
eftersom det kan medföra en samsyn kring hur styrdokumenten tolkas
194
EDUCARE 2015:2
och kring hur elevers prestationer bedöms, men även eftersom lärare
kan få en ökad kompetens att undervisa och bedöma.
Som tidigare beskrivits kräver en likvärdig bedömning att lärare
är samstämmiga i flera tolkningsled. I detta avsnitt kommer frågan
om huruvida sambedömning har potential att leda till en sådan
samstämmighet att diskuteras i förhållande till de tre tolkningsleden.
Inledningsvis lyfts argument som talar för detta fram (dvs. ökad
bedömarkompetens och ökad samsyn) och därefter argument som talar
emot (dvs. lärares olika tolkning, att samsyn inte är samma sak som
samstämmighet och sammanvägningen till omdömen).
Ökad bedömarkompetens
Ett av argumenten för att likvärdigheten i lärares bedömning och
betygssättning ökar som en följd av sambedömning är att resultaten
pekar på att det leder till ökad bedömarkompetens hos lärarna.
Sambedömning ger lärare möjlighet till diskussion och reflektion kring
frågor kopplade till undervisning och bedömning utifrån konkreta
elevprestationer. Vid diskussioner kring kvaliteter i elevers prestationer
tvingas lärare att sätta ord på vad som skiljer olika prestationer från
varandra och vad som är prestationens styrkor respektive svagheter.
Därmed måste lärare även identifiera vad som är nästa steg i elevernas
lärande, vilket i sin tur kan innebära att lärare blir bättre på att
finna belägg för elevers kunnande och att använda kunskapen som
utgångspunkt vid planering av undervisning (Bolt, 2011; Falk & Ort,
1998; Malone, De Lucchi & Long, 2004). Ökad bedömarkompetens
i kombination med utvecklade insikter som stödjer undervisningen
(Bolt, 2011; Clarke & Gipps, 2000; Falk & Ort, 1998) innebär därmed
att både det första och det andra tolkningsledet stärks, och därmed även
likvärdigheten. Resultaten av denna forskningsöversikt ger däremot
inga tydliga belägg för att lärares bedömningskompetens beträffande
sammanvägning av olika prestationer till ett kunskapsomdöme eller
betyg, det vill säga tolkningsled tre, ökar.
Ökad samsyn
Ett annat resultat som talar för att sambedömning kan leda till en ökad
likvärdighet vid bedömning och betygssättning är att det skapar en
EDUCARE 2015:2
195
samsyn mellan lärare kring vad mål, kriterier och kravnivåer innebär
(Connolly et al., 2012; Hall & Harding, 2002; Reid, 2007; Roberts et
al., 1997). Att lärare får en samsyn kring styrdokumenten beror bland
annat på att olika sätt att uppfatta dessa blir synliggjorda och föremål
för diskussion utifrån konkreta elevprestationer. Adie et al. (2012)
menar att en gemensam förståelse bland lärare för de begrepp som
används är en förutsättning för att kunna diskutera och sambedöma.
Att utgå ifrån konkreta elevprestationer tvingar lärare att sätta ord på
sina uppfattningar så att dessa blir tydliga och medvetandegjorda, både
för den enskilde läraren men även för kollegor, vilket kan leda till
att lärare omförhandlar sin bedömning (ibid.). Enligt Sadler (2009) är
sådana kravnivåer som används i styrdokumenten abstrakta och för
att utveckla en förståelse för dessa behövs just konkreta exempel för
att illustrera olika kvaliteter. Diskussioner utifrån konkreta exempel
blir då betydelsefulla för att utveckla en gemensam förståelse för
innebörden av kravnivåerna och för utvecklandet av en känsla för
vad som utmärker olika kvaliteter. Harlen (2004) menar att hur pass
konsekventa lärare är i vid bedömningen av elevprestationer hör
ihop med hur man tolkat styrdokumenten och hur dessa omsatts i
undervisning. Att därför låta sambedömningen omfatta även det första
tolkningsledet blir då betydelsefullt för en likvärdig bedömning och
betygssättning eftersom samsyn påverkar både reliabilitet och validitet
vid bedömning (Harlen, 2004; Holroyd, 2000).
Lärares olika tolkning
Ökad bedömarkompetens och samsyn ger goda förutsättningar för en
likvärdig bedömning och betygssättning, men det finns å andra sidan
sådant som talar emot detta. Ett problem kan vara att även om lärare
enas om bedömningen av en elevprestation eller kring tolkningen av
styrdokumenten så är det inte självklart att en sådan tolkning är korrekt
eller i linje med hur andra lärare gör motsvarande tolkningar. En
konsekvens kan då bli att lärares bedömningar blir samstämmiga utan
att vara i linje med styrdokumenten. Ett sätt att komma ifrån att lärares
bedömningar sker utifrån en felaktig tolkning av styrdokumenten
skulle kunna vara att enbart utgå från till exempel nationella prov
vid bedömning och betygssättning, eftersom olika provkonstruktörer
här gjort tolkningen av styrdokumenten åt lärarna. Å andra sidan ger
196
EDUCARE 2015:2
det inte lärare den kunskap och kompetens som krävs för att själva
kunna planera och genomföra undervisning och bedömning i linje med
styrdokumenten. Genom att låta sambedömningen omfatta det första
tolkningsledet kan man däremot förvänta sig att lärare utvecklar en
samsyn kring styrdokumenten som i sin tur kan ge förutsättningar för
en mer samstämmig bedömning också i andra bedömningssituationer
än vid bedömningen av de nationella proven. En annan konsekvens kan
vara att likvärdigheten tenderar att bli tämligen lokal när sambedömning
sker mellan lärare på enskilda eller närliggande skolor. Det finns studier
där lärare träffats över skolgränser och ibland också över internet,
vilket kan skapa förutsättningar för nationell likvärdighet. Ett utvecklat
exempel med goda erfarenheter från detta är i Queensland, Australien.
Här har man inga nationella prov utan istället ett väl utbyggt system
för sambedömning i flera steg, på lokal, regional och nationell nivå
(Maxwell, 2007). Detta kräver dock en organisation och struktur som
i dagsläget inte finns i Sverige.
Samsyn är inte samstämmighet
Ökad samsyn betyder inte heller nödvändigtvis att likvärdigheten
vid bedömning och betygssättning ökar, eftersom samsyn och
samstämmighet inte är samma sak. Det finns få studier som styrker att
sambedömning ger ökad samstämmighet vid bedömning och de studier
som återfunnits ger motsägelsefulla resultat. Sadler (1998) beskriver
den del av bedömningsprocessen där lärare tolkar och värderar elevers
prestationer som ett förlopp i tre steg: (1) uppmärksamhet riktas mot
elevprestationen; (2) elevprestationen värderas mot till exempel ett
ramverk och (3) poäng, betygsbelägg eller dylikt utdelas. Utifrån en
sådan beskrivning av lärares bedömning kan samsyn innebära att lärare
är överens i steg 2 om hur en elevprestation ska tolkas och värderas, det
vill säga vad som utifrån bedömningskriterierna är elevprestationens
styrkor och vad i denna som är mindre bra. En sådan samsyn betyder
inte nödvändigtvis att lärare i nästa steg (3) är överens och ger
elevprestationen exakt samma poäng eller betygsbelägg. Även det
omvända förhållandet kan råda, det vill säga att lärare i steg 2 värderar
olika kriterier på olika sätt i förhållande till varandra men ändå gör
en likartad helhetsbedömning i steg 3. En svensk studie genomförd
av Olofsson (2006) pekar på detta. I studien har fyra lärare bedömt
EDUCARE 2015:2
197
elevarbeten från det nationella provet i matematik, först enskilt och
därefter ännu en gång efter att ha sambedömt där emellan. Resultatet
visar att lärarna efter sambedömning ändrade sina bedömningar i viss
utsträckning så att de blev mer samstämmiga men även att lärare var
olika benägna att revidera sina bedömningar, bland annat beroende på
vilka kriterier de hade olika uppfattningar kring. Detta kan få till följd
att olika elevers prestationer, även om man sambedömer, kan få en
likartad bedömning men att denna baseras på olika kriterier. Om detta
är att betrakta som godtagbart eller inte beror på i vilken utsträckning
man kräver samstämmighet och på vilka grunder. Måste lärares
bedömning och betygssättning vara exakt lika eller är det tillräckligt
att vara överens om på vilka grunder elevprestationerna bedöms? Ett
sätt att få till stånd samstämmighet är förstås att kräva konsensus. En
nackdel med detta, förutom att det är väldigt tidskrävande att bedöma
samtliga elevprestationer tillsammans, är dock att det finns en risk att
olika uppfattningar blir svåra att hantera och att målet blir att komma
överens snarare än att skapa en samsyn (Davison, 2004). Moss och
Schutz (2001) varnar för att en strävan efter konsensus kan leda
till en falsk trygghet där viktiga argument utesluts, vilket pekar på
betydelsen av att skapa goda förutsättningar för ett öppet och tillåtande
diskussionsklimat om sambedömningen ska ha möjlighet att leda till
samsyn kring styrdokument och bedömning av elevprestationer.
Sammanvägning
Ett annat problem med en likvärdig bedömning är kopplat till det tredje
och sista tolkningsledet när elevers olika prestationer ska sammanvägas
till ett kunskapsomdöme eller ett betyg utifrån olika kravnivåer. För
en likvärdig bedömning i detta led krävs att kunskapskraven tolkas
på samma sätt av olika lärare och att sammanvägningen till omdöme
och betyg sker enligt styrdokumentens föreskrifter. I en studie av Allal
(2013) uppgav lärare att de ofta samarbetade i det första tolkningsledet,
med att planera undervisning och att konstruera bedömningsuppgifter
medan det var mindre vanligt med samarbete i de övriga tolkningsleden.
Dessutom visade det sig att lärarna vid sammanvägning av elevers
resultat till ett betyg gav olika tyngd åt olika informationskällor och
att det skiljde sig åt hur man hanterade olika elevers resultat (ibid).
Även Korp (2006) visar utifrån svenska förhållanden att lärare vid
198
EDUCARE 2015:2
betygssättning använder olika metoder för att sammanväga olika
elevprestationer till ett betyg. Konsekvensen kan bli att även om lärare
är överens om vad som ska bedömas och att enskilda bedömningar är
både reliabla och valida så blir sammanvägningen av olika resultat
en process som hanteras på skilda sätt. Även om det utifrån denna
studie inte finns tydliga belägg för att sambedömning leder till ökad
likvärdighet kring det tredje tolkningsledet finns det andra erfarenheter
som talar för att sådan kan stödjas genom sambedömning, exempelvis
erfarenheter ifrån Queensland. I en rapport från Queensland Studies
Authority (QSA) där man granskat ett stort urval elevportföljer, fann
man en överensstämmelse mellan skolornas och granskningsgruppens
bedömning i 92 procent av fallen (QSA, 2012). Detta tyder på att
sambedömning kan stödja även betygssättningen.
Slutsatser
Det visar sig således att den befintliga forskningen inte ger ett
entydigt svar på frågan om sambedömning leder till en ökad
likvärdighet vid bedömning och betygssättning eftersom utfallet
av sambedömningsprocessen kan påverkas av flera olika faktorer.
Den slutsats som ändå kan dras är att sambedömning har potential
att stödja en likvärdig bedömning och betygssättning eftersom det
finns belägg för att sambedömning kan bidra till en samsyn och till
en ökad bedömarkompetens bland lärare. Man bör däremot inte
förvänta sig att en samsyn är det samma som att lärare ger samma
poäng eller betygsbelägg för samma elevprestation utan snarare att
de grunder utifrån vilka sådana omdömen ges är likartade. Vidare
bör sambedömning ses som en process som omfattar och inkluderar
samtliga tolkningsled i bedömningsprocessen om sambedömning ska
kunna leda till en ökad likvärdighet. Ju fler av tolkningsleden som
sambedömningen omfattar desto större är förutsättningarna för ökad
likvärdighet vid bedömning och betygssättningen.
En ökad likvärdighet till följd av sambedömning bör även ses som en
lokal process som sker på lång sikt och med behov av en tydlig struktur
och ledning. Att likvärdigheten ökar på lokal nivå är däremot inte det
samma som att likvärdigheten ökar på regional eller nationell nivå, om
inte dessa nivåer kopplas samman på något sätt. En sammankoppling
EDUCARE 2015:2
199
kräver en välutbyggd struktur och omfattande satsningar. Erfarenheter
från Queensland, Australien, har visat att detta är möjligt och dessutom
med hög likvärdighet som följd.
Att identifiera andra enskilda faktorer som är av särskild att
betydelse för att sambedömning ska leda till en ökad likvärdighet är
svårare. Något som kan ses som centralt för att sambedömning ska vara
framgångsrikt är variation. Variation blir då en indirekt en faktor som
påverkar likvärdigheten genom att: (1) olika åsikter och perspektiv
beaktas för att skapa förutsättningar för fördjupade diskussioner;
(2) att urvalet av elevprestationer för bedömning speglar en bredd
och variation av prestationer samt (3) att lärare kommer ifrån olika
kontexter och ges möjlighet till sambedömning i olika konstellationer.
Att befintlig forskning om sambedömning och dess effekter till
betydande del grundas på intervjuer med lärare eller på observationer
av lärare när de sambedömer får till följd att forskningen i stor
utsträckning baseras på lärares uppfattningar om sambedömning och
dess effekter. Till exempel kan lärare uppfatta att deras bedömningar
blir mer samstämmiga utan att ha belägg för att det verkligen förhåller
sig på detta sätt. Därför finns ett behov av ytterligare studier som på
ett systematiskt sätt undersöker om sambedömning verkligen leder till
ökad samstämmighet i lärares bedömning. Det finns även en avsaknad
av forskning som studerat sambedömning i det tredje tolkningsledet,
när elevers prestationer ska sammanvägas till ett kunskapsomdöme
eller till ett betyg. Allal (2013) ser detta tolkningsled som centralt för
att stödja en likvärdig bedömning och betygssättning eftersom detta är
en process som hanteras på olika sätt av olika lärare.
200
EDUCARE 2015:2
Referenslista
Adie, Leonore E. (2010). Developing shared understandings of
standards-based assessment: On-line moderation practices across
geographically diverse contexts. Doktorsavhandling, Queensland
University of Technology, Australien.
Adie, Leonore (2012). Learning as identity and practice through
involvement in online moderation. Educational Assessment,
Evaluation and Accountability, 24, 43-56.
Adie, Leonore E., Klenowski, Valentina & Wyatt-Smith, Claire (2012).
Towards an understanding of teacher judgement in the context of
social moderation. Educational Review, 64, 223-240.
Allal, Linda (2013). Teachers’ professional judgement in assessment:
a cognitive act and a socially situated practice. Assessment in
Education: Principles, Policy & Practice, 20, 20-34.
Baird, Jo-Anne, Greatorex, Jackie & Bell, John F. (2004). What makes
marking reliable? Experiments with UK examinations. Assessment
in Education: Principles, Policy & Practice, 11, 331-348.
Biggs, John B. & Tang, Catherine S. (2007). Teaching for quality
learning at university: what the student does. (3. ed.) Maidenhead:
McGraw-Hill/Society for Research into Higher Education.
Black, Paul, Harrison, Christine, Hodgen, Jeremy, Marshall, Bethan &
Serret, Natasha (2010). Validity in teachers’ summative assessments.
Assessment in Education: Principles, Policy & Practice, 17, 215232.
Bolt, Susan (2011). Making consistent judgments: Assessing student
attainment of systemic achievement targets. Educational Forum,
75,157-172.
Clarke, Shirley & Gipps, Caroline (2000). The role of teachers
in teacher assessment in England 1996–1998. Evaluation and
Research in Education, 14, 38-52.
Connolly, Stephen, Klenowski, Valentina & Wyatt-Smith, Claire M.
(2012). Moderation and consistency of teacher judgement: teachers’
views. British Educational Research Journal, 38, 593-614.
EDUCARE 2015:2
201
Crisp, Victoria (2013). Criteria, comparison and past experiences:
how do teachers make judgements when marking coursework?
Assessment in Education: Principles, Policy & Practice, 20, 127144.
Crooks, Terence J. (1988). The impact of classroom evaluation practices
on students. Review of Educational Research, 58, 438–481.
Davison, Chris (2004). The contradictory culture of teacher-based
assessment: ESL teacher assessment practices in Australian and
Hong Kong secondary schools. Language Testing, 21(3), 305-334.
de Eca, Pereira & Torres, Maria T. (2005). Using portfolios for external
assessment: An experiment in Portugal. International Journal of Art
& Design Education, 24, 209-218.
Erickson, Gudrun (2009). Nationella prov i engelska – en studie av
bedömarsamstämmighet. Hämtad 24 februari 2014, från http://
www.nafs.gu.se/digitalAssets/1319/1319572_bed.np-eng-g.
erickson-2009.pdf
Falk, Beverly & Ort, Suzanna (1998). Sitting down to score. Teacher
learning through assessment. Phi Delta Kappan, 80, 59-64.
Forsberg, Christina & Wengström, Yvonne (2008). Att göra
systematiska litteraturstudier: värdering, analys och presentation
av omvårdnadsforskning. (2., [uppdaterade] utg.) Stockholm: Natur
& Kultur.
Gipps, Caroline V. (1994). Beyond testing: towards a theory of
educational assessment. London: Falmer.
Graneheim, Ulla H. & Lundman, Berit (2004). Qualitative content
analysis in nursing research: concepts, procedures and measures to
achieve trustworthiness. Nurse Education Today, 24(2), 105-112.
Gustavsson, Anders, Måhl, Per & Sundblad, Bo (2012). Betygssättning:
en handbok. (1. uppl.) Stockholm: Liber.
Hall, Kathy & Harding, Austin (2002). Level descriptions and teacher
assessment in England: towards a community of assessment
practice. Educational Research, 44(1), 1-16.
Harlen, Wynne (Ed.) (1994) Enhancing Quality in Assessment. BERA
Policy Task Group on Assessment, Paul Chapman Publishers.
202
EDUCARE 2015:2
Harlen, Wynne (2004). A systematic review of the evidence of reliability
and validity of assessment by teachers used for summative purposes.
In: Research Evidence in Education Library. London: EPPI-Centre,
Social Science Research Unit, Institute of Education.
Harlen, Wynne (2005). Teachers’ summative practices and assessment
for learning - tensions and synergies. Curriculum Journal, 16(2),
207-223.
Holroyd, Colin (2000). Are assessors professional? Active Learning in
Higher Education 1 (1), 28–44.
Klenowski, Val & Adie, Leonore (2009). Moderation as judgement
practice: Reconciling system level accountability and local level
practice. Curriculum Perspectives, 29, 10-28.
Klenowski, Valentina & Wyatt-Smith, Claire (2010). Standards-Driven
Reform Years 1-10: Moderation an Optional Extra? Australian
Educational Researcher, 37(2), 21-39.
Klenowski, Valentina (2012). Raising the stakes: the challenges for
teacher assessment. The Australian Educational Researcher, 39(2),
173-192.
Korp, Helena (2006). Lika chanser i gymnasiet? En studie om betyg,
nationella prov och social reproduktion. Doktorsavhandling,
Malmö högskola.
Krippendorff, Klaus (1980). Content Analysis. An Introduction to its
Methodology. The Sage Commtext Series, Sage Publications Ltd.,
London.
Linn, Robert L. (1993). Linking Results of Distinct Assessments.
Applied Measurement in Education, 6(1), 83-102.
Little, Judith W., Gearhart, Maryl, Curry, Marnie & Kafka, Judith
(2003). Looking at student work for teacher learning, teacher
community, and school reform. Phi Delta Kappan, 85, 185-192.
Malone, Larry, De Lucchi, Linda, & Long, Kathy (2004). All Things
in Moderation. Science and Children, 41(5), 30-34.
EDUCARE 2015:2
203
Maxwell, Graham S. (2002). Progressive assessment: Synthesising
formative and summative purposes of assessment. In Frank Ventura
and Grace. Grima (eds), Contemporary issues in educational
assessment: Proceedings of the ACEAB Second International
Conference, Malta 2002, pp. 220–234. Msida, Malta: MATSEC
Examinations Board.
Maxwell, Graham (2007). Implications for moderation of proposed
changes to senior secondary school syllabuses. Paper commissioned
by the Queensland Studies Authority. Brisbane: Queensland Studies
Authority.
Morgan, Candia & Watson, Anne (2002). The interpretative nature of
teachers’ assessments of students’ mathematics: Issues for equity.
Journal for Research in Mathematics Education, 33, 78-110.
Moss, Pamela A. & Schutz, Aaron (2001). Educational standards,
assessment, and the search for consensus. American Educational
Research Journal, 38, 37-70.
Olofsson, Gunilla (2006). En studie av lärares bedömning av
elevarbeten på ett nationellt prov i matematik kurs A. Stockholms
universitet, PRIM-gruppen.
Queensland Studies Authority. (2012). Random sampling project 2012.
Report on random sampling of assessment in Authority subjects.
Brisbane: Queensland Studies Authority.
Reid, Lesley (2007). Teachers talking about writing assessment:
valuable professional learning. Improving Schools, 10, 132-149.
Roberts, Lily, Wilson, Mark & Draney, Karen (1997). The SEPUP
assessment system: An overview BEAR Report Series (Vol. SA97-1). Berkeley: University of California.
Sadler, D. Royce (1998). Formative Assessment: revisiting the
territory. Assessment in Education: Principles, Policy & Practice,
5(1), 77-84.
Sadler, D. Royce (2009). Grade integrity and the representation of
academic achievement. Studies in Higher Education, 34(7), 807-82.
Sadler, D. Royce (2013). Assuring academic achievement standards:
from moderation to calibration, Assessment in Education:
Principles, Policy & Practice, 20 (1), 5-19.
204
EDUCARE 2015:2
Skolinspektionen (2012). Lika för alla? Omrättning av nationella
prov i grundskolan och gymnasieskolan under tre år. Stockholm:
Skolinspektionen.
Skolinspektionen (2013). Tillsyn av bedömning och betygssättning.
Stockholm: Skolinspektionen.
Skolverket (2004). Handlingsplan för en rättssäker och likvärdig
betygssättning. Stockholm: Skolverket.
Skolverket (2009a). Redovisning av regeringsuppdrag att ge förslag
på hur det nationella provsystemet bör utvecklas och utformas.
Stockholm: Skolverket.
Skolverket (2009b). Bedömaröverensstämmelse vid bedömning av
nationella prov. Dnr 2008:286. Stockholm: Skolverket.
Skolverket (2011a). Läroplan för grundskolan, förskoleklassen och
fritidshemmet 2011. Stockholm: Skolverket.
Skolverket (2011b). Läroplan, examensmål och gymnasiegemensamma
ämnen för gymnasieskola 2011. (2011). Stockholm: Skolverket.
Skolverket (2012a). Betygsskalan A-E. Hämtad 24 februari 2014, från:
http://www.skolverket.se/bedomning/betyg
Skolverket (2012b). Likvärdig utbildning i svensk grundskola?
En kvantitativ analys av likvärdighet över tid. Rapport nr. 374.
Skolverket (2012c). Redovisning av uppdrag om avvikelser mellan
provresultat och betyg i grundskolan årskurs 9. Dnr 75-2012:311.
Skolverket (2012d). Redovisning av uppdrag om avvikelser mellan
provresultat och kursbetyg i gymnasieskolan. Dnr 75-2012:311.
Skolverket: Stockholm.
Syverson, Margaret A. (2009). Social justice and evidence-based
assessment with the Learning Record. Forum on Public Policy,
1-27.
Wilson, Mark (Ed.). (2004). Towards coherence between classroom
assessment and accountability. Chicago: University of Chicago
Press.
EDUCARE 2015:2
205
Bedömnings-, dokumentationspraktiker
och pedagogiska identiteter
Ingela Andreasson, Maj Asplund Carlsson
och Marianne Dovemark
When competition and an increasing level of marketisation characterises
school life, the number of evaluations and the level of control has
grown out of proportion. Through comparisons, assessments and
ranking systems, also called ‘the terrors of performativity’ according to
Ball (2003) commercial agents have gained influence over practices of
assessment and documentation within the education system. Increased
demands on pupils’ and parents’ participation and a belief that written
documentation will lead to better results has caused an extensive use of
different web based tools like Unikum. With the point of departure in a
collected material of more than a hundred Individual Educations Plans
(IEP) where commercial web based tools have been used, we make an
analysis with Basil Bernstein’s (1996, 2000) concepts Pedagogic Identity,
and Instructional and Regulative discourse in relation to expectations
and constructions manifest in the plans. The results show that all four
identities are expressed in the plans however, with an emphasis on a
neo-liberal identity. We discuss the results in relation to the instructional
and regulative discourses. The conclusion is that the tools both shape and
determine possible identities and possible discourses in the web based
interaction between children, parents and teachers. Keywords: Keywords: Identity, Individual Education Plans, Pedagogic
Discourse, Performativity, Regulativity
Ingela Andreasson, docent, Institutionen för pedagogik och
specialpedagogik, Utbildningsvetenskapliga fakulteten, Göteborgs
universitet
ingela.andreasson@ped.gu.se
206
EDUCARE 2015:2
Maj Asplund Carlsson, senior professor, Institutionen för pedagogik,
kommunikation och lärande, Utbildningsvetenskapliga fakulteten,
Göteborgs universitet
maj.asplund.carlsson@gu.se
Marianne Dovemark, docent, Institutionen för pedagogik och
specialpedagogik, Utbildningsvetenskapliga fakulteten, Göteborgs
universitet
marianne.dovemark@ped.gu.se
Inledning
I en tid av konkurrens och tilltagande marknadisering har antalet
utvärderingar och kontroller ökat inom utbildningsväsendet. Genom
jämförelser, bedömningsmatriser och olika rankingsystem, vad
Ball (2003) kallar ‘terror of performativity’, har kommersiella
aktörer numera ett betydande inflytande över bedömnings- och
dokumentationspraktiker inom förskola och skola. Ökade krav på
elevers och föräldrars delaktighet och en förhoppning om att skriftlig
dokumentation ska leda till ökad måluppfyllelse har lett till intensifierad
användning av olika webbverktyg. Unikum, Info Mentor och Fronter
är exempel på de största aktörerna på marknaden.
Med utgångspunkt i ett insamlat material av drygt ett hundra
Individuella Utvecklings Planer [IUP] där kommersiella
dokumentationsverktyget Unikum har använts, gör vi i denna artikel
en analys utifrån Basil Bernsteins (1996, 2000) begrepp pedagogisk
diskurs och pedagogisk identitet i relation till de förväntningar och
konstruktioner som skrivs fram i materialet. Syftet är således att studera
hur olika pedagogiska diskurser formar de identiteter som skrivs fram
av barn, föräldrar och lärare i de individuella utvecklingsplanerna.
EDUCARE 2015:2
207
INGELA ANDREASSON, MAJ ASPLUND CARLSSON
OCH MARIANNE DOVEMARK
Bakgrund
Skolreformer i Sverige som decentralisering, mål- och resultatstyrning
och valfrihet har på senare år banat väg för utveckling av en
skolmarknad och en kultur av individualism. Individualiseringen
skrevs tydligt fram bland annat i 1994 års läroplan (Lpo 94) med
sitt starka fokus på ansvar (Dovemark, 2004). I kölvattnet av
reformerna började individuella utvecklingsplaner att dyka upp inom
utbildningsväsendet och sedan 2006 har det varit obligatoriskt att
upprätta en individuell utvecklingsplan för alla elever i grundskolan1.
Denna plan ska vara framåtsyftande (formativ) och upprättas i
samband med utvecklingssamtal med vårdnadshavare för att beskriva
elevers skolsituation och kunskapsutveckling. 2008 gjordes ett tillägg
att IUP skulle kompletteras med skriftliga omdömen med syfte
att beskriva elevens kunskapsstatus i varje ämne i förhållande till
kursplanemålen. Dessa omdömen ska till skillnad från den individuella
utvecklingsplanen vara av tillbakablickande karaktär (summativ).
De skriftliga omdömena kan antingen ges i beskrivande form eller i
standardiserad form som exempelvis en symbol eller uttryck (t.ex. ”ej
uppnått målen”). För att minska lärares administrativa arbetsuppgifter
gjordes dock en lagändring i november 2013 som innebar att för de
årskurser där betyg sätts, finns det inte längre krav på upprättande av
IUP (SFS 2010:800; Skolverket, 2013).
Syftet med införandet av IUP var att skapa ett verktyg i skolan för
ökad måluppfyllelse, att öka elevers och föräldrars delaktighet samt
att likvärdigheten skulle stärkas (Skolverket, 2005). På nationell nivå
ska introduktionen av IUP också ses i ljuset av att skolans mål- och
resultatstyrning skulle få ökad genomslagskraft (Andersson, 2011).
Den individuella utvecklingsplanen ska enligt allmänna råden
(Skolverket, 2013) användas kontinuerligt under hela skolåret
för planering och utvärdering av elevens lärande. Upprättande av
IUP och de kontinuerliga bedömningar som föregår denna, såsom
exempelvis portofolier eller självvärderingar, ska hjälpa eleverna
att förstå sina egna inlärningsprocesser och på så sätt ta ansvar för
sina studier (Dovemark, 2004) vilket också ligger i linje med den
formativa bedömningen som uppmärksammats under senare år (se
exempelvis Black & Wiliam, 1998; 2009; Hattie & Timperley, 2007;
1 Gäller även grundsärskolan, specialskolan och sameskolan
208
EDUCARE 2015:2
Lundahl, 2011). IUP:n ska också ses vara utgångspunkt för lärarens
kontinuerliga utvärdering och planering av undervisningen. Rektor
kan besluta att även information om elevernas sociala utveckling kan
ingå. Riktlinjerna i Allmänna råden om utvecklingssamtalet och den
skriftliga individuella utvecklingsplanen (Skolverket, 2013) betonar
emellertid att ”varken informationen om elevens sociala utveckling
eller kunskapsutveckling får innehålla subjektiva beskrivningar av
elevens karaktär och beteenden, som kan kränka elevens personliga
integritet” (s.14).
Noterbart är att IUP inte är en isolerad bedömningspraktik
utan existerar i ett komplext sammanhang tillsammans med andra
kunskapsmätningar i skolan. Bedömningar (ofta i form av olika
test) har sedan lång tid tillbaka varit en viktig drivkraft för att styra
skolan både i Sverige och internationellt (Lundahl, 2011; Lingard et
al, 2006; Jeffrey & Troman, 2012). Det finns inget krav på nationell
likvärdighet när det gäller de skriftliga omdömena. Jämförelser
mellan skolor kan inte göras eftersom det är varje enskild rektor som
bestämmer utformningen av skolans IUP med skriftliga omdömen. I en
uppföljningsstudie av IUP påpekar emellertid Skolverket (2010) att en
utveckling av ett gemensamt och likriktat språk är av betydelse när det
gäller bedömningsformuleringar på varje enskild skola. I omdömena
ska också anges mot vilka mål i läroplanen eller kursplanen som
bedömningen görs. Detta gäller även för bedömningar av den sociala
utvecklingen.
Ända sedan införandet har den individuella utvecklingsplanen
emellertid varit omdiskuterad och styrdokumentens intentioner har haft
svårt att förverkligas i praktiken. I Skolinspektionens och Skolverkets
rapporter (Skolinspektionen 2009; 2012; Skolverket, 2010) påpekas
att variationen mellan skolorna är mycket stor när det gäller hur man
arbetar med IUP och i vilken mån som IUP är kopplad till läroplanens
kunskapsmål. Resultaten pekar vidare mot att varken i den individuella
utvecklingsplanens framåtsyftande del eller i de skriftliga omdömena
finns den tydlighet som efterfrågas och uppdraget har därmed uppfattats
olika av lärare och rektorer. Många lärare har dessutom känt sig osäkra
hur dokumentationen ska genomföras trots Skolverkets riktlinjer i
de allmänna råden (Skolverket, 2008; 2013). Andra synpunkter som
EDUCARE 2015:2
209
framkom var att skrivandet av IUP och skriftliga omdömen tagit
mycket tid i anspråk, tid som tas från undervisningen.
Tidigare studier av elevdokumentation visar vilka förväntningar som
riktas mot eleverna i texterna. De begrepp som används i dokumenten
visar att elevernas förhållningssätt till lärande betonas i högre
utsträckning än själva lärandet. Självständighet, motivation och lust att
lära betonas ofta (Andreasson, 2007). Flera studier har också visat att
elevdokumenten ofta fokuserar elevernas eget ansvar och handlar till
syvende och sist om självreglerande bedömningar som styrningsteknik
(jfr Foucault, 2000). Skolsvårigheter beskrivs ofta som individuella
brister hos eleverna (Isaksson, Lindqvist & Bergström 2007; Asp Onsjö,
2006; Vallberg Roth, 2009). Vidare framkommer att ”personliga”
omdömen ofta är rikligt förekommande i dokumenten, beskrivningar
som kan påverka ett barns identitetsutveckling (Andreasson, 2007;
Vallberg Roth & Månsson, 2008). Skolverket har, som tidigare nämnts,
senare i sina allmänna råd (Skolverket 2008; 2013) också slagit fast
att dokumenten inte ska innehålla värderingar och omdömen av
integritetskränkande karaktär. Det finns även studier som har fokuserat
på själva arbetsprocessen vid upprättandet av IUP. Eva Morell-Olsson
(2012) visar i sin avhandling att både elever, föräldrar och lärare
uttrycker att arbetet med IUP möjliggör ett förändrat arbetssätt som
sätter elevens eget lärande i fokus. Studien visar emellertid också på
att det i arbetsprocessen framträder olika former av makt, kontroll och
förhandling. I ytterligare en avhandling visar Åsa Hirsh (2013) att de
lärare som är mest positiva till arbetet med IUP:n är de som lyckats
införliva det i det dagliga arbetet och gjort det till ”sitt eget”. De ser då
IUP verktyget som en självklar del av arbetet och något man arbetar
kontinuerligt med tillsammans med eleverna.
I en internationell metastudie av nästan 300 studier visar Mitchell,
Morton och Hornby (2010) att det finns en generell kritik mot systemet
med elevdokumentation som verkar återkomma i olika sammanhang.
De visar på starkt inflytande av beteende- och utvecklingspsykologi
med en överbetoning på det individuella och personliga i dokumenten.
Det finns med andra ord anledning att ytterligare granska denna
praktik och sätta in den i ett utbildningssociologiskt snarare än ett
individualpsykologiskt sammanhang.
210
EDUCARE 2015:2
Pedagogiska identiteter som förväntningar och
konstruktioner
Till hjälp i vår analys har vi haft användning av Basil Bernsteins
(1990; 1996; 1999; 2000) utbildningssociologiska teorier2 som
i hög grad baseras på idén om att vårt medvetande formas och har
sina rötter i sociala och ekonomiska relationer, med andra ord är
materiellt betingat. Vår utgångspunkt är således att utbildning ska
ses som ett kollektivt åtagande (jmf t.ex. Bourne, 2004:79). Från
denna position, är det sociala och det pedagogiska, med andra ord
även relationen mellan lärare och elever, grundläggande för att förstå
elevers framgångar och tillkortakommanden i skolan. Bernstein skiljer
här mellan den instruktionella diskursen som handlar om skolans och
undervisningens innehåll, och elevernas kunskaper, färdigheter och
förmågor och den regulativa diskursen som ses som en moralisk och
fostrande diskurs då den handlar om ordning och uppförande. Den
regulativa diskursen ses alltid som överordnad den instruktionella
och egentligen kan man tala om en enda diskurs. Analytiskt är det
dock en poäng att urskilja två skilda diskurser vilket vi gör i analysen
av vårt material. Den pedagogiska diskurs som markerar den sociala
relationen mellan lärare och elev konstruerar inte bara kunskaper
och färdigheter som ska förvärvas, utan även de specifika sociala
identiteter och inriktningar som får betydelse för elevers skolkarriärer
(jfr. Bourne, 2008; Singh, 2013; Singh et al, 2013). Bernstein (1996)
uppmärksammar hur den officiella pedagogiska diskursen konstruerar
två samtida utbildningsmodeller, dels en prestationsmodell och dels en
kompetensmodell. Prestationsmodellen grundar sig på ett sammanhang
där kompetens, rutiner och ämnesområden är klart och tydligt
definierade, med andra ord starkt klassificerade och inramade. Lärare
och elever har liten kontroll över urval och sekvensering. Eleverna
bedöms utefter tydliga kriterier efter vad de har åstadkommit och de
upplyses också om vad de ska uppnå i framtiden. Däremot görs de inte
medvetna om hur deras lärande är socialt betingat och beroende av
det institutionella sammanhanget, utan istället presenteras prestationer
som ett resultat av medfödda talanger och förmågor (jfr Bourne, 2008).
2 I vår beskrivning av Bernsteins teori har vi haft god hjälp av nutida forskare
som Jill Bourne och Parlo Singh.
EDUCARE 2015:2
211
Till skillnad från prestationsmodellen grundar sig kompetensmodellen
på ett sammanhang där ämnesområden är mer diffusa, integrerade
i form av projekt och teman. Ämnen är svagt klassificerade och
inramade och eleverna har mer kontroll över urval och sekvensering.
Undervisningen bygger mer på valfrihet och kontrollen är personlig
och fokuserad på självreflektion och självdisciplinering (jfr Beach &
Dovemark 2007; 2009; 2011). Lärare bedömer elevers prestationer
men (i motsats till prestationsmodellen) är den oftast dold och delas
inte med eleven (Dovemark, 2013). Eleverna kan därför inte veta hur
de uppfattas i förhållande till andra i sin åldersgrupp förrän kanske för
sent, när de får finna sig placerade i lägre årskurser, eller finna sig i att
anses vara ”svagpresterande” (Dovemark, 2004). De ges därmed inte
heller någon möjlighet till vidare utbildning (jfr Bourne, 2008). Bilden
är naturligtvis mer komplex med en bred typologi av pedagogiska
modeller och stilar (Bernstein, 1990), men i syfte att göra vårt fall
synligt och klart görs dessa distinktioner.
Vid olika tider och i olika nationella sammanhang, kan antingen
prestations- eller kompetensmodellen vara mer eller mindre
framträdande i den officiella pedagogiska diskursen. Samtidigt kan
olika diskurser vara dominerande för olika elever, dels den som
fokuserar på elever som kategoriseras som “högpresterande”, och dels
den som fokuserar på de elever som kategoriseras som “lågpresterande”
(Bernstein, 1996; jfr Bourne, 2008). De skilda diskurserna kan således
framträda i olika skolor eller inom en och samma skola och klass vid
samma period eller vid olika tider. Följaktligen konstruerar varje form
av pedagogisk modell en viss form av “idealelev”, som ”framstående”,
”lydig” och följsam till regler eller helt enkelt som ”stark” och “begåvad
och talangfull”. Mot denna “idealelev”, konstrueras andra kategorier
av elever som ”långsamma”, “underpresterande”, ”svaga”, elever med
”särskilda behov”. Genom de olika formerna av pedagogiska diskurser
och deras sätt att kategorisera elever olika, skapas en strukturering av
elevens identitet (Bernstein 1999: 259). Vi menar att olika diskurser
blir synliga i elevdokumenten beroende på om eleven anses som
”stark” eller ”svag”.
För att ytterligare komplicera bilden av hur elever kategoriseras
i IUP-planerna inför vi även begreppet pedagogisk identitet
(Bernstein, 2000). Bernstein beskrev pedagogiska identiteter som
212
EDUCARE 2015:2
meningsskapande, en känsla av tillhörighet. Pedagogiska identiteter
är inte individuella attribut, men inte heller är de politiskt eller
ideologiskt konstruerade eller följden av en viss läroplan, utan uppstår
snarare genom ett samspel mellan officiell och lokal kunskap och de
metoder som används inom en pedagogisk gemenskap (Bernstein,
1996). Pedagogisk identitet är alltså inbäddad i de sociala praktiker
som existerar inom utbildningsvärlden inom olika ”sociala ordningar”
och utvecklar i detta sammanhang relationer “av ömsesidigt
erkännande och stöd, ömsesidig legitimering och slutligen genom
förhandlade kollektiva syften” (Bernstein, 1996:73 vår övers.). Enligt
Bernstein (1996, 2000) är pedagogiska identiteter konstruerade inom
institutionen, såväl som utåt jämfört med andra institutioner. De är inte
nödvändigtvis stabila positioner utan kan förväntas skifta beroende på
möjligheterna att behålla den diskursiva och ekonomiska basen för
identiteten (jfr Lundahl et al, 2014).
De pedagogiska identiteterna består av fyra positioner som
representerar olika förhållningssätt till reglering och förvaltning av
moraliska, kulturella och/eller ekonomiska förändringar (Bernstein,
2000). De centrerade traditionellt konservativa och neo-konservativa
identiteterna reflekterar en sorts ”top-down” politik som syftar till
enhetlighet i bevarandet av stora nationella, religiösa och kulturella
berättelser. Det handlar således om att skapa en kollektiv identitet.
Samhället investerar i utbildning för att i viss mening behålla status
quo i form av ett stabilt samhälle in i framtiden. Resultatet i form av en
färdig produkt är en individ som är bärare av traditionella värden och
som i en snäv mening är bildad, för sin egen skull. Den neo-konservativa
identiteten är också den framåtriktad och bärare av ett bildningsideal
för att stärka kollektivet inför framtida konkurrensutsatta prövningar.
De två andra identiteterna, den marknadsorienterade och den
terapeutiska pedagogiska identiteten betraktas som de-centrerade.
Dessa identiteter uppfattar utbildning mer som ett privat projekt
och utveckling av den enskilde individen (Bernstein, 2000:66). De
två sistnämnda identiteterna genereras från lokala resurser, vilket
visar på att lokala institutioner har stor självständighet gällande t.ex.
anställningar, kompetensförsörjning och företagande.
Bernstein förutspådde att den decentrerade marknadsidentiteten
bildar en skola som fokuserar på att skapa en “produkt” med ett
EDUCARE 2015:2
213
bytesvärde som är livskraftig på marknaden. Fokus ligger snarare
på kortsiktighet än långsiktighet och på externa snarare än på
interna mål, helt enkelt på vad som anses vara nyttigt och säljbart på
arbetsmarknaden (jfr Lundahl et al, 2014). Pedagogiska identiteter ska,
liksom prestations-och kompetensmodellerna ovan, ses som idealtyper.
De existerar inte i “rena” former i verkligheten, utan erbjuder ett
analysverktyg för att få syn på olika önskvärda och mindre önskvärda
elevidentiter i vårt material.
I denna artikel använder vi framförallt begreppen regulativ och
instruktionell diskurs jämte pedagogisk identitet på en institutionell
nivå. Vi sätter in begreppen i prestations- och kompetensmodellen
såsom de speglas i en polarisering av elevpositioner. Vi undersöker
med hjälp av dessa teoretiska verktyg hur skolaktörers, elevers och
föräldrars texter skrivs fram i ett digitalt verktyg och hur olika diskurser
framträder i de analyserade individuella utvecklingsplanerna.
Empiriskt material, metod och analys
De individuella utvecklingsplanerna, totalt 118 stycken, som utgör
vårt empiriska material samlades in under läsåret 2011/2012 genom ett
slumpmässigt urval från elever i årskurs fem i en kommun i Sverige3.
Ett urval gjordes från klasslistor där var femte namn på listan valdes ut.
Anonymiserade IUP med skriftliga omdömen för de utvalda eleverna
samlades därefter in från varje skola.
Planerna är skrivna i det webbaserade dokumentationsverktyget
Unikum och har en omfattning av mellan 10-40 sidor per elev. Unikums
verktyg bygger på en textuell dialog mellan elev, föräldrar och lärare
inför utvecklingssamtalet på skolan. Inledningsvis i mallen finns 27
stycken självreflekterande frågor som eleven ska besvara. Dessa handlar
om skolmiljön i relation till trivsel, kamrater, skolmat etc. Därefter
ska eleven reflektera över sin personliga och sociala utveckling, sitt
eget lärande och hur hon/han tar ansvar för sitt lärande. Frågorna ska
eleven besvara i en fyrgradig skala genom att kryssa för gubbar med
olika ansiktsuttryck (glad gubbe, ledsen gubbe etc.). Först efter denna
självskattning ska eleven också kommentera denna och därefter ska
3 Materialet utgör en del av en större studie finansierat av Högskolan Väst (se
Sjöberg, 2015).
214
EDUCARE 2015:2
läraren och föräldrarna också kommentera och ge synpunkter på elevens
självskattning. Efter självskattningsfrågorna inklusive kommentarer
börjar de skriftliga omdömena i varje enskilt ämne i Unikums mall.
Dessa omdömen bygger i princip på samma dialogform som tidigare.
De inleds med elevens självskattning (fyrgradig skala med olika
ansiktsuttryck, från glad till ledsen) i varje kunskapsämne. Rubrikerna
för elevens självskattning är: ”Mitt intresse... ”, ”Jag kan…” samt
”Jag behöver bli bättre på…” följt av elevens egen kommentar runt
självskattningen. Därefter följer lärarens sammanfattande omdöme
och föräldrars kommentarer. Dokumentationsverktyget avslutas genom
upprättande av en individuell utvecklingsplan för varje elev, det vill
säga den framåtsyftande delen med mål och insatser för den kommande
terminen.
Det finns en stor variation i hur mycket elever, lärare och föräldrar
använder sig av att skriva kommentarer. Det finns föräldrar i materialet
som inte skriver någon kommentar alls medan andra skriver flera
kommentarer i varje ämne. Det visar sig också att elever hoppar över
och inte svarar på självskattningsfrågorna. Antalet kommentarer och
bedömningar varierar därför mellan 20-70 stycken per dokument.
Vårt fokus ligger på dokumentens diskursiva funktion. Vi utgår
ifrån att de digitala verktygens design och innehåll styr bedömningarna
genom sitt sätt att forma våra tankar. I processen skapas, genom sättet
att ställa frågor och uppmaningar inom specifika områden, en bild av
vad som kan anses vara relevant eller inte inom undervisningen. Således
utgår vi ifrån en föreställning om att de sätt, på vilka policydokument,
rutiner och mallar (i vårt exempel webbverktygens mallar) utformas
och uttrycks, påverkar hur bedömningspraktiker utförs. Diskurserna
som finns inbäddade i dokument och mallar ramar in de faktiska
bedömningarna på speciella sätt och representerar olika diskursiva
praktiker. Dokumentens och mallarnas form ska således förstås som
agenter i skolpraktiken (Andreasson & Dovemark, 2013). På en mer
generell nivå ska dokumenten ses som ett medel för styrning (Foucault,
2000; Simons & Masschelein, 2008).
Vi har läst de individuella utvecklingsplanerna upprepade gånger.
Ett återkommande mönster angående undervisningens innehåll
framkom i texterna. Dessa mönster analyserades därefter med hjälp
av Bernsteins teoretiska begrepp. Nedan presenteras inledningsvis
EDUCARE 2015:2
215
exempel på den regulativa och den instruktionella diskursen i de
analyserade dokumenten. Därefter exemplifierar vi skolaktörers,
elevers och föräldrars uttalanden och hur dessa orienterar sig mot olika
pedagogiska identiteter. Vi har för tydlighetens skull försökt att skriva
fram de olika identiteterna var för sig trots att vi är medvetna om att
de sällan eller aldrig förekommer renodlade utan gränserna är flytande.
Den överordnade regulativa diskursen
Analysen pekar mot en stark relation mellan ämnesspecifikt innehåll
och elevens sociala utveckling (moralutveckling), i Bernsteins
(2000) termer den regulativa respektive instruktionella diskursen.
Den regulativa diskursen handlar framförallt om elevens moraliska
värderingar och sociala utveckling såsom beteende, karaktäristika och
ordningssamhet. Den instruktionella diskursen handlar istället om det
ämnesinnehåll som elever förväntas möta i skolan dvs. begrepp, texter
och fakta som hör till ett specifikt ämne. Det är emellertid viktigt att
återigen poängtera att den regulativa diskursen alltid är överordnad
den instruktionella och att särskiljandet görs för att tydligare göra en
analytisk poäng (Bernstein, 2000).
De studerade individuella planerna består både av ämnesspecifika
bedömningar utifrån en prestationsinriktad modell och av bedömningar
av elevers skolsociala liv utifrån en kompetensinriktad modell.
Dokumenten har i allmänhet en stark betoning på en nyttighetsorienterad
marknadslogik mot framtida anställningsbarhet. En traditionell
bildningsdiskurs med fokus på en framtida samhällsmedborgare
förekommer endast sporadiskt. Att lärare använder bedömning och
betyg i rent disciplinerande syfte visar både Selghed (2005) och Tholin
(2006) i sina studier och även i våra studerade planer förekommer
rikligt med reglerande skrivningar (se även Andreasson, 2007; Vallberg
Roth, 2009). Analysen visar på en tydlig regulativ diskurs som riktar
sig mot frågor om attityd, arbetsförmåga, läxor, reflektionsförmåga
(medvetenhet om hur man lär), tid, ordning och uppförande. Av
de drygt 5000 kommentarer och bedömningar vi har läst i de 118
analyserade individuella utvecklingsplanerna har en klar majoritet,
cirka 65 %, visat på en överordnad regulativ diskurs.
216
EDUCARE 2015:2
Det är ett starkt individualiserat förhållningssätt som framträder i
dokumenten dvs. det mesta tillskrivs eleven att göra, medan skolans
pedagogiska ansvar ofta blir osynliggjort. I dokumentmallen finns till
exempel en rubrik som uppmanar eleven att skriva fram vad hon/han
”behöver bli bättre på”.
En elev påpekar att han inte förstår vad läraren menar. Han skriver:
att fatta vad Erik [läraren] säger …
Läraren Erik svarar upp mot denna önskan med följande kommentar:
Att inte glömma penna och sudd till lektionerna.
Att försöka vara koncentrerad på skolarbetet under lektionerna.
Exemplet visar att läraren undviker att svara på elevens önskan att
förstå lärarens instruktioner utan lägger över hela ansvaret på eleven
själv. Insatserna individualiseras således och läggs på individnivå
där eleven själv påläggs ansvar för eventuella förbättringar genom
självreglerande disciplinering (Foucault, 2000). Lärarens reflektion
över sin egen undervisning och dess innehåll finns inte framskriven. I
Skolverkets allmänna råd (2007, 2008, 2013) poängteras emellertid att
det är den pedagogiska organiseringen som ska förändras för att svara
upp mot elevens behov. Frågan är hur eleven känner inför lärarens svar
då han försökt uttrycka vad han behöver blir bättre på. Även följande
exempel visar på den regulativa diskursens starka disciplinerande kraft
då lärare uppmanar eleverna till eget ansvarstagande för att de ska nå
sina mål:
Satsa på eget ansvar och använd tiden väl, då har du goda möjligheter att
nå målen
Ansvara för dig själv, ditt material och arbeta på, ta hem och göra klart
om du inte hinner
I ett annat dokument skriver en elev om vad han skulle behöva förbättra
i engelska:
Nothing!!! engelska är tråkigt för att vi håller på med repetition.
EDUCARE 2015:2
217
Eleven kommenterar undervisningen, men även här förläggs ansvaret
på den enskilde eleven. Läraren svarar eleven:
Du behöver ta mycket bättre ansvar för hur din egen språkinlärning sköts
och tänka på hur du lär dig engelska. Det fungerar inte bra med läxor,
inlämningar och elevutvärderingar. Detta är JÄTTEVIKTIGT och ligger
till grund för fortsatt bra utveckling./…/ men då är det viktigt att ändra
inställning och inse att det ALLTID finns saker man kan bli bättre på.
I dialogen ovan uttrycker sig eleven i relation till ämnesinnehållet,
att engelska är tråkigt när de jobbar med repetition, dvs. eleven rör
sig i den instruktionella diskursen, medan läraren svarar och ger
bedömningar utifrån den regulativa diskursen. Det är således eleven
som ska ändra inställning och ta ansvar för sina läxor, inlämningar etc.
för att kunna lära sig engelska. Läraren bidrar inte med något om att
ändra undervisningens innehåll och/eller organisering för att gå eleven
till mötes.
Att ta ansvar och göra sina läxor är vanligt förekommande reglerande
uppmaningar i planerna, vilket följande exempel från ett skriftligt
omdöme visar:
Kalle sköter sina läxor bra och får då goda resultat.
Läxorna fungerar inte. Viktigt att ta hem dem och träna. Engelska glosor
till exempel kräver nötning och det hinner du inte göra i skolan. Jobba
stenhårt för att göra dina läxor.
Den omfattande läxdiskursen visar bland annat lärarnas förväntningar
att mycket av lärandet ska ske i hemmet. Även föräldrarna förväntas
hjälpa till och det är inte ovanligt med direkta uppmaningar riktade till
föräldrar eller andra vårdnadshavare:
Vårdnadshavare kan fortsätta stötta Lisa i hennes skolarbete, påminna
henne att göra läxor och ta med i tid till skolan.
Hjälpa hemma med läxor. Kontrollera läxorna hemma.
Hjälp av föräldrar vid läxor och annat skrivande hemma.
218
EDUCARE 2015:2
Ovanstående citat visar att föräldrarna också innefattas av skolans
regulativa diskurs och det tas för givet att skolarbete också ska göras
i hemmet. Forsberg (2007) har studerat läxdiskursen i Sverige och
menar att kontrollen och hjälpen med barnens läxor är starkt kopplat
till diskursen om ett gott föräldraskap. Att vara en bra förälder innebär
inte bara att ta hand om barnen hemma, man behöver även ha ett aktivt
intresse för barns utbildning och prestation i skolarbetet (jfr. Bouakaz,
2007).
Elevens förmåga att reflektera och medvetandegöras om hur man lär
ingår även det som en del i den regulativa diskursen.
Det är bra att du är medveten om vad du behöver tänka på och jag tycker
det har blivit bättre och du lyssnar på instruktionerna. Fortsätt att jobba på
och vara aktiv så kommer du att utvecklas ännu mer.
I en annan plan skriver en elev att han i ämnet svenska vill bli ”bättre
på att skriva och jobba”. Läraren svarar genom följande korta och
koncisa påståenden:
Du har utvecklat din vilja att läsa litteratur av eget intresse. Du kan
utveckla din förmåga att reflektera över hur du lär dig.
Svaren saknar råd och vägledning om hur eleven ska bära sig åt för att
bli ”bättre på att skriva och jobba”. Här finns heller inga råd om hur
den pedagogiska organiseringen skulle kunna förändras för att hjälpa
eleven.
Det är vanligt att lärarna skriver att eleverna behöver reflektera över
sitt eget lärarande. Eleven förmodas genom denna reflektion förbättra
sitt lärande. Några anvisningar och råd från lärarnas sida hur denna
reflektion ska gå till förekommer dock inte. Texterna vittnar istället om
ett förgivet-tagande från lärarnas sida gällande de elvaåriga elevernas
förmåga att reflektera över hur man lär sig.
Tid är ytterligare en viktig faktor i skolans regulativa diskurs där
även ordning och uppförande ingår. Exemplen nedan visar på hur
denna diskurs omfattas av skolans olika aktörer.
EDUCARE 2015:2
219
Tänk på tiden, det är viktigt att komma i tid. Det senaste har du kommit
både fem och tio minuter för sent flera gånger. (lärare)
Sköt dig själv och använd tiden i skolan. (förälder)
Mina mål är att veta när man ska vara tyst och när det är ok att prata. (elev)
Kan lyssna på en instruktion och vänta på sin tur. (lärare)
I dessa citat blir tid också kopplad till skolans praktik som plats. Att
vara på rätt plats på rätt tid tillskrivs stor betydelse för att socialiseras
in i skolans normsystem. Det finns i citaten ovan en tydlig moralisk
underton som verkar disciplinerande.
Sammantaget visar analysen att lärarnas bedömningar betonar både
ämnesområden (instruktionell diskurs) och den sociala utvecklingen
inklusive moraliska värderingar (regulativ diskurs) vilket enligt
Bernstein (2000) är ofrånkomligt i all undervisning. Analysen visar
också att i flera exempel är den regulativa diskursen överordnad i
förhållande till den instruktionella, även när eleven kommenterar
pedagogikens organisering och innehåll.
Pedagogisk identitet
Dokumentens diskurser visar inte endast på en instruktionell och
regulativ diskurs utan orienterar sig också mot olika pedagogiska
identiteter (Bernstein, 2000).
Retrospektiv eller konservativ pedagogisk
identitet
Dokumentverktyget är konstruerat utifrån ett starkt klassificerat
innehåll där skolans elevbedömningar är framskrivna i form av en
matris. Klassificeringen har att göra med makten över det som ska läras.
Detta kan förstås som en form av retrospektiv konservativ identitet då
läroplan- och kursmål är starkt styrande för verksamhetens innehåll.
Rubriker i planerna för att kontrollera att eleven når upp till dessa mål
är exempelvis: ”Förväntas att nå nationella målen”; ”Riskerar att ej
nå nationella målen” samt ”På väg att nå nationella målen”. På så sätt
konstrueras en kollektiv nationell identitet i form av en ”idealelev” som
även möter upp mot de gemensamma målen för hela den svenska skolan.
220
EDUCARE 2015:2
Den elvaåring som når målen i alla ämnen ingår därmed i ett stabilt
nationellt kunskapskollektiv. Den retrospektiva eller konservativa
identiteten positioneras med hjälp av traditionella ämneskunskaper i
till exempel svenska (stavning, grammatik, ordförråd) och matematik
(aritmetik och geometri). En elev skriver under rubriken ”Vad jag
behöver bli bättre på”:
Jag kan det mästa [sic] och gör mitt bästa!
Eleven utvecklar sina egna tankar om vad som skulle kunna förbättras:
Jag skulle vilja göra något annat än att jobba i böcker och sånt skulle va
kul.
Läraren lägger i sitt svar tillbaka ansvaret på eleven utan att komma
med några idéer om hur hon/han skulle kunna ändra på undervisningens
innehåll och organisering:
Svenska är ett stort ämne där vi ska lära oss många olika saker som t.ex. det
vanligaste reglerna för skriftspråket och språkläran, de vanligaste reglerna
för stavning (veckans ord) och att använda en ordlista (ordremsor). /…/
du kan utveckla din förmåga att bearbeta dina texter och reflektera över
hur du lär dig.
Eleven uppmanas i citatet att bearbeta sin text och reflektera över sitt
eget lärande. Några konkreta verktyg för hur detta ska genomföras
ges emellertid inte. Liknande resultat visas i Andersson Vargas (2014)
studie där hon diskuterar vikten av att lärare ger elever verktyg för att
kunna utveckla sitt lärande.
Uppmaningar från lärare om betydelsen av att träna traditionella
kunskaper förekommer frekvent i planerna, det vill säga en orientering
mot en konservativ pedagogisk identitet:
Satsa på att göra snygga jobb och vårda handstilen!
Han känner till ordklasserna substantiv och verb och vet hur han använder
en ordlista. Han har också blivit säkrare på när han använder stor bokstav
och skiljetecken men han behöver öva lite till.
Multiplikationstabellen måste du öva mycket på framöver så att du snart
kommer att känna dig säkrare…
EDUCARE 2015:2
221
I denna retrospektiva konservativa pedagogiska identitet ingår således
traditionella ämneskunskaper såsom multiplikationstabellen, stavning,
språklära och handstil. Ett innehåll som länge varit en del av skolans
bedömningspraktik oavsett olika läro- och kursplaner.
Prospektiv eller neokonservativ pedagogisk
identitet
Orientering mot den prospektiva identiteten innebär att synliggöra och
motivera läroplan- och kursmålen för eleverna. Måluppfyllelse ligger
i fokus där målen på varje nivå ska vara väl kända. Nedanstående
exempel i ämnet engelska visar vad en elev anser sig behöva ”bli bättre
på” och där läraren svarar med kursplanens målformuleringar:
prata engelska (elev)
Du visar att du har förmåga att delta i samtal på engelska. (lärare)
Läraren fortsätter:
Kunna läsa och tillgodogöra sig det viktigaste innehållet i enkla
instruktioner och beskrivningar.
Kunna reflektera över hur den egna inlärningen av t.ex. ord och fraser
går till.
Kunna genomföra korta, enkla muntliga och skriftliga uppgifter i
samarbete med andra eller på egen hand.
Citaten visar på ett stark resultatinriktat innehåll och omdömenas
formuleringar vävs samman med kursplanens målformuleringar
så gott som ordagrant. Ytterligare ett exempel är hämtat från de
samhällsorienterade ämnena där lärarens omdömen också är starkt
kopplade till kursplanens formuleringar:
Du har utvecklat din förståelse för demokratins värdegrund.
Du har utvecklat din kunskap om hur det är i andra länder.
Du har god förmåga att kritiskt granska hur saker är i samhället.
Du har god förmåga att reflektera över olika frågor som är viktiga för dig.
222
EDUCARE 2015:2
Du har god kunskap om natur och samhälle.
Du har utvecklat din förmåga att se människans påverkan på naturprocesser.
Citatet visar på hur läraren använder sig av kursplanens ord då han/hon
skriver fram bedömningen i ämnet vilket gör bedömningen generell
och till sin form opersonlig och rigorös.
Den prospektiva pedagogiska identiteten har också en orientering
mot kollektiva värden och en framtida kollektiv identitet. I citaten
nedan kan skönjas en önskan om kollektiva gemensamma värden som
demokrati- och medborgarfostran. En elev som i dokumentverktyget
uppmanas att skriva om vad hon vill arbeta med framöver formulerar
följande:
Jag skulle vilja jobba med andra länder och bli bättre på det. Det skulle
vara kul.
Läraren svarar eleven:
Du har utvecklat din förtrogenhet med vilka rättigheter och skyldigheter du
har som medborgare. Du har utvecklat din förståelse för centrala begrepp.
Du har utvecklat din självständighet i att söka, bilda och använda kunskap
om samhällsfrågor. Du kan utveckla din förmåga att reflektera över
samband och sammanhang som finns mellan det som händer i samhället
nu och det som har hänt förr i tiden.
Även i denna dialog svarar läraren på flickans önskan om att vilja
arbeta med andra länder genom att ge direkta svar och formuleringar
från kursplanens mål. Frågan reser sig hur eleven uppfattar och
förstår svaret på sin önskan genom dessa formuleringar. Nedan följer
ytterligare exempel på en orientering mot en prospektiv identitet mot
kollektiva framtida värden. Lärare skriver:
God förmåga att samarbeta, lyssnar på andras idéer, bra för gruppen, frågar
så att alla hänger med i grupparbeten.
Släppa in andra kompisar när det är grupparbete.
Utvecklar sin förmåga att arbeta i demokratiska former.
EDUCARE 2015:2
223
Sammantaget visar planerna på att oberoende av ämnesinnehåll är
omdömen och kommentarer starkt sammanvävda med kursplanens
målformuleringar vilka i många fall bli omöjliga för elever att förstå i
termer av språk och ordval. Både den retrospektiva och den prospektiva
identiteten riktar sig mot kollektiva värden där den konservativa
framförallt vilar på traditionella färdigheter och värden medan den
neo-konservativa skapar en gemenskap inför framtida förmågor och
värden.
Terapeutiska pedagogiska identiteten
I de studerade dokumenten framträder även betydelsen av elevernas
trivsel och hälsa i skolan. Detta framstår som en central diskurs vilket
i vår analys tolkas som en orientering mot den terapeutiska identiteten:
Jag e social och snäll. (elev)
Ja, du är snäll och vill alla väl. (lärare)
Snäll och hjälpsam både mot vuxna och kamrater. (förälder)
Visar att han bryr sig om andra, är omtänksam. Verkar vara en bra kamrat.
(lärare)
Fortsätta att vara positiv och glad tjej. Bra för gemenskapen i klassen.
(lärare)
Pigg och glad klasskamrat som sprider glädje i klassen. (lärare)
Den terapeutiska identiteten handlar snarare om känslomässiga och
sociala aspekter än kognitiva i det pedagogiska innehållet. Den visar
bort från en kollektiv gemenskap mot individuella och lokala mål, från
framtid och dåtid mot en tydlig nutid. Ett exempel som handlar om
läxor, visar på hur viktig denna trivsel betraktas inom den terapeutiska
identiteten. En pojke skriver om sina läxor och får svar från läraren:
Väldigt svåra men roliga!
Läraren: Vad skönt att du trivs i skolan. Läxorna är svåra. Det får vi tala
mer om på samtalet.
224
EDUCARE 2015:2
Läraren poängterar att trivseln är viktig i skolan medan läxorna får
en underordnad betydelse. Tidigare studier av elevdokumentation har
även visat på liknande resultat där trivsel och anpassning till skolans
normer var mer framträdande i dokumenten än kunskapsdiskursen (se
Andreasson, 2007)
Inom den terapeutiska identiteten ingår också idén om personlig
utveckling. I nedanstående exempel framkommer betydelsen av ”att
vilja” som en viktig komponent för denna personliga utveckling.
Läraren: Du vet att jag väldigt gärna hjälper dig. Men för att lyckas måste
du vilja det själv. Det är där vi måste börja. Jag vill att du tar vara på dina
chanser att bli säkrare på matematik
Läraren tar i detta exempel upp ”viljan” som en förutsättning för att
läraren ska hjälpa eleven med matematik, det vill säga eleven behöver
vara motiverad att lära sig. Här läggs ansvaret återigen på elevens
egenansvar att själv se till att bli motiverad och att vilja. Det nämns
ingenting om en förändring av undervisningssituationen. Matematiken
blir här en personlig strävan mot säkerhet snarare än en gemensam
möjlighet för eleven att ingå i ett nationellt kunskapskollektiv.
Det finns exempel i planerna på en retorik som ger uttryck för en
hållning om att läraren och eleven gemensamt ska hjälpas åt med
elevens personliga och sociala utveckling. I nedanstående citat är det
läraren som erbjuder sig att hjälpa till med en förändring av elevens
beteende. Eleven skriver under rubriken ”Jag behöver bli bättre på”:
Att inte springa runt. (elev)
Läraren svarar:
En sak som jag skulle önska att du funderade över är hur vi tillsammans
kan komma iordning med det där att du vandrar runt i klassrummet. Det
får bli våran gemensamma utmaning.
I detta citat framkommer att eleven själv är medveten om sitt problem
att ”springa runt” i klassrummet. Eleven ska förändras med lärarens
hjälp. Det blir i citatet en ”gemensam utmaning” vilket kan tolkas
orientera sig mot den terapeutiska identiteten där läraren och eleven
EDUCARE 2015:2
225
kan erhålla en speciell stödrelation. De ska göra detta ”tillsammans”. Vi
konstaterar att eleverna positioneras i ett individuellt rum där ordning
och reda framstår som ett nödvändigt villkor för att senare – kanske –
kunna arbeta med kunskapsmålen.
Marknadsliberala pedagogiska identiteten
I skollag (SFS 2010:800) och läroplan (Lgr 11) framställs vilka värden
som är förenliga med dagens samhälle där samarbete, entreprenöriellt
lärande, ansvar och självständighet lyfts fram som viktiga. Detta är
också något som är frekvent förekommande i de studerade dokumenten.
I planerna framträder en entreprenörsdiskurs där en tydlig nyttoaspekt
blir uppenbar. I dokumentverktyget finns en fråga som lyder: Vad vill
jag särskilt lära mig under det kommande halvåret? Eleven svarar och
skriver:
Jag vill kunna prata engelska
Läraren svarar:
Det är viktigt att kunna tala engelska, det är ett språk som pratas över allt
och man kan komma långt med engelskan när man reser och jobbar.
Lärarens omdöme senare i det skriftliga omdömet inom ämnet engelska
lyder:
Det är viktigt att du fortsätter så att du tar mer ansvar för dina läxor och
arbetsuppgifter och rättar i arbetsboken och du måste också fråga om du
inte förstår.
Läraren svarar upp mot elevens önskan genom att poängtera
användbarheten och vikten av kunskaper i engelska för framtida arbete
och fritidsaktiviteter. För att nå upp till detta mål uppmanas eleven att
bland annat ta ”ansvar för sina läxor”. Ansvaret läggs därmed på den
enskilde individen snarare än på undervisningen vilket också eleven
visar sig helt inställd på. Eleven lägger ansvaret på sig själv, och
kommenterar genom att framhålla ”jag ska sköta läxan”.
Nedan ges fler exempel på en orientering mot en marknadsliberal
identitet i lärarnas skriftliga omdömen:
226
EDUCARE 2015:2
Ambitiös, noggrann och flitig.
Våga prata mer i klassrummet.
Ta mer plats under lektionstid.
En tjej som arbetar mycket självständigt.
Våga säga ifrån och stå upp för sig själv.
Fortsätta att utveckla sina positiva ledaregenskaper
kommer med goda idéer.
Vill gärna bestämma. Är ambitiös och vill hela tiden utvecklas.
Det som premieras i många av de studerade individuella
utvecklingsplanerna är sociala individuella ledarskapsförmågor som
”självständighet”, ”att våga” och ”ta plats” vilket också framställs i
skollagen (SFS 2010:800) och läroplanen (Lgr 11) som viktiga mål.
Även här individualiseras förmågorna till eleverna även om diskursen
i en förlängning ska bidra till byggandet av gemensamma materiella
värden. Vi kan dock konstatera att ingenstans i läroplaner och
kursplaner finns några motsvarande nationella mål.
Den regulativa diskursen och pedagogiska
identiteter
Studien har haft som syfte att illustrera hur skolaktörers, elevers och
föräldrars texter i 118 Individuella utvecklingsplaner skrivs fram i ett
standardiserat webbverktyg och mot vilka olika pedagogiska identiteter
texterna är orienterade. Vi kan konstatera att det webbaserade
dokumentationsverktyget styr de pedagogiska diskurserna starkt
(jmf Andreasson & Asplund Carlsson, 2009; Andreasson & Asplund
Carlsson, 2013; Andreasson & Dovemark, 2013). Resultatet av vår
studie visar att i de studerade planernas texter runt pedagogikens
innehåll och organisering och kommunikationen runt densamma,
framträder en orientering mot såväl traditionella konservativa
(retrospektiva), som neo-konservativa (prospektiva), terapeutiska och
marknadsliberala identiteter. Ett påfallande mönster som framträder
är att planerna speglar en starkt regulativ diskurs. Enligt Bernstein
(1996) påverkas lärare av en förändrad skolpolitisk diskurs; den
EDUCARE 2015:2
227
inbjuder eller tvingar dem att tolka och anpassa sig till nya idéer.
Även kravet på dokumentation i olika webbverktyg tvingar in lärare
i vissa rutiner. I vår studie framträder de olika aktörernas texter som
intvingade i webbverktygets mall bland annat genom verktygets tydliga
framskrivning och koppling till läro- och kursplanernas mål. Lärarnas
formuleringar följer i många fall kursplanemålens formuleringar till
punkt och pricka. Frågan är hur de inblandade förstår kommentarerna
och hur mycket det hjälper eleverna till en måluppfyllelse.
En prestationsmodell (Bernstein, 1996), grundad på klara och tydligt
definierade ämnesmål orienterad mot en marknadsliberal identitet
utkristalliseras i de studerade planerna. Lärare och elever har liten
kontroll över urval då kursplanernas mål styr genom att frågor och
kommentarer i verktyget gång på gång relateras till kursplanens mål.
Eleverna bedöms utefter tydliga kriterier efter vad de har åstadkommit
(eller inte) och de upplyses också om vad de ska uppnå i framtiden
bland annat genom formuleringar som ”har ännu inte uppnått de
nationella målen”. Däremot saknas formuleringar gällande planering
och utvärdering av elevens lärande vilket var de intentioner som låg
till grund för införandet av Individuella utvecklingsplaner (Skolverket,
2005). Det som framträder i texterna är snarare bedömningar av sociala
förmågor, personlighet och färdigheter såsom samarbetsförmåga,
relationer till kamrater, viljan att göra sitt bästa, hur läxorna
görs, uppförande etc. Den regulativa diskursen överordnas den
instruktionella.
Ett starkt individualistiskt förhållningssätt framkommer i planerna
där individuella ledarskapsförmågor som till exempel självständighet,
att våga och att ta plats premieras. Detta kan jämföras med det fokus i
läroplanen som numera lyfter fram vikten av att elever ”skall utveckla
ett förhållningssätt som främjar entreprenörskap” (Lgr 11:9).
Till skillnad från Skolverkets allmänna råd (2008; 2013) där
man poängterar vikten av pedagogikens förändring av innehåll och
organisering visar vår studie att ansvaret för ett förändringsarbete
snarare läggs på den enskilde eleven. Det är eleven som ska ändra sig,
genom självreglering och reflektion för att medvetandegöras hur man
lär och hur man bör vara och bete sig. En diskussion om anpassning
av undervisningen förekommer mycket sparsamt i de studerade
planerna. Istället finns det ett flertal exempel på hur läraren för tillbaka
228
EDUCARE 2015:2
ansvaret på eleven (jfr Beach & Dovemark 2009, 2011; Dovemark,
2004). Eleven uppmanas att förändra sin egen uppfattning och sitt eget
förhållningssätt om undervisningens innehåll och organisering.
Vad som ska bedömas styrs genom mallens frågor och utformning
och även hur dessa bedömningar kommuniceras bestäms av
bedömningsverktyget i de analyserade planerna (Andreasson &
Dovemark, 2013). Frågan är hur dessa verktyg påverkar lärarnas
professionalitet eftersom dessa uppgifter traditionellt sett ingått som
en del av lärarnas kärnverksamhet. Vår studie visar att kommersiella
och privata aktörer har kommit att få ett stort inflytande över skolans
bedömningspraktik på bekostnad av lärares professionalitet.
Referenser
Andersson, Håkan (2011). Skriftliga omdömen. I Agneta Hult &
Anders Olofsson (Red). Utvärdering och bedömning i skolan. För
vem och varför? (ss 195-211). Stockholm: Natur och Kultur
Andersson Varga, Pernilla (2014). Skrivundervisning i gymnasieskolan.
Svenskämnets roll i den sociala reproduktionen. (Göteborg Studies
in Educational sciences, 359). Göteborg: Acta.
Andreasson, Ingela (2007). Elevplanen som text – om identitet, genus,
makt och styrning i skolans elevdokumentation (Göteborg Studies
in Educational sciences, 259). Göteborg: Acta.
Andreasson, Ingela & Asplund Carlsson Maj (2009). Elevdokumentation
- om textpraktiker i skolans värld Stockholm: Liber.
Andreasson, Ingela, & Asplund Carlsson Maj (2013). Individual
Educational Plans in Swedish Schools--Forming Identity and
Governing Functions in Pupils’ Documentation. International
Journal of Special Education, (28), 58-67.
Andreasson, Ingela & Dovemark, Marianne (2013). Transforming
Insecurity into a Commodity: using the digital tools Unikum
and InfoMentor as an example in Swedish education. European
Educational Research Journal. (12), 480-491.
EDUCARE 2015:2
229
Asp-Onsjö, Lisa (2006). Åtgärdsprogram – dokument eller verktyg? En
fallstudie i en kommun . (Göteborg Studies in Educational sciences,
248). Göteborg: Acta
Ball, Stephen J. (2003). The Teacher’s Soul and the Terrors of
Performativity. Journal of Education Policy, (18), 215-228.
Beach, Dennis & Dovemark, Marianne (2007). Education and the
Commodity Problem: Ethnographic Investigations of Creativity
and Performativity in Swedish Schools. London: Tufnell Press.
Beach, Dennis & Dovemark, Marianne (2009). Making ‘right’
choices? An ethnographic account of creativity, performativity and
personalised learning policy, concepts and practices. Oxford Review
of Education, 1465-3915, (35). 689-704.
Beach, Dennis & Dovemark, Marianne (2011). Twelve Years of UpperSecondary Education in Sweden: The Beginnings of a Neo-liberal
Policy hegemony. Educational Review. (63), 313-327.
Bernstein, Basil (1990). Class, codes and control. Vol. 4, The
structuring of pedagogic discourse. London: Routledge.
Bernstein, Basil (1996). Pedagogy, Symbolic control and identity:
theory, research, critique. London: Taylor and Francis.
Bernstein, Basil (1999). Official knowledge and pedagogic identities,
in Frances Christie (Red.), Pedagogy and the Shaping of
Consciousness. (ss. 246-261) London: Continuum.
Bernstein, Basil (2000). Pedagogy, Symbolic control and identity:
theory, research, critique.[Rev.ed.] Oxford: Rowman & Littlefield.
Black, Paul & Wiliam, Dylan (1998). Inside the Black Box: Raising
Standards through Classroom Assessment. London: School of
Education, Kings College.
Black, Paul & Wiliam, Dylan (2009). Developing the Theory of
formative assessment. Educational Assessment, Evaluation and
Accountability. (21), 5-31.
Bouakaz, Laid (2007). Parental involvment in school: what hinders
and what promotes parental involvementin an urban school. Malmö
Studies in Educational Sciences, 30. Lärarutbildningen, Högskolan
i Malmö.
230
EDUCARE 2015:2
Bourne, Jill (2004). Framing talk. Towards a ’radical visible pedagogy’.
I Johan Muller, Brian Davies & Ana Morais (Red). Reading
Bernstein. Researching Bernstein. (ss. 61-74). London: Routledge
Falmer.
Bourne, Jill (2008). Official pedagogic discourses and the construction
of learners’ identities. I Nancy H. Hornberger, (Red.). Encyclopedia
of Language and Education. (ss. 798-809). Springer US.
Dovemark, Marianne (2004). Pupil Responsibility in the Context of
School Changes in Sweden: market constraints on state policies
for a creative education. European Educational Research Journal,
(3), 658-673.
Dovemark, Marianne (2013). A school for all? Different worlds:
Segregation on the basis of freedom of choice. I Ulf Blossing,
Gunn Imsen & Leijf Moos (Red.). The Nordic Education Model:
‘A School for All’ Encounters Neo-Liberal Policy (ss. 173-189).
Dordrecht: Springer.
Foucault, Michel (2000). Governmentality. I James. D. Faubion (Red.),
Essential works of Foucault, 1954-1984. Power. Vol.3. (ss. 201222). New York. The New Press.
Forsberg, Lucas (2007). Homework as serious family buisness: power
and subjectivity in negotiating about school assignments. British
Journal of Sociology of Education, (28), 209-226.
Hattie, John & Timpeley, Helen (2007). The power of feedback. Review
of Educational Research, (77), 81-112.
Hirsh, Åsa (2013). The individual development plan as tool and
practice in Swedish compulsory school (Doktorsavhandling).
Jönköping: Högskolan för lärande och kommunikation.
Isaksson, Joakim, Lindqvist, Rafael & Bergström, Erik (2007). School
problems or individual shortcomings? A study of individual
educational plans in Sweden. European Journal of Special Needs
Education. (22), 75-91
Jeffrey, Bob & Troman, Geoff (Eds). (2012). Performativity in
UK Education. Ethnographic Cases of its Effects, Agency and
Reconstructions. Hockley: Tufnell Press.
EDUCARE 2015:2
231
Lgr 11 (2011). Läroplan för grundskolan, förskoleklassen och
fritidshemmet 2011. Stockholm: Fritzes
Lingard, Bob, Mills, Martin & Hayes Debra Nola Anne. (2006).
Enabling and Aligning Assessment for Learning: some research and
policy lessons from Queensland, International Studies in Sociology
of Education, (16), 83-102.
Lpo 94 Läroplan för det obligatoriska skolväsendet, förskoleklassen
och fritidshemmet Stockholm: Fritzes
Nordstedts.
Lundahl, Lisbeth, Erixon Arreman, Inger, Holm, Ann Sofie, &
Lundström, Ulf (2014). Gymnasiet som marknad. Umeå: Borea. Mitchell, David, Morton, Missy & Hornby, Garry (2010). Review of
the literature on individual education plans. Report to the New
Zealand Ministry of Education. Ministry of Education.
Morell Olsson, Eva (2012). Att göra lärandet synligt? Individuella
utvecklingsplaner och digital dokumentation (Doktorsavhandling).
Umeå universitet. Institutionen för tillämpad utbildningsvetenskap,
Interaktiva medier och lärande
Selghed, Bengt (2005). Betygen i skolan. Stockholm: Liber
SFS (2010:800). Skollag. Stockholm: Fritzes
Simons, Maarten & Masschelein, Jan (2008). The governmentalization
of learning and assemblage of a learning apparatus. Educational
Theory, (58), 391-415.
Singh, Parlo (2013). Unlocking pedagogic mazes. Discourse: Studies
in the Cultural Politics of Education (34), 799-807.
Singh, Parlo, Thomas, Sue & Harris, Jessica (2013). Recontextualising
policy discourses: a Bernsteinian perspective on policy
interpretation, translation, enactment, Journal of Education Policy,
(28), 468-480
Sjöberg, Lena (2015). The Construction of Mathematical Knowledge
and Learning in and Through Individual Education Plans.
EDUCARE (2015:1), 7-29
232
EDUCARE 2015:2
Skolinspektionen (2009). Skolinspektionens bedömning av skolors
arbete med skriftliga omdömen. Dnr 40-2009:2348 Stockholm:
Skolinspektionen.
Skolinspektionen (2012). En skola med tilltro lyfter alla elever.
Skolinspektionens erfarenheter och resultat från tillsyn och
kvalitetsgranskning 2011. Dnr 40:2012:2991. Stockholm:
Skolinspektionen
Skolverket (2005). Allmänna råd. Den individuella utvecklingsplanen
Stockholm: Fritzes.
Skolverket (2007). Hur används individuella utvecklingsplaner. En
studie efter införandet av nya bestämmelser. Stockholm: Skolverket.
Skolverket (2008). Allmänna råd. Den individuella utvecklingsplanen
med skriftliga omdömen. Stockholm: Fritzes
Skolverket (2010). Individuella utvecklingsplaner med skriftliga
omdömen i grundskolan – en uppföljning och utvärdering av
skolornas arbete. Dnr 71-2009:115. Stockholm: Skolverket.
Skolverket (2013). Allmänna råd. Utvecklingssamtalet och den
skriftliga individuella utvecklingsplanen. Stockholm: Skolverket
Tholin, Jörgen (2006). Att kunna klara sig i ökänd natur. En
studie av betyg och betygskriterier – historiska betingelser
och implementering av ett nytt system. Borås: Institutionen för
pedagogik, Högskolan i Borås.
Vallberg Roth, Ann-Christine (2009). Styrning genom bedömning av
barn. EDUCARE, (2009:2–3),195–219.
Vallberg Roth, Ann-Christine & Månsson, Annika (2008). Individuella
utvecklingsplaner som uttryck för reglerad barndom. Likriktning
med variation. Pedagogisk forskning i Sverige, (13), 81-102.
EDUCARE 2015:2
233
IUP i Praktiken: En skolreforms formande
i skärningspunkten mellan yttre styrning
och professionell autonomi
Åsa Hirsh
The present study aims to deepen the knowledge about how teachers’ work
with individual development plans (IDPs) is shaped at the intersection of
national and local governance on the one hand and teachers’ professional
autonomy on the other. The conceptual points of departure are mainly
taken from Wartofsky’s distinction between primary, secondary and
tertiary artifacts, Latour’s conceptual pair inscription - translation, and
the activity theoretical understanding of contradictions and dilemmas.
Methodologically, the study is based on qualitative content analysis of
material based interviews with five teachers from each of the three school
stages: primary, intermediate, and secondary stage (in total 15 teachers).
Through the analysis of how IDPs are understood and used by teachers, a
picture emerges of the complexity that is involved when a school reform
takes shape in different local contexts. The results show that IDP work on
the one hand is shaped by the aims that teachers perceive that they need
to achieve by using the IDP tool, on the other hand by the contextual
conditions framing their work, particularly in terms of external control
vs. autonomy. Further in-depth analysis also indicates that teachers’
work with IDPs takes shape in relation to various dilemma management
strategies related to time/workload, scope/complexity of document
content, and the fact that IDPs are to fulfil summative as well as formative
assessment purposes. Teachers’ emerging IDP work is discussed in the
light of international studies that in similar ways point to the contextual/
organizational conditions as contributing to creating concrete assessment
and instructional practices.
Keywords: Individual development plans (IDPs), assessment practices,
contextual conditions, external control – autonomy, dilemmas
Åsa Hirsh, PhD and senior lecturer in Education, Jönköping University
asa,hirsh@hlk.hj.se
234
EDUCARE 2015:2
IUP i Praktiken: En skolreforms formande i skärningspunkten
mellan yttre styrning och professionell autonomi
Introduktion
Individuella utvecklingsplaner (IUP) har varit en lagstadgad del av
svenska grundskollärares bedömningsarbete sedan 2006. Under denna
förhållandevis korta tidsperiod har förutsättningarna för lärares IUParbete förändrats tämligen drastiskt. Från en första reform 2006,
där IUP skulle fungera som en sammanfattande och framåtsyftande
överenskommelse mellan tre parter vid utvecklingssamtalet två gånger
om året (Skolverket, 2005), via en ny reform 2008 med skriftliga
omdömen i skolans alla ämnen som tillägg till redan befintlig formativ
funktion (Skolverket, 2008), kom 2013 ett nytt förslag som innebär att
IUP ska bli enklare och mindre tidskrävande att skriva, och inte ska
behöva upprättas mer än en gång om året för årkurs 1-5 och inte alls för
årskurs 6-9 (Skolverket, 2013). Bakom den sistnämnda reformen ligger
en diskussion och utredning (Ds 2013:23) kring det faktum att många
lärare upplever att administration och dokumentation har tagit orimliga
proportioner i förhållande till den tid de lägger på undervisning. Det
är framför allt 2008 års reform med skriftliga omdömen som gjort
att dokumentationens omfattning har ökat markant. Besluten för hur
dokumentationen ska utformas har också kommit att i ökad grad ligga
på andra än den lokala skolan. IUP formas inte bara av lärare, utan av
olika aktörer på olika nivåer, där samtliga aktörer och nivåer bidrar
till vad IUP blir i praktiken på lokala skolor. Innehållet i föreliggande
artikel syftar till att fördjupa kunskapen kring lärares arbete med IUP,
och hur detta arbete – i termer av möjligheter och svårigheter - formas
i skärningspunkten mellan nationell och lokal styrning1 å ena sidan
och lärares professionella autonomi å andra sidan. Resultaten från två
tidigare studier (Hirsh, 2014; Hirsh, 2015), som empiriskt bygger på
kvalitativ innehållsanalys av intervjuer med 15 lärare på grundskolans
tre stadier, dras samman (i termer av att det som i tidigare studier
betraktats som två separata analysenheter nu betraktas som en) och
diskuteras utifrån fyra frågeställningar:
1. Vilka kvalitativt olika sätt att förstå och arbeta med IUP kan
urskiljas i lärares beskrivningar?
1 Med nationell styrning avses här skollag och Skolverkets allmänna råd,
medan lokal styrning avser såväl huvudmannanivå som lokal skolenhet.
EDUCARE 2015:2
235
ÅSA HIRSH
2. Vilka kontextuella faktorer påverkar lärares förståelse av och
arbete med IUP?
3. Vilka dilemman och dilemmahanteringsstrategier kan urskiljas i
lärares beskrivningar av IUP-praktik?
4. Hur kan förhållandet mellan lärares dilemmahantering och
framväxande IUP-praktiker förstås?
De två första frågorna relaterar till det som tidigare var analysenhet
1, och den tredje frågan till det som tidigare var analysenhet 2.
Den fjärde frågan tar sin utgångspunkt i den nya (gemensamma)
analysenheten. För att dessutom sätta in resultaten i föreliggande
artikel i ett större sammanhang görs i diskussionsdelen en jämförelse
med internationella studier med liknande situerad förståelse av hur
lärares bedömningspraktiker tar form.
Bakgrund
IUP har under senare år utgjort en väsentlig del av lärares
bedömningspraktik. Som sådan är den representativ för ett ’nytt
bedömningsparadigm’ (jfr Havnes & McDoewll, 2007), där
bedömningsinformation används i såväl summativa som formativa
syften. När IUP för första gången introducerades 2006 var det enbart
den formativa funktionen som betonades. Grundskolans terminsvisa
utvecklingssamtal skulle regelmässigt leda fram till att varje enskild
elev fick en framåtsyftande individuell utvecklingsplan, där mål och
insatser för att nå målen skulle summeras. Redan 2008 förändrades
dock villkoren för IUP tämligen drastiskt. I en promemoria från
utbildningsdepartementet (2008) hävdades att den information som
gavs elever och föräldrar vid utvecklingssamtal inte var tillräckligt
tydlig, och med anledning av detta skulle lärarna nu avge skriftliga
omdömen i varje ämne som eleverna hade undervisning i. Dessutom
ansåg man att lärarna skulle få möjlighet att uttrycka sig med hjälp
av så kallade ”betygsliknande symboler”2 (Utbildningsdepartementet,
2 I Skolverkets allmänna råd (2008) beskrivs att en betygsliknande symbol till
sin form kan likna ett betyg (vilket tolkas som att symbolen kan utgöras av
exempelvis en bokstav eller en siffra), men att den inte är att betrakta som
236
EDUCARE 2015:2
2008, s 4) i de skriftliga omdömena. Reformen genomfördes 2008
och IUP antog i och med detta benämningen den individuella
utvecklingsplanen med skriftliga omdömen. Förändringen kan ses som
symptomatisk för en tid där resultatredovisning anses vara ett sätt att
höja skolors resultat. Diskursiva kontrasteringar ställdes emot varandra
i IUP-debatten: flum, tröghet och diskontinuitet ställdes mot klarhet,
regelbundenhet och tidig diagnos av skolsvårigheter (Krantz, 2009).
Med sådana beskrivningar blev det svårt för lärare och skolledare att
hävda kritik gentemot reformen, och i den stora utvärdering som gjordes
av Skolverket 2010 beskrivs också reformen i mångt och mycket som
positiv: IUP med skriftliga omdömen ansågs av lärare och skolledare
bidra till såväl förtydligande av kursplanens mål som en underlättad
implementering av styrdokumenten i praktiken, samtidigt som den
också beskrevs som ett verktyg som tränar elevers metakognitiva
förmåga. På basis av Skolverkets utvärdering (2010) kunde man
kunna förstå verktyget IUP som bidragandes till en professionalisering
av lärarkåren (jfr Krantz). Innehållet i dokumenten har däremot fått
utstå en del kritik, framför allt rörande det faktum att elevers olika
svårigheter sällan ses i ljuset av kontextuella faktorer, utan betraktas
som individuella tillkortakommanden (jfr Isaksson m. fl, 2007).
Kritiken har också handlat om att en relativt stor del av innehållet i
IUP-mål har varit riktade mot eleven som person snarare än elevens
kunskap i skolämnen (Korp & Sjöberg, 2012; Hirsh, 2011; Skolverket
2007; Skolverket, 2010). I Skolverkets utvärdering från 2010 nämns på
den problematiska sidan också att IUP-skrivande upplevs av lärare som
oerhört tidskrävande, och att det finns en tendens till att skolor i allt
högre utsträckning använder standardiserade mallar för dokumentation
som mer eller mindre mekaniskt kan fyllas i. Skolverket (2010) menar
att detta kan innebära en viss fara för den professionaliseringseffekt
som man annars konstaterat att IUP har medfört. Senare års forskning
visar också indikationer på att så kan vara fallet (se t ex Hirsh, 2013;
Mårell Olsson, 2012).
I såväl skollagen som Skolverkets allmänna råd kring IUP uttrycks
att ansvaret för utformandet av IUP ligger hos rektor på den lokala
skolan. Utformandet av de skriftliga omdömena är således inte
likställd med ett betyg. Ett betyg är nationellt standardiserat, vilket en betygslikande symbol i en IUP inte är.
EDUCARE 2015:2
237
ÅSA HIRSH
nationellt standardiserat. Den kritik som i både utvärderingar och
forskning kring IUP framkommit kring lärares sätt att formulera
innehåll kan tänkas ha bidragit till att huvudmän, trots detta, velat styra
lärare mot att uttrycka sig på ett visst sätt i dessa dokument. Det faktum
att innehållet i dokumenten ska relatera till kursplanernas texter har
ofta kommit att betyda att dokumenten innehåller kursplanernas exakta
formuleringar. Svårigheten för kommuner att själva utforma mallar för
dokumentation har också lett till att man i hög grad köper in tjänster
från företag som skapar och säljer lösningar för skoldokumentation. I
och med detta har såväl huvudmän som dokumentationsföretag blivit
aktiva IUP-aktörer som måste betraktas som medskapare av den IUPpraktik som utvecklas på lokala skolor (Hirsh, 2013; Lindqvist, 2012;
Mårell Olsson, 2012).
Fenomenet IUP har nyligen inträtt i en tredje fas. Efter senare års
allt intensivare debatt kring det faktum att dokumentation upplevs av
lärare som så tidskrävande att de inte längre hinner med att planera och
utvärdera sin undervisning (jfr Asp-Onsjö, 2012) beslutades i november
2013 att kraven på IUP skulle reduceras till icke-betygssättande
årskurser (d.v.s. åk 1-5) och att den bara skulle behöva skivas en
gång om året. IUP kallas sedan dess för den skriftliga individuella
utvecklingsplanen. IUP-dokumentation har stundtals i den allmänna
debatten (se t ex Helte, 2012) jämförts med betyg, och med en sådan
syn blir IUP överflödig i och med införandet av betyg i årskurs 6. Detta
är också den bakomliggande meningen i departementspromemoria
2013:23, där rekommendationen om borttagande av krav på IUP
i årskurs 6-9 grundar sig på införandet av betyg i årskurs 6, samt
det faktum att betygsskalan efter 2011 har fler steg och därmed,
tillsammans med innehållet i kursplanernas kunskapskrav, anses ge en
mer nyanserad information.
Teoretiska utgångspunkter
En central utgångspunkt är att skolreformer – i det här fallet IUPreformerna – formas snarare än implementeras av de olika aktörer som
förväntas implementera dem i enlighet med de syften som beskrivs i
policy. I genomförda studier (Hirsh, 2014; Hirsh, 2015) har en viktig
fråga därför rört lärarnas uppfattning av syftena med IUP, med andra
ord, vad de uppfattar att de ska åstadkomma med hjälp av verktyget IUP.
238
EDUCARE 2015:2
En utgångspunkt är också att människor handlar i en kontext
med hjälp av medierande verktyg, fysiska såväl som intellektuella.
Verktygen får sin funktion i händerna på användarna, men användarnas
bruk påverkas av vad de uppfattar att den omgivande kontexten
kräver, tillåter eller möjliggör (Säljö, 2000). Lärarnas uppfattningar
och användning av IUP förstås här i relation till kontextuella villkor
som traditioner, regler, rutiner och andra aktörers inflytande. Dessutom
påverkas verktygsanvändandet av i vilken grad brukaren (i det här
fallet lärarna) anser sig ha nytta av verktyget. Wertsch (1998) beskriver
hur verktygsanvändande å ena sidan kan ses som kopplat till att man
behärskar verktyget i teknisk mening (mastery), utan att man för den
skull approprierar det som ett fruktbart verktyg som i varierande mån
förändrar ens sätt att tänka och handla. Appropriering, å andra sidan,
innebär att man anammar verktyget mer än i teknisk mening, att man
finner det fruktbart och användbart. Appropriering är starkt kopplat till
ett uppfattat behov; om ett verktyg uppfattas som ålagt användaren kan
det i stället leda till känslor av motstånd.
Vidare används Wartofskys (1979) distinktion mellan primära,
sekundära och tertiära artefakter, samt Latours (1987) begreppspar
inscription – translation i det analytiska ramverket. Termen IUP
kan förstås och användas på olika sätt. Vardagligt syftar man ofta
på det fysiska dokumentet, men termen används ibland också med
referens till arbetsprocesser och användarmönster som dokumentet
medför. Man kan dessutom anta att arbetet med IUP får till följd att
användarna börjar tänka i nya banor som följd av IUP-arbetet. Med
hjälp av Wartofskys begreppsapparat definieras det fysiska dokumentet
IUP som primär artefakt, när IUP används för att informera elever
och föräldrar, när den används som arbetsinstruktioner i kontinuerligt
klassrumsarbete eller när den exempelvis utgör grund för att rapportera
resultat till huvudman. IUP som sekundär artefakt handlar om
tolkningar och modeller för hur IUP kan användas i praktiken, medan
IUP som tertiär artefakt innebär att IUP på en meta-nivå kan förstås
som ett verktyg som möjliggör nya och/eller alternativa sätt att tolka
och förstå företeelser. Nya sätt att tänka och handla som tillägnats som
resultat av IUP-arbete kan betraktas som exempel på tertiär artefakt (jfr
Habib & Wittek, 2007).
EDUCARE 2015:2
239
ÅSA HIRSH
Begreppen inscription (inskription) och translation (översättning)
är hämtade från Actor Network Theory (ANT) (Akrish & Latour,
1992), och används som ett sätt att förstå den sekundära nivån: hur
IUP blir ett verktyg i undervisningspraktiken. Inskription syftar på hur
vissa användningsmönster införlivas i ett objekt redan då detta skapas
på basis av tilltänkta användare och användningsområden. I ANT
förstås ett sådant objekt som en aktör som ålägger användaren ett visst
handlingsmönster. Faktisk användning kan dock i olika grad avvika
från det inskriberade handlingsmönstret. Processen när användare
tolkar, omförhandlar eller rekonstruerar objektet kallas översättning.
I fallet IUP sker inskribering på nationell nivå, i skollag och allmänna
råd från Skolverket, men också på huvudmannanivå, i termer av
lokala riktlinjer och inköpta program med färdiga IUP-lösningar.
Översättningsprocessen handlar om hur lärare (och skolledare) sedan
– i varierande grad - anpassar och utvecklar det redan inskriberade
objektet till sina lokala förutsättningar och omständigheter.
Då lärares IUP-arbete ses som kontextuellt format behövs en
definition av kontext-begreppet. I analogi med verksamhetsteori och
Engeström (2001) definierar jag kontextuella faktorer som regler
(skrivna och oskrivna regler som bestämmer IUP-arbete), gemenskap
(olika aktörer som finns på skolan i form av personal och elever) och
arbetsdelning (ansvars- och rollfördelning mellan olika aktörer).
Ett annat viktigt begrepp som använts i analysen av IUP-relaterade
svårigheter är motsättningar. Med utgångspunkt i verksamhetsteori
förstås motsättningar som ständigt närvarande i verksamhetssystem
och som varande en viktig drivkraft för förändring. Engeström och
Sannino (2011) beskriver motsättningar som historiskt framvuxna
strukturella spänningar inom och mellan verksamhetssystem.
Diskursiva manifestationer av sådana motsättningar kan vara dilemman
som artikuleras av dem som finns i systemet. I genomförda intervjuer
med lärare framkommer såväl möjligheter som svårigheter med IUParbete, där svårigheterna i många fall kan tolkas som dilemman.
Dilemman definieras i föreliggande studie som situationer i vilka två
delvis motsägelsefulla syften måste uppfyllas och inget av dem kan
väljas bort. Dilemman har därmed ingen given lösning utan måste
balanseras på något sätt.
240
EDUCARE 2015:2
Metod
Föreliggande studie tar sin empiriska utgångspunkt i 15 intervjuer
genomförda hösten 2011 med lärare från grundskolans tre stadier
(5 från varje stadium). Eftersom IUP-skrivande och IUP-arbete inte
är nationellt standardiserat och därmed kan se olika ut från skola
till skola, var variation en viktig faktor i urvalet av informanter. 13
lärare arbetade på kommunala skolor i totalt fem olika kommuner, och
två lärare arbetade på fristående skolor. För de kommunala skolorna
lämnade den centrala skolförvaltningen namn på ett antal rektorer som
kontaktades och fick en kort beskrivning av studiens syfte. Rektorerna
ombads tillfråga ett antal lärare om de var villiga att delta i intervjuer
kring IUP, och bland inkomna namn kontaktades 13 stycken, fördelade
på olika kommuner, skolor och stadier. Två rektorer på fristående skolor
kontaktades på motsvarande sätt och lämnade förslag på lärare som var
villiga att delta. Intervjuerna var materialbaserade, vilket innebär att
varje lärare till intervjutillfället hade med sig två IUP:er som hen själv
hade varit huvudansvarig för att upprätta under det senaste året. Tack
vare detta kunde lärares utsagor relateras till dokumentens innehåll i
hög grad. Intervjuerna transkriberades ordagrant.
Kvalitativ innehållsanalys (Graneheim & Lundman, 2004) användes
ursprungligen vid processande och analys av data i båda de studier
som här har förts samman och betraktats som en analysenhet, Detta
har möjliggjort fördjupad förståelse och diskussion av den fråga som
handlar om hur förhållandet mellan lärares dilemmahantering och
framväxande IUP-praktiker kan förstås.
Ur analysenheten (intervjuerna) har meningsenheter (meningar eller
textstycken innehållandes aspekter som relaterar till ett visst givet
innehåll) identifierats där lärarna ger uttryck för
1/ uppfattade syften med IUP (Vad är IUP? Varför IUP?)
2/ användning av IUP (När används IUP? Hur?)
3/ kontextuella villkor som påverkar IUP-arbete (Explicita/implicita
rutiner, organisatoriska/strukturella faktorer, hur olika aktörer är
inblandade)
4/ svårigheter med IUP
5/ hur svårigheter hanteras
EDUCARE 2015:2
241
ÅSA HIRSH
Identifierade meningsenheter har sedan kondenserats, vilket innebär
en förkortning av texten utan att kärnmeningen går förlorad eller
abstraheras. Kondenseringen är ett mellanled mellan meningsenhet
och kod som underlättar överblicken i det annars väldigt omfattande
materialet. I tabellen nedan exemplifieras stegen meningsenhet –
kondensering – kod. Samtliga utdrag i tabellen nedan kommer från
samma intervju (Lärare 2):
Tabell 1. Exempel på analysarbete
Meningsenheter
Kondenserade
meningsenheter
Koder/
Handlar om
Mmmm… IUP är en slags avstämning där
jag får sammanfatta vad eleven har gjort.
Det känns ju som att, det är ju bättre att
göra det två gånger per termin, både vid
betygssättning OCH till en IUP. För att
hålla sig uppdaterad liksom SJÄLV. Och
för att eleven själv ska veta... så att man
formulerar vad de måste göra. Har jag
formulerat det i ett dokument så finns det
kanske mer tydligt att eleven MÅSTE satsa
på det här, den eleven vill nå MVG, men
då MÅSTE den bli bättre på det här och det
här, och då har man försökt formulera det.
IUP är en extra
avstämning/
sammanfattning av
elevens nivå.
Uppfattade
syften
Nej, jag vet inte… man har ju såna där IUPtider på vissa skolor, där de liksom jobbar
med sin IUP i stället för Elevens val eller vad
det nu kan va… Men då gäller det ju att
det står något bra där i IUPn, som de kan
jobba med. Det går säkert för dem som är
duktiga och inkörda i det här arbetet… och
som liksom känner själv att DET HÄR skulle
jag kunna använda så här och så här...
Men vi har inga strategier här känns det
som, vi samarbetar inte… inga direkta…
riktlinjer från rektor eller så… ingen följer
upp i skolledningen heller, eller verkar tycka
att det är viktigt… man kan ju göra som
man vill… Jag vet inte, men här är det vid
utvecklingssamtal vi använder den. Som
information då. Det känns ändå som att IUP
först och främst är en extra avstämning…
eller.. ja en extra information då.
Det bäste vore
om det fanns en
koppling mellan
dokumentinnehåll och
undervisning, men
strategier för sådant
arbete saknas. Stöd
och intresse från
skolledning saknas.
Då blir IUP som
en information vid
utvecklingssamtal.
Dokumentet tydliggör
vad eleven måste göra
för att höja nivån.
Kontextuella
villkor
Svårigheter
med IUP
Användning
av IUP
(Tabell 1 forts. på nästa sida)
242
EDUCARE 2015:2
(Tabell 1 forts.)
Ja, men, som jag säger, det finns ju
en viss slags avstämningsnytta… och
information… med det… men den TIDEN
som det tar för mig att sitta och formulera
detta på ett bra sätt för SÅ många elever
som jag har… det är HELT orimligt alltså…
jag känner… det är frustrerande alltså…
Plus att… Vi fick gå nån kurs, det var
förra hösten… och man fick se såna här
omdömen och hur de SKULLE skrivas, som
förslag, och det var liksom UPPSATSER
på varje elev. Då kände man ju bara…
ja, det bara vänder sig i magen på
en… ALDRIG att jag sitter och skriver de
uppsatserna om varje elev, jag gör det
bara inte alltså… Eller hur ska jag hinna
det? Om jag ska göra det så hinner jag
inte undervisa alltså… eller planera… Nej,
såna omdömen skriver jag inte, det får
bli.. oftast nåt kort… bara för att det ska
bli gjort…
Det tar mycket tid att
skriva omdömen som
de ”borde vara”.
Om man skulle skriva
så skulle man inte
hinna planera eller
undervisa.
Uppfattade
syften
Svårigheter
med IUP
(Under
kategorisering:
Dilemma -Tid)
(Strategi
för att hantera
dilemma:
Procedural
display)
Läsningen av materialet har gått från helhet till delar, och tillbaka till
helhet igen. Analysens pendling mellan delar och helhet indikerade att
det var möjligt att förstå lärarnas uppfattningar av syften med IUP som
avgörande för hur och när IUP användes i kontinuerlig praktik. I de
utdrag som exemplifieras i Tabell 1 ovan beskrivs IUP som tjänandes
syftena avstämning och information, och man kan förstå det faktum att
IUP används två gånger om året vid utvecklingssamtal som en logisk
följd av just dessa uppfattade syften. I en annan intervju säger en
lärare ”IUP innebär ju en JÄTTESTOR förändring... Den ska ju hjälpa
barnen… att sätta mål, vara medvetna om sina mål… och utvärdera
dem” (Lärare 3), vilket tyder på att läraren ser metakognitiv träning
som ett syfte med IUP. Längre fram i intervjun säger samma lärare
”Några gånger per termin sitter jag tillsammans med varje elev… och
de får utvärdera, liksom tänka kring sina IUP-mål… och kanske, om
vi tycker att de har nått dem, så tänker de på nya mål”, vilket kan
förstås som en logisk följd av att IUP uppfattas som ett verktyg för
metakognitiv träning. Uppfattade syften blev därför den definierande
faktorn i skapandet av en typologi som visar tre kvalitativt olika sätt
att förstå och arbeta med IUP. Ett antal aspekter av kontextuella villkor
sammanföll med uppfattat syfte och kontinuerlig arbete, varför det blev
EDUCARE 2015:2
243
ÅSA HIRSH
möjligt att beskriva tre olika IUP-praktiker som innefattar även vissa
kontextuella villkor.
För det som kodats som IUP-relaterade svårigheter gjordes
en ny läsning som resulterade i en underkategorisering utifrån
aspekter relaterade till tid (arbetsbelastning i relation till arbetstid),
kommunikation (språk och formuleringar i dokumenten), och
bedömning (relationen mellan summativa och formativa syften).
Var och en av de tre kategorierna förstås som innehållandes ett
dilemma som behöver balanseras/hanteras. Lärares sätt att balansera/
hantera dessa dilemman resulterade också i en i underkategorisering
(Procedural display, Enligt konstens alla regler och Towards a new
thirdness), som i sin tur – specifikt i denna studie - sätts i relation till
typologin av tre kvalitativt olika IUP-praktiker.
Resultat
Resultatredovisningen utgår ifrån studiens fyra frågeställningar.
Inledningsvis beskrivs kortfattat tre kvalitativt olika IUP-praktiker,
innefattandes kontextuella faktorer som kan påverka arbetet med IUP.
Därpå redovisas tre centrala IUP-relaterade dilemman och strategier för
att hantera dessa dilemman. Kopplingen mellan de olika praktikerna
och sätten att hantera dilemman avslutar resultatdelen.
Som beskrivits i metoden ovan visade den empiriska analysen att
lärarnas uppfattning av syftena med IUP kunde förstås som avgörande
för hur arbetet med IUP formas i kontinuerlig praktik. Totalt kunde
fem olika uppfattade syften/funktioner med IUP utläsas i det empiriska
materialet:
A: IUP som dokument med information kring elevens nuvarande
kunskapsnivå och framåtsyftande mål
B: IUP som utgångspunkt för utvecklingssamtal
C: IUP som verktyg för att visualisera varje individ och
identifiera individers lärandebehov
D: IUP som verktyg för att involvera eleven i bedömning/
utvärdering och för metakognitiv träning
E: IUP som verktyg för utvärdering och anpassning av
undervisning
244
EDUCARE 2015:2
Syfte A, B och C fanns i varierande utsträckning med i utsagor från alla
intervjuer, medan syfte D endast fanns med i utsagor från lärare som
placerades i praktik 2 och 3 och syfte E enbart fanns med i utsagor från
lärare som placerades i praktik 3. Man kan därmed visa på indelningen
i tre kvalitativt olika IUP-praktiker utifrån följande figur (Figur 1):
IUP-praktik 1
Syfte A, B, C beskrivs
IUP-praktik 2
Syfte A, B, C, D
beskrivs
IUP-praktik 3
Syfte A, B, C, D, E
beskrivs
Figur 1. Typologi av IUP-praktiker baserad på uppfattade syften
IUP-praktik 1
IUP beskrivs i första hand som ett dokument som ger information
till elev och vårdnadshavare vid de terminsvisa utvecklingssamtalen.
Lärarna beskriver att dokumenten inte används i skolan mellan
samtalen, varför IUP kan betraktas som ett formativt verktyg endast
om mottagarna (elever och föräldrar) förstår den information som
ges och själva kan agera utifrån den. Givna mallar och riktlinjer
för IUP-skrivande följs tämligen strikt. Inskriptionen – särskilt i
termer av mallar som huvudmannen tillhandahåller - är stark, medan
översättningen förefaller vara mycket begränsad:
Nu säger de ju liksom bara ”Det här är kommunövergripande, så här är
det, alla ska använda de här mallarna”. That’s it, det är det enda vi har
fått… Vet inte om jag kan påverka… jag vet inte om jag bryr mig… om
man ändå inte tycker att IUPn är så användbar, så kanske det inte spelar
så himla stor roll för en hur det är uppspaltat liksom. (L2)
Ett mått av motstånd är närvarande i lärarnas beskrivningar i termer av
att de menar att oproportionerligt mycket arbete läggs ned på skrivande
som inte upplevs göra någon större skillnad. Lärarna i IUP-praktik 1
beskriver att det finns få forum för kollegialt samarbete kring IUP; var
och en sköter sitt skrivande och skolledarna blandar sig i låg grad i vare
sig skrivande eller uppföljande arbete.
EDUCARE 2015:2
245
ÅSA HIRSH
IUP-praktik 2
Även här beskrivs IUP i första hand som ett dokument som ger
information vid terminsvisa utvecklingssamtal, men också som
bildandes utgångspunkt för ett mer professionellt utvecklingssamtal.
IUP används till att inför samtal involvera eleverna i att sätta upp och
utvärdera mål, vilket anses vara fruktbart för deras metakognitiva
utveckling. Lärarnas arbete med att skapa IUP-dokumentet beskrivs
leda till att varje individs behov synliggörs på ett annat sätt än tidigare,
och dessa behov ’finns med i bakhuvudet’ hos läraren mellan samtalen.
IUP som dokument är dock statisk mellan samtalen och förändras
inte, även om eleverna på olika sätt påminns om sina mål. Lärarna
beskriver också här att en mycket stor del av deras arbetstid ägnas åt
att dokumentera, men till skillnad från lärarna i praktik 1 upplever de
att det ger tillbaka i termer av att deras egen reflektion kring elevernas
lärande fördjupas:
Eh… alltså, även om det tar VÄLDIGT lång tid att skriva och så ju… så
känns det ändå som det ger nånting. Dels får man verkligen tänka igenom,
gör jag på rätt sätt? Det är väldigt mycket kopplat till kursplanerna ju. Så
man blir betydligt mer medveten om vad man gör, vad eleverna verkligen
lär sig. (L5)
Inskriptionen väger tungt och lärarna beskriver att de följer mallar och
riktlinjer strikt. Vilja till översättningsprocess finns, men den omgivande
kontexten – främst i termer av riktlinjer från huvudmannanivå och
skolledare – uppmuntrar inte till översättning. Skolledarna beskrivs
som involverade främst i termer av att ge ramar för hur tiden för lärares
skrivarbete ska organiseras och att skapa vissa forum för samarbete
kring formuleringsarbete:
Och sen har vår rektor organiserat det så att… vi har både under hösten
och våren tre veckors dokumentveckor, som vi kallar det då. Det är
mötesfria veckor och då får vi hålla på att skriva våra skriftliga omdömen
på arbetsplatsförlagd tid då. Och det är också bra, för när man kör fast i
hur man formulerar sig och skriver, så kan man ju fråga andra kollegor
som också sitter vid datorn, ”Hur tycker du detta låter?” eller ”Du känner
ju Kalle, hur kan jag formulera detta?”. (L3)
246
EDUCARE 2015:2
IUP-praktik 3
Även här betraktas IUP som information till elev och förälder vid
utvecklingssamtal, men den beskrivs främst som ett formativt verktyg
som på ett mer genomgripande sätt påverkar lärarnas planering och
genomförande av undervisning. Fortlöpande används IUP för att
involvera eleverna i reflektion och planering av sin egen utveckling,
och för detta finns regelbundet schemalagd tid. Eftersom eleverna
dessutom anses motiveras av mer kortsiktiga mål som påtagligt kan
’prickas av’ och ersättas med nya kan dokumentet inte vara statiskt
mellan samtalen, utan uppdateras kontinuerligt på elevernas IUPtid i takt med att de utvecklas och behöver nya mål. Endast i praktik
3 beskriver lärarna att de använder elevernas dokument som grund
för gemensamma utvärderingar i syfte att hitta mönster och anpassa
undervisning:
Det som är bra, det är ju att vi TILLSAMMANS sitter med det här… det
gör ju att man kan se ”Vad händer? Är det något vi behöver ta fasta på?”
För vi diskuterar ju ofta med varandra i arbetslaget när vi skriver IUP, vad
är det som påverkar att eleven får bättre betyg hos dig än hos mig? Och
varför presterar hon eller han sämre när hon eller han skriver hos dig? Hur
kan vi överbrygga de olikheterna och skillnaderna? Beror det på situation,
kompisar, grupper, vad är det liksom? (L11)
De förefaller ha approprierat IUP som ett konceptuellt verktyg, och
beskriver IUP-tanken som ett sätt att organisera och fortlöpande
dokumentera lärprocesser, snarare än administration som löper vid
sidan av undervisningen. Eftersom IUP beskrivs ha bidragit till att
lärarna tänker annorlunda kring undervisning är det möjligt att tala
om att den fungerar som en tertiär artefakt. Lärarna beskriver att
skolledarna är aktivt inblandade i en kritisk diskussion kring hur IUP
kan formas, och arbetar tillsammans med lärarna för att översätta den
till ett lokal fungerande verktyg. Inskriptionen förefaller därmed vara
mindre påtaglig i praktik 3 än i övriga två.
IUP-relaterade dilemman
14 av 15 intervjuade lärare beskriver påtagliga svårigheter med IUParbete. Överensstämmelsen i de svårigheter som beskrivs är stor,
oavsett vilken kommun, skola eller stadium man representerar, och
EDUCARE 2015:2
247
ÅSA HIRSH
det är i huvudsak tre problemområden som framträder som centrala;
tidsrelaterade, kommunikationsrelaterade och bedömningsrelaterade.
Det som skiljer lärarnas beskrivningar åt är framför allt deras sätt/
förutsättningar att hantera dessa problemområden, eller – med andra
ord – att balansera de dilemman som de medför.
Som tidigare nämnts definieras dilemman som situationer i vilka två
delvis motsägelsefulla syften måste uppfyllas och inget av dem kan
väljas bort. Dessa dilemman kan sammanfattas enlig följande:
Dokumentation vs. Undervisning: Dokumentationsarbetet upplevs som
så tidskrävande att man känner att man inte längre har adekvat tid över
för att planera och efterarbeta sin undervisning. Arbetsbördan ökade
kraftigt när lagen om skriftliga omdömen i alla ämnen kom 2008, utan
att det skedde några justeringar av lärarnas övriga arbetsuppgifter:
Det som jag tror de flesta lärare tänker på, det är ju att det blev en till
pålaga på oss. Utan att vi vare sig fick tid eller pengar för det. Det är det
som gör att det kanske känns extra jobbigt. Att man kanske skulle ha gett
oss… TID på nåt sätt… så att det inte BARA blir på vår planeringstid
då. För annat blir ju lidande. Och som det blir för många, man sitter ju
även utöver det, för att bli färdig. Det blir ju ett irritationsmoment, det
blir ju det. Och då är det lätt att man själv får en negativ inställning till
IUP. Så det känns som att… ja… det tar TID… men samtidigt så hjälper
det när jag väl har gjort det, men det tar ju tid från det övriga vi gör. (L7)
Officiellt korrekt vs. Elevvänligt språk: Dilemmat handlar om omfånget
och komplexiteten i det innehåll som formuleras i dokumentet, och
har därmed viss koppling till tidsdilemmat. Lärarna känner krav från
huvudmanna- och skolledarhåll på att uttrycka sig byråkratiskt och
kursplanelikt i IUP. Följden av detta blir, menar de, att mottagarna inte
förstår innehållet och blir överväldigade av dokumentens språk och
omfattning. Detta får konsekvensen att lärarna känner att de lägger
mycket tid på något som elever och föräldrar i låg grad förstår och kan
använda sig av:
Det tar ju så lång tid att skriva, man ska ha med så mycket från kursplanen
och så…Det här (pekar) är ju krångligt att läsa för mig, som vet hur man
ska läsa det. Och då tänker jag mig en elev… eller förälder… de har
ju jättesvårt att läsa det. De förstår kanske inte nånting… Förutom om
248
EDUCARE 2015:2
man har föräldrar som då är… välutbildade och som har god insikt i
styrdokument och sånt här /.../ Det här som är hämtat från kursplanen…
man hör lite att föräldrar uttrycker att ’Ja, det är ju inte solklart direkt’.
Så det är svårt med språket för att det ska bli bra det här. Professionellt.
För det har vi ju pratat mycket om, att vi ska ha ett språk för lärarkåren…
Men samtidigt då, vem skriver man för? Ska inte föräldrar förstå det? Det
känns lite konstigt… man önskar väl att det skulle vara mer för elevers
och föräldrars skull. (L8)
Summativ vs. Formativ bedömning: Lärarna menar att det finns en
svårighet i att ett och samma dokument ska fylla både en summerande
och en framåtsyftande funktion. Mottagarnas uppmärksamhet riktas
enligt lärarna automatisk mot de betygsliknande delarna av dokumentet
och det framåtsyftande – som samtliga lärare beskriver som det mest
centrala i IUP - hamnar därmed i bakgrunden. Flera lärare – särskilt
på lägre stadier - menar också att eleverna bedöms på ett onödigt
instrumentellt sätt, och de beskriver en oro för att detta ska leda till
minskad lust att lära hos eleverna:
De (eleverna och föräldrarna) tittar bara på matriserna med kryssen. Det
är det enda de kollar på… och säger ’Det ser ju bra ut, jag når målen i alla
ämnen’. ’Jaha, har du läst den framåtsyftande texten då’ frågar jag. ’Näää’,
säger de. Man vill ju att de ska se IUP som en hjälp att bli bättre… Men
nu tittar de bara på själva ”betyget”… (L8)
Det är väldigt konfliktfyllt för en när man jobbar med små barn… De är
liksom så små och oskrivna på något vis, och många barn vi har här på
skolan har ett annat modersmål. Då är det inte enkelt och självklart att man
fixar SO och NO när man går i årskurs 3. Och hjälper det då att bli bedömd
med de här kryssen? /…/ Det är så lätt att stjälpa dem när man håller sig
till såna här kryss och betyg. (L3)
Dilemmahantering och formandet av
IUP-praktiker
De lärare som upplever dilemman i hög grad återfinns främst i
IUP-praktik 2. De vill följa alla riktlinjer (nationella såväl som från
huvudmannanivå) fullt ut och utforma sina dokument enligt konstens
alla regler. Det finns inga givna strategier för att hantera de dilemman
EDUCARE 2015:2
249
ÅSA HIRSH
som uppstår, och det blir därmed svårt för dem att hitta en balans i sitt
arbete. Lärarna försöker anpassa sig genom att ändra på vissa delar
av sitt IUP-relaterade arbete, men dessa förändringar sker individuellt
snarare än kollektivt och innebär inte sällan ytterligare merarbete;
det finns exempelvis lärare som beskriver att deras frustration över
att mottagaren inte förstår innehållet i dokumenten har lett till att de
skapar mer dokumentation vid sidan av den officiella IUP:n, för att
kunna ge elever och föräldrar ett dokument som de förstår också.
I lärarnas utsagor i den samlade empirin går det att uttolka tre
kvalitativt olika sätt att hantera dilemman. Det ovan beskrivna enligt
konstens alla regler är ett av dem. Detta är ingen balansering, utan
snarare ett merarbete. Nära knutet till praktik 1 är ett sätt att hantera
dilemman som jag har valt att kalla för procedural display (jfr. Bloome
m.fl, 1989). Lärare uppvisar (för skolledare och mottagare) procedurer
som kan räknas som IUP-praktik, men deras beskrivningar indikerar
snarast ett ’rituellt’ beteende i termer av att man gör det som krävs för
att få ihop ett dokument. ”För många av oss är det klipp och klistra, man
skriver detsamma för de flesta elever, och efteråt känner man Skönt,
nu är det gjort, nu är det ett halvår till nästa gång” säger en av lärarna
i intervjun. Det tredje sättet att hantera de dilemman som finns har jag
kallat för towards a new thirdness. Som tidigare nämnts ser man inom
verksamhetsteorin på motsättningar som en drivkraft för förändring
av verksamheten. När motsättningar växer och blir ohållbara kan det
leda till en kollektiv förändringsprocess där kvalitativt nya sätt att
arbeta utvecklas. De nya sätten är inte att betrakta som en kompromiss
av det som tidigare utgjort grunden för motsättningarna, utan som en
mer genomgripande förändring som kan betraktas som en tredje väg
(jfr Engeström & Sannino, 2011). Flera lärare beskriver hur de varit i
enligt konstens alla regler, men upplevt det som ohållbart. Kollegialt
och med stöd av sin rektor har de bestämt sig för förändringar som
inneburit elevvänligt formulerade dokument och en betoning av de
undervisningsmässiga konsekvenserna av dokumentets innehåll. Den
dokumentation som fyller formativa funktioner hanteras kontinuerligt
och involverar eleverna.
Dessa tre sätt ska inte betraktas som kategorier med några absoluta
gränsdragningar mellan, utan mer som utgörandes grund för att
diskutera möjliga sätt att hantera dilemmaliknande situationer som
250
EDUCARE 2015:2
genomgripande påverkar lärares arbetssituation och professionella
identitet. Från och med införandet av de skriftliga omdömena i skolans
alla ämnen har lärarna haft Skolverkets allmänna råd att förhålla sig till,
och dessutom ofta ytterligare riktlinjer från huvudmannanivå. Givna
mallar för dokumentation har ofta ålagts lärare utan att de har haft
möjlighet att påverka utformningen av dem eller arbetet med dem. Det
har blivit ett omöjligt uppdrag för många att hantera den omfattande
dokumentationen som detta har medfört inom ramen för sin arbetstid,
och då kan man – hypotetiskt – anta att lärare som finns i enligt konstens
alla regler, för att klara sin arbetssituation, till slut hamnar i procedural
display eller towards a new thirdness. Vilken utav dem det blir beror
inte bara på enskilda lärares eller lärargruppers kunskap, inställning
och engagemang, utan också på kontextuella faktorer som riktlinjer
från huvudman, rektors kunskap, engagemang och sätt att organisera
arbetet, skolstadium, vilka mallar för dokumentation som används och
lärarnas möjlighet att ha inflytande över arbetet.
Diskussion
Den sammantagna empiriska analysen har visat att IUP-relaterat
arbete kan se ut på olika sätt. IUP kan betraktas som ett exempel på
komplexiteten som är involverad när en skolreform formas i lokala
praktiker. Den nya analysen av materialet (de två ursprungliga
analysenheterna sammantaget) visar att det går att förstå framväxande
IUP-praktiker inte bara som formade av de syften lärare uppfattar som
centrala, utan också som kopplade till lärares olika sätt att hantera
dilemman. Den formella dimensionen av IUP (knuten till skrivelser
i skollag, allmänna råd och indirekt även till läroplanen) tolkas inte
sällan av aktörer på huvudmannanivå och dokumentationsföretagsnivå
innan den lokala skolnivån träder in med sin förståelse. För olika lokala
skolor kan inskriptionen, i termer av hur mycket tolkning som gjorts
på huvudmanna- och företagsnivå, väga olika tungt. IUP-lösningar
som är tungt inskriberade med vissa givna sätt att formulera dokument
och arbeta med IUP kan hindra översättningsprocesser på den lokala
skolan. Utifrån empirin i föreliggande studie kan konstateras att de
lärare som i hög grad beskriver dilemman som är svåra att balansera
arbetar med IUP-lösningar som är tungt inskriberade med regler och
EDUCARE 2015:2
251
ÅSA HIRSH
riktlinjer från huvudmanna- och företagsnivå. De lärare som i högre
grad fått vara med och forma/förändra IUP-lösningar i samklang med
sin rektor beskriver att de hittat sätt att balansera dilemman. Utifrån
verksamhetsteoretiska perspektiv betraktas dilemman som diskursiva
manifestationer av historiskt framvuxna motsättningar inom och
mellan verksamhetssystem. Jag betraktar motsättningen mellan
central styrning och lärares professionella autonomi som central i det
här sammanhanget. I samband med införandet av det målrelaterade
betygssystemet på 1990-talet decentraliserades också skolans styrning
till kommunnivå. En av tankarna bakom detta var att vägar till målen
i hög grad skulle beslutas i den lokala kontexten. På senare år har
makten att formulera vägar till målen snarare re-centraliserats (jfr
Forsberg, 2014), och formandet av lokala skolpraktiker hamnar därmed
i skärningspunkten mellan nationell, kommunal och lokal skolnivå. I
fallet IUP har marknaden i form av dokumentationsföretag också gjort
sig gällande på ett påtagligt sätt.
När lärares IUP-praktiker formas förefaller balansen mellan
inskription och översättning vara central. Detta, i sin tur, kan relateras
till övriga teoretiska begrepp som i genomförda studier använts för att
analysera och förstå lärares arbete med IUP. För lärare som åtnjuter
en högre grad av autonomi har översättningsarbetet blivit en process
under ständig utveckling. Möjligheten att dessa lärare ska appropriera
IUP som ett användbart verktyg ökar, vilket i sin tur ligger nära min
förståelse av IUP som tertiär artefakt. Tertiära artefakter färgar vår
förståelse av fenomen i världen (Wartofsky, 1979; Säljö, 2000) på ett
sätt som delvis är frikopplat från den primära artefakten. De förändrade
sätt att tänka och tala om företeelser som vi utvecklar kan överföras
mellan kontexter, varför tertiära artefakter blir viktiga som medierande
verktyg för att förändra etablerad praxis. En konceptuell förståelse
av IUP som ett formativt verktyg som involverar kontinuerligt
arbete med lärandemål, utvärdering, bedömning, reflektion och
involverande av elever i processen kan spilla över på andra delar av
undervisningspraktiken och vice versa.
När inskriptionen – i termer av regler, riktlinjer och givna mallar – är
tung redan när IUP-lösningen når den lokala skolan kan IUP komma att
betraktas som en given och färdig lösning. Tolkningarna av skollagen
och det som står i de allmänna råden har redan gjorts av aktörer på andra
252
EDUCARE 2015:2
nivåer, vilket kan minimera den lokala skolans översättningsprocess.
Skolorna förväntas anpassa sig till en given lösning i effektivitetens
och likvärdighetens namn. Det kan naturligtvis finnas positiva aspekter
av detta, och det är på ett sätt inte svårt att förstå kommuner som i detta
avseende förespråkar likvärdighet i termer av ’lika för alla’. Mallar
kan dessutom i mångt och mycket uppfattas som en hjälp för dem
som använder dem. Agevall och Jenner (2008) menar dock att själva
förmågan att balansera och finna lösningar i komplexa situationer
utvecklas genom autonom handling. Om lärare inte förväntas tänka i
termer av översättning, är det möjligt att deras professionella förmåga
att forma, anpassa, förfina och utvärdera sin praktik inte utvecklas. Med
en begränsad grad av autonomi kan lärares möjlighet att appropriera
IUP som konceptuellt verktyg reduceras, vilket medför en risk för
att IUP blir något som man ’hanterar’ på ett sätt som Wertsch (1998)
beskriver som mastery utan appropriering. Detta, i sin tur, leder ofta
till ett visst mått av motstånd hos användarna av ett verktyg, och till att
man betraktar det som något som löper vid sidan av snarare än något
som är en del av undervisningssammanhanget.
Jämförande utblick
Denna studie handlar om lärares arbete med individuella
utvecklingsplaner i Sverige, men resultaten kan lyftas och diskuteras på
en mer övergripande nivå som handlar om lärares bedömningspraktiker
som situerade i en kontext, där organisation och villkor på olika nivåer i
skolsystemet blir medskapare av konkret klassrumspraktik. En nyligen
genomförd översiktsstudie om 2000-talets forskning kring formativ
bedömning (Hirsh & Lindberg, 2015) visar att påtagligt många
studier lyfter fram kontextuella/organisatoriska villkor som starkt
bidragande till att forma lärares (formativa) bedömningspraktiker (se
exempelvis Cooper & Cowie, 2010; Gardner m fl, 2011; Harlen, 2010;
Smith, 2011). Pryor och Crossouard (2008) positionerar exempelvis
lärares implementering av formativa bedömningsprocesser som
situerade, och använder just basen av Engeströms (2001) triangulära
verksamhetssystem (regler, gemenskap, arbetsdelning) för att förstå hur
lärares arbete formas olika trots att principerna för formativ bedömning
skulle kunna betraktas som generella. Davies och Neitzel (2011),
liksom Hermansen och Nerland (2014) hävdar att lärare som i intervjuer
EDUCARE 2015:2
253
ÅSA HIRSH
uppvisar komplex och fördjupad förståelse för formativ bedömning
ändå inte förmår arbeta i enlighet med denna förståelse, då de i så hög
utsträckning styrs av externa krav på resultatredovisning. En studie av
Birenbaum m fl (2011), där 122 lärare deltagit i en enkätstudie och sex
lärare och deras klassrumspraktiker och skolkultur sedan närstuderats
med avseende på sambandet mellan implementeringen av formativt
klassrumsarbete och skolkultur, påvisar dessutom stora likheter med
föreliggande studie. De sex närstuderade fallen kategoriserades i två
grupper – A och B. I grupp A, där formativa praktiker fungerade sämre,
uppvisar lärarna i olika grad bedömningspraktiker som forskarna
benämner som ”pseudo-formativa” (Birenbaum m fl, 2011, s 45,
min översättning). En uppsättning formativa tekniker anammas, men
bedömningsinformationen används inte i formativt syfte. Här finns
likheter med den dilemmahanteringsstrategi som jag har valt att kalla
procedural display, och det som Wertsch (1998) menar är mastery
utan appropriation. I grupp B är formativ bedömning i betydligt högre
grad inbäddad som naturlig del av klassrumsarbetet. I likhet med min
diskussion kring begreppsparet inscription – translation och graden av
lärares autonomi kontra extern reglering, menar Birenbaum m fl (2011)
att de kan se ett påtagligt samband mellan styrning/autonomi å ena
sidan och utvecklandet av högkvalitativ formativ bedömningspraktik
å den andra:
Overall, a dimension along which our six cases vary, which underlies both
classroom and organizational contexts, is that of regulation, ranging from
external to internal. Group A cases are located toward the external pole,
indicating their submissiveness to external regulation. This characteristic
is evident at all levels of the hierarchy – school leadership vis-à-vis an
inspectorate; teachers vis-à-vis school leadership; students vis-à-vis
teachers. Group B (particularly Rona’s school) is located toward the
internal pole, indicating their organizational self-regulation, as exemplified
by the staff directing their professional development, developing their
school-based curriculum, and continuously investigating their practice to
improve it. (s 46)
I likhet med mig menar de att lärares bedömningspraktiker å ena sidan
formas av hur de förstår sitt uppdrag, och å andra sidan av organisation
och förväntningar i den kontext de befinner sig i.
254
EDUCARE 2015:2
Avslutningsvis
Utifrån den teoretiska argumentation som har förts i föreliggande
artikel är IUP ett fortsatt viktigt område att studera. Under de år som
gått sedan den första reformen infördes har svenska lärare arbetat
intensivt med IUP och dokumentation i en kontext där förändringar
och nya riktlinjer duggat tätt. Min utgångspunkt är att nya reformer i
skolan formas snarare än implementeras, och de genomförda studierna
bekräftar att så har varit fallet med IUP. De kvalitativt olika praktiker
som formas har vuxit fram i olika lokala kontexter, och IUP-relaterade
dilemman upplevs mer eller mindre påtagligt av de olika lärarna.
Det tar tid att forma en praktik som fungerar, det krävs kontinuerligt
översättningsarbete. Frågan är om de senaste åtta årens arbete med IUP
har lett till nya sätt att tänka och arbeta som kommer att bestå oavsett
om de formella kraven på IUP försvinner. I linje med denna artikels
argumentation kan man tänka sig att de som har approprierat IUP på
ett sätt som gör att den kan beskrivas som en tertiär artefakt kommer
att fortsätta med ett IUP-inspirerat arbetssätt oavsett formella krav på
dokumentation. De som inte har sett några vinster med IUP å andra
sidan, och möjligen drar en lättnadens suck när de formella kraven i
betygssättande årskurser försvinner, behöver måhända fundera över
alternativa sätt att dokumentera och informera om elevers kunskaper
vid utvecklingssamtal. Inte minst behöver man också ta ställning till
frågorna kring de formativa funktionerna som IUP antas fylla. Ett
borttagande av IUP i årkurs 6-9 innebär inte bara ett borttagande av
något som är summativt och betygsliknande, det innebär också ett
borttagande av ett redskap med formativ funktion som skulle kunna
göra skillnad för elevers lärande och lärares utvärdering av sin egen
undervisning.
EDUCARE 2015:2
255
ÅSA HIRSH
Referenser
Agevall, Lena. & Jenner, Håkan. (2008). Lärares professionalitet –
förmågan att hantera dilemma. I Jonnergård, K., E.K. Funck, &
Wolmesjö, M. (Red.), När den professionella autonomin blir ett
problem. Växjö: Växjö University Press.
Akrish, Madeleine., & Latour, Bruno. (1992). A Summary of a
Convenient Vocabulary for the Semiotics of Human and Nonhuman
Assemblies. In W.E. Bijker & J. Law (Red), Shaping Technology/
Building Society – studies in societal change, (259-264). Cambridge:
The MIT Press.
Asp-Onsjö, Lisa. (2011). Dokumentation, styrning och kontroll i den
svenska skolan. Educare, nr 2, 39-56.
Birenbaum, Menucha., Kimron, Helena., & Shilton, Hani. (2011).
Nested contexts that shape assessment for learning: School-based
professional learning community and classroom culture. Studies in
Educational Evaluation, 37, 35-48.
Bloome, David., Pamela. Puro., & Erine. Theodorou. (1989).
Procedural Display and Classroom Lessons. Curriculum Inquiry
19 (3): 265-291.
Cooper, B., & Cowie, B. (2010). Collaborative research for assessment
for learning. Teaching and Teacher Education, 26, 979-986.
Davies, Dennis. S., & Neitzel, Carin. (2011). A self-regulated learning
perspective on middle grades classroom assessment. The Journal
of Educational Research, 104(3), 202–215.
Ds 2013:23 Tid för undervisning – lärares arbete med
skriftliga individuella utvecklingsplaner. Stockholm:
Utbildningsdepartementet.
Engeström, Yrjö. (2001). Expansive Learning at Work: toward an
activity theoretical reconceptualization. Journal of Education and
Work, 14(1), 133-156.
Engeström. Yrjö., & Sannino, Annalisa. (2011). Discursive
manifestations of contradictions in organizational change efforts:
A methodological framework. Journal of Organizational Change
management 24 (3): 368-387.
256
EDUCARE 2015:2
Forsberg, Eva. (2014). “Rätt man på rätt plats” i redovsiningssamhället.
I Lars Svedberg (Red). Rektorn, skolchefen och resultaten – mellan
profession och politik. Malmö: Gleerups Utbildning.
Gardner, John., Harlen, Wynne., Hayward, Louise., & Stobart,
Gordon. (2011). Engaging and Empowering Teachers in Innovative
Assessment Practice. I A. Berry & B. Adamson (Red), Assessment
Reform in Education, Policy and Practice. Dordrecht: Springer.
Graneheim, Ulla. H. & Lundman, Berit. M. (2004). Qualitative content
analysis in nursing research: concepts, procedures and measures to
achieve trustworthiness. Nurse Education Today, 24, 105-112.
Harlen, Wynne. (2010). What is quality teacher assessment? I J.
Gardner, W. Harlen, L. Hayward, G. Stobart, & M. Montgomery
(Red), Developing teacher assessment (29–52). Berkshire: Open
University Press.
Havnes, Anton., & McDowell, Liz. (2007). Introduction: Assessment
dilemmas in contemporary learning cultures. In A. Havnes & L.
McDowell (Eds.), Balancing Dilemmas in Assessment and Learning
in Contemporary Education. London: Routledge.
Helte, Stefan. (2012). Dokumentationen har gått för långt. Lärarnas
Tidning. 7-20 September.
Hermansen, Hege., & Nerland, Monika. (2014). Reworking practice
through an AfL project: an analysis of teachers’ collaborative
engagement with new assessment guidelines. British Educational
Research Journal, 40(1), 187–206.
Hirsh, Åsa. (2015). IDPs at work. Scandinavian Journal of Educational
Research, Vol. 59, (1) 77-94. (i-first-publicerad online 2013-1007)
Hirsh, Åsa. (2014). The Individual Development Plan: supportive tool
or mission impossible? Swedish teachers’ experiences of dilemmas
in IDP practice. Education Inquiry Vol. 5, (3) 405-427.
Hirsh, Åsa. (2013). The individual development plan as tool and
practice in Swedish compulsory school. Doktorsavhandling.
Högskolan i Jönköping.
EDUCARE 2015:2
257
ÅSA HIRSH
Hirsh, Åsa. (2011). A tool for learning? An analysis of targets and
strategies in Swedish Individual Education Plans. Nordic Studies
in Education, Vol. 31, 14–30.
Hirsh, Åsa., & Lindberg, V. (2015). Formativ bedömning på 2000-talet:
en översikt av svensk och internationell forskning. SKOLFORSK
delstudie XI. Vetenskapsrådet.
Isaksson, Joakim., Lindqvist, Rafael., & Bergström, Erik. (2007).
School problems or individual shortcomings? A study of individual
education plans in Sweden. European Journal of Special Needs
Education, 22(1), 75-91.
Korp. Helena., & Sjöberg, Lena. (2012). Individual Education Plans:
sustaining or challenging power relations? Ingår i ECER European
Educational Research Association: The Need for Educational
research to Champion Freedom, Education and Development for
All. Refereegranskat konferensbidrag.
Krantz, Joakim. (2009). Styrning och mening: anspråk på professionellt
handlande i utbildning och skola. Växjö: Doktorsavhandling, Växjö
universitet.
Latour, Bruno. (1987). Science in action: How to follow scientists and
engineers through society. Milton Keynes: Open University Press.
Lindqvist, Eva. (2012). Digitala uppföljningssystem i skolan värld –
möjligheter och hinder. Forskning om undervisning och lärande,
nr 9, 56-62.
Mårell-Olsson, Eva. (2012). Att göra lärande synligt? Individuella
utvecklingsplaner och digital dokumentation. Doktorsavhandling,
Umeå Universitet.
Pryor, John., & Crossouard, Barbara. (2008). A socio-cultural
theorisation of formative assessment. Oxford review of Education,
34(1), 1-20.
Skolverket. (2005). Skolverkets allmänna råd och kommentarer. Den
individuella utvecklingsplanen. Stockholm: Fritzes.
Skolverket. (2007). Hur används individuella utvecklingsplaner? En
studie efter införandet av nya bestämmelser. Stockholm: Skolverket.
Skolverket. (2008). Allmänna råd för den individuella utvecklingsplanen
med skriftliga omdömen. Stockholm: Fritzes.
258
EDUCARE 2015:2
Skolverket. (2010). Skriftliga omdömen i grundskolans individuella
utvecklingsplaner. En uppföljning av skolornas arbete ett år efter
reformen. Rapport 340. Stockholm: Fritzes.
Skolverket. (2013). Skolverkets allmänna råd med kommentarer.
Utvecklingssamtalet och den skriftliga individuella
utvecklingsplanen. Stockholm: Fritzes.
Smith, Kari. (2011). Professional development of teachers—A
prerequisite for AfL to be successfully implemented in the
classroom. Studies in Educational Evaluation, 37, 55-61.
Säljö, Roger. (2000). Lärande i praktiken. Stockholm: Prisma.
Utbildningsdepartementet. (2008). Departementspromemoria: En
individuell utvecklingsplan med skriftliga omdömen. Stockholm:
Utbildningsdepartementet.
Wartofsky, Marx W. (1979). Models. Representation and the scientific
understanding. Dordrecht, The Netherlands: Riedel.
Wertsch. James V. (1998). Mind as Action. New York: Oxford
University Press.
EDUCARE 2015:2
259
Medverkande författare
Ingela Andreasson är docent i pedagogik vid Göteborgs universitet.
Hennes forskning rör framförallt likvärdighet och elevbedömningar
ur ett diskursivt perspektiv. Mer specifikt handlar det huvudsakligen
om analyser av diskurser och marginaliseringsprocesser i skolans
elevdokumentation såsom individuella utvecklingsplaner och
åtgärdsprogram.
Maj Asplund Carlsson är senior professor i utbildningsvetenskap vid
Högskolan Väst och docent i pedagogik vid Göteborgs universitet,
där hon för närvarande arbetar som gästlärare. Hon forskar om
olika textpraktiker i skolans värld, framförallt fiktionsläsningen
och litteraturanvändningen i förskolan men också elevplaner och
pedagogisk dokumentation.
Lisa Asp-Onsjö är docent i pedagogik vid Göteborgs universitet och
verksam vid Institutionen för pedagogik och didaktik vid samma
lärosäte. Hennes forskningsintresse rör det specialpedagogiska
forskningsfältet i allmänhet med särskilt fokus på elevdokumentation
och bedömning. Hon har också ett intresse för frågor som fokuserar
relationen mellan genus och skolprestationer.
Frank Bach är verksam vid institutionen för didaktik och pedagogisk
profession vid Göteborgs universitet och ingår i den grupp som, för
Skolverkets räkning, utformar nationella prov i NO-ämnena för årskurs
6. Hans utbildnings- och forskningsintresse är ämnesdidaktik med
inriktning mot naturvetenskap och framförallt då fysik.
Marianne Dovemark är docent i pedagogik vid Göteborgs universitet.
Hennes huvudsakliga forskningsintressen rör strukturella faktorers
påverkan på barns och ungas utbildning. Speciellt intresse ligger på
faktorer som klass, kön och etnicitet vilket beforskas huvudsakligen
genom etnografisk ansats men också genom diskursanalys.
260
EDUCARE 2015:2
MEDVERKANDE FÖRFATTARE
Olof Franck är docent i religionsfilosofi och universitetslektor i
ämnesdidaktik med inriktning mot samhällsorienterande ämnen vid
Institutionen för didaktik och pedagogisk profession, Göteborgs
universitet. Hans forskning är särskilt inriktad på etik, värdegrundsfrågor
och det religionsdidaktiska fältet, i synnerhet där detta aktualiserar
religionsfilosofiska problemställningar. För närvarande är han engagerad
i det av Vetenskapsrådet finaniserade projektet “What May be Learnt in
Ethics? – Varieties of Conceptions of Ethical Competence to be Taught
in Compulsory School” (http://idpp.gu.se/english/Research/research_
projects/what-may-be-learnt-in-ethics), men också i ett forskningsprojekt
om etik i läromedel samt nationella och europeiska samarbeten kring
forskning rörande ESD (Education for Sustainable Development).
Birgitta Frändberg är verksam vid institutionen för didaktik och
pedagogisk profession vid Göteborgs universitet och ingår i den
grupp som, för Skolverkets räkning, utformar nationella prov i NOämnena för årskurs 6. Hennes utbildnings- och forskningsintresse är
ämnesdidaktik medinriktning mot naturvetenskap och framförallt då
biologi och kemi.
Mats Hagman är verksam vid institutionen för didaktik och pedagogisk
6. Hans utbildnings- och forskningsintresse är ämnesdidaktik med
inriktning mot naturvetenskap
Åsa Hirsh är fil dr och lektor i pedagogik vid Högskolan för lärande
och kommunikation i Jönköping. Såväl avhandling som pågående
forskning är finns inom fältet bedömning, dokumentation och
formativa undervisningsprocesser. Åsa tillhör det nationella nätverket
för pedagogisk bedömning.
Lars Holm er lektor, ph.d. ved Institut for Uddannelse og Pædagogik
(DPU), Aarhus Universitet, Campus Emdrup. Hans forskningsinteresse
retter sig blandt andet mod sproglig evaluering i førskole og skole, mod
literacy i flersprogede og postkoloniale kontekster, og mod udviklingen
af heldagsskoler.
EDUCARE 2015:2
261
Anders Jönsson är biträdande professor i naturvetenskapernas didaktik
vid Högskolan Kristianstad. Hans främsta forskningsintresse är
klassrumsbedömning, både för formativa och summativa ändamål.
Anders medverkar även i konstruktionen av nationella prov i NOämnen för årskurs 6.
Johan Korhonen är universitetslärare och forskarstuderande i special
pedagogik vid Åbo Akademi i Finland.
Annika Lilja är universitetslektor i pedagogiskt arbete vid Institutionen
för didaktik och pedagogisk profession, Göteborgs universitet.
Hennes forskning är dels inriktad mot relationell pedagogik, dels
mot etikdidaktik inom det av Vetenskapsrådet finaniserade projektet
“What May be Learnt in Ethics? – Varieties of Conceptions of Ethical
Competence to be Taught in Compulsory School” (http://idpp.gu.se/
english/Research/research_projects/what-may-be-learnt-in-ethics).
Lilja har under flera år arbetat som provutvecklare för de nationella
proven i religionskunskap.
Annika Lindskog är universitetsadjunkt i ämnesdidaktik med inriktning
mot samhällsorienterande ämnen vid Institutionen för didaktik
och pedagogisk profession, Göteborgs Universitet, där hon bl.a. är
projektledare för Nationella Prov i Religionskunskap åk 6 och åk 9.
Lindskog är också doktorand vid institutionen och bedriver forskning
om religionskunskapslärares perspektiv på ämnet och dess centrala
innehåll.
Karin Linnanmäki är docent och akademilektor vid Åbo Akademi,
Finland.
Johan Nyberg är doktorand i musikpedagogik vid Luleå tekniska
universitet, Institutionen för konst, kommunikation och lärande,
Musikhögskolan i Piteå. Hans forskningsintresse riktar sig mot
utbildning som kommunikation. Kontexten för det pågående
avhandlingsarbetet är gymnasieskolans nationella, estetiska program.
262
EDUCARE 2015:2
Christina Osbeck är docent i religionsvetenskap och universitetslektor
i ämnesdidaktik med inriktning mot samhällsorienterande ämnen
vid Institutionen för didaktik och pedagogisk profession, Göteborgs
Universitet. Hennes forskning är särskilt inriktad på religionsdidaktik,
etik och värdegrundsfrågor. För närvarande utgör det VR-finansierade
projektet “What May be Learnt in Ethics? – Varieties of Conceptions
of Ethical Competence to be Taught in Compulsory School” (http://
idpp.gu.se/english/Research/research_projects/what-may-be-learnt-inethics) en stor del av hennes forskningsverksamhet.
Mats Oscarson är professor emeritus vid Institutionen för didaktik
och pedagogisk profession (IDPP) vid Göteborgs Universitet. Hans
forskningsintressen rör främst lärande och bedömning av språk i skola
och vuxenundervisning.
Camilla Svens-Liavåg är speciallärare i Vasa och forskarstuderande i
specialpedagogik vid Åbo Akademi, Finland.
Pia Thornberg är universitetsadjunkt i matematik vid Högskolan
Kristianstad. Hon undervisar inom lärarutbildningen och har ansvar
för programområdet kompetens- och skolutveckling. Pia har ett särskilt
intresse för bedömningsfrågor och har skrivit en masteruppsats där
sambedömning och dess effekter diskuteras.
Eva West är verksam vid institutionen för didaktik och pedagogisk
6. Hennes utbildnings- och forskningsintresse är ämnesdidaktik med
inriktning mot naturvetenskap.
Ann Zetterqvist är verksam vid institutionen för didaktik och pedagogisk
6. Hennes utbildnings- och forskningsintresse är ämnesdidaktik med
inriktning mot naturvetenskap och framförallt då biologi och kemi.
EDUCARE 2015:2
263
EDUCARE – vetenskapliga skrifter
Utgivning
EDUCARE 2015:1. Artiklar: Lena Sjöberg, The Construction of
Mathematical Knowledge and Learning in and Through Individual
Education Plans; Peter Håkansson, Folkbildningen och det sociala
kapitalet; Pia Sundqvist & Christina Olin-Scheller, Engelska på
fritiden och engelska i skolan – en omöjlig ekvation; Marie Nordlund,
Vocabulary in textbooks for young learners; Eva Änggård, Gåturer
som forskningsmetod med barn; Anette Svensson, ”New technologies”
and ”old values”: The function of various text and media forms in
literary studies; Niclas Månsson & Ali Osman, Lärarutbildningen och
miljonprogrammets skola
EDUCARE 2014:2. Tema: Childhood, Learning and Didactics.
Ingegerd Tallberg Broman, Preface; Susanne Thulin & Agneta
Jonsson, Child Perspectives and Children’s Perspectives – a Concern
for Teachers in Preschool; Annika Månsson & Lena Rubenstein Reich,
Democracy in Research Circles to Enable New Perspectives on Early
Childhood Education and Didactics; Mats Bevemyr, Childrens Use of
Every Day Mathematical Concepts to Describe, Argue and Negotiate
Order of Turn; Dorota Lembrér & Tamsin Meaney, Socialisation
Tensions in the Swedish Preschool Curriculum – Scaffolding and
Challening Conversational Skills; Carina Hermansson, Tomas Saar
& Christina Olin-Scheller, Rethinking ’Method’ en Early Childhood
Writing Education; Camilla Löf, Didactics for Life?
EDUCARE 2014:1. Artiklar: Helena Andersson, Elevers berättelser om sina upplevelser av högstadiet; Magnus Persson, Blåst?
Från kulturindustriell manipulation till entreprenöriellt lärande;
Per-Åke Rosvall, Programarbetslag som stöd för nyexaminerade
kärnämneslärare etablering som gymnasielärare; Michael Tengberg,
Konstruktion och bedömning av förmågan att läsa (och förstå) skönlitterär text. Två nedslag i det nationella provets läsförståelsedel, åk 9
264
EDUCARE 2015:2
EDUCARE 2013:2. Tema: Samhällsfrågor i skolans matematik- och
NO-undervisning. Mats Lundström, Förord; Per Hillbur, Good to
Be Different? On Cosmopolitanism, Pluralism and ‘the Good Child’
in Swedish Educational Policy; Jonas Dahl & Maria C. Johansson,
The Citizen in Light of the Mathematics Curriculum; Thomas
Lundblad, Claes Malmberg, Mats Areskoug & Per Jönsson, Dialogic
Manifestations of an Augmented Reality Simulation.
EDUCARE 2013:1. Artiklar: Monica Lindgren & Claes Ericsson,
Diskursiva legitimeringar av estetisk verksamhet i lärarutbildningen;
Anita Norlund, ”Varför tycker du man ska ha dödsstraff, då?” Ett
sociologisk-didaktiskt verktyg för analys av klassrumsdebatter; Elsa
Foisack, Claudia M. Pagliaro & Ronald R. Kelly, Matematikprestationer
och elever med dövhet eller hörselnedsättning.
EDUCARE 2012:1. Artiklar: Thom Axelsson, Att konstruera
begåvning – Debatten om IQ; Hans Larsson & Claes Nilholm, Att
utmana eller återkskapa traditionen – Sex skolors arbete med elever i
relationssvårigheter; Jonas Lindbäck & Ove Sernhede, Från förorten
till innerstaden och tillbaka igen – Gymnasieskolan, valfriheten och
den segregerade staden.
EDUCARE 2011:3. Tema: Tvåspråkig undervisning på svenska och
arabiska i mångkulturella storstadsskolor. Anna-Lena Tvingstedt,
Inledning; Berit Wigerfelt, Undervisning på svenska och arabiska
tar form i ett mångetniskt område; Berit Wigerfelt & Eva Morgan,
Balansgång mellan två språk. Lärares berättelser om tvåspråkig
undervisning på svenska och arabiska; Anna-Lena Tvingstedt,
”Barnen talar två språk och har två kulturer” – Föräldraperspektiv
på tvåspråkig undervisning; Anna Sandell, ”Vi förstår, du behöver inte
översätta” – Elevperspektiv på tvåspråkig undervisning i den svenska
skolan; Helen Avery, Lärares språkbruk i tvåspråkiga klassrum;
Eva-Kristina Salameh, Grammatisk och fonologisk utveckling på
svenska och arabiska vid tvåspråkig undervisning; Eva-Kristina
Salameh, Lexikal utveckling på svenska och arabiska vid tvåspråkig
undervisning; Anna-Lena Tvingstedt & Eva-Kristina Salameh, Läsoch kunskapsutveckling hos elever som fått tvåspråkig undervisning på
svenska och arabiska; Anna-Lena Tvingstedt, Avslutande reflexioner.
EDUCARE 2015:2
265
EDUCARE 2011:2. Tema: Välfärdsstat i omvandling: regelerad
barndom – oregerlig ungdom? Ove Sernhede & Ingegerd Tallberg
Broman, Förord; Patrick J. Ryan, Discursive Tensions on the
Landscape of Moderna Childhood; Lisa Asp-Onsjö, Dokumentation,
styrning och kontroll i den svenska skolan; Ann-Marie Markström,
”Soft Governance” i förskolans utvecklingssamtal; Ingela Kolfjord,
En skolas implementering av kamratmedling; Philip Lalander & Ove
Sernhede, Social mobilization or street crimes: Two strategies among
young urban outcasts in contemporary Sweden; Johan Söderman
Vem är egentligen expert? Hiphop som utbildningspolitik och
progressiv pedagogik i USA.
EDUCARE 2011:1. Tema: Svenska med didaktisk inriktning. Lotta
Bergman, Förord: Svenska med didaktisk inriktning; Magnus Persson,
Den friska boken och den sjuka läsaren: Om litteratur som medicin;
Kent Adelmann, Lyssnandets århundrade? Att lyssna till den talande
boken; Cecilia Nielsen, Kroppen läser och skriver? Läsandets och
skrivandets kroppslighet i ljuset av Merleau-Pontys kroppsfilosofi;
Annbritt Palo & Lena Manderstedt, Texter, språk och skrivande med
utgångspunkt i de nya ämnesplanerna i svenska; Cecilia Olsson Jers,
Den retoriska arbetsprocessens betydelse för möjligheten att framstå
med starkt och trovärdigt ethos i muntlig framställning; Lisa Källström,
Vad kan vi lära oss av berättelser? Det fiktivas funktion i svenska som
främmande språk.
EDUCARE 2010:1. Thomas Johansson Etnografi som teori, metod och
livsstil, Sara Irisdotter Aldenmyr Förvaltningsarbete för mångfald och
konkurrens: En studie av den kommunala skolförvaltningens ansvar
att främja mångfald i den konkurrensutsatta grundskolan, Maria
Simonsson & Mia Thorell Att börja på förskolan: Exempel på barns
sociala samspelsprocesser under inskolningen, Lena Sjöberg ”Same
same, but different”: En genealogisk studie av den ’goda’ läraren’, den
’goda’ eleven och den ’goda’ skolan i svenska lärarutbildningsreformer
1940-2008, Ann-Louise Petersen Studieförbundens institutionella
förutsättningar skapar möjligheter på utbildningsmarknaden
266
EDUCARE 2015:2
EDUCARE 2009:4. Lena Lang Förord: Att infånga praxis – kvalitativa
metoder i (special)pedagogisk forskning i Norden, Dianne L. Ferguson
Introduction: Honoring and celebrating diversity in educational
research, Dora S. Bjárnason Walking on eggshells: Some ethical
issues in research with people in vulnerable situations, Lena Lang
& Lisbeth Ohlsson Ytterst berörd - sällan hörd: Att som forskare
lyssna till berättelser, Susan Tetler & Kirsten Baltzer Læring i
inkluderende klasserum: Når eleverne gives stemme, Lotta Andersson
& Anna-Lena Tvingstedt Med fokus på samspel: Att använda video i
specialpedagogisk forskning, Anne Morin Praksisforskning: På tværs
af almen- og specialpædagogik, Inger Assarsson Att skapa mening i en
skola för alla: Ett diskursanalytiskt förhållningssätt, Birgit Kirkebaek
Efterord: Kontrol betyder ikke nødvendigvis kvalitet.
EDUCARE 2009:2-3. Mångkontextuell barndom. Ingegerd Tallberg
Broman Inledning, Pauline Stoltz Styrning, barndom och skola, Berit
Wigerfelt En likvärdig skola? Tomas Peterson Barndomens reglering
via skol- och föreningsidrott, Camilla Löf Livskunskap – en gränsöver
skridande praktik i skolan Ingela Kolfjord Alternativ konflikthantering:
Hur kamratmedling kan påverka elevers relationsskapande, AnnCarita Evaldsson Verbal mobbning och normerande praktiker i
flickors relationsprat, Angerd Eilard Barndomsbilder i förändring
i grundskolans läseböcker, Ann-Christine Vallberg Roth Styrning
genom bedömning av barn, Ingegerd Tallberg Broman ”No Parent Left
Behind”: Föräldradeltagande för inkludering och effektivitet, Mats
Trondman Slutkommentar: Mångkontextuella och gränsöverskridande
läroprocesser - Om barn som självreglerande och egenansvariga subjekt.
EDUCARE 2009:1. Redaktör. Idrottsvetenskap: Kutte Jönsson Fysisk
fostran och föraktet för svaghet: En kritisk analys av hälsodiskursens
moraliska imperativ; Anna Fabri & Torun Mattsson Betydelsen av
praktisk-personlig färdighet i idrottslärarutbildningen; Lars Lagergren
& Jesper Fundberg Integration i förening: Kritiska reflektioner kring
ett projekt; Susanna Hedenborg Till vad fostrar ridsporten? En
studie av ridsportens utbildningar med utgångspunkt i begreppen
tävlingsfostran, föreningsfostran och omvårdnadsfostran; Ingegerd
Ericsson, Patrik Grahn & Erik Skärbäck Närmiljöns betydelse och hur
den kan påverkas.
EDUCARE 2015:2
267
EDUCARE 2008:3 CiCe/CLaD: Jens Qvortrup, Childhood and politics;
Annika Månsson The construction of “the competent child” and early
childhood care: Values education among the youngest children in a
nursery school; Nanny Hartsmar & Maria Sandström, The right of
all to inclusion in the learning process: Second language learners
working in a technology workshop; Tomas Peterson, When the field
of sport crosses the field of physical education; Alistair Ross, Human
rights and education for citizenship, society and identity: Europe and
its regions.
EDUCARE 2008:2. Redaktör. Artiklar: Thomas Johansson Fostran till
kulturentreprenörer, Ylva Wibaeus Historiedidaktik, Anders Jönsson &
Gunilla Svingby Underlag till ramverk för en provbank i grundskolan.
Malmö, Lärarutbildningen, 2008.
EDUCARE 2008:1. Redaktör. Artiklar: Maj Asplund Carlsson &
Johannes Lunneblad ”När han är arg är han turkisk”: Identitetsskapande
i Lin Hallbergs kompisbokstrilogi; Jonas Aspelin och Sven Persson
Lärares professionella/personliga utveckling; Ann-Marie Markström
Förskolans utvecklingssamtal – ett komplex av aktiviteter i tid och rum.
Malmö, Lärarutbildningen, 2008.
EDUCARE 2007:2. Redaktör. Artiklar: Johan Söderman, Claes
Ericsson & Göran Folkestad Traditionsbärare och fostrare – samtal
om lärande med två amerikanska rappare; Lars Berglund, Lise-Lotte
Malmgren, Bim Riddersporre & Ingrid Sandén Profession, forskning
och praktik: 30 rektorers syn på specialpedagogisk professionalitet;
Boel Westerberg ”Jag tar varken kristendom eller islam på allvar, jag
går efter vad jag själv tycker”. Malmö, Lärarutbildningen, 2007.
EDUCARE 2007:1. Redaktör. Artiklar - tema kreativitet: Lars
Lindström Kan kreativitet läras ut? En bildpedagogisk översikt;
Li Bennich-Björkman Universiteten, kreativiteten och politikens
aningslöshet; Feiwel Kupferberg Läraruppdragets egenart och
rollmodeller: Kreativitetsregimer i hybridmoderniteten. Malmö,
Lärarutbildningen, 2007.
268
EDUCARE 2015:2
EDUCARE 2006:6. Redaktör. Rapport: Rune Jönsson & Bodil Liljefors
Persson Religionskunskap i årskurs 9. Malmö, Lärarutbildningen,
2006.
EDUCARE 2006:5. Redaktör. Rapport: Lars Berggren & Roger
Johansson Historiekunskap i årskurs 9. Malmö, Lärarutbildningen,
2006.
EDUCARE 2006:4. Redaktör. Rapport: Maja Lundahl, Anders
Olsson & Inge-Marie Svensson Hållbar utveckling och geografi i
årskurs 9. Malmö, Lärarutbildningen, 2006. http://dspace.mah.se/
bitstream/2043/3392/1/Geografirapport SG 12 dec.pdf
EDUCARE 2006:3. Redaktör. Rapport: Anna Henningsson-Yousif &
Haukur Viggósson Lärarstudenters bidrag i skolutvecklingen. Malmö,
Lärarutbildningen, 2006. http://dspace.mah.se/bitstream/2043/3391/1/
partner9dec.pdf
EDUCARE 2006:2. Redaktör. Artiklar: Ingegerd Tallberg Broman
Att förändra den sociala ordningen; Eva Änggård Förskolebarns
bildaktiviteter utamanar vuxenvärlden; Annelis Jönsson och
Lena Rubinstein Reich Invandrade lärares arbetssituation och
läraridentitet – efter fyra år som lärare i den svenska skolan.
Malmö, Lärarutbildningen, 2006. http://www.mah.se/upload/LUT/
Publikationer/EDUCARE/artikelnummer 6 dec.pdf
EDUCARE 2006:1. Redaktör. Artiklar: Anna-Lena Tvingstedt
& Gunilla Preisler Children with Cochlear Implants in Different
School Settings; Fredrik Lindstrand Gestaltning, konstruktion och
meningsskapande i ungdomars arbete med film; Ingegerd Ericsson
Koncentrationsförmåga ur ett relationellt perspektiv. Malmö,
Lärarutbildningen, 2006.
EDUCARE 2005:1. Redaktör. Rapport: Specialpedagogik i två
skolkulturer. Lena Holmberg, Annelis Jönsson & Anna-Lena
Tvingstedt. Malmö, Lärarutbildningen, 2005.
EDUCARE 2015:2
269
270
EDUCARE 2015:2
EDUCARE
EDUCARE
– Vetenskapliga
– Vetenskapliga
skrifter
skrifter
är enärskriftserie
en skriftserie
som som
ges ut
ges
vidutFakulteten
vid Fakulteten
för lärande
för lärande
och och
samhälle,
samhälle,
vid Malmö
vid Malmö
högskola
högskola
sedan
sedan
hösten
hösten
2005.
2005.
Den speglar
Den speglar
den mångfald
den mångfald
av ämnen
av ämnen
och och
som som
finnsfinns
inominom
EDUCARE
EDUCARE
är också
är också
ett nationellt
ett nationellt
och nordiskt
och nordiskt
forum
forum
där nyare
där nyare
forskning,
forskning,
aktuella
aktuella
perspektiv
perspektiv
ämnen
ämnen
samtsamt
utvecklingsarbeten
utvecklingsarbeten
med med
ett teoretiskt
ett teoretiskt
fundament
fundament
ges plats.
ges plats.
EDUCARE
EDUCARE
vänder
vänder
sig tillsig till
forskare,
forskare,
lärare
lärare
och studenter
och studenter
högskolor
högskolor
och universitet
och universitet
samtsamt
alla alla
intresserade
intresserade
inominom
skola-skolaoch utbildningsväsende.
och utbildningsväsende.
ADRESS
ADRESS
EDUCARE
EDUCARE
-vetenskapliga
-vetenskapliga
skrifter,
skrifter,
Malmö
Malmö
högskola,
högskola,
205 205
06 Malmö.
06 Malmö.
www.mah.se/educare
www.mah.se/educare
ARTIKL
ARTIKL
AR AR
EDUCARE
EDUCARE
välkomnar
välkomnar
originalmanus
originalmanus
på max
på max
80008000
ord. Artiklarna
ord. Artiklarna
ska vara
ska vara
skrivna
skrivna
på något
på något
nordiskt
nordiskt
språkspråk
eller eller
engelska.
engelska.
Tidskriften
Tidskriften
är refereegranskad
är refereegranskad
vilketvilket
innebär
innebär
att alla
att inkomna
alla inkomna
manus
manus
granskas
granskas
av två
avanonyma
två anonyma
sakkunniga.
sakkunniga.
Redaktionen
Redaktionen
förbehåller
förbehåller
sig rätten
sig rätten
att redigera
att redigera
texterna.
texterna.
Författarna
Författarna
ansvarar
ansvarar
för innehållet
för innehållet
i sinai artiklar.
sina artiklar.
För ytterligare
För ytterligare
information
information
se se
på hemsidan
på hemsidan
www.mah.se/educare
www.mah.se/educare
eller eller
vändvänd
er direkt
er direkt
till redaktionen.
till redaktionen.
Artiklarna
Artiklarna
publiceras
publiceras
ävenäven
elektroniskt
elektroniskt
i MUEP,
i MUEP,
Malmö
Malmö
University
University
Electronic
Electronic
Publishing,
Publishing,
www.mah.se/muep
www.mah.se/muep
REDAK
REDAK
TIONTION
Johan
Johan
Söderman,
Söderman,
huvudredaktör
huvudredaktör
och Björn
och Björn
Sundmark,
Sundmark,
biträdande
biträdande
redaktör
redaktör
Redaktionsråd:
Redaktionsråd:
Cecilia
Cecilia
FermFerm
Thorgersen,
Thorgersen,
Hector
Hector
Perez,
Perez,
Lisa Asp-Onsjö,
Lisa Asp-Onsjö,
Thomas
Thomas
Johansson,
Johansson,
Andreas
Andreas
FejesFejes
och Anna-Carita
och Anna-Carita
Evaldsson.
Evaldsson.
COPYRIGHT:
COPYRIGHT:
Författarna
Författarna
och Malmö
och Malmö
högskola
högskola
EDUCARE
EDUCARE
2015:2
2015:2
Kritiska
Kritiska
perspektiv
perspektiv
på bedömning
på bedömning
och dokumentation
och dokumentation
TitelnTiteln
ingåringår
i serien
i serien
EDUCARE,
EDUCARE,
publicerad
publicerad
vid vid
Fakulteten
Fakulteten
för lärande
för lärande
och samhälle,
och samhälle,
Malmö
Malmö
högskola.
högskola.
GR AFISK
GR AFISK
FORM
FORM
TRYCK:
TRYCK:
Holmbergs
Holmbergs
AB, Malmö,
AB, Malmö,
20152015
ISBNISBN
: 978-91-7104-498-3
: 978-91-7104-498-3
( tr yck)
( tr yck)
ISBNISBN
: 978-91-7104-499-0
: 978-91-7104-499-0
( pdf)( pdf)
ISSNISSN
: 1653-1868
: 1653-1868
BESTÄLLNINGSADRESS
BESTÄLLNINGSADRESS
www.mah.se/muep
www.mah.se/muep
Holmbergs
Holmbergs
AB AB
Box 25
Box 25
201 201
20 Malmö
20 Malmö
TEL. 040-660
TEL. 040-660
66 60
66 60
FAX 040-660
FAX 040-660
66 70
66 70
EPOST
EPOST
LisaLisa
Asp-Onsjö
Lisa
Asp-Onsjö
Asp-Onsjö
Challenges
Challenges
Challenges
of of
Assessment
of
Assessment
Assessment
in in
Ethics
in
Ethics
Ethics
– Teachers’
– Teachers’
– Teachers’
reflections
reflections
reflections
when
when
when
assessing
assessing
assessing
National
National
National
Tests
Tests
Tests
Christina
Christina
Christina
Osbeck,
Osbeck,
Osbeck,
Olof
Olof
Olof
Franck,
Franck,
Franck,
Annika
Annika
Annika
LiljaLilja
and
Lilja
and
Annika
and
Annika
Annika
Lindskog
Lindskog
Lindskog
E D U C A R E 2 0 15 : 2
E D U C A R E 2 0 15 : 2
E D U C A R E 2 0 15 : 2
Gästredaktören
Gästredaktören
Gästredaktören
har
har
har
ordet!
ordet!
ordet!
Kritiska
Kritiska
Kritiska
perspektiv
perspektiv
perspektiv
påpå
bedömning
på
bedömning
bedömning
och
och
och
dokumentation
dokumentation
dokumentation
22
015
2015
015
: 2: 2
:2
DeDe
nationella
De
nationella
nationella
proven
proven
proven
i NO
i NO
i NO
åkåk
6.
åk
6.
Skillnader
6.
Skillnader
Skillnader
i resultat
i resultat
i resultat
mellan
mellan
mellan
olika
olika
olika
grupper
grupper
grupper
Frank
Frank
Frank
Bach,
Bach,
Bach,
Birgitta
Birgitta
Birgitta
Frändberg,
Frändberg,
Frändberg,
Mats
Mats
Mats
Hagman,
Hagman,
Hagman,
EvaEva
West
Eva
West
West
ochoch
Ann
och
Ann
Zetterqvist
Ann
Zetterqvist
Zetterqvist
Professionalism
Professionalism
Professionalism
in in
action
in
action
action
– Music
– Music
– Music
teachers
teachers
teachers
onon
an
on
an
assessment
an
assessment
assessment
journey
journey
journey
Johan
Johan
Johan
Nyberg
Nyberg
Nyberg
Kan
Kan
Kan
dudu
tage
du
tage
tage
pigen
pigen
pigen
opop
af
op
af
kufferten?
af
kufferten?
kufferten?
EnEn
analyse
En
analyse
analyse
af af
sproglig
af
sproglig
sproglig
evaluering
evaluering
evaluering
i daginstitutioner
i daginstitutioner
i daginstitutioner
LarsLars
Holm
Lars
Holm
Holm
Bedömning
Bedömning
Bedömning
påpå
systemnivå
på
systemnivå
systemnivå
- En
- En
-komparativ
En
komparativ
komparativ
studie
studie
studie
avav
stegsystemet
av
stegsystemet
stegsystemet
i språk
i språk
i språk
i den
i den
i den
svenska
svenska
svenska
skolan
skolan
skolan
och
och
och
språknivåer
språknivåer
språknivåer
i Europarådets
i Europarådets
i Europarådets
Common
Common
Common
European
European
European
Framework
Framework
Framework
of of
Reference
of
Reference
Reference
forfor
Languages
for
Languages
Languages
(CEFR)
(CEFR)
(CEFR)
KRITISKA
KRITISKA
KRITISKAPERSPEKTIV
PERSPEKTIV
PERSPEKTIV
PÅ
PÅ
PÅBEDÖMNING
BEDÖMNING
BEDÖMNINGOCH
OCH
OCH
DOKUMENTATION
DOKUMENTATION
DOKUMENTATION
Mats
Mats
Mats
Oscarson
Oscarson
Oscarson
Elevbedömning,
Elevbedömning,
Elevbedömning,
motivation
motivation
motivation
och
och
och
uppförande.
uppförande.
uppförande.
EnEn
studie
En
studie
studie
avav
skolvisa
av
skolvisa
skolvisa
skillnader
skillnader
skillnader
i bedömning
i bedömning
i bedömning
och
och
och
diskrepans
diskrepans
diskrepans
mellan
mellan
mellan
vitsord
vitsord
vitsord
och
och
och
testresultat
testresultat
testresultat
i årskurs
i årskurs
i årskurs
9 99
i finlandssvenska
i finlandssvenska
i finlandssvenska
skolor
skolor
skolor
Camilla
Camilla
Camilla
Svens-Liavåg,
Svens-Liavåg,
Svens-Liavåg,
Johan
Johan
Johan
Korhonen
Korhonen
Korhonen
ochoch
Karin
och
Karin
Karin
Linnanmäki
Linnanmäki
Linnanmäki
Sambedömning
Sambedömning
Sambedömning
förför
ökad
för
ökad
ökad
likvärdighet?
likvärdighet?
likvärdighet?
PiaPia
Thornberg
Pia
Thornberg
Thornberg
ochoch
Anders
och
Anders
Anders
Jönsson
Jönsson
Jönsson
Bedömnings-,
Bedömnings-,
Bedömnings-,
och
och
och
pedagogiska
pedagogiska
pedagogiska
identiteter
identiteter
identiteter
Ingela
Ingela
Ingela
Andreasson,
Andreasson,
Andreasson,
MajMaj
Asplund
Maj
Asplund
Asplund
Carlsson
Carlsson
Carlsson
ochoch
Marianne
och
Marianne
Marianne
Dovemark
Dovemark
Dovemark
IUP
IUP
IUP
i Praktiken:
i Praktiken:
i Praktiken:
EnEn
skolreforms
En
skolreforms
skolreforms
formande
formande
formande
i skärningspunkten
i skärningspunkten
i skärningspunkten
mellan
mellan
mellan
yttre
yttre
yttre
styrning
styrning
styrning
och
och
och
professionell
professionell
professionell
autonomi
autonomi
autonomi
ÅsaÅsa
Hirsh
Åsa
Hirsh
Hirsh
E DUC
EEDUC
DUC
AA
RAR
EREE
VE
VE
VE
TE
TTNS
EENS
NS
KAP
KAP
KAP
L IG
LLIG
IG
AAA
SKR
SKR
SKR
I FI T
FI FE
TTR
EERR
Lärande
Lärande
Lärande
ochoch
samhälle,
och
samhälle,
samhälle,
Malmö
Malmö
Malmö
högskola
högskola
högskola
ISBN
ISBN
ISBN
978-91-7104-498-3
978-91-7104-498-3
978-91-7104-498-3
(tryckt)
(tryckt)
(tryckt)
ISBN
ISBN
ISBN
978-91-7104-499-0
978-91-7104-499-0
978-91-7104-499-0
(pdf)
(pdf)
(pdf)
2015:
2015:
2015:
1 Kritiska
1 Kritiska
1 Kritiska
perspektiv
perspektiv
perspektiv
på på
bedömning
på
bedömning
bedömning
ochoch
dokumentation
och
dokumentation
dokumentation
E DUC
EEDUC
DUC
AR
AR
AR
E EE
VE
VE
VE
TE
TTNSKAP
EENSKAP
NSKAP
L IG
LLIG
IG
AAA
SKR
SKR
SKR
I FI T
FI FE
TTR
EERR

educare 2015:2 - Malmö högskola

Transcription

Similar documents

Bedö mning av yrkeskunnande inöm hantverksprögrammets frisö

Bedömningsplan - Gripsholmsskolan

Internetadressen für Unterrichtsideen

Goetheschule Hannover - NiBiS WordPress Netzwerk

Hen kan inte resonera! Kan vi pysa?

Lathund i källkritik på Internet

Välkomstbrev - Institutionen för tillämpad utbildningsvetenskap

Validitet i bedömning av reell kompetens inom högre utbildning

Kursdokumentation - Fånga lärprocesser