Hur kan vi använda korpusmaterial och teckenspråkslexikon i
Transcription
Hur kan vi använda korpusmaterial och teckenspråkslexikon i
Exempel på texttranskription i Excel 3b ...TIDNING SOM HETA A-L-L-E-R-S (a:R-dur) VÄNTA HAFT FÖRST FRÅGA POSS-c MAMMA FUNGERA HUR PEK-c VARIT PEK-c LITEN FRÅGA FUNGERA BRA MED FÖRÄLDRAR DÖVA MAMMA DÖV PEK-c VARIT FÖRR PEK-c SE BRA PEK-c SKÖTA TVÅ BARN SJÄLV INTE PEK-c KLARA-SIG BRA VÄXA.-UPP BLI SÄMRE ÖGONEN BARN KÄNNA MAMMA SE SÄMRE BARN FÖRSTÅ BYTA ÖVA TECKENSPRÅK TAKTILT UPPFATTA BÄTTRE BÄTTRE KÄNNA PEK-DOM Hur kan vi använda korpusmaterial och teckenspråkslexikon i språkutbildningen? NÖJD PÅ MAMMA FRÅGA-INTERVJUA OLIK KUNNA KLARA-SIG ALLT PEK-f FÅ LÄSA TIDNING EFTER N-Y-Å-R-E-T 3a N-Y-Å-R 3b NUMMER ETT ELLER TVÅ VETA INTE PEK-f FÅ SE SEN * 3a BRUKA BRUKA PEK-adr-k SKRIVA I P-T P-T-dur (1.3) 3b I VAD 3a P-T 3b JA T-P JA Johanna Mesch Thomas Björkstrand 3a PEK-c MINNAS PEK-c SKRIVA SKICKA-c-f TILL DIG 3b HA-INTE FÅTT-f-c PEK-c VÄNTA PÅ FÅ BREV VÄNTA-LÄNGE INTE KONSTIG FÅ INTE NÅGONSTANS INTE * 3a HAFT PEK-adr SKRIVA SKICKA-c-fh SKICKA-c-fv-dur(.) Rikskonferens för lärare i teckenspråk Vänersborg 3 november 2010 3b JA 3a FUNGERA BRA-dur(.) 3b BRA MEN IBLAND HAFT SKICKA-f VÄNTA I-N-G-R-I-D HA-INTE LÄST BREV PÅ FRÅN MIG PÅ EN MÅNAD Teckenspråksmaterial ~ 1500 tim? Teckenspråk(en) • Flyktigt, svårt att fånga • Har inte skriftform • Teckenspråkstexter kan lagras i form av video 2010-11-03 Johanna Mesch Teckenspråksmaterial ~ 1500 tim? • Konstruerade meningar i lexikon • Konstruerade meningar i lexikon • Forskares egna material • Undervisningsmaterial • Material från SDR, SIT, SVT osv • Webbsidor (översättningar av myndigheters information) • YouTube 2010-11-03 Johanna Mesch Teckenspråk och teckenspråkiga – Kunskaps- och forskningsöversikt 2006:29 ”För svenska språket, i såväl skriven som talad form, finns • Forskares egna material numera allmänt tillgängliga databaser med stora • Undervisningsmaterial textmängder. Sådana korpora utgör i dag oumbärliga • Material från SDR, SIT, SVT osv • Men inte annoterade, inte Webbsidor (översättningar av myndigheters information) heller sökbara • YouTube verktyg för många olika typer av studier av svenska språket. Något motsvarande ”arkiv” med löpande text på teckenspråk finns inte och det pågår ingen dokumentation av olika typer av teckenspråksanvändning. // Ett brett upplagt korpusarbete behövs för såväl lexikonarbetet, som för fördjupad forskning om teckenspråkets struktur, men också för barnspråksforskning och forskning om tolkning mellan teckenspråk och svenska.” 2010-11-03 Johanna Mesch 2010-11-03 Johanna Mesch 1 Teckenspråk och teckenspråkiga – Kunskaps- och forskningsöversikt 2006:29 ”För svenska språket, i såväl skriven som talad form, finns numera allmänt tillgängliga databaser med stora textmängder. Sådana korpora utgör i dag oumbärliga verktyg för många olika typer av studier av svenska språket. Något motsvarande ”arkiv” med löpande text på Något motsvarande ”arkiv” av olika typer av teckenspråksanvändning. // med löpande text på Ett brett upplagt korpusarbete behövs för såväl teckenspråk finns inte teckenspråk finns inte och det pågår ingen dokumentation lexikonarbetet, som för fördjupad forskning om teckenspråkets struktur, men också för barnspråksforskning Bidrag från Riksbankens jubileumsfond 2009-2011 • Att påbörja och skapa förutsättningar för ett långsiktigt arbete med en svensk teckenspråkskorpus – för att på sikt kunna utföra korpusbaserade studier av teckenförrådet och av teckenspråkets grammatiska struktur och forskning om tolkning mellan teckenspråk och svenska.” 2010-11-03 Johanna Mesch Vad är en teckenspråkskorpus? 2010-11-03 Johanna Mesch Fabelberättelser från 2004 är transkriberade och tillgängliga • Datorläsbar text • Naturligt förekommande språk (representativt) • ELAN-program (annotera, söka, visa, sortera, räkna) • Hitta information om region, åldergrupp, skolgång osv • Annoteringar, t.ex. glosor och svensk översättning 2010-11-03 Johanna Mesch 2010-11-03 Johanna Mesch 2010-11-03 Johanna Mesch 2010-11-03 Johanna Mesch 2 Att skapa en teckenspråkskorpus Nyttan av teckenspråkskorpusen? – Planering, bygga upp videostudio – Inspelningar med informanter, ca 2 timmar – Redigering – Annoteringsarbete – Granskning – Metadata – Uppläggning av materialet • Utveckling av Svenskt teckenspråkslexikon • Framtida studier i teckenspråksgrammatik, sociolingvistik, språkundervisning, historisk lingvistik, kulturstudier, tolkning • Undervisning tack vare tillgänglighet av databasen 2010-11-03 Johanna Mesch 2010-11-03 Johanna Mesch Informanters hemort Deltagande i korpusprojektet • just nu 34 av 40 kvinnor och män i åldrarna 2082 från tre regioner: Norrland, Svealand och Götaland Norrland 3 Svealand 22 • T.ex. Piteå, Sundsvall, Leksand, Stockholm, Örebro, Vänersborg, Trollhättan, Kalmar, Göteborg och Malmö Götaland 9 Kvinnor 19 Män 15 Bildkälla: Lapplänning 2010-11-03 Johanna Mesch 2010-11-03 Vilken skola? Johanna Mesch Ålder? Dövskola i Härnösand 6 Dövskola i Örebro 4 Dövskola i Stockholm 4 Dövskola i Vänersborg 7 20-29 30-39 Totalt 9 5 40-49 5 50-59 3 60-69 70- 8 4 Hörselklass/kommunal klass 4 Integrerad 3 Dövskola i Lund 5 Hörande 1 2010-11-03 Johanna Mesch 2010-11-03 Johanna Mesch 3 Upplägg - 2 timmar • Presentation Annoteringsarbete • Samtalsämnen (t.ex. släkt, arbetsplats, föreningsliv, fritidsaktiviteter, evenemang) • Tidskrävande!! • Berättelser (den viktigaste händelsen i livet eller en favoritfilm) • Elicitering – återberätta till partner • • • • 2010-11-03 • Aktuellt för korpusprojektet: – Glosor – Svensk översättning Bildbok: Groda - var är du? Bildbok: Snögubben Bildserie Avsnitt från någon komedifilm (Mr Bean, Plankan) Johanna Mesch 2010-11-03 Johanna Mesch Mediafönster i ELAN Två mediafönster 2010-11-03 2010-11-03 Johanna Mesch 2010-11-03 Johanna Mesch Johanna Mesch Fyra mediafönster 2010-11-03 Johanna Mesch 4 Korpus 2010-11-03 Johanna Mesch 2010-11-03 <>> Lexikon Johanna Mesch Teckenspråkslexikon Lexikondatabasen • Används det i språkutbildningen i praktiken? • Under 2010 har lexikonverksamheten på Institutionen för lingvistik utvecklat lexikondatabasen kontinuerligt och antalet dokumenterade tecken är nu uppe i 12 461. 2010-11-03 2010-11-03 Johanna Mesch Databas År Antal tecken Antal meningar Svenskt teckenspråkslexikon 2010 29 okt 2010 6006 (+ 1025 varianter) 1867 uppdateras kontinuerligt Sjukvård 2010 (juli) 911 - Siffertecken 2008 (sept) 179 (581 videosekvenser) Sex och samlevnad 2007 (nov) 391 - Kyrkliga tecken 2006 (dec) 568 - Tecken för svenska landskap och orter 2006 (maj) 515 - Tecken för begrepp inom Språkvetenskap 2005 (jan) 414 - Tecken inom området bridge 2005 370 - Tecken för matematiska begrepp 2004 469 - Digital version av Svenskt teckenspråkslexikon 2001 3132 - Johanna Mesch Vi tar en närmare titt på korpusprojektet och lexikondatabasen www.ling.su.se/tsp 2010-11-03 Johanna Mesch 5