Tässä - Oulun yliopisto

Transcription

Tässä - Oulun yliopisto
Learner Language, Learner Corpora
Oulun yliopisto 5.–6.10.2012
The University of Oulu October 5–6, 2012
Abstraktit
Abstracts
Toimittaneet
Edited by
Sisko Brunni
Jarmo Jantunen
Antti Tolonen
2
JÄRJESTÄVÄT PROJEKTIT
VIRSU
Suomalais-ugrilaiset kielet kohdekielinä
http://univie.ac.at/virsu
CoLLU ja ICLFI
Korpustutkimus oppijankielen universaaleista ja Kansainvälinen oppijansuomen korpus
http://www.oulu.fi/hutk/sutvi/oppijankieli/
JÄRJESTELYTOIMIKUNTA
Jarmo Harri Jantunen (Oulun yliopisto), puheenjohtaja
Pirkko Muikku-Werner (Itä-Suomen yliopisto), puheenjohtaja
Sisko Brunni (Oulun yliopisto), apulaispuheenjohtaja
Antti Tolonen (Oulun yliopisto), konferenssisihteeri
Annekatrin Kaivapalu (Tallinnan yliopisto)
Tuija Määttä (Uumajan yliopisto)
Marianne Spoelman (Oulun yliopisto)
TIETEELLINEN TOIMIKUNTA
Pille Eslon (Tallinnan yliopisto)
Jyrki Kalliokoski (Helsingin yliopisto)
Johanna Laakso (Wienin yliopisto)
Sirkku Latomaa (Tampereen yliopisto)
Maisa Martin (Jyväskylän yliopisto)
Raili Pool (Tarton yliopisto)
Kirsti Siitonen (Turun yliopisto)
Helena Sulkala (Oulun yliopisto)
Minna Suni (Jyväskylän yliopisto)
SPONSORIT
Tieteellisten
Seurain
Valtuuskunta
Oulun yliopisto, Suomen kieli ja Suomi toisena ja vieraana kielenä, 2012
3
RESEARCH GROUPS
VIRSU
Finno-Ugric Languages as Target Languages
http:// univie.ac.at/virsu/
CoLLU and ICLFI
Corpus study on Learner Language Universals and International Corpus of Learner Finnish
http://www.oulu.fi/hutk/sutvi/oppijankieli/en/ICLFI_Corpus.html
ORGANIZING COMMITTEE
Jarmo Harri Jantunen (The University of Oulu), chair
Pirkko Muikku-Werner (The University of Eastern Finland), chair
Sisko Brunni (The University of Oulu), co-chair
Antti Tolonen (The University of Oulu), conference secretary
Annekatrin Kaivapalu (Tallinn University)
Tuija Määttä (The University of Umeå)
Marianne Spoelman (The University of Oulu)
SCIENTIFIC COMMITTEE
Pille Eslon (Tallinn University)
Jyrki Kalliokoski (The University of Helsinki)
Johanna Laakso (The University of Vienna)
Sirkku Latomaa (The University of Tampere)
Maisa Martin (The University of Jyväskylä)
Raili Pool (The University of Tartu)
Kirsti Siitonen (The University of Turku)
Helena Sulkala (The University of Oulu)
Minna Suni (The University of Jyväskylä)
SPONSORS
Federation of
Finnish Learned
Societies
The University of Oulu, Finnish Language and Finnish as a Second and Foreign Language,
2012
4
5
PLENAARIESITELMÄT
KEYNOTE LECTURES
6
7
Determinants of mutual intelligibility between closely related languages in Scandinavia
Gooskens, Charlotte
Scandinavian department, University of Groningen
c.s.gooskens@rug.nl
Normally, when we listen to a speaker of a different language than our own, we cannot
understand the other, unless we have learnt the other language – either by explicit instruction
(in a school setting) or by natural exposure to the other language (as when we immigrate to a
foreign country). Sometimes, however, we may understand a foreign language, either fully or
partly, even if we are not familiar with it. This can happen when the speaker talks to us in a
language that is closely related to our own. In such cases speaker and listener may engage in
what has been called semi-communication, a term introduced by Haugen (1966), or receptive
multilingualism (e.g. Ten Thije & Zeevaert 2007). Both interactants speak their own
language, and yet understand each other. The extent to which the interactants are intelligible
to one another is expressed in the degree of mutual intelligibility. The three mainland
Scandinavian languages, i.e. Danish, Swedish and Norwegian, are examples of languages that
are so closely related that in principle the speakers are able to communicate each using their
own language. However, in daily practice inter-Scandinavian communication sometimes fails.
The results of several studies have shown that especially Danes and Swedes have difficulties
understanding each other’s language.
In my talk I will present results from a large research project on the determinants of
mutual intelligibility in Scandinavia. First, I will present a number of experiments set up to
investigate the role of extra-linguistic determinants such as the amount of previous contact
with the language of the speaker, attitudes toward the language and its speakers, and the
special role that orthography plays in the inter-Scandinavian communication. Next, I will
summarize the results of experiments concerned with the role of linguistic factors at different
linguistic levels, i.e. phonetic-phonological, lexical and morphosyntactic. Finally, I will deal
with the interaction between the various linguistic and non-linguistic factors.
Keywords: receptive multilingualism, semicommunication, mutual intelligibility
References
Ten Thije, J.D – L. Zeevaert (eds.) 2007. Receptive multilingualism : linguistic analyses, language policies and
didactic concepts. Amsterdam: Benjamins.
Haugen, E. 1966. Semicommunication: the language gap in Scandinavia. Sociological inquiry, 36, 280–297.
8
A guided tour of learner corpus research: leaving from SLA and ending in classrooms
Meunier, Fanny
Centre for English Corpus Linguistics, Université Catholique de Louvain
fanny.meunier@uclouvain.be
This plenary talk will first provide a brief overview of the rather impressive network of
connections that learner corpus research (LCR) has made with other fields over the last 20
years. The evolution of research priorities in LCR will also be broadly sketched. These
priorities include, among other aspects:
- types of learner corpora collected (e.g. from cross-sectional to longitudinal, from
written to spoken or multimodal),
- compilation and annotation issues (e.g. from part-of-speech to more
pragmaticallyoriented tagging),
- types of statistical analysis (e.g. from Chi-squares to multilevel modelling),
- focus of analysis (e.g. from description to interpretation, from L1 groups to
individuals within groups, from corpus data only to triangulation methods),
- applied perspectives (e.g. from an overoptimistic global use of learner corpora in
classrooms to a more learner-centred, context-dependent and culture-bound approach).
I will then zoom in on two particular fields, namely the applied field of foreign/second
language teaching and the more theoretical field of second language acquisition. Whilst LCR
can be said to stand at a crossroads between those two disciplines, it will be shown that –
contrary to what the title of the talk might imply – the journey is in no way straightforward,
can sometimes even be arduous, but is definitely worth the detour. The presentation will be
illustrated by numerous examples of studies that have used learner corpus data to answer (if
only partly) some SLA research questions (Sianova & Schmitt 2007, Crossley & Salsbury
2011, Meunier and Littré forthcoming) and/or propose learning/teaching applications be it in
terms of pedagogical tools (Granger & Paquot 2010), methodologies (Belz & Vyatkina 2008)
or even profiling issues (Thewissen, forthcoming).
References
Belz, J. – N. Vyatkina 2008. The Pedagogical Mediation of a Developmental Learner Corpus for ClassroomBased Language Instruction, Language Learning & Technology 12 (3), pp. 33–52.
Crossley, S.A. – Salsbury, T. 2011. The development of lexical bundle accuracy and production in English
second language speakers. International Review of Applied Linguistics in Teaching, 49, 1, 1–26.
Granger, S. – Paquot, M. 2010. Customising a general EAP dictionary to meet learner needs. In Granger, S.
Paquot, M. (eds.) eLexicography in the 21st century: New challenges, new applications. Proceedings of
ELEX2009. Cahiers du CENTAL. Louvain-la-Neuve, Presses universitaires de Louvain, 87–96.
Meunier F. – Littré, D. (forthcoming-a / accepted December 2011 – publication date 2013) A cognitive
perspective on tense and aspect in SLA: preliminary insights from a longitudinal learner corpus. In
International Journal of Corpus Linguistics. Special issue on Advances in Qualitative Learners Corpus
Analysis Research. V. Hasko (ed.).
Siyanova, Anna – Norbert Schmitt 2007. Native and nonnative use of multi-word vs. oneword verbs. IRAL 45:
119–139.
Thewissen, J. (forthcoming) Capturing L2 accuracy developmental patterns: Insights from an errortagged EFL
learner corpus. Special issue of the Modern Language Journal on Qualitative Learner Corpus Research
(Hasko, V. and Meunier, F. eds).
9
Kielenoppimisen tutkimus: mistä on tultu ja mihin ollaan menossa?
Suni, Minna
Kielten laitos, Jyväskylän yliopisto
minna.suni@jyu.fi
Toisen kielen oppimisen tutkimuksessa eletään poikkeuksellisen kiinnostavia aikoja. Alalla
tähdätään yhtenäisen kokonaisteorian löytämiseen sen sijaan, että teoretisointi ja
mallintaminen kohdistettaisiin vain joihinkin oppimisen osa-alueisiin kerrallaan.
Välikielihypoteesin ja monitorimallin jälkeen on koeteltavana ollut useita kognitiivisia
malleja, kuten MacWhinneyn (1998) kilpailumalli ja Pienemannin (1998)
prosessoitavuusteoria, sekä Gassin (1997) interaktionaalisista lähtökohdista rakentunut
IIOmalli (Input, Interaction, Output), joka pyrki kokoamaan yhteen useita siihen mennessä
laajaa tukea saaneita näkökulmia. Varsinaiseen kokonaisteoriaan ei näiden varassa ole
kuitenkaan vielä ollut aineksia – eri tutkimusperinteiden erojen ja kytkösten tunnistamiseen
kylläkin.
Paraikaa keskustelun ytimessä ovat holistiset teoriat, jotka pyrkivät selittämään
kielenoppimisen dynamiikkaa nimenomaan kokonaisuutena: miten erilaiset yksilöt oppivat
eri kieliä niissä moninaisissa ympäristöissä, joissa he liikkuvat ja toimivat? Kokonaisteorian
asemaan ovat vahvimmin tarjolla kompleksisuusteoriaan ja dynaamisten systeemien teoriaan
nojaavat esitykset siitä, mistä kielenoppimisessa on kyse (ks. esim. de Bot & Larsen-Freeman
2011; Larsen-Freeman 2011). Holistista näkökulmaa tarjoaa myös van Lierin (2004) esiin
tuoma ekologinen näkemys kielenoppimisesta. Huomionarvoista on, että näissä kaikissa ovat
lähtökohtana matemaattiset tai luonnontieteelliset teoriat.
Tarkastelen tässä esitelmässä sitä, miten kielenoppimisen tutkimuksen sirpaleinen
historia on johtanut nykyvaiheeseen, jossa jonkinlainen jaettu käsitys näyttää viimein olevan
mahdollinen, ja sitä, mihin päin alan empiirinen tutkimus on nyt menossa. Pyrin myös
sijoittamaan suomeen, viroon ja unkariin keskittynyttä toisen kielen tutkimusta alan
kehityksen yleiselle jatkumolle ja osoittamaan tällaisen tutkimuksen erityisen relevanssin
muutamien tähänastisten tulosten kautta. Samalla haluan herätellä keskustelua siitä, mitä ovat
ne ilmiöt, joihin näiden kielen oppimisen tutkimusta kannattaisi jatkossa suunnata.
Lähteet
de Bot, Kees – Diane Larsen-Freeman 2011. Researching second language development from
a dynamic systems perspective. Teoksessa M. Verspoor, K. De Bot, W. Lowie (Eds.),
A Dynamic Approach to Second Language Development: Methods and Techniques.
Amsterdam: John Benjamins.
Gass, Susan M. 1997. Input, Interaction, and the Second Language Learner. Mahwah, NJ:
Lawrence Erlbaum Associates.
Larsen-Freeman, Diane 2011. A complexity theory approach to second language
development/acquisition.(2011). Teoksessa D. Atkinson (Ed.), Alternative Approaches to Second
Language Acquisition. Oxford: Routledge. 38–72.
MacWhinney, Brian 1988. Competition and Teachability. Teoksessa R. Schiefelbusch & M. Rice (Eds.), The
teachability of language. New York: Cambridge University Press, s. 63–104.
Pienemann, Manfred 1998. Language Processing and Second Language Development:
Processability Theory. Amsterdam: John Benjamins.
van Lier, Leo 2004. The Ecology and Semiotics of Language Learning: A Sociocultural Perspective. New York:
Springer.
10
11
SEKTIOESITELMÄT
SECTION LECTURES
12
13
Learner speech variation across proficiency levels of Japanese EFL learners
Abe, Mariko
Takasaki City University of Economics
mabe@tcue.ac.jp
This study aims to investigate the overall patterns of variation in learner language across
seven oral proficiency levels of Japanese EFL learners and to compare variation in native and
non-native speakers of English.
In order to achieve this purpose a methodological approach combining learner corpus,
language processing techniques, and multivariate statistical analysis was used to identify the
frequent linguistic co-occurrence patterns from over one million running words of L2 spoken
English. After calculating the frequencies of 57 linguistic features, which have been shown to
distinguish text and style variation in Biber (1988), multivariate statistical analyses were
performed to identify the linguistic features that distinguish Japanese EFL learners’ oral
proficiency levels and discriminate them from the oral production of native speakers of
English. As the frequencies of specific linguistic features have a central role in this study, the
largest spoken learner corpus in Japan, the National Institute of Information and
Communications Technology Japanese Learner English (NICT JLE) Corpus (Izumi,
Uchimoto, & Isahara, 2004), which consists of spoken interview transcripts of over 1,200
learners who have taken the Standard Speaking Test (SST), was chosen. This oral English
test was constructed on the basis of the American Council on the Teaching of Foreign
Language Oral Proficiency Interview (ACTFL OPI) and designed to evaluate Japanese EFL
learners. The individual scripts are coded with the oral proficiency level, which is
approximately equal to a Test of English for International Communication (TOEIC) range of
356 to 921 by certified raters, and the scripts can be compared with data gathered from native
speakers of English who performed identical speaking tasks.
The following research questions were investigated: (a) what linguistic features
distinguish English oral proficiency levels of Japanese EFL learners? and (b) what linguistic
features distinguish the differences between native and non-native speakers of English?
The study revealed four significant groups of linguistic features that discriminate oral
proficiency levels and native and non-native speakers of English: (a) pronominal features, (b)
pronouns and do as pro-verb, (c) nominal features, and (d) degree adverbs and degree
modifier. Additionally, negation and coordination were shown as a sign of second language
(L2) development, and various ways of development of syntactic complexity such as relative
and subordinate clauses were shown in the results. However, linguistic features drawn from
quantitative analysis can be discussed in terms of how learner language moves through the
development of: (a) personal and impersonal topic of the speaking task, (b) referential
function, (c) informational density, and (d) pragmatic sophistication to provide with
qualitative interpretation.
The results of the study are to be discussed from the aspects of input, cognitive factors
and first language (L1) influence. The study contributes to our understanding of the
distinguishing characteristics of learner language at a wide range of proficiency levels and the
differences between native and non-native speakers of English.
Keywords: L2 speech, proficiency level, Japanese EFL learners
14
References
Biber, D. 1988. Variation across speech and writing. New York: Cambridge University Press.
Izumi, E. – Uchimoto, K. – Isahara, H. 2004. A speaking corpus of 1200 Japanese learners of English. Tokyo:
ALC Press.
15
Presenting LONGDALE-GE – a multi-methodological longitudinal corpus at the
crossroads of English linguistics
Altendorf, Ulrike; Gerckens, Caroline
Leibniz Universität Hannover
ulrike.altendorf@engsem.uni-hannover.de
It is the aim of this paper to present LONGDALE-GE, in particular its innovative multimethodological approach as well as results for the use of tense and aspect by advanced L1
German-speaking learners of English based on this approach.
The German section (GE) of the international Longitudinal Database of Learner
English (LONGDALE), initiated by the Centre for English Corpus Linguistics at the
Université catholique de Louvain, is currently being compiled in the Department of English
Linguistics at Leibniz Universität Hannover.
LONGDALE-GE is a database at the crossroads of English linguistics. It is a
collection of written and spoken corpus and experimental panel data, produced by about
100 adult post-intermediate to advanced German-speaking learners of English over a period
of 3 years, and of related biographical data equally provided by these learners at half-year
intervals. Both types of data are to serve researchers as a basis on which to investigate
learners' language proficiency, the structure of their interlanguage as well as the impact of
their learning environment, institutional and non-institutional, on their linguistic progress. At
a theoretical level, LONGDALE-GE aims at exploring the possibilities and limitations of
combining converging evidence from multi-methodological research within the framework
of Cognitive Corpus Linguistics.
For the latter purpose, LONGDALE-GE combines the recording of naturally
occurring and minimally elicited corpus data with experimental data elicited under controlled
conditions. In addition, LONGDALE workshops serve as a testing ground for research in the
areas of second language acquisition and foreign language teaching. In these workshops, a
subgroup of LONGDALE participants receive instruction on a selection of linguistic forms
and functions that have emerged as particularly error-prone and improvement-resistant in the
corpus data. Instructions take the form of particular teaching methods, such as processing
instruction (PI) and meaning-based output instruction (MOI) (see e.g. Keating and Farley
2008). The effect of these methods on the learning process is also being tested medium-term
within the LONGDALE framework since LONGDALE is a longitudinal project.
To illustrate the potential of the methodology outlined above, results for tense and
aspect based on LONGDALE corpus and experimental data will be presented. In accordance
with Granger (1999), tense and aspect have also turned out to be among the most error-prone
and improvement-resistant areas of language performance in LONGDALE-GE. It will be
shown that errors in these areas are not only due to the cognitive complexity of the system
but also the result of incorrect assumptions at the level of competence. At the methodological
level, the results for tense and aspect can also illustrate the problem of 'avoidance' of
'unpopular' linguistic forms and functions in naturally occurring and minimally elicited data,
especially in educational settings in which an "ideology of correctness" prevails.
Keywords: corpus linguistics, second language acquisition, foreign language teaching,
converging evidence, experimental data, tense and aspect
16
References
Granger, Sylviane 1999. Use of tenses by advanced ELF learners: evidence from an error-tagged computer
corpus. – Hilde Hasselgård and Signe Oksefjell (eds.). Out of Corpora - Studies in Honour of Stig
Johansson, 191-202. Amsterdam & Atlanta: Rodopi.
Keating, Gregory D. – Andrew P. Farley 2008. Processing Instruction, Meaning-Based Output Instruction, and
Meaning-Based Drills: Impacts on Classroom L2 Acquisition of Spanish Object Pronouns. – Hispania
91 (3), 639–650.
17
Logging a free-form student response system
Antonsen, Lene
University of Tromsø
lene.antonsen@uit.no
A suite of language learning programs for North Sami are available on a web-based learning
platform on the Internet with immediate error feedback and advice about morphology and
grammar for the user (http://oahpa.uit.no). In two of the programs, a QA-drill and a machine
governed dialogue system, the student's free input is analysed by grammatical parsers, and
the system gives specific tutorial feedback on syntactic errors (Antonsen et al 2009). The
underlying pedagogical goal for both programs is grammar training, of e.g. verbal and
nominal inflection.
The user’s input and the feedback from the system are logged and make it possible to
investigate the L2 language and users’ response to metalinguistic feedback from the system.
The evaluation so far shows that
- the users have orthographic errors in 53 % of the free input sentences. The present
system points out the misspellings for the user, but does not offer correction
suggestions, nor can it look beyond the misspellings, and the user's spelling problems
thus often make it difficult to give feedback to the student about syntactic
constructions.
- even though the system is capable of identifying and giving feedback to a long list of
syntactical errors, many of the rules are hardly in use. The reason for this is that users
do not write more complex language than they have to, and rules targeting such
constructions are then left unused. The price we pay for the free input strategy is thus
that the users are not forced to build more complex sentences.
A new login-system is now introduced to Oahpa, which makes it possible to sort the
logs according to user. A questionnaire will enrich the data with information about the
student's L2 knowledge. The log-data may also be sorted according to what kind of feedback
is given. By improving the programs, we will force the student to write more complex
language, but still keep the free input. These improvements will make the log valuable for
learner language analysis. My research will focus upon the following topics:
- Experimenting with metalinguistic feedback to the user's misspellings. In a study in a
German ICALL-system, the metalinguistic feedback only pointed out the misspelled
word, it didn't characterize the misspelling (Heift & Rimrott 2008).
- My hypothesis is that most misspellings are systematic, and therefore possible to
predict, and therefore also possible to give a metalinguistic feedback to the learner
about the nature of the error. The log will then show the student’s response to the
feedback. In a similar study in a German ICALL-system, the metalinguistic feedback
only pointed out the misspelled word, it didn't characterize the misspelling (Heift &
Rimrott 2008).
- Study the student's response to the feedback to syntactic errors.
Keywords: learner language, corrective feedback, ICALL, grammar instruction, North Sami
as second language
18
References
Antonsen, L. – Huhmarniemi, S. – Trosterud, T. 2009. Constraint grammar in dialogue systems. In Proceedings
of the 17th Nordic Conference of Computational Linguistics, volume 8 of NEALT Proceeding Series,
pages 13–21, Odense. http://dspace.utlib.ee/dspace/bitstream/10062/14289/1/proceedings.pdf.
Heift, T. – Rimrott, A. 2008. Learner responses to corrective feedback for spelling errors in call. System,
36(2):196–213.
19
Suomi vieraana kielenä -arviointimateriaalien suunnittelua
Karjalan keskikouluja varten
Bogdanova, Jelena; Khramtcova, Olga
Karjalan valtion pedagoginen akatemia
enine@onego.ru; olga.hramtsova@onego.ru
Viime vuosina Venäjän koulutussysteemissä on käynnistetty uudistuksia. Etusijalle on
nostettu muun muassa koulutuksen laatu, jota pidetään koulutustason tärkeänä indikaattorina
ja jota tulee säännöllisesti ja monipuolisesti mitata.
Karjalan tasavallassakin vuodesta 2011 on käynnistetty koululaisten oppimistulosten
arvioinnin kehittämistyö, jonka tavoitteena on suomi vieraana kielenä -oppilaiden kielitaidon
testaus yhtenäisen valtakunnallisen päättökokeen muodossa sekä yhtenäisen alueellisen
päättökokeen muodossa.
Karjalan tasavallan Koulutuksen laadun arviointikeskuksen ohjaaman hankkeen
puitteissa on luotu testitiedosto koulutuksen laadun automaattista arviointia varten. Karjalan
tasavallan keskikoulujen suomen kielen opettajien sekä Karjalan valtion pedagogisen
akatemian lehtoreiden voimin on laadittu suppea suomen kielen testikorpus, joka käsittää n.
200 testiä. Testit on suunnattu keskikoulujen 4–11-luokkalaisille. Koulujen suomi vieraana
kielenä -opettajilla on mahdollisuus valita yksi testi kuudesta vaihtoehdosta silmällä pitäen
testin keskeiset sisällöt, mm. kielioppiosion ja keskeisen sanaston, jotka ovat esillä ns.
testieritelmässä eli spesifikaatiossa. Testit sisältävät monivalintatehtäviä, tuottamis- ja
reagointitehtäviä, aukkotehtäviä, avoimia lyhytvastauksia, jotka on pyritty laatimaan
vaikeustasoltaan mahdollisimman samankaltaisiksi. Kaikki suomi vieraana kielenä -testien
sisällöt pohjautuvat Karjalan tasavallan alueelliseen suomi vieraana kielenä opetusstandardiin sekä alueellisiin suomi vieraana kielenä -opetusohjelmiin.
Samanaikaisesti kehitettiin testaustehtäviä Karjalan tasavallan valtion sekä
kunnallisten oppilaitosten pedagogisten työntekijöiden ammattipätevyyskoetta varten.
Paperipohjainen testaus sisältää opettajien ammattialaan liittyviä kysymyksiä sekä
tilannetehtäviä. Testaus on suoritettavissa myös sähkömuodossa online-versiossa.
Karjalan tasavallan opetusministeriön arvostelulautakunta on hyväksynyt 26.09.2011
opettajien ammattipätevyyskokeen muodoksi tietokonepohjaisen testauksen. Testitehtävät
ovat monivalintatehtäviä, joissa on yksi oikea vastaus neljästä (viidestä) vaihtoehdosta;
monivalintatehtäviä, joissa on useampi kuin yksi oikea vastaus neljästä (viidestä)
vaihtoehdosta; yhdistelytehtäviä; sanajärjestystehtäviä / virkkeiden järjestyksen
valintatehtäviä.
Testaustehtävien laatimisprosessi osoittautui hyvin haastavaksi, työlääksi ja
ongelmalliseksi. Tiettyjä vaikeuksia syntyi myös esimerkiksi suomi vieraana kielenä oppikirjojen puutteesta. Silti saamamme kokemus on antanut mahdollisuuden ymmärtää
paremmin arvioinnin olennaisia piirteitä, testien laatimisen periaatteita ja logiikkaa.
Esitelmässä
pyrimmekin
selittämään
testausmateriaalien
suunnitteluteknologian
yksityiskohtia.
Asiasanat: suomi vieraana kielenä, arviointi, testaustehtävä, koulutuksen laatu, keskikoulu
20
Lähteet
Eurooppalainen viitekehys : kielten oppimisen, opettamisen ja arvioinnin yhteinen eurooppalainen viitekehys /
[julkaisija:] Council of Europe; käännös: Irma Huttunen ja Hanna Jaakkola. Helsinki: WSOY, cop.
2003.
Kokkonen, Marja 2008. Arvaanko vai arvioinko? : opas aikuisten maahanmuuttajien suomen kielen arviointiin /
Marja Kokkonen, Saara Laakso ja Anni Piikki. Helsinki: Opetushallitus.
Nissilä, Leena 2006. Saako olla suomea?: opas suomi toisena kielenä -opetukseen / Leena Nissilä ... [et al.].
Helsinki: Opetushallitus.
Годынская, И.Н. Дидактические принципы составления учебного материала для некоторых видов
тестов по иностранному языку. - http://www.norma-tm.ru/lang_education18.html
Смирнов, И.Б. Принципы современной системы оценивания достижений учащихся по иностранному
языку. – http://festival.1september.ru/articles/419317/
21
pitää-verbi fraseologisena yksikkönä S2-opetuksen näkökulmasta
Brunni, Sisko
Oulun yliopisto
sisko.brunni@oulu.fi
Leksikaalinen priming tarkoittaa sanan tai sanayhdistelmien vakiintunutta yhdistymistä
kontekstissa ilmenevien sanastollisten, kieliopillisten ja semanttisten piirteiden kanssa. (Hoey
2004, 2005.) Sanaa ja sen erilaisia kontekstuaalisia myötäesiintymiä, eli näin muodostunutta
fraseologista yksikköä, on tähän saakka tutkittu lähinnä englannin kielen pohjalta. Suomen
kaltainen morfofonologisesti rikas kieli tuo yksikköön kuitenkin vielä uusia piirteitä:
Ensinnäkin ytimellä on leksikaalisten, syntaktisten ja semanttisten myötäesiintymien lisäksi
myös morfologisia preferenssejä (Jantunen 2004). Lisäksi sanan eri taivutusmuodoilla on
myös omat taipumuksensa muodostaa myötäesiintymiä sekä sanastollisten, kieliopillisten että
semanttisten piirteiden kanssa. Nämä ovat osa sanan morfologiseksi primingiksi
kutsumaamme ilmiötä (Jantunen & Brunni 2011).
Suomen kielessä lauseen ydin on verbi, joten verbien yhteyteen muodostuneet
fraseologiset yksiköt ovat erityisen keskeisiä. Suomen verbit voivat edellyttää
laajennuksiltaan tiettyä sijamuotoa (rektio) tai muutoin täydentyä tiettyjen morfosyntaktisten
periaatteiden mukaan ja muodostaa näin useampisanaisia fraseologisia rakenteita.
Monimerkityksisillä verbeillä eri merkitykset ja erilaiset täydennysympäristöt liittyvät
toisiinsa: polyseemisten verbien merkitykset aktuaalistuvat usein tiettyjen verbitäydennysten
yhteydessä (ISK §449). Toisaalta verbin ja sen täydennysten muodostamilla muoteilla on
myös taipumus suosia tiettyjä verbinmuotoja ja muoteissa esiintyvillä ytimen sananmuodoilla
ja myös koko muoteilla on omat leksikaaliset priminginsa.
Käytän esimerkkinä monimerkityksistä PITÄÄ-verbiä ja tutkin sen muodostamia
morfosyntaktisesti ja semanttisesti motivoituneita fraseologisia rakenteita. Sen neljä
keskeisintä merkitystä aktuaalistuvat erilaisissa muoteissa: pitelymuotissa (pitää kädessään)
tykkäämismuotissa (pitää suklaasta), arvioimismuotissa (pitää asiaa hyvänä ideana) ja
nesessiivisessä rakenteessa sinun pitää lähteä. (Ks. ISK.) Analyysini lähtökohtana on tutkia
eri rakenteiden välisiä suhteita, muun muassa niiden yleisyyttä, aineistossani. Lisäksi
tarkastelen kutakin rakennetta omana fraseologisen yksikkönään ja analysoin sen
kotekstuaalista primingia: kollokaatioita, kolligaatioita, semanttisia myötäesiintymiä ja
rakenteen yhteyttä eri merkitysvariantteihin. Erityistä huomiota kiinnitän morfologiseen
primingiin. Aineistona on Suomen kielen tekstipankin 1990-luvulla kerätty
sanomalehtikieleen pohjautuva korpus sekä Käännössuomen korpus.
Sanaston ja kielen opetuksessa on jo pitkään liputettu fraseologisuuden nimeen, mutta
käytännön tietoa siitä, miten sanan kontekstia ja fraseologisoitumista voisi käyttää
opetuksessa hyväksi, on vielä suhteellisen vähän. Analyysieni avulla osoitan, miten
fraseologislähtöisessä sanaston opetuksessa erityisesti verbejä voidaan käsitellä itse verbiä
laajempina fraseologisina yksikköinä ja miten muotoa harjoitellaan kiinteässä yhteydessä
merkitykseen. Lisäksi korpuspohjainen analyysi tuo mukaan myös kolmannen
funktionaalisen oppimiskäsityksen korostaman seikan: todellisen käytön. (Aalto ym. 2009:
409.) Kun lähtökohtana on S2-opetus, ei tavoitteena ole tehdä täydellistä analyysia
rakenteista vaan keskittyä natiivikielen pohjalta selville saatuihin yleisiin ja frekventteihin
seikkoihin.
Asiasanat: S2-opetus, fraseologisuus, leksikaalinen priming
22
Lähteet
Aalto, Eija – Mustonen, Sanna – Tukia, Kaisa 2009. Funktionaalisuus toisen kielen opetuksen
lähtökohtana. Virttäjä 3, 402–423.
Hoey, Michael 2004. The textual priming of lexis. — G. Aston, S. Bernardini ja D. Stewart (toim.) Corpora and
Language Learners. 21–41. Studies in Corpus Linguistics 17. Amsterdam: Benjamins.
----- 2005. Lexical Priming. A New Theory of Words and Language. London: Routledge.
ISK = Hakulinen, Auli – Vilkuna, Maria – Korhonen, Riitta – Koivisto, Vesa – Heinonen, Tarja Riitta – Alho,
Irja 2004. Iso suomen kielioppi. Helsinki: Suomalaisen Kirjallisuuden Seura.
Jantunen, Jarmo Harri. 2004. Synonymia ja käännössuomi: Korpusnäkökulma samamerkityksisyyden
kontekstuaalisuuteen ja käännöskielen leksikaalisiin erityispiirteisiin. Joensuun yliopiston humanistisia
julkaisuja 35.
Jantunen Jarmo Harri. – Brunni, Sisko 2011. Morphology, lexical priming and second language acquisition: a
corpus-study on learner Finnish. Learner Corpus Research 2011 “20 years of learner corpus research:
looking back, moving ahead” in Louvain-la-Neuve on 15-17 September 2011.
23
Annotating Errors in a Hungarian Learner Corpus
Dickinson, Markus; Ledbetter, Scott
Indiana University
md7@indiana.edu; saledbet@indiana.edu
Learner corpora have been useful for studying various aspects of the interlanguage of
language learners (e.g. Myles, 2005), for developing pedagogical materials and lexicographic
resources (e.g., Nicholls, 2003), and for developing and evaluating error detection systems
(e.g. Granger, 2003). One limitation has been that most of the work has focused on Western
European languages. Determining how to annotate learner corpora of more morphologicallyrich languages has had very little work (though, see Lee et al., 2011; Hana et al., 2010). We
focus in this paper on defining an error annotation scheme for learners of Hungarian. Our
goal is to define the scheme such that, after applying it to a corpus, error detection systems
can be developed and evaluated for learner Hungarian. A large part of that goal is to describe
learners’ interlanguages: by analyzing non-target forms and their features, we can begin to
understand the interlanguage grammars of learners. This is a crucial step toward providing
individualized, relevant feedback to the language learner.
We follow a line of work on annotating learner corpora with error information (e.g.
Nicholls, 2003; Lüdeling et al., 2005; Rozovskaya and Roth, 2010). Some annotation
schemes make use of multi-layered annotation (Lüdeling et al., 2005). Multiple layers of
annotation also allow one to treat error annotation as an incremental process, building from
smaller constituents to larger ones (Boyd, 2010; Hana et al., 2010). Hana et al. (2010) use a
“two-stage annotation design, based on three levels,” in which corrections for a single form
comprise one level and corrections that span multiple forms, e.g. word order, comprise
another. Turning to agglutinative languages, Lee et al. (2011) annotate post-positional
particle errors in Korean. The agglutination forces them to add a segmented layer of
annotation, among other things.
Our proposal incorporates multiple categories of annotation organized into two layers.
The first layer defines four basic error annotation categories, reflecting character,
morphological, grammatical relation, and sentence errors. Errors from these categories are
unordered and can span multiple forms. We use morphemes as the base unit of analysis to
accommodate the agglutinative nature of Hungarian. A second layer of annotation follows the
first, but it is notable in that it does not represent errors, but rather adjustments to
interlanguage forms that map to a target form. They are secondary emendations which only
emerge consequent to correcting the specific errors learners made. For learning, knowing
both what is erroneous (first layer) and what is a correct sentence (second layer) are useful.
The annotation is being applied to a corpus of daily journals collected from Englishspeaking students of Hungarian at the university level. The later stages of the annotation will
include the use of descriptive features for individual forms. These features are intended to aid
in the analysis of learner interlanguage through a comparison with target language features.
There are a number of uses for such features, including the extraction of learner lexica
complete with linguistic information about each lexical entry as exhibited in the production
data.
Keywords: learner corpora, error annotation, Hungarian
24
References
Adriane Boyd. 2010. EAGLE: an error-annotated corpus of beginning learner German. In Proceedings of
LREC-10. Malta.
Sylviane Granger. 2003. Error-tagged learner corpora and CALL: A promising synergy. CALICO Journal,
20(3):465–480.
Jirka Hana – Alexandr Rosen – Svatava Škodová – Barbora Štindlová. 2010. Error-tagged learner corpus of
Czech. In Proceedings of LAW-10, pages 11–19. Uppsala, Sweden.
Sun-Hee Lee – Markus Dickinson – Ross Israel. 2011. Challenges in annotating Korean particle errors. Talk
given at Learner Corpus Research 2011. Louvain-la-Neuve, Belgium. September 16, 2011.
Anke Lüdeling – Maik Walter – Emil Kroymann – Peter Adolphs. 2005. Multi-level error annotation in learner
corpora. In Proceedings of Corpus Linguistics 2005. Birmingham.
Florence Myles. 2005. Review article: Interlanguage corpora and second language acquisition research. Second
Language Research, 21(4):373–391.
Diane Nicholls. 2003. The Cambridge learner corpus - error coding and analysis for lexicography and ELT. In
Proceedings of Corpus Linguistics 2003, pages 572–581. Lancaster University.
Alla Rozovskaya – Dan Roth. 2010. Annotating ESL errors: Challenges and rewards. In Proceedings of
NLPBEA, pages 28–36. Los Angeles.
25
A background to the creation of the first Corpus of Hungarian as a Foreign Language
Durst, Péter
University of Zagreb, University of Szeged
durst.peter@gmail.com
Szabó, Martina Katalin
University of Szeged
szabomartinakatalin@gmail.com
The characteristics of the acquisition of Hungarian as a second or foreign language have been
examined so far using only data collected separately for the individual projects. There is an
indisputable need for a corpus, which contains language output from learners of Hungarian as
a foreign language and which is available to all researchers specializing in this field. This
corpus can contribute considerably to the study of the acquisition of Hungarian as a foreign
language as well as to the development of new teaching materials.
In this paper we aim at presenting the basic principles that guide us while creating the
first Corpus of Hungarian as a Foreign Language (CHFL) including the issues of data
collection, data processing, morphological annotation, POS-tagging and error-tagging. It is
fundamental to rely on international experience gathered in this field, however, the special
features (especially those concerning morphology) of Hungarian have to be taken into
consideration when planning the methods of data collection and error analysis.
As the first step we analyzed a sample corpus using Magyarlánc, a sentence splitter,
morphological analyzer and POS-tagger software developed at the University of Szeged (The
Natural Language Processing group). This helps us shed light on the possibilities that a
software originally planned to analyze data from native speakers offers in our research
project.
The practical considerations of data collection will be also presented. In the first phase
written texts will be collected from learners of different L1s, whose level of proficiency in
Hungarian will be evaluated and categorized.
An annotation scheme is being developed to perform error tagging in a way that takes
into consideration the special characteristics of Hungarian morphology and learner language.
This scheme is based on Granger (2002: 19) and Durst (2010, 2011).
Keywords: Hungarian as a foreign Language, learner corpus
References
Durst, Péter 2010: A magyar mint idegen nyelv elsajátításának vizsgálata – különös tekintettel a főnévi és igei
szótövekre, valamint a határozott ragozásra. Unpublished PhD thesis. University of Pécs.
Durst, Péter – Janurik, Boglárka 2011: The Acquisition of the Hungarian definite conjugation by learners of
different first languages. Lähivõrdlusi. Lähivertailuja 21. Tallinn: Estonian Association for Applied
Linguistics (EAAL), 19-44.
Granger, Sylviane 2002: A Bird's-eye View of Computer Learner Corpus Research, In: Granger S.– Hung J. –
Petch-Tyson S. ed(s),: Computer Learner Corpora, Second Language Acquisition, and Foreign
Language Teaching. Amsterdam & Philadelphia, Benjamins, Language Learning and Language
Teaching, 6, p. 3-33
Magyarlánc http://www.inf.u-szeged.hu/rgai/nlp?lang=hu&page=magyarlanc
The Natural Language Processing Group, University of Szeged, Hungary http://www.inf.uszeged.hu/rgai/nlp?lang=en&page=nlp
26
Paradigmatic and syntagmatic aspects in language use
Eslon, Pille; Õim, Katre
Tallinn University
peslon@tlu.ee; katre.oim@tlu.ee
1. Research question
Variability of Estonian object cases is a sufficiently explored and discussed area in Estonian
linguistics and elsewhere. The variability of object cases, however, still poses the question
whether it is a regular phenomenon or is it subject to foreign influence from language
contacts.
2. Methodology
In order to shed light on the issue, an attempt to study the use of object case from the
paradigmatic and syntagmatic aspect, comparing the frequency distribution of object case in
texts and dictionaries through different variants of language use, such as journalistic or
phraseological language, is worth undertaking.
The frequency of object NP case-markings in sample groups describes the inflectional
paradigm – the frequency distribution of singular or plural nominative, genitive or partitive,
etc. in journalistic language and phraseologisms. Syntagmatic aspect is employed in
describing the repeatedly used morphosyntactic and lexical units in which the verbal and
constructural choice is lexico-grammatically restricted. The object case variability study at
hand is based on the results of a comparative analysis of the object NP containing the
Estonian verb saama (’to get’, ’to become’).
3. Conclusion
The paradigmatic aspect is used to describe the frequency of object cases in inflectional
paradigm and the constructural homonymy of grammatical cases, which is mostly connected
with inflectional morphological processes of singular countable and uncountable mono- or
disyllabic abstract nouns of fixed meaning. This is evidence of the shortening and
simplification of inflectional paradigm as part of natural language evolution. Comparison
with diachronic studies suggests that the Estonian object case use has been a highly varying
and temporally fluctuating process but not one that is single-directional or dismisses its
Finno-Ugric characteristics.
Preference for frequently occurring object cases of morphosyntactic units which are
described from the syntagmatic aspect is the result of informational structure – i.e. the
choices a language user makes while construing the elements of the language system – rather
than the language system itself. Since from the speaker’s viewpoint the focus is on the object
conveying new information, the choice of object case is not determined by the inflectional
morphological or semantic characteristics (countable/uncountable, concrete/abstract,
definite/indefinite), the aspectual features (atelic/telic), or the resultativity/irresultativity of
the object NP. It seems that a language user does not think about the quantification of the
object with a partial/total marker or the limited/unlimited action marker. When applying
grammatical cases, the alternation of nominative, partitive, and genitive has a neutralizing
function, e.g. Meie eesmärk on tõsta inimene [sg.nom] ~ inimest [sg.part] esile ‘Our purpose
is to dignify man ~the man’, Oleks tore neile pakkuda selline tore üritus [sg.nom] ~ sellise
toreda ürituse [sg.gen] ~sellist toredat üritust [sg.part]. ‘It would be great to offer them a
nice event ~such a nice event ~this particular nice event.’ The emphasis will shift to the
information conveyed by the object NP, which is why the marking of the object or action
with case will become irrelevant.
27
Keywords: grammatical
morphosyntax
cases,
markedness,
frequency,
object
case
alternation,
28
Intensiteettisanat oppijansuomessa ja sanakirjoissa
Fárová, Lenka
Prahan yliopisto
lenka.farova@ff.cuni.cz
Intensiteettisanat kuten aika, aivan, hyvin, ihan, melko, oikein ym. ovat suomessa
taajuudeltaan yleisiä (ks. Parole 500 -taajuuslistaa) ja näin ollen muodostavat tärkeän
sanaryhmän. Myös suomen oppijat käyttävät niitä jo varhaisessa oppimisvaiheessa varsinkin mielipidekirjoituksissa, mutta muulloinkin. Niiden käyttö on kuitenkin horjuvaa,
mistä todistavat esimerkit tšekkiläisten oppijoiden ICLFI:n osakorpuksesta:
Se kuulostaa aivan mukavalta.
..., mikä ei ollut erittäin helppoa.
Ja se on myös hyvin helpompi.
Vastaus on ihan vaikea.
Horjunta johtunee siitä, että näitä sanoja oppikirjoissa mainitaan vain ohimennen ja
sanakirjatkaan eivät usein oppijaa auta, kun ne eivät kuvaile sanan käyttöalaa ollenkaan,
tarjoavat osittain kehämääritelmiä (ks. esim. Kielitoimiston sanakirjan yllä mainittujen
sanojen hakusanoja), joita olisi syytä varoa (ks. esim. Atkins & Rundell 2008: 434), ja
esimerkkilauseita on perinteisesti vähän.
Vaikka VISK:n mukaan (§ 666) intensiteettimääritteet muodostavat subjektiivisia
tulkinnallisia skaaloja, eräänlaisia vahvuusasteikkoja, on tämän esitelmän päämääränä etsiä
objektiivisia tapoja esitellä tätä problematiikkaa suomen kielen oppijoille. Ensin tarkastellaan
suomen oppijoiden intesiteettisanojen käyttöä oppijakorpuksen aineistojen valossa, sen
jälkeen verrataan tuloksia Kielipankin aineistoihin ja lopuksi pohditaan mahdollisuuksia,
miten intensiteettisanojen asteikkoja opettaa S2-alalla, sekä sitä, mihin suuntaan voitaisiin
laatia sanakirjojen määritelmiä, jotta ne palvelisivat myös ei-natiiveja suomen kielen osaajia.
Asiasanat: intensiteettisanat, oppijansuomi, sanakirjatyö
Lähteet
Atkins, B. T. Sue – Rundell, Michael 2008. The Oxford Guide to Practical Lexicography. Oxford: Oxford
University Press.
ICLFI, viitattu 19.12.2011. Saatavissa: http://www.oulu.fi/hutk/sutvi/oppijankieli/ICLFI/Yleinen/index.html
Kielipankki - http://www.csc.fi/kielipankki/
Kielitoimistonsanakirja – versio 1.0 – 12.10.2004, Kielikone Oy ja Kotimaisten kielten tutkimuskeskus
Orpana, Terttu 1988: Kuvaus vai kommentti: Tutkimus suomen kielen adjektiiviadverbien semanttisesta
tulkinnasta. Opera Fennistica & Linguistica. 2. Tampere: TaY.
Parole 5000 -taajuuslista, viitattu 19.12.2011.
Saatavissa: http://kaino.kotus.fi/sanat/taajuuslista/parole_5000.html
VISK = Auli Hakulinen – Maria Vilkuna – Riitta Korhonen – Vesa Koivisto – Tarja Riitta Heinonen – Irja Alho
2004: Iso suomen kielioppi. Helsinki: Suomalaisen Kirjallisuuden Seura. Verkkoversio, viitattu
21.12.2011. Saatavissa: http://scripta.kotus.fi/visk URN:ISBN:978-952-5446-35-7
29
Building a corpus for learning how to produce weak pronouns
in the Romanian clitic sequence
Gerstenberger, Ciprian-Virgil
University of Tromsø
ciprian.gerstenberger@uit.no
The development of digital communication revolutionized all domains of human activity:
working, learning, doing research, spending leisure time, shopping, etc. Due to the technical
issues, this development came along with an increase of text production in digital media,
which is much cheaper than producing spoken language. That means that (second) language
learners would find more often written materials. Even more, when using web-based learning
systems, they have to solve exercises in written form, i.e., they have to produce text with
correct orthography. What if there is not only one possible surface form but several options to
choose among?
Exactly this is the case for some constellations of the clitic sequence in Romanian.
Depending on the context, Romanian weak pronouns have different morphophonological
realizations (Popescu 2000). These forms are mirrored in the official orthography: a reduced
form and the (phonologic) host are written with a dash inbetween. In order to produce correct
written sentences, one has to learn (1) whether there is a case of optional (ex. 1) or obligatory
(ex. 2) reduction, and (2) if the reduction is optional which variant to pick, e.g., the variant in
(ex. 1.a) or the variant in (ex. 1.b).
1. a. Ştiu că-i scrii emailuri.
2. a. Ştiu că i-ai scris emailuri.
b. Ştiu că îi scrii emailuri.
b. *Ştiu că îi ai scris emailuri.
c. *Ştiu că-i ai scris emailuri.
d. *Ştiu că-i-ai scris emailuri.
[I know that you write him/her emails.]
[I know that you have written him/her emails.]
As exemplified in (ex. 3), the clitic sequence can contain not only weak pronouns but
also auxiliaries, negation particles, subjunctions, hence, it can become quite long with more
complex rules.
3.
Due to different factors influencing the realization of specific weak pronoun forms in
the clitic sequence, this phenomenon has been thoroughly described both in comparative
studies with other Balkan and Romance languages (Calude 2001), and in formal frameworks
such as Head-driven Phrase Structure Grammar -- HPSG, (Monachesi 2000) -- or Optimality
Theory -- OT, (Popescu 2000). However, none of the aforementioned approaches are
30
concerned with the operationalization of the clitic sequence production in such a way that it
can be used to help language learners of Romanian cope with the choice of the correct form.
Employing a usage-based approach, our plan is to collect and annotate data with
respect to the phenomenon under discussion. The ultimate goal is twofold: on one hand, we
want to find out whether a corpus-based study is useful to make a choice between optional
variants of clitic sequences, and on the other hand, we want to operationalize the results both
for language learners and surface realization in Natural Language Generation -- NLG. The
reason to do so is that there are parallels between NLG (by machines) and language
production (by humans): in NLG, the choice making issue described above is a much bigger
problem, coined as "surface realization ranking".
We propose an annotation scheme for the Romanian clitic sequence and report on our
on-going work on corpus building and annotation. Moreover, we show that the rules needed
for guiding the L2 learner of Romanian to choose the correct weak pronoun form in the clitic
sequence can be employed without problems in a constraint-based system for surface
realization in NLG (Gerstenberger 2007).
Keywords: Romanian, language learning, special corpus, corpus annotation, weak pronouns,
clitics, clitic sequence, Natural Language Generation, surface realization
References
Calude, Andreea 2001. Romanian Clitics: Siding with the French or the Serbo-Croatian? –Revue Roumaine de
Linguistique, 1-4: 91–105.
Gerstenberger, Ciprian-Virgil 2007. A mereology-based general linearization model for surface realization. –
Proceedings of EUROLAN 2007, Iasi, Romania.
Monachesi, Paola 2000. Clitic placement in the Romanian verbal complex. – Clitics in Phonology, Morphology
and Syntax, John Benjamins.
Popescu, Alexandra 2000. The morphophonology of the Romanian clitic sequence. – Lingua 10: 773–799.
31
Establishing a standardized procedure for building learner corpora – a response to
demands and suggestions of users
Glaznieks, Aivars; Abel, Andrea; Lyding, Verena
European Academy Bolzano
aivars.glaznieks@eurac.edu
Decisions taken at the beginning of the preparation of a learner corpus are of crucial impact
on the way the linguistic data can be retrieved and on how the corpus can be analyzed.
Unfortunately, there are no guidelines on a coherent workflow. Thus, we need a procedure
for learner corpus building which yields a consistently annotated corpus in a standardized
format, so that it can be imported into standard tools for analysis. Usually learner texts are
written by hand in the classroom and must be digitized before any further processing e.g.
error annotations can be applied. The successful selection of appropriate programs for the
transcription and annotation of the original data is a challenge for every corpus linguist, as the
programs need to be flexible, yet powerful and at the same time should not require extensive
technical skills.
The choice of a program is influenced by both the aims of the project and the needs of
the transcribers and annotators. Assuming an “ideal” program, it should be adjustable so as to
provide for the transcription and annotation of the data with its specific phenomena and
characteristics. Namely it should support the systematic integration of metadata and different
types of annotations according to specifications by the user. Additionally, the “ideal”
program must support standardized data formats as to be easily integrated into workflows
with other programs used for the project, e.g., programs to create the searchable learner
corpus. From the users’ perspective the tool should automate processing steps where possible
and support the creation of consistent and well-formed data.
Applied research work on such methodological questions has yielded many editors
that can be used for transcription and annotation (e.g. EXMARaLDA, Atlas.ti). Each one
might have its advantages with respect to some purposes of a given project but it also will
have its limitations with regard to others. Since linguists are generally not developers of
programs, they often depend on using existing solutions. The decision for a program, then, is
based on which of the existing programs fits best or is most adjustable. But any chosen
program does not necessarily satisfy all of the users’ needs.
In this paper, we will discuss several existing methods of building a learner corpus
(e.g. Granger 2002, Siemen et al. 2006). On the basis of these approaches we will discuss our
experiences in using a generic XML editor with customized extensions for the transcription
and annotation of hand-written L1/L2-data. The data were collected in the course of two
different projects in which we analyzed L1/L2 writing skills of German and Italian speaking
high school students. We will introduce our approach based on the user-friendly generic tool,
and show how it can be easily adjusted to different users’ and projects’ needs. We will give
an overview over the established workflow starting with the appropriate transcription tool,
continuing with aspects of building a searchable corpus with respective interface, and ending
with an outlook on our needs for programs for further linguistic annotation and interpretation
of learner texts.
Keywords: L1 learner corpora, L2 learner corpora, methodology, standardization of
workflow
32
References
Granger, Silviane 2002. A Bird’s-eye view of learner corpus research. – Silvaine Granger – Joseph Hung –
Stephanie Petch-Tyson (eds.), Computer Learner Corpora, Second Language Acquisition and Foreign
Language Teaching, 3-33. Amsterdam: Benjamins.
Siemen, Peter – Anke Lüdeling – Frank Henrik Müller 2006. FALKO – Ein fehlerannotiertes Lernerkorpus des
Deutschen.
Proceedings
of
Konvens
2006.
Konstanz.
http://www.linguistik.huberlin.de/institut/professuren/korpuslinguistik/forschung/falko/publikationen
33
Vatjan ja inkeroiskielen opettamisesta ei-akateemisessa luokkahuoneessa
Heinsoo, Heinike; Saar, Eva
Tarton yliopisto
heinike.heinsoo@ut.ee; eva.saar@ut.ee
Tällä hetkellä on vatjan puhujia alle kymmenen, ja inkeroiskieltä puhuu n. 150 ihmistä.
Vatjan kieli on herättänyt enemmän akateemista huomiota, ja muistiinpanoja on vuodesta
1783 alkaen runsaasti (Heinsoo 2004). Inkeroiskieltä ei ole aina pidetty itsenäisenä
kielenäkään (varsinkaan suomalaisten tutkijoiden toimesta). Akateemisella tasolla on vatjaa
opetettu yli 100 vuotta. Inkeroiskieltä on opetettu yliopistoissa harvemmin.
Vatjalainen Dmitri Tsvetkov (30.8.1889 Jõgõperä – 26.08.1930 Narva) oli Alajõella
venäjän kielen opettajana. Hän laati v. 1922 vatjan kieliopin (Tsvetkov 2008), ja 1923–1925
Joenperän murteen sanakirjakortiston (Tsvetkov 1995). Lauri Kettunen kutsui Tsvetkovin
vuonna 1922 Tarton yliopistoon. Tsvetkovista haluttiin kouluttaa maailman ensimmäinen
vatjalainen vatjan kielen tutkija. Tsvetkov lakkasi harrastamasta vatjaa jo ennen
valmistumistaan yliopistosta (Ernits 2009).
Väino J. Junus, kansallisuudeltaan ilmeisesti suomalainen (s. 1905 Pokkisen-Purskova, k.
15.11.1937 Leningradissa?) oli Leningradin Historian ja Lingvistiikan Instituutin
apulaisprofessori. Hän yritti perustaa kirjakieltä sekä Laukaan että Soikkolan murteen
puhujille. Hän osallistui oppikirjojen laatimiseen (Iljin, Junus 1936, Junus 1936). 1932–1937
oli olemassa latinalaisiin kirjaimiin perustuva inkeroiskielen kirjoitustapa, ja inkeroiskielellä
opetettiin koulujen alaluokilla. Jotkut oppikirjat olivat 1936–1937 käytössä myös Luuditsan
vatjalaiskoulussa.
Vuodesta 1992 on alettu luoda vatjan kirjakieltä (Ernits 2006, 2010). 1990-luvulla
opetti Joenperän koulussa vatjaa Mehmet Muslimov – http://www.vadjamaa.narod.ru/ (5
kappaletta). Vatjaa on Joenperän koululla opetettu sattumanvaraisesti myöhemminkin. 2010,
2011 (2012) järjesti Heinike Heinsoo neljä päivää kestävät vatjan kielen kurssit „Baabuškassa
vunukkaassaa“ (Mummosta lapsenlapseen). Osallistujien joukossa (n. 20) oli aika hyvin
vatjaa taitavia ja myös niitä, jotka eivät olleet koskaan kuulleetkaan vatjaa. Osallistujia oli
kaikista ikäryhmistä (12-82). Vuoden 2010 kokemus osoitti, että kirjoittamisesta täytyy
kokonaan luopua. Lukeminen sujuu, jos tekstinä on lyhyt sananlasku, arvoitus tms. Vuoden
2011 opetusmateriaaleihin kuului sanalotot, ristikot, arvaamisleikit, morfeemipalikat ym.
leikkisä valmiiksi painettu materiaali, samoin sanalaput, joissa oli toisella puolella
vatjankielinen, toisella venäjänkielinen sana. Klassinen, vaikka kuinka helppo kieliopin
opettaminen ei toimi.
Inkeroiskieltä opetti 2010–2011 Viistinän koulla Nikita Djatshkov, nuori Viistinän
kotiseutumuseon tutkija, jolla on vatjalais-inkeroiset sukujuuret. Opetusmateriaalit hän tekee
itse. Eva Saar on aikeissa pitää inkeroiskielen kesäkurssit kesällä 2012.
Esitelmässämme haluamme puhua (äidin)kielen opettamisen kokemuksista kyrillisiä
aakkosia lukemiseen ja kirjoittamiseen käyttäville eri-ikäisille ihmisille.
Asiasanat: kirjakielettömän kielen opettaminen, aikuisopetus
Lähteet
Ernits, Enn 2006.Vadja liikumisest ja kirjakeelest Keel ja Kirjandus 1, 83-91.
Ernits, Enn 2009. Vadja haritlane Dmitri Tsvetkov. Eesti Kirjandusmuuseumi Teaduskirjastus. Tartu.
Ernits, Enn 2010. „Vadja kirjaviisist ja sõnaloomest.“ ESUKA – JEFUL 2010, 1 – 1: 41 –56
34
Heinsoo, Heinike 2004. Investigating Obsolescense: Votic. – Fenno-Ugristica 26. Uralistika müüdid ja faktid.
Tartu, 10–17.
Iljin N.A., Junus V.I. 1936 Bukvari iƶoroin şkouluja vart. M.-L., 1936
Junus, Väino 1933. Lukukirja inkeroisia oppikoteja vart, toiseel oppivuuvveel.
Junus, V.I. 1936 Izoran keelen grammatikka. Morfologia. Opettajia vart. Ucpedgiz. Leningrad-Moskova 1936.)
Tsvetkov, Dmitri 2008. Vadja keele grammatika. Toim. Jüri Viikberg. Eesti keele Sihtasutus.(Эсимейн ваддя
чээлэ грамаатикк. Сост. Д.Цветков 1922).
Tsvetkov, Dmitri 1995. Vatjan kielen Joenperän murteen sanasto. Toim. Johanna Laakso. Lexica Societatis
Fenno-Ugriae XXV. Suomalais-Ugrilainen Seura. Kotimaisten Kielten Tutkimuskeksus. Helsinki.
35
Keystructure analysis of formally defined structures of learner Finnish
Ivaska, Ilmari
University of Turku
itivas@utu.fi
The studies of learner language – the so-called interlanguage – and the second language (L2)
acquisition studies have for quite some time been interested in the interlanguage on its own
terms, instead of error analysis made from point of view of the target language. The research,
however, has for a long time focused mainly on describing the features of learner language
qualitatively and on testing hypotheses set beforehand. The present paper studies the typical
structural features of advanced L2 Finnish by looking at the quantitative differences between
learner Finnish and Finnish as a first language.
One way to use a corpus in linguistics is to verify or falsify a given hypothesis with
the help of a corpus. Another possibility is to use it in a corpus-driven manner, so that corpus
data is used from the very beginning of the process to sketch the actual research questions (cf.
Tognini-Bonelli 2001: 177–179). The dominating paradigm of corpus linguistics studying L2
acquisition is the Contrastive Interlanguage Analysis (CIA), a method that makes it possible
to analyse the quantitatively typical features of learner language also regardless of any
normatively qualifying comparisons with the target language in question (Granger 1996). The
Keystructure Analysis (Ivaska-Siitonen 2011) is a research method similar to the Keyword
Analysis (Scott–Tribble 2006; 58–59). The aim is to find typical structures of a given
language variety (in this case L2-Finnish) by comparing the frequencies of the clause
structures found in the research data and in the reference data (cf. Scott 2010 about studying
the key elements in general; cf. Jantunen 2011 about studying the over- and underrepresented
key elements in learner language). A similar method is used also by Wiersma et. al. (2011).
In the present paper, clause structures typical in L2-Finnish are studied by using the
aforementioned methods. Clause structure is considered as a pattern consisting of linguistic
features that co-occur typically and that can be defined by their lexical nature (word form,
lemma, part-of-speech) or by their morphological form. Following the definition, all the
examples 1–4 can be seen as clause structures consisting of three members, and they all can
be used to describe the same clause kielissä on eroja ’there are differences in languages’.
(There are obviously a number of combinations, as well).
1) (word form)
kielissä ’in languages’ on ’is’
eroja ’differences’
2) (lemma)
KIELI ’language’
OLLA ’to be’
ERO ’difference’
3) (part-of-speech)
N
V
N
4) (morphology)
PL INE
FIN IND PRES SG3 PL PART
Each level is initially observed separately but the relations between the levels lie at
the centre of the analysis. The potential keystructures found are analysed in terms of their
distribution analysis (cf. Croft 2001: 11–15) to look at the nature of the form–function
mappings in each of the data sets. Similarly, the cotextual profiles (cf. Sinclair 1991: 171–
172) of the potential keystructures are compared between the data sets.
The data of the study is The Corpus of Advanced Learner Finnish of the University of
Turku (cf. Ivaska–Siitonen 2009), which is extensively annotated in terms of word lemmas,
parts-of-speeches and morphological forms. The corpus contains exam essays, manuscripts of
theses, and other writings written by advanced L2-learners of Finnish. A reference data
(including the respective text genres) by native speakers of Finnish has also been collected as
36
part of the corpus. The texts have been written during and as parts of research subjects’
university studies and, thus, they are all part of a natural communication discourse.
Keywords: corpus research, clause structure, keystucture analysis, learner Finnish
References
Croft, William 2001. Radical Construction Grammar - Syntactic Theory in Typological Perspective. Oxford:
Oxford University Press.
Granger, Sylviane 1996. From CA to CIA and back: An integrated approach to computerized bilingual and
learner corpora. – Aijmer, Karin – Altenberg, Bengt – Johansson, Mats (eds), Languages in Contrast.
37–51. Lund: Lund University Press.
Ivaska, Ilmari – Siitonen, Kirsti 2009. Syntaktisesti koodattu oppijankielen korpus: mahdollisuuksia ja
ongelmia. – Eslon, Pille – Õim, Katre (eds), Korpusuuringute metodoloogia ja märgendamise
probleemid, 54–71. Eesti keele ja kultuuri instituuti toimetised 11. Tallinna: Tallinna Ülikool.
Ivaska, Ilmari – Siitonen, Kirsti 2011. Avainrakenneanalyysi: tapa tutkia oppijankielen lauserakennetta
korpusvetoisesti. – AFinLA-e 3, 35–47.
Jantunen, Jarmo H. 2011. Avainsana-analyysi annotoidun oppijankieliaineiston tutkimisessa: Alustavia
havaintoja. – AFinLA-e 3, 48–61.
Scott, Mike – Tribble, Christopher 2006. Textual Patterns: Key Words and Corpus Analysis in Language
Education. Amsterdam: John Benjamins.
Scott, Mike 2010. Problems in investigating keyness. – Scott, Mike – Bondi, Marina (eds), Keyness in Texts,
43–58. Studies in Corpus Linguistics 41. Amsterdam: John Benjamins.
Sinclair, John 1991. Corpus. Concordance, Collocation. Oxford: Oxford University Press.
Tognini-Bonelli, Elena 2001. Corpus Linguistics at Work. Studies in Corpus Linguistics 6. Amsterdam:
Benjamins.
Wiersma, Wybo – Nerbonne, John – Lauttamus, Timo 2011. Automatically extracting typical syntactic
differences from corpora. – Literary and Linguistic Computing 26 (1), 107–124.
37
Learner universals, learner corpora and methodology
Jantunen, Jarmo Harri
University of Oulu
jarmo.jantunen@oulu.fi
This presentation examines the general laws regarding learning a second language, i.e. the
possible so-called universal characteristics of learning a second language. I will introduce
presumptions and observations examined in previous research literature, and aim to classify
them according to the following division: acquisition universals, language skill or process
universals (productive and receptive skills) and product universals. Furthermore, I will
illuminate characteristics pointed out especially by the recent corpus research. In addition, I
will introduce corpus methodological options that may especially help examining output
universals. They also convey intermediary information on language skills and language
learning.
In language learning research, the concept of universal or widespread tendency has
been occasionally highlighted when researchers wish to emphasize that a certain phenomenon
is relevant to learning more than one language. Especially, research in first language
acquisition has striven to discover general cognitive laws. However, the issue has also been
considered in research in second language learning particularly with regard to the learning
process. Nevertheless, a systematic analysis of wide-ranging tendencies has not been
developed very much. New and extensive learner corpora present an opportunity for such
analysis.
In research literature, transfer, interference (or cross-linguistic influence), overgeneralisation and simplification have been suggested as universal characteristics of language
learning (e.g. Odlin 2002; Jarvis & Pavlenko 2008; Safaya 2009; Jantunen 2008) while even
more specific tendencies have been suggested as common to all language learning such as
faster acquisition of nouns in comparison to verbs (Gentner 2006), making use of previously
learned information in language use situations (Carrasquillo & Rodrigues 2001) or need for
practice in learning (Halmari 2004). In addition to the previous, wide-ranging tendencies may
also include atypical frequencies of linguistic elements and the unconventional nature of
language (Jantunen 2008).
Currently, research addresses possible universal characteristics in an unstructured and
oblique manner: no distinction is made between learning processes, production and reception
processes and the characteristics of the output. In this presentation, I intend to provide a
preliminary systematisation of the presumptions in the research literature, and discuss
especially such output universals whose analysis requires vast learner corpora.
The earlier assumptions regarding wide-ranging tendencies may be based on parallels
describing learning on a general level, or studies based on small (elicited) corpora. One
exception, for example, is Meriläinen’s study (2011), which analyses the relationship of
cross-linguistic influence and universals through corpora. In my presentation, I examine
alternative corpus-based methods, with the aid of which corpora may be approached for
examining the universals of output. The most extensively introduced method in the literature
is probably Granger’s (1996) Contrastive Interlanguage Analysis (CIA); however, this
method alone is not sufficient for the purpose of investigating the universals to be found in
learner output.
Keywords: learner universals, learner corpora, corpus methodology
38
References
Carrasquillo, Angela – Vivian Rodriguez 2001. Language minority students in the mainstream classroom.
Bilingual education and bilingualism 33. Clevedon: Multilingual Matters.
Gentner, Dedre 2006. Why verbs are hard to learn. – Kathryn Hirsh-Pasek & Roberta Golinkoff (eds.), Action
meets word. How children learn verbs, 544–564. Oxford: Oxford University Press.
Granger, Sylviane 1996. From CA to CIA and back. An integrated approach to computerized
bilingual and learner corpora. – Karin Aijmer, Bengt Altenberg & Mats Johansson (eds.), Languages in
contrast. Text-based cross-linguistic studies, 37–51. Lund Studies in English 88. Lund: Lund
University Press.
Halmari, Helena 2004. Codeswitching patterns and developing discourse competence in L2. – Diana Boxer &
Andrew Cohen (eds.), Studying speaking to inform second language learning, 115–146. Second
language acquisition 8. Clevedon: Multilingual Matters.
Jantunen, Jarmo H. 2008. Haasteita oppijankielen korpusanalyysille: oppijankielen universaalit. [Challenges for
learner corpus research: learner language universals.] – Pille Eslon (ed.), Õppijakeele analüüs:
vöimalused, probleemid, vajadused, 67–92. Tallinna ülikooli eesti filoloogia osakonna toimetised 10.
Tallinn: Tallinna ülikool.
Jarvis, Scott – Aneta Pavlenko 2008. Crosslinguistic influence in language and cognition. New York:
Routledge.
Meriläinen, Lea 2011. On the relationship between cross-linguistic influence and learner universals in learner
English. Presentation in Eurosla 21 Conference, Stockholm, 8–10 September 2011.
Odlin, Terence 2002. Language transfer and cross-linguistic studies. Relativism, universalism, and the native
language. – Robert Kaplan (ed.), The Oxford handbook of applied linguistics, 253–261. Oxford: Oxford
University Press.
Safaya, B.N. 2009. Teaching of language. A practical approach. Chandigarh: Abhishek Publications.
39
Reseptiivinen monikielisyys vieraan kielen oppimisessa: viron- ja suomenkielisen
kirjallisen tekstin ymmärtäminen
Kaivapalu, Annekatrin
Jyväskylän yliopisto, Tallinnan yliopisto
kaivapa@tlu.ee
Reseptiivisella monikielisyydellä tarkoitetaan erityistä monikielisen kommunikaation tapaa:
vuorovaikutuksessa kukin osallistuja käyttää toiselle puhuessaan omaa äidinkieltään ja
ymmärtää toisen kieltä. Vaikka reseptiivistä monikielisyyttä on käsitelty ensisijaisesti
sosiolingvistisessä ja kielipoliittisessa viitekehyksessä, näkökulma tarjoaa ulottuvuuden myös
kielen oppimisen tarkasteluun.
Opetellessaan uutta kieltä ihminen joko tietoisesti tai tiedostamattaan hyödyntää sitä
tietoa ja taitoa, mikä hänellä on äidinkielestään ja/tai muista jo tuntemistaan kielistä. Kieltä
opetteleva soveltaa uuteen kieleen niitä rakenteita ja ilmaisustrategioita, jotka hän ennestään
hallitsee. Viro ja suomi ovat tunnetusti läheiset sukukielet, jotka muistuttavat paljon toisiaan
rakenteellisesti, leksikaalisesti ja funktionaalisesti. Molemmissa kielissä on asioita, jotka
oppijat tavallaan jo valmiiksi osaavat lähdekielensä perusteella ja joita hyödynnetään erityisesti kielen vastaanottamisessa ja ymmärtämisessä. Kielten geneettinen ja typologinen tausta
luo odotuksia, joihin liittyvät oppijan käsitykset ja kokemukset samankaltaisuudesta ja
erilaisuudesta.
Tässä esitelmässäni tarkastelen, mitä ja miten suomenkieliset vironoppijat ja vironkieliset suomenoppijat ymmärtävät kohdekielisestä kirjallisesta tekstistä lähdekielensä pohjalta
ilman eksplisiittistä opetusta ja ilman aikaisempaa kokemusta kohdekielestä. Tutkimus on rajattu reseptiiviseen taitoon varsinkin sen takia, että kielen omaksuminen alkaa lukemisesta ja
kuuntelemisesta: ennen kuin oppija pystyy tuottamaan opittavaa kieltä, on siitä edes jotain
ymmärrettävä. Ymmärtäminen toimii pohjana tuottamiselle, ja sen tutkimisen avulla voi
selvittää kohdekielen oppimisen edellytyksiä Tavoiteena on keskittyä kieliopillisiin rakenteisiin ja kielijärjestelmän toimimisperiaatteisiin, joista tekstin ymmärtämisessä on mahdollisesti etua tai haittaa. Lähtökohtana on viron ja suomen rakenteiden todellinen samankaltaisuus ja erilaisuus, johon kieltenvälinen positiivinen ja negatiivinen vaikutus pohjautuvat.
Tutkimus perustuu Itä-Suomen, Tallinnan ja Jyväskylän yliopistojen yhteistyönä
aloitetun REMU-hankkeen puitteissa kerättyyn aineistoon. Viroa lainkaan taitamattomille
suomenkielisille opiskelijoille ja suomea lainkaan taitamattomille vironkielisille opiskelijoille
annettiin luettavaksi sama vastaavasti viron- ja suomenkielinen teksti ”Sild üle mere/Silta yli
meren”, jonka sisältöä heitä pyydettiin kuvaamaan. Myös kääntämiseen kannustettiin. Lisäksi
opiskelijoiden toivottiin reflektoivan kokemustaan: mikä on helppoa, mikä vaikeaa, ja
millaisia keinoja merkityksiä rakennettaessa hyödynnettiin.
Tutkimuksen tulokset osoittavat, että lähde- ja kohdekielen rakenteiden ja
järjestelmien samankaltaisuus on ymmärtämisprosessissa kaikkine osa-alueineen
kokonaisvaltaisesti mukana: lähde- ja kohdekielen rakenteellinen ja funtionaalinen
samankaltaisuus on yhtä tärkeä kuin samankaltainen sanasto. Varsinkin taivutusmuotojen,
johtamisen, yhdistämisen ja lauserakenteiden samankaltaisuus auttavat tekstin sisällön
selvittämisessä. Vastauksista on myös pääteltävissä, että strateginen kompetenssi ja
metalingvistinen tietoisuus edistävät ymmärtämistä.
Asiasanat: reseptiivinen
rakenteet, suomi, viro
monikielisyys,
lähisukukieli,
ymmärtäminen,
kieliopilliset
40
Learner Language analysis in SPbEFL Learner Corpus
Kamshilova, Olga
Herzen State Pedagogical University of Russia, St. Petersburg
onkamshilova@gmail.com
The paper presents analysis of interlanguage data found in a Learner English corpus being
developed at Herzen University (Saint Petersburg, Russia). SPbEFL LC, started in 2009, is a
multi-mother tongue (Russian, Chinese, Japanese, Korean, Thai, and Vietnamese) corpus that
compiles written texts (essays and personal letters), monologues, and dialogues (in scripts).
The contributors’ pre-tested language proficiency is intermediate (26%) and upperintermediate (74%). The language/text relevant criteria include medium, genre, topic,
technicality and task setting. SPbEF LC is an attempt to compile a target-specific structure, a
text collection in accord with essential corpus design criteria. Operated with reliable free
tools, the corpus proves efficient enough in spotting and analyzing the learner language.
The investigation bases on the assumption that both the vocabulary and the sentence
patterns presumably reflect the actual language fund that the learners subconsciously resort to
in case of FL communication. The interlanguage study is carried out with reference to
syntactically parsed texts, concordance, frequency and collocation lists. The report focuses on
the overuse of lexical have and link be in basic syntactic structures S V C and S V Od and the
actual fill of their other components that imparts the non-native “accent”.
The overuse of have, for instance, marks no apparent violation in S V Od structure
use. What seems quite special for the learner texts is the overuse of the pattern with the Od
position filled with nominalized forms, that is, they prefer a precast pattern to a more
conventional for native speakers nominal (be allergic, be free, be independent) or verbal
predicate (to live by oneself, to communicate):
[I can understand when people don’t keep any animals because they have an allergy]
[If you leave your childhood house you'll have your own life]
[If you have your own accomodation you also have a freedom]
[I enjoy to have communication with interesting people from different countryes].
With the complement structure S V C it is the fill of C position with preference to adjectives
and the lexical choice of the adjective, as well, that marks learner language.
SPbEFL corpus findings pinpoint “atypical” mistakes in learner interpretation and use
of basic structures that address issues of both learner universals and new language learning
and teaching materials.
Keywords: learner corpus, syntactic structures, interlanguage, overuse
References
Biber D. – Johansson S. – Leech G. – Conrad S. – Finegan E. 1999. Longman Grammar of Spoken and Written
English. – Harlow: Longman, 1999.
Cobb T. 2003. Analyzing late interlanguage with learner corpora: Quebec replications of three European studies.
– Canadian Modern Language Review 59(3), 393-423.
Granger, S. – Rundell, M. 2007. From corpora to confidence. – English Teaching Professional 50, 15-18.
41
Estonian as a foreign language at the University of Tartu: the current situation
and future outlook
Kikerpill, Tiina; Klaas-Lang, Birute; Praakli, Kristiina
University of Tartu
birute.klaas-lang@ut.ee
The presentation offers an overview of the current situation and future outlook for the
teaching and researching of Estonian as a second and foreign language at the University of
Tartu, based on the needs of the Estonian state, universities, researchers, learners and
instructors.
One of the missions of the Department of Estonian as a Foreign Language is to
prepare Estonian teachers for work in both non-Estonian schools and universities abroad. The
teaching of Estonian outside Estonia is also supported by the Estonian government, which has
initiated and provided funding for a Programme of Academic Studies of Estonian Language
and Culture Abroad. According to this programme, the number of foreign universities
teaching Estonian will gradually increase. The programme also supports the training of
foreign lecturers, Estonia-related research, the compilation of teaching materials, etc.
Estonia’s accession to the European Union and Estonians’ recently increased mobility,
including intensified labour migration, has also given rise to new needs for the teaching of
Estonian abroad.
A second important mission of the department is to research the teaching, learning
and use of Estonian as a second language and support other researchers in the field. The
research topics require the gathering of different variations of Estonian spoken abroad and
also Estonian language usage of non-Estonians in Estonia and abroad, both in the learning
phase and in spontaneous communication. As a result, our department has had to expand the
gathering of language usage data, creating alongside the existing corpus of language errors
other corpora, such as a spoken corpus consisting of both Estonian as a second language and
Estonian as a foreign language data. The purpose of the compiled corpora is to support
Estonian as a second and foreign language research in different fields such as language
acquisition, language teaching methodology, testing etc. The pedagogical function of the
corpus lies in the use of the corpus data in the teaching of Estonian as well as in teacher
training programs.
Keywords: Estonian as a second language, Estonian as a foreign language, learner corpus
References
Klaas, Birute 2003. Eesti keele õpetamisest ja uurimisest võõrkeelena ja teise keelena Tartu Ülikoolis. 200
aastat eesti keele ülikooliõpet. Juubelikogumik, 319-348. Koostaja Valve-Liivi Kingisepp. Toimetaja
Mati Erelt.
Pool, Raili 2010. Eesti keele teise keelena uurimine Tartu Ülikoolis – hetkeseis ja perspektiivid. Eesti ja soomeugri keeleteaduse ajakiri. Journal of Estonian and Finno-Ugric Linguistics 1.
Laagus, Aino – Klaas, Birute – Allik, Mari 2004. Lõuna-Rootsi eestlased ja nende keel. Valimik intervjuusid.
Tartu Ülikooli eesti keele (võõrkeelena) õppetooli toimetised 4. Tartu.
Eesti keele arengukava 2011-2017. Eesti Keele Sihtasutus, Tallinn, 2011.
Eesti keele ja kultuuri akadeemilise välisõppe programm 2011-2017, vt
http://ekkm.estinst.ee/site_media/uploads/programm/EKKAV_programm_2011-2017.pdf
42
Lexicogrammatical profile of Estonian as a second language on the B1 level:
Some results of the pilot study
Kitsnik, Mare
Tallinn University
marekitsnik@gmail.com
In Estonia as in the whole European Union the CEFR is used as the basis for determining
second language proficiency. In the CEFR the language levels are described in the "can do"
style and these detailed descriptions can be applied to all languages. However, curriculum
writers, the authors of study materials and language teachers and learners also need more
language specific information about vocabulary, phrases and constructions which are
important to communicate successfully on particular levels of the language proficiency. In
my doctoral thesis I will examine the lexicogrammatical profile of B1 and B2 writing
performances in Estonian as a second language, both quantitatively and qualitatively. I will
describe when and how the different linguistic features appear in learner language. The study
is carried out on a sub-corpus of Estonian Interlanguage Corpus which contains written B1
and B2 level examination papers of Estonian as a second language. Successful performances
of adults and high school students will be examined and compared.
The theoretical framework of my research is based on three dimensions of language
proficiency: complexity, accuracy and fluency (Housen, Kuiken 2009). In addition the
DEMfad model is used (Franceschina, Alanen, Huhta & Martin, 2006). In the process of
investigation the program WordSmith Tools 5,0 (Scott, Tribble 2006) will be used. By using
the program, three lists will be compiled: the vocabulary frequency list, concordances and
key words. Then the words will be grouped (objects, actions and processes, qualities and
states, amounts and extents, time and space, relations and connections) and descriptions of
frequent lexicogrammatical constructions will be compiled (including usage contexts,
collocations and typical incorrectnesses).
In my paper the preliminary results of the pilot study of written performance on the
B1 level will be presented and discussed.
Keywords: second language acquisition, lexicogrammatical
performance, B1 and B2 levels, Estonian
constructions,
writing
References
Franceschina, F. – Alanen, R. – Huhta, A. – Martin, M. 2006. A progress report on the Cefling project.
Housen, Alex – Kuiken, Folkert 2009. Complexity, accuracy and fluency in Second Language Acquisition. –
Applied Linguistics 2009.
Scott, Mike – Tribble, Christopher 2006. Textual Patterns: Key Words and Corpus Analysis
in Language Education. Philadelphia, John Benjamins.
43
Concerning the vitality of Estonian and Finnish in higher education
Klaas-Lang, Birute
University of Tartu
birute.klaas-lang@ut.ee
Linguistic and cultural diversity is certainly one of Europe’s core values and assets. However,
a language exists until its trouble-free use is granted in all domains, including higher
education. A language must be able to ensure this and meet the needs of those domains
independently. On the other hand, a state / society / institution must have an environment that
enables the use of the language. In the realm of higher education, which is open and
international, universities are making efforts to maintain a balance between international (i.e.
almost always English-medium) and mother-tongue-medium teaching. The promotion of the
international environment is important for universities from the point of view of both
business and institutional quality. On the other hand, one mission of universities is to ensure
the continuity of the native-language intelligentsia, which is necessary for the continuation of
the state and nationality and the development of the country’s mother tongue.
Estonian and Finnish represent less-used European languages that have mothertongue-medium higher education (incl. doctoral studies) and research. The presentation will
compare the position of Estonian and Finnish in higher education; it will attempt to show
whether and how the regulation of the institutional language environment and resultant
actions can maintain a balance between mother-tongue-medium instruction (in the case of
less-used languages) in higher education and international openness. The presentation will
also analyse how the language-policy regulations of the state and institutions of higher
education interact with one another.
Keywords: language vitality, higher education, language policy and planning
References
http://unesdoc.unesco.org/images/0018/001836/183699E.pdf
Hakulinen, Auli ym 2009. Suomen kielen tulevaisuus. Kielipoliittinen toimintaohjelma. Kotimaisten
kielten tutkimuskeskuksen verkkojulkaisuja 7. Helsinki.
Eesti keele arengukava 2011–2017. Eesti Keele Sihtasutus, Tallinn, 2011.
Eesti keele arendamise strateegia elluviimine 2004–2010. Tartu, 2011.
(The presentation will be held in Finnish.)
44
Kieliopilliset käsitteet työvälineinä S2-opetuksessa
Kok, Maria
Itä-Suomen yliopisto
maria.kok@uef.fi
Opetettaessa suomea vieraana kielenä kieliopillisiin käsitteisiin kohdistuu erilaisia
vaatimuksia kuin äidinkielen opetuksessa. Käsitteiden käyttöarvo opetusvälineenä korostuu.
Äidinkielen opetuksessa kieliopillisten kategorioiden nimityksiä käytetään usein ainoastaan
kieliopillisten ilmiöiden nimeämiseen ja tunnistamiseen. Vierasta kieltä opiskeleva sen sijaan
tukeutuu kieliopillisiin käsitteisiin ja odottaa niistä olevan apua kieliopillisten ilmiöiden
ymmärtämisessä. Käsitteet, jotka jäävät hämäriksi tai välittävät vääristynyttä informaatiota,
pettävät opiskelijan odotukset, vaikeuttavat oppimista ja ovat enemmän haitaksi kuin
hyödyksi.
Ergonomia on oppisuuntaus, joka tutkii työvälineitä ja työtapoja sekä myös kehittää ja
huoltaa niitä. Yksi ergonomian koulukunnista on kognitiivinen ergonomia. Se tutkii ja
kehittää erityisesti tiedon esittämiseen liittyvää välineistöä, johon myös käsitteet ja
käsitejärjestelmät kuuluvat. Sellaista tutkimussuuntausta kuin kielioppiergonomia tai
ergonominen kielitiede ei tällä hetkellä vielä tunneta systemaattisena lähestymistapana.
Kognitiivinen ergonomia voisi kuitenkin tarjota varteenotettavan teoreettisen viitekehyksen
kielenopetuksessa käytettävän käsitteistön tutkimiseksi, arvioimiseksi, kehittämiseksi ja
huoltamiseksi. Ovathan sekä kielen oppiminen että opettaminen kognitiivisia prosesseja.
Vaikka kieliopillisia käsitteitä ei aikaisemmin ole tarkasteltu systemaattisesti
ergonomian viitekehyksestä käsin, yksittäisiä käsitteitä ja käsitejärjestelmiä on kuitenkin aika
ajoin kehitetty ja huollettu tavalla, jota voisi pitää ergonomian sovelluksena. Käsitteiden
informaatioarvoon ja käyttäjäystävällisyyteen on kiinnitetty huomiota esimerkiksi uudessa
Isossa suomen kieliopissa sekä useissa uudemmissa S2-oppikirjoissa. Esitelmän
tarkoituksena on ensinnäkin tarkastella kognitiivisen ergonomian näkökulmasta joitain
ongelmallisia käsitteitä ja käsiteryhmiä, joiden käyttökelpoisuutta on onnistuttu parantamaan.
Otan puheeksi myös joitain käsitteitä, joihin onnistunutta ratkaisua ei vielä ole löytynyt.
Aineistona käytän S2-oppikirjoja ja suomen oppijoille suunnattuja kielioppeja. Osa
aineistosta on historiallista, sillä kiinnitän huomiota ergonomisten seikkojen lisäksi myös
käsitteiden historialliseen taustaan.
Lähteet
Gehring, Sonja – Heinzmann, Sanni 2010: Suomen mestari 1. Finn Llectura, Helsinki.
SWK = Suomen Wanhat Kieliopit. Turun yliopisto, toim. Kalevi Wiik.
Työterveyslaitos. http://www.ttl.fi/fi/ergonomia/Sivut/default.aspx
VISK = Auli Hakulinen – Maria Vilkuna – Riitta Korhonen – Vesa Koivisto – Tarja Riitta Heinonen – Irja Alho
2004. Iso suomen kielioppi, verkkoversio. http://scripta.kotus.fi/visk/etusivu.php
White, Leila 2010. Suomen kielioppia ulkomaalaisille. Finn Lectura, Helsinki.
White, Leila 2010. From Start to Finnish. Finn Lectura, Helsinki.
45
Viestinnällisten konstruktioiden kehittyminen suomenoppijan kielessä
Koskela, Anne
Oulun yliopisto
anne.koskela@oulu.fi
Esitelmäni liittyy tutkimukseeni, joka käsittelee ulkomaalaistaustaisten yliopistoopiskelijoiden suomen kielen oppimista. Tavoitteena on tuottaa tietoa akateemisesti
koulutetun suomenoppijan oppimisprosessista. Tässä esitelmässä tarkastelen erilaisten
viestinnällisten konstruktioiden kehittymistä oppijankielessä.
Tarkastelun kohteena on oppijan puhuma kieli, jonka kehittymistä seuraan
kielenoppimisen alkuvaiheessa (A1-tasolta A2-tasolle). Aineistona ovat kahden yliopistoopiskelijan puheentuottamistallenteet, jotka koostuvat haastatteluista ja kuvasarjasta
kertomisista.
Siitä, miten kieltä opitaan ja omaksutaan, on olemassa monenlaisia käsityksiä.
Funktionaalisen käsityksen mukaan esimerkiksi opetuksessa ei pidä painottaa yksittäisten
sanojen tai morfeemien mieleen painamista tai syntaksin virheettömyyttä. Tämä tukee
ajatusta siitä, että kieltä opitaan tietynlaisina konstruktioina. Tärkeää on myös oikea ajoitus:
oppimisen kannalta oikeisiin asioihin, oikeaan aikaan keskittyvä opetus nopeuttaa oppimista.
Teoreettinen viitekehys on vielä avoinna, mutta työssä voisi hyödyntää Fillmoren
kehittämää konstruktiokielioppia. Kielenkäyttö ja muoto nähdään mallissa kokonaisuutena,
jota ei voi erotella. Malli soveltuu siis myös erilaisten fraasien ja vakiintuneiden rakenteiden
kieleen ilmaantumisen ja niiden kehittymisen tutkimiseen. Sovellan mallia poimimalla
aineistosta oppijan käyttämiä viestinnällisiä konstruktioita (esim. fraasit, vakiintuneet
rakenteet) ja seuraamalla niiden muuttumista eri vaiheissa oppimista.
Tutkimus noudattaa kvalitatiivisen tutkimusotteen periaatteita. Tarkastelemalla sitä,
mitä viestinnällisiä konstruktioita oppijankielessä on oppimisen eri vaiheissa, tunnistan,
rajaan ja kuvaan olennaisen tiedon. Tämä tieto on luonteeltaan deskriptiivistä.
Konstruktioiden muuttumisen seuraamisen avulla puolestaan tarkastelen tutkimusongelmaa
kielitaidon kehittymisen näkökulmasta. Saatu tieto on deskriptiivistä mutta myös
luokittelevaa.
Olen poiminut tallenteista ilmauksia, joiden avulla oppija kertoo johonkin
menemisestä ja jostakin tulemisesta (esim. työhön menemisestä ja elokuvissa käymisestä
sekä lomalle lähtemisestä). Näen nämä ilmaukset edellä esitetyn kaltaisina konstruktioina,
jotka koostuvat verbistä ja paikkaa ilmaisevasta sanasta. Oppijat osaavat kuvasta kertoessaan
heti oppimisen alkuvaiheessa rakentaa yksinkertaisia liikkumista ilmaisevia konstruktioita
(esim. käydä-verbi + jossakin). Vapaassa puheessa, joka on siis tuotettu haastattelutilanteessa, esiintyy tällaisia ilmauksia vain vähän ja ne eivät ole kielen rakenteen mukaisia.
Viesti kuitenkin välittyy. Kertoessaan kuvasta oppijat hyödyntävät paremmin kurssilla
oppimiaan fraaseja (kuvasarjassa on tuttuja asioita, joita on käsitelty kurssilla). Puhuessaan
spontaanisti he eivät käytä samoja konstruktioita, vaikka esimerkiksi kertovat menemisestään
johonkin.
Aihe tuo lisävalaistusta puhutun oppijankielen kehittymiseen eri vaiheissa oppimista.
Tutkimustulokset tuovat oman lisänsä suomi toisena kielenä -tutkimuskenttään, ja niiden
avulla voidaan kehittää suomi toisena kielenä -opetusta.
Asiasanat: akateeminen suomenoppija, kielenoppiminen, oppijankieli, oppimisprosessi,
viestinnälliset konstruktiot
46
Lähteet
Aalto, E., Mustonen, S. – Tukia, K. 2009. Funktionaalisuus toisen kielen opetuksen lähtökohtana. Virittäjä 113
(3), 402–423.
Aalto, E., Mustonen, S. – Tukia, K. 2010. Oppimisen prosessia ohjaamassa. Teoksessa Tani, H. & Nissilä, L.
(toim.), Tasolta toiselle – Opas kielitaidon tasojen kuvausasteikon käyttöön suomi toisena kielenä opetuksessa. Opetushallitus. Helsinki.
Fried, M. – Östman, J-O. 2004. Construction Grammar: A Thumbnail sketch. Teoksessa Östman, J-O. & Fried,
M. (toim.), Construction Grammar in a Cross-Language Perspective. Bejamins. Amsterdam.
Kynsijärvi, T. 2007. Se johtuu siitä, että minulla oli muistinmenetys – Olla-verbirakenteiden kehkeytyminen
oppijankielessä. Pro gradu -tutkielma. Jyväskylän yliopiston kielten laitos.
Suni, M. 2008. Toista kieltä vuorovaikutuksessa. Kielellisten resurssien jakaminen toisen kielen omaksumisen
alkuvaiheessa. Jyväskylä Studies in Humanities 94. Jyväskylä. Jyväskylän yliopisto.
47
Uusia työkaluja sanaston opettamiseen ja opiskeluun
Kumpulainen, Marjo; Tammimies, Tanja
Oulun Aikuiskoulutuskeskus
marjo.kumpulainen@oakk.fi; tanja.tammimies@oakk.fi
Jantunen, Jarmo Harri
Oulun yliopisto
jarmo.jantunen@oulu.fi
Suomen kielen opetuksessa sanaston opettaminen on pitkään tukeutunut joko oppikirjojen
kappaleiden tai eri teemoihin koottujen sanalistojen opiskeluun ja yksittäisistä sanoista
koottujen lauseiden tuottamiseen. Kieli ei kuitenkaan ole tässä suhteessa täysin vapaata;
useimmat sanat esiintyvät tietynlaisissa konteksteissa, usein vieläpä tietyissä kieliopillisissa
muodoissa (esim. Jantunen 2009). Kokemuksemme mukaan käytännön tasolla
kontekstuaalisuuden opettaminen ja sen oppimateriaaleissa näkyminen on vielä vähäistä.
Kielen fraseologisia piirteitä on kyllä esitelty suomen kielen sanakirjoissa ja
oppimateriaaleissa (esim. Jönsson-Korhola & White 1999, Muikku-Werner ym. 2008), mutta
kielen rutiineja, idiomeja ja rektioita vapaammin varioivat tapaukset ovat jääneet
vähemmälle huomiolle.
Vaikka S2-oppimateriaalia on runsaasti saatavilla, on se pääasiassa suunnattu joko
alkeiden tai pelkkien kielen rakenteiden opiskeluun (Jokinen ym. 2011). Kun riittävä
perussanasto ja rakenteellinen tieto kielestä on saavutettu, tärkeimmäksi kielen opiskelussa
muodostuu sanaston oikeanlainen käyttö ja monipuolisen sanaston hallitseminen. Ilman
opiskelua ja oppimateriaalia edistyneenkin kielenoppijan on vaikea tunnistaa esimerkiksi
sanojen tyypillisiä käyttöympäristöjä.
Sanaston opettamiseen ja opiskeluun soveltuvassa täysin uudentyyppisessä ConLexisverkkosanakirjassa sanat esitetään niiden todellista käyttöä kuvaamalla. Ennen sanaartikkelien kirjoittamista jokaisen sanan käyttötapa on tutkittu hyödyntämällä sähköistä
tekstikorpusta, Suomen kielen tekstipankkia, joka koostuu pääasiassa sanomalehtiteksteistä.
Sanakirjaprojekti on käynnistynyt vuonna 2008. Tänä vuonna sanakirjan käytettävyyttä on
parannettu sanakirjan sanoihin tuotetuilla ConPraxis-harjoituksilla. Harjoituksiin on poimittu
materiaalia erilaisista Internet-teksteistä sanakirja-artikkeleihin kootun tiedon pohjalta.
Sana-artikkeleissa on sanan merkityksen lisäksi tietoa sanan tavallisimmista
kollokaateista, synonyymeista ja antonyymeista ja esimerkkejä sanojen käytöstä, joten se
antaa kielenoppijalle malleja kielen tyypillisyydestä ja opettajalle tietoa sanojen ja ilmausten
käyttötavoista, esiintymisympäristöistä ja esimerkiksi synonyymien eroista. Näin opettaja ei
joudu nojaamaan sanaston opettamisessa pelkästään intuitioonsa. Sanakirjaa ja
sanastoharjoituksia ovat olleet toteuttamassa Oulun Aikuiskoulutuskeskus, Oulun yliopisto ja
Opetushallitus.
Lähteet
Jantunen, Jarmo Harri 2009: "Minulla on aivan paljon rahaa" – Fraseologiset yksiköt suomen kielen
opetuksessa. Virittäjä 3/2009. s. 356–381.
Jönsson-Korhola, Hannele & White, Leila 1999: Tarkista tästä. Suomen sanojen rektioita suomea vieraana
kielenä opiskeleville. Toinen, korjattu painos. Finn Lectura, Helsinki.
Jokinen, Päivi, Immonen-Oikkonen, Pirjo & Nissilä, Leena (toim.) 2011: Kommentoitu luettelo
maahanmuuttajataustaisten opetuksen ja koulutusten materiaaleista. Opetushallitus, Helsinki.
48
Muikku-Werner, Pirkko, Jantunen, Jarmo Harri & Kokko, Ossi 2008: Suurella sydämellä ihan sikana. Suomen
kielen kuvaileva fraasisanakirja. Gummerus, Helsinki.
49
Lähisukukielen aspektin ilmaisemisen vaikeuksia viron- ja suomenkielisillä oppijoilla
Kuusk, Margit
Tarton yliopisto
margit.kuusk@ut.ee
Esitelmäni lähtökohtana on viron ja suomen kielen aspektin ilmaisemisen keinojen
kontrastiivinen analyysi ja sen tulosten vertaileminen oppijakielen korpusten materiaaliin
(Eesti vahekeele korpus (EVKK) ja International Corpus of Learner Finnish (ICLFI)).
Tavoitteina on selvittää, millaisten keinojen avulla suomenkieliset vironoppijat ja
vironkieliset suomenoppijat ilmaisevat aspektia kohdekielissä (viron ja suomen kielessä) ja
millainen on lähdekielen vaikutus.
Aspekti on käsite, jolla tarkoitetaan lauseen rakenteen eri tasoilla ilmeneviä tilanteen
keston ilmaisemiseen liittyviä seikkoja. Puhutaan lauseen aspektista, verbi-ilmauksen
aspektuaalisesta tilannetyypistä ja verbin omasta aspektimerkityksestä (ISK 2004: 1430).
Suomen ja viron kielessä ei ole sellaista morfologista tai derivatiivista systeemiä aspektin
ilmaisemiseksi kuin monissa muissa maailman kielissä. Suomen ja viron kielessä aspektia ei
voida käsittää ainoastaan verbi- vaan koko lauseen kategoriana (Sulkala 1996: 169, Seilenthal
1988: 53).
Aspektia ilmaistaan viron ja suomen kielessä pääosin totaali- tai partitiiviobjektilla.
Muita aspektin ilmaisemisen keinoja ovat verbin aikamuodot, verbisemantiikka, subjektin
sijavaihtelu, määräadverbiaalin sijavaihtelu, paikan, ajan ja tilan adverbiaalien käyttö ja
derivaatio.
Aspektin ilmaisemisessa viron ja suomen kielessä on myös eroavaisuuksia.
Esitelmässäni keskitynkin niistä kahteen: viron kielen perfektiivisyysadverbien (ära, välja,
maha, läbi, üles, peale) käyttöön suomenkielisillä oppijoilla ja kvasiresultatiivisten lauseiden
aspektin ilmaisemiseen vironkielisillä oppijoilla.
Korpusmateriaalin avulla pyrin vastaamaan seuraaviin kysymyksiin: Käyttävätkö
vironoppijat ylipäätään adverbillisiä yhdysverbejä? Pystyykö kieltä käyttämään ilman niitä?
Kun aspektin ilmaisemista lähisukukielessä yleensä ei opeteta vaan edellytetään, että
oppijat omaksuvat sen helposti lähdekielen kautta, niin käyttävätkö vironkieliset
suomenoppijat kvasiresultatiivisissa lauseissa ainoastaan partitiiviobjektia niin kuin
vastaavissa vironkielisissä lauseissa vai huomaavatko suomen kielen tässä kohdassa eroavan
äidinkielestään (sm tiesin sen, vir teadsin seda)?
Asiasanat: suomenkieliset vironoppijat, vironkieliset suomenoppijat, lähdekieli, kohdekieli,
aspekti, adverbilliset yhdysverbit, kvasiresultatiivinen lause
Lähteet
ISK 2004 = Auli Hakulinen (päätoimittaja), Maria Vilkuna – Riitta Korhonen – Vesa Koivisto – Tarja Riitta
Heinonen – Irja Alho. Iso suomen kielioppi, Suomalaisen Kirjallisuuden Seuran Toimituksia 950.
Sulkala, Helena 1996. Expression of Aspectual Meanings in Finnish and Estonian. – Mati Erelt (toim.),
Estonian: typological Studies I, 165–225. Tartu Ülikooli eesti keele õppetooli toimetised 4. Tartu: Tartu
Ülikooli Kirjastuse trükikoda.
Seilenthal, Tõnu 1988. Aspektist ja muust eesti ja soome keeles. – Peep Nemvalts, Päivi Rintala (toim.),
Lähivertailuja 3, 52–59. Turun yliopiston suomalaisen ja yleisen kielitieteen laitoksen julkaisuja 34.
Turku.
50
Mitä kaikkea viroksi voi tehdä, mutta suomeksi ei
Kuusk, Margit; Nurk, Anu
Tarton yliopisto
margit.kuusk@ut.ee; anu.nurk@ut.ee
Tois(t)en kiel(t)en opettaminen on antoisaa, koska se ohjaa havaitsemaan usein uusia asioita
myös omasta äidinkielestä. Vironkielisten suomenoppijoiden tuottamat sanastovirheet ovat
panneet meidät pohtimaan viron kielen teha-verbi-ilmausten vastineita suomen kielessä.
Viron kielen teha-verbiä käsitellään transitiivisena yleisverbinä (lihtverb) ja
merkitykseltään ns. tyhjänä verbinä (viron ’tugiverb’), jonka avulla viron kielessä useimmiten
muodostetaan verbikeskeisiä pysyviä yhdistelmiä (Muischnek 2004: 577). Lapset omaksuvat
tehdä-verbin käytön ensimmäisenä verbinä ja näin myös toisen kielen oppijatkin heti
oppimisen alkuvaiheessa.
”Eesti keele seletava sõnaraamatu” (EKSS) mukaan teha-verbillä on 18 eri
merkitystä. Suomen vastineiden löytäminen niille ei ole mahdollista viron kielen mallien
kautta.
Esitelmässämme käsittelemme näitä tehdä-verbin käyttötapauksia, joiden
ilmaiseminen tuottaa vironkieliselle suomenoppijaille syystä tai toisesta vaikeuksia.
Esimerkiksi viron teha-verbi korvataan suomen kielessä muulla verbillä: eksamit teha
‘suorittaa kokeita’; kun suomen ’tehdä’ tarkoittaa nimenomaan valmistamista: vir teen suitsu,
vrt. sm teen tupakkaa, ’poltan tupakkaa’; suomen kielessä käytetään vain yleisverbiä, ei
verbi-ilmausta: meiki teha ’meikata’.
Tutkimusaineistomme on peräisin ICLFI-korpuksesta, osin myös omista
opetuskokemuksistamme.
Suomenkieliset vironoppijat eivät kohtaa samanlaista ongelmaa, koska suomen
yleisverbin sijasta käy viron kielessäkin yleensä vain verbi (meikata ’meikida’). Sen lisäksi
Suomessa on ohjaileva kielenhuolto aina suositellut ”varomaan substantiivitautia,
ilmaisutapaa, jossa teonnimet ja ominaisuudennimet pyrkivät anastamaan ilmaisukykyiselle
predikaattiverbille kuuluvan aseman” (Itkonen 1988: 99). Sisällöltään tyhjinä verbeinä on
suomessa pidetty esim. olla, suorittaa, tehdä, osoittaa, panna, tapahtua.
Asiasanat: vironkieliset suomenoppijat, viron teha-verbiä sisältävät ilmaukset, tyhjä verbi,
virheanalyysi, transferi
Lähteet
EKSS = Eesti keele seletav sõnaraamat, http://www.eki.ee/dict/ekss/
Muischnek, Kadri 2004. Verbi ja noomeni püsiühenditest eesti keeles. Keel ja Kirjandus nr 8, 574–589.
Itkonen, Erkki 1988. Kieliopas. 4., tarkistettu painos. Helsinki.
51
Viron kieli toisena kielenä -opetuksesta Tarton yliopistossa 1820-luvun lopulla
Laanekask, Heli
Oulun yliopisto, Tarton yliopisto
heli.laanekask@oulu.fi
Viron ja suomen kielen lehtoraatti perustettiin Tarton yliopistoon 12. syyskuuta 1803.
Samaan aikaan perustettiin venäjän kielen ja latvian kielen lehtoraatit. Lehtorien tehtävänä oli
paikallisten väestöryhmien kielten opettaminen saksankielisille opiskelijoille, tuleville
virkamiehille, opettajille ja pappismiehille. Tarkastelen tässä esitelmässä stud. theol. Wilhelm
Julius Moritzin viron kielen luentomuistiinpanoja vuosilta 1828–1829. Käsikirjoitus on
tallella Viron kulttuurihistoriallisessa arkistossa Tartossa. Tarton yliopiston viron kielen
lehtorina toimi 1826–1837 Johann Samuel Friedrich Boubrig. Opetuskielenä oli saksa,
kohdekielen esimerkkejä löytyy muistiinpanoista sekä pohjoisviron että eteläviron
kirjakielestä.
Esitelmässäni käytän kvalitatiivista tarkastelutapaa. Tavoitteena on selvittää
Boubrigin viron kieli toisena kielenä -opetuksen sisältöä, opetuskirjallisuutta sekä
opetuksessa käytettyjä metodeja. Pohdin myös, millä tavalla kohdekielen kieliopin teoriaan
keskitttynyt opetus edesauttoi viron kielen käytännön osaamista, jota silloin vaadittiin
esimerkiksi Viron alueen seurakuntien pappisvirkoja hakevilta. 1810–1830-lukujen Virossa
käytiin vilkasta julkista keskustelua yhteisen kirjaviron tavoittelusta. Tarkoitus on tehdä
havaintoja myös siihen liittyvistä Boubrigin kannanotoista.
Asiasanat: viron kieli toisena kielenä -opetus, kirjaviron historia
Lähteet
Ariste, Paul 1979. Johann Samuel Friedrich Boubrig. – Tartu ülikooli ajaloo küsimusi VII, 42–51. Tartu: Tartu
Riiklik Ülikool.
Laanekask, Heli 2003. Johann Samuel Friedrich Boubrigi kiri Karl Gottlob Sonntagile. – 200 aastat eesti keele
ülikooliõpet. 1803 eesti ja soome keele lektoraat Tartu ülikoolis, 61–87. Tartu Ülikooli eesti keele
õppetooli toimetised 25. Tartu: Tartu Ülikool.
Laanekask, Heli 2007. Specimen eruditionis ehstonicae. – Harri Mantila & Merja Karjalainen & Jari Sivonen
(toim.), Merkityksen ongelmasta vähemmistökielten oikeuksiin. Juhlakirja professori Helena Sulkalan
60-vuotispäivänä, 125–142. Acta Universitatis Ouluensis B. Humaniora 79. Oulu: Oulu University
Press.
Moritz, Wilhelm Julius. Ehstnische Sprachlehre. Eesti Kirjandusmuuseumi Eesti kultuurilooline arhiiv, fond
192, mapp A78.
Tamul, Sirje 2003. Veel kord Tartu ülikooli taasavamise ja eesti keele lektori küsimusest. – 200 aastat eesti
keele ülikooliõpet. 1803 eesti ja soome keele lektoraat Tartu ülikoolis, 14–27. Tartu Ülikooli eesti keele
õppetooli toimetised 25. Tartu: Tartu Ülikool.
52
Suomen kielen oppija verkossa
Lehtonen, Tuija
Jyväskylän yliopisto
tuija.lehtonen@jyu.fi
Sosiokulttuurisen kielenoppimiskäsityksen mukaan kielenoppiminen nähdään sosiaalisena ja
dynaamisena toimintana, joka on tiiviisti sidoksissa arjen käytänteisiin ja jossa muiden
ihmisten rooli on keskeinen (Lantolf & Thorne 2006; Pavlenko & Lantolf 2000; van Lier
2000). Kielenoppimisen verkko-oppimisympäristöt tarjoavat yhden sosiaalisen areenan, jossa
kielenoppijat muodostavat erilaisia yhteisöjä ja jossa oppijat voivat toimia eri tavoin
vuorovaikutuksessa keskenään: he voivat esimerkiksi vaihtaa sähköpostiviestejä, osallistua
verkkokeskusteluihin ja chatata. Kielenoppimisen näkökulmasta keskeistä onkin juuri
yhteisöjen toimintaan osallistuminen (Lantolf & Thorne 2006) sekä tässä toiminnassa
avautuvat affordanssit eli tarjoumat (van Lier 2000).
Yhteisöjen toimintaan osallistumista voidaankin tukea erilaisten tehtävätyyppien
avulla, kuten rakentamalla esimerkiksi neuvottelua vaativia tilanteita tai ohjaamalla oppijoita
neuvotteluun ja ongelmanratkaisuun. Nämä eivät ole ainoastaan tärkeitä kohdekielen taitoja,
vaan ne myös edistävät toisen kielen oppimista (ks. enemmän Long 1996). Vaikka
oppimistehtävätyyppien valinnan avulla voidaan myös suunnitelmallisesti rakentaa
oppimisen oikea-aikaista tukea eli scaffoldingia (ks. Lantolf & Thorne 2006) osaksi
virtuaalisia oppimisympäristöjä, keskeisiä tuen tarjoajia ovat kuitenkin toiset vertaisoppijat ja
ohjaaja.
Esityksessäni tarkastelen sitä, millaista tukea suomi vieraana kielenä -oppijat jakavat
toisilleen sekä miten tehtävät ohjaavat oppijoita toimimaan vuorovaikutuksessa keskenään.
Aineistona ovat yhdeksän viikon mittaiselle verkkokurssille osallistuneen yhden kolmen
hengen pienryhmän verkkokeskustelut sekä kurssin oppimistehtävät. Tutkimus toteutetaan
kvalitatiivisin menetelmin etnografisella otteella.
Asiasanat: suomi toisena ja vieraana kielenä, kielen oppiminen verkossa
Lähteet
Lantolf, J. P. – Thorne, S. 2006. Sociocultural theory and the genesis of second language
development. Oxford University Press.
Long, M. 1996. The role of linguistic environment in second language acquisition – W. C. Ritchien & T. K.
Bahtia (toim.). Handbook of second language acquisition. 413 – 468. San Diego: Academic Press.
Pavlenko, A. – Lantolf, J. P. 2000. Second language learning as participation and the reconstrution of selves. –
J. P. Lantolf (toim.), Sociocultural theory and second language learning. 155–177. Oxford: Oxford
University Press.
van Lier, L. 2000. From input to affordance: Social-interactive learning from an ecological perspective. – P.
Lantolf (toim.), Sociocultural theory and second language learning, 245–260. Oxford: Oxford
University Press.
53
On the development of word forms in the written L2 Finnish of adults and teenagers
Martin, Maisa
University of Jyväskylä
maisa.martin@jyu.fi
The development of a second language requires both the ability to produce word forms and
the ability to use them in appropriate contexts. The latter has traditionally been seen as the
domain of syntax, the former as morphology, which in turn, particularly in fennistic
literature, overlaps with phonology, as many phenomena can be viewed as either
phonologically or morphologically controlled. Furthermore, the words also have meanings,
with all the information and nuances covered by that term. Thus the learning and use of L2
words, which for the learner is one single task, becomes divided between several areas of
linguistic inquiry. This is also displayed in textbooks and teaching: the meanings of words are
listed separately in the end of the lessons, the inflection is dealt with in grammar sections
which either precede or follow the presentation of the syntactic use of the morphological
forms.
This admittedly fractured view of language makes sense to the researcher and the
teacher trained in traditional linguistics. It may also help the well-educated learners to acquire
the necessary knowledge piece by piece to make sense of the language they see and hear.
Many learners of Finnish, however, are now exposed to the language and have to start using
it without the pre-requisite analytic grammar skills, either because their previous education
has not provided them with such ways of thinking or because they are too young to have
learnt them yet at school. Nevertheless, they learn and use Finnish.
Thus the main question presented in this paper is: Is it possible to separate the
learning of word forms, i.e. the morphological development, from the use of word forms, i.e.
the syntactical development, by looking at the written learner data provided by the currently
available corpora? The two corpora investigated for this purpose are ICLFI corpus of Oulu
University, consisting of writing samples of adults who have learnt Finnish at universities
across the world, and the Cefling corpus of Finnish written by 12–16-year-olds who learn
Finnish as L2 in Finnish schools. This leads into a sub-question: Does the theoretically
separate focus on morphology and syntax, usually provided in university teaching of Finnish,
lead to different results as to the acquisition of word forms, as compared with the
“immersion” approach where Finnish is mainly learned as a side product of going to school
in Finnish?
The aim of the presentation is methodological: Before any quantitative study of the
development of the Finnish word forms in the two corpora can be embarked on, one has to
search for tools and concepts to be utilized to describe the word forms in a way that allows
both for the traditional morphology vs. syntax division and a view of word forms as a part of
larger units. Both construction grammar and the study of formulaic utterances will be used as
resources of this re-thinking of the acquisition of Finnish morpho-syntax.
Keywords: morpho-syntax, word forms, acquisition of L2 Finnish
References
Cefling, see https://www.jyu.fi/hum/laitokset/kielet/cefling
ICLFI, see http://www.oulu.fi/hutk/sutvi/oppijankieli/en/ICLFI_Corpus.html
54
Do I use native syntax in a non-native language? or Do I use in a native language nonnative syntax?: A corpus-based study on complement/adjunct placement in learner
language
Martínez-Insua, Ana Elina; Pérez-Guerra, Javier; Tizón-Couto, Beatriz
Universidade de Vigo
jperez@uvigo.es
This study deals with the integration of syntactic complements and adjuncts (or modifiers) in
a number of phrasal projections in learner English in an attempt to determine whether the
production of such constituents in English by non-native speakers is influenced or not by
their first language. The analysis is based on sequences of complements and adjuncts in verb
phrases (in (1)), noun phrases (in (2)) and adjective phrases (in (3)):
(1a) deal [with the construction] [in a somewhat strange way which will lead to odd results]
(1b) deal [in a somewhat strange way which will lead to odd results] [with the construction]
(2a) the author [of this book] [from London]
(2b) the author [from London] [of this book]
(3a) keen [on music] [to a large extent]
(3b) keen [to a large extent] [on music]
The aim of this paper is to check the distributional consequences that the placement of
adjuncts and complements has for the parsing of the phrases in which they occur. More
specifically, in this paper we determine, firstly, whether native and nonnative English data are
in keeping or not with Hawkins’ (1994, 2004) hypothesis that the sequences of constituents in
a sentence are connected in an optimal way whose goal is to reduce processing effort for both
the speaker and the hearer, and, more specifically, whether this hypothesis is relevant
especially to examples of complementation or not. Secondly, we investigate whether the
placement of adjuncts and complements in the phrase by non-native speakers of English is
influenced by their first language or not. On one hand, the theoretical framework is the
performance grammar described in Hawkins (1994, 2004). On the other hand, this study is
couched in frameworks which analyse student’s interlanguage (see Eubank et al. 1997 for
recent definitions) and approximative linguistic systems (Nemser 1971) in general, and
follows Granger’s (1996) comprehensive Integrated Contrastive Model (ICM; see Gilquin
2008: 6–8) to interlinguistic analysis, which includes a component where the original data
from one language is compared with original data from another language, as well as as an
additional module where native language is compared with a non-native variety of the
language.
We will analyse data retrieved from the following corpora:
– the 100,000-word learner spoken corpus of English VICOLSE, produced by Spanish
University students of English (Tizón-Couto 2012),
– the native corpus LOCNEC (Centre for English Corpus Linguistics, Université catholique
de Louvain), which is used as the English native control corpus, and
– a selection of speech-based passages of the twentieth-century oral component of Corpus del
Español, compiled by Mark Davies (http://corpus.byu.edu), which is used as the Spanish
native control corpus.
A major issue in ICM is the degree of comparability between the data (register, topic
or task, target language proficiency, the language varieties included, textual data, design
criteria, purpose, and standardisation and documentation), especially in the case of learner
corpora, which are unique and complex sets of data especially in terms of authenticity.
55
VICOLSE and LOCNEC are comparable corpora since the compilation of the former has
followed the design of tasks, topics and transcription conventions used in LOCNEC, inherited
from the LINDSEI project. These two corpora however differ in a number of features. First,
as regards the type of participants, the subjects in VICOLSE are Spanish non-native
university students of English and those in LOCNEC are British native university students.
Second, although both corpora can be considered similar as far as the choice for topics is
concerned, in LOCNEC the tasks are carried out in the form of an interview, while VICOLSE
consists of recordings in a lab. Whereas the considerably common design of VICOLSE and
LOCNEC eases the possibilities of comparison between the databases, a careful selection of
materials from Corpus del Español has proved necessary in order to warrant comparability.
This paper concludes, first, that, especially in verb and adjective phrases, the
performance solution “complement plus adjunct” is preferred both in native and in learner
language. And, second, the fine-grained analysis applied to the corpus data shows that the
syntactic principle “complements-first” is stronger in native English than in native Spanish
and, in consequence, the examples retrieved from the learner database are subject to
“complements-first” to a larger extent than those in the native Spanish corpus.
References
Eubank, Lyn –, Larry Selinker – Michael Sharwood Smith. 1995. The current state of Interlanguage.
Amsterdam: John Benjamins.
Gilquin, Gaëtanelle. 2008. “Combining contrastive and interlanguage analysis to apprehend transfer: detection,
explanation, evaluation”. In Gaëtanelle Gilquin – Szilvia Papp – María Belén Díez-Bedmard eds.
Linking up contrastive and learner corpus research. Amsterdam: Rodopi, 3–33.
Granger, Sylviane. 1996. “From CA to CIA and back: an integrated approach to computerized bilingual and
learner corpora”. In Karin Aijmer – Bengt Altenberg – Mats Johansson eds. Languages in contrast.
Text-based cross-linguistic studies. Lund: Lund University Press, 37–51.
Hawkins, John A. 1994. A performance theory of order and constituency. Cambridge: Cambridge University
Press.
Hawkins, John A. 2004. Efficiency and complexity in grammars. Oxford: Oxford University Press.
Nemser, William. 1971. “Approximative systems of foreign language learners”. International Review of Applied
Linguistics 9/2: 115–123.
Tizón Couto, Beatriz. 2012 forthcoming. Clausal complements in native and learner spoken English. A corpusbased study with VICOLSE. Bern: Peter Lang.
56
”Luotettavat ystävät” viron ymmärtämisen apuna
Muikku-Werner, Pirkko
Itä-Suomen yliopisto
pirkko.muikku-werner@uef.fi
Viron ja suomen vertailevaa tutkimusta on tehty paljon, ja nimenomaan näiden
lähisukukielten välisten erojen selvittämistä on aina pidetty tärkeänä. Samankaltaisuus on
kuitenkin oppimisen kannalta yhtä keskeistä. Yllättävän vähän on kiinnitetty huomiota sen
myönteiseen vaikutukseen. Nykyisin kielisukulaisuuden hyöty on kuitenkin pystytty
osoittamaan suomen- ja vironkielisten oppijoiden oppimiskäsityksiä ja -kokemuksia
käsittelevissä tutkimuksissa (ks. tarkemmin Kaivapalu 2007, 2009).
Varsin niukasti on tietoa siitä, miten lähisukukielten yhtäläisyyksiä hyödynnetään
pyrittäessä ymmärtämään viroa tai suomea niissä tapauksissa, jolloin kyseistä kieltä ei ole
lainkaan opetettu, ja siitä ei ole kuin joitakin epäjärjestelmällisiä havaintoja. Itä-Suomen,
Tallinnan ja Jyväskylän yliopistojen yhteistyönä on aloitettu REMU-hanke (Receptive
Multilingualism), jonka tavoitteena on tutkia lähisukukielten ymmärtämisen edellytyksiä
silloin, kun muodollinen opetus puuttuu. Yhtenä ulottuvuutena ovat samankaltaisuuden edut
mutta myös sen tuottamat ongelmat (esim. petolliset ystävät). Tämän esitelmän tavoitteena on
selvittää, millaisia ovat viron sanastolliset ”luotettavat ystävät”, miten paljon ne eroavat
kirjoitusasultaan suomen sanoista ja millaisiin ymmärtämistä edistäviin seikkoihin
informantit kiinnittävät huomiota yrittäessään ymmärtää vironkielistä sanastoa. Onko oikein
ymmärretyistä sanoista ja arvioista löydettävissä joitakin yleisiä suuntia tai strategioita?
Ovatko esimerkiksi viron loppuheittoiset sanat helpompia kuin ne, joissa sanansisäiset
vokaalit ovat erilaisia kuin suomenkielisissä vastineissa.
Itä-Suomen yliopiston suomen kielen opiskelijoita (33:a opiskelijaa) pyydettiin joko
selostamaan vironkielisen tekstiä ja/tai kääntämään sitä. Heiltä kysyttiin myös strategioista,
joita he hyödynsivät merkitystä selvittäessään. Tarkasteltavana on siis käännettyjen tuotosten
ohella metakieli, joka käsittelee ymmärtämisen edellytyksiä ja sen edistämistä auttavia
keinoja. Käytetyn tekstin sisältö on opiskelijoille osittain helppo, sillä siinä puhutaan
kielisukulaisuudesta. Näin ollen heillä on aiheen tuttuuden kautta mahdollisuus ymmärtää
asiakokonaisuuksia. Myös Viron historian tuntemuksesta on apua.
Aiemmista tutkimuksista poiketen fokus on puhtaasti leksikossa: halutaan katsoa,
millainen sana on helppo tunnistaa oikein. Petollisiin ystäviin ei tässä esitelmässä puututa.
Apuna merkityksiä etsittäessä käytetään esimerkiksi suomen murteita ja puhekieltä: arjen
havainnot äidinkielen varieteeteista edistävät sukukielisen vastineen tunnistamista.
Tutkimustuloksia on tarkoitus hyödyntää sanakirjoja ja oppimateriaalia laadittaessa.
Asiasanat: reseptiivinen monikielisyys, lähisukukieli, ymmärtäminen, sanasto, suomi, viro
Lähteet
Kaivapalu, Annekatrin 2007. Äidinkieli vieraiden kielten opiskelussa – etu vai haitta? – Olli-Pekka Salo – Tarja
Nikula – Paula Kalaja (toim.). Kieli oppimisessa – Language in Learning, 289–309. AFinLAn
vuosikirja 65. Jyväskylä: AFinLA.
Kaivapalu, Annekatrin 2009. Vironkielisen suomenoppijan äidinkieli – ongelma, haaste vai voimavara? –
Virittäjä 3, 382-402.
Kaivapalu, Annekatrin – Muikku-Werner, Pirkko 2010. Reseptiivinen monikielisyys: miten suomenkielinen
oppija ymmärtää viroa äidinkielensä pohjalta? – Pirkko Muikku-Werner – Maria-Maren Sepper (toim.),
Lähivõrdlusi. Lähivertailuja 20, 68–97.Tallinn: Eesti Rakenduslingvistika Ühing.
57
Petolliset ystävät – harhauttaja viron ymmärtämisessä?
Muikku-Werner, Pirkko; Paajanen, Ilona; Heinonen, Maria
Itä-Suomen yliopisto
pirkko.muikku-werner@uef.fi
Lähisukukielen ymmärtämistä edistää yhtäläisyyksien havaitseminen kielisukulaisten välillä.
Viro ja suomi muistuttavat paljon toisiaan rakenteellisesti, leksikaalisesti ja funktionaalisesti.
Viroon tutustuva saattaakin olettaa, että viro toimii suunnilleen samalla tavalla kuin suomi.
Ellei hänellä ei ole juuri mitään tietoa virosta, oletettu ja todellinen samankaltaisuus eivät
välttämättä kohtaa.
Tunnettu tosiasia on se, että yrittäessään ymmärtää toisiaan suomen- ja vironkieliset
etsivät apua kielten samankaltaisista sanoista tai ovat huojentuneita monista lähes identtisistä
kieliopillisista rakenteista. Valitettavasti tukeutuminen sanaston vastaavuuteen johtaa helposti
harhaan, sillä ”petolliset ystävät” tuottavat väärinkäsityksiä. Muissakin lähisukukielissä on
tällaista riskisanastoa (esim. ruotsin ja englannin välisistä petollisista ystävistä ks. Ringbom
1987). Luokkahuoneessa tai kursseilla sukukieltä oppivat ovat vaarasta hyvin tietoisia,
ovathan riskisanat hyvin tuttuja, ja niistä on oppikirjoissa ja muussa materiaalissa listoja (ks.
esim. Alvre & Vodja 1995). Viron kielestä ovat kiinnostuneita kuitenkin myös sellaiset
ihmiset, jotka eivät sitä varsinaisesti opiskele, mutta mieluusti ymmärtäisivät edes jotain.
Tässä esitelmässä tarkastellaan, miten viroa osaamaton lankeaa petollisiin ystäviin.
Oletuksena on ollut, että konteksti auttaa välttämään väärintulkintoja. Asian selvittämiseksi
laadittiin kolme erilaista testiä. Informanteilla ei ole ollut juuri mitään kokemusta viron
kielestä. Ensimmäisessä testissä he joutuivat ”arvaamaan” 30 virolaisen sanan merkitykset
(kaikki eivät olleet petollisia ystäviä). Toisessa testissä sanat oli sijoitettu lauseyhteyteen,
mutta eri lauseet eivät muodostaneet koherenttia tekstiä. Kolmannessa testissä kyse oli
yhtenäisestä tekstistä. Lisäksi informantteja pyydettiin kuvaamaan keinoja, joilla he päätyivät
ehdottamaansa merkitykseen.
Odotuksenmukaisesti petolliset ystävät aiheuttavat väärinymmärrystä erityisesti
silloin, kun sanat ovat irrallisia. Yllättävää on esimerkiksi se, että sana pealinn ’pääkaupunki’
ilman kontekstia saa enimmäkseen muita tulkintoja kuin petollisen ’päälinna’-tulkinnan.
Kontekstissa sen sijaan ’päälinna’-käännöstä on ehdotettu, koska se on jossain määrin
järjellinen vaihtoehto. Sen sijaan kontekstiton töötada lähes 100-prosenttisesti ymmärretään
’tööttäämiseksi’ eikä ’työskentelemiseksi’. ”Ystävysten” tulkinnassa myös äänteellisellä
läheisyydellä on tärkeä merkitys. Kaiken kaikkiaan kontekstin mukaantulo edistää
huomattavasti oikeiden ratkaisujen tekemistä. Vaikka tulos ei ole mullistava, eräät
yksityiskohdat lisäävät tietoa päättelyn kulusta. Prosessoinnista saatu informaatio on
hyödynnettävissä niiden ohjeistukseen, jotka haluavat tutustua viron kieleen mutta joilla ei
ole mahdollisuutta muodolliseen opetukseen.
Asiasanat: lähisukukielet, ymmärtäminen, sanasto, petolliset ystävät, konteksti, suomi, viro
Lähteet
Alvre, Paul – Vodja. Raul 1995. Pulma poikineen. Virolais-suomalainen vertailusanakirja. Helsinki: WSOY.
Laalo, Klaus 1992. Huvitav lugu – kiinnostava juttu. Suomen ja viron välinen sanaston riskiryhmä ja sen
taustaa. Helsinki: SKS.
58
Möller, Robert 2007. A computer-based exploration of the lexical possibilities of intercomprehension. Finding
German cognates of Dutch words. – Jan D. ten Thije – Ludger Zeevaert (toim.), Receptive
multilingualism. Linguistic analyses, language policies and dialectic concepts, 283–305. Amsterdam:
John Benjamins.
Ringbom, Håkan 1987. The role of the first language in foreign language learning. Clevedon: Multilingual
Matters.
Zeevaert, Ludger 2007. Receptive multilingualism and inter-Scandinavian semicommunication. Jan D. ten
Thije – Ludger Zeevaert (toim.), Receptive multilingualism. Linguistic analyses, language policies
and dialectic concepts, 103–135. Amsterdam: John Benjamins
59
Paikallissijojen funktioista ruotsinkielisten alkeistason suomenoppijoiden
kirjallisissa tuotoksissa
Määttä, Tuija
Umeå universitet
tuija.maatta@finska.umu.se
Esitelmässäni tarkastelen, missä eri funktioissa äidinkieleltään ruotsinkieliset suomenoppijat
alkeistasolle kuuluvilla suomi vieraana kielenä -kursseilla (Finska A 30 hp, Finska A1 15 hp
ja Finska A2 15 hp) käyttävät paikallisijoja kirjallisissa tuotoksissaan. Tutkimukseni
kohdistuu ainoastaan varsinaisiin paikallissijoihin (illatiivi, inessiivi, elatiivi, allatiivi,
adessiivi, ablatiivi; Määttä 2011, 155).
Tutkimusaineistonani on osa Ruotsin osakorpuksesta, joka sisältyy laajahkoon
digitaaliseen Kansainvälisen oppijansuomen korpukseen (International Corpus of Learner
Finnish, ICLFI; Jantunen 2011, 86−105). Aineistoni kirjalliset tuotokset on kerätty
lukuvuosina 2006−2009, ja aineisto sisältää 43 496 sanetta. Tuotokset edustavat erilaisia
tekstityyppejä: kertomuksia, kirjeitä, kortteja, päiväkirjoja, sarjakuvatekstejä ym. Opettajan
antamien otsikoiden aiheet liittyvät läheisesti oppikirjana käytetyn Suomen kielen
alkeisoppikirjan (Lepäsmaa & Silfverberg 1998, 2009) tekstien aiheisiin.
Tutkimusaineisto on analysoitu WordSmith Tools -ohjelmaan sisältyvällä Condordtyökalulla, jonka avulla aineistosta on saatu esiin yhteensä 4 408 eri paikallissijoissa
esiintyvää sanetta. Aikaisemmassa tutkimuksessani (Määttä 2011, 154−184) olen kartoittanut
ruotsinkielisten suomenoppijoiden käyttämien varsinaisten paikallissijojen yleisyyttä ja myös
sitä, missä määrin suomenoppijat käyttävät paikallissijoja norminvastaisesti. Tuloksista käy
selville, että norminvastaisia sijavalintoja on aineistossa vain 7 % (320 esiintymää), mikä
viittaa siihen, että ruotsinkieliset suomenoppijat hallitsevat suomen monimutkaisen
paikallissijasysteemin varsin hyvin. Norminvastaisissa tapauksissa paikallissijat vaihtelevat
keskenään tai paikallissijaa käytetään jonkin ihan muun sijan asemesta.
Paikallissijojen funktioiden analyysissa ovat mukana sekä norminmukaiset (4 088
esiintymää) että norminvastaiset esiintymät (320 esiintymää). Analyysissä ei ole huomioitu
tuotosten eri tekstityyppejä. Eri funktioiden esille saamiseksi aineisto on analysoitu
manuaalisesti, ja funktioiden määrittäminen ja jako pohjautuvat ISK:n esittelemiin tapauksiin
(ISK 2004, 1187−1206).
Analyysi osoittaa, että suomenoppijat käyttävät paikallissijoja useimmiten kolmessa
funktiossa, paikan ja ajan funktiossa ja habitiivissa ilmauksissa.
Eniten paikallissijoja käytetään nimenomaan erilaisten konkreettisten paikkojen funktioissa
(Joskus menen ensin kauppaan. Söyn aamiaista hotellissa. Timo jouksi ulos pankista.).
Oikean sijan valinta ei ole kuitenkaan aina hallinnassa vaan sisä- ja ulkopaikallissijat
sekoittuvat keskenään (Sitten minä menin asemaan. Uskon että haluan jäädä kotissa tänä
iltana.).
Aineistossa on runsaasti paikallissijaisia ajanilmauksia. Suomenoppijat kirjoittavat
esimerkiksi mitä eri vuorokauden- tai vuodenaikaan tapahtuu (Minä heräsin neljä amulla.
Talvella ei kukaan asu siellä.). Ajanilmausten joukossa on 14 jotakin määrättyä ajankohtaa
tarkoittavaa ilmausta, joissa tulisi käyttää essiiviä, mutta suomenoppija onkin valinnut sijaksi
adessiivin (Lauantai-aamulla he nousevat aikaisin. -- se ei muistaisi mitään seuraavalla
päivällä --.).
60
Kolmas funktio, joka on yleinen ruotsinkielisten suomenoppijoiden tuotoksissa, on
habitiiviset ilmaukset. Suurimmassa osassa on kyse jonkin esineen omistamisesta (Hänella
oli lyhyt valkea leninki --. -- minulla on ajokorttia.).
Alkeistason kursseilla suomenoppijoille opetetaan paikallissijojen perusmerkityksiä ja
-käyttöjä, jotka esitellään oppikirjassa. Joidenkin yksittäisten sanojen ja fraasien kohdalla
huomautetaan erikseen, onko niissä käytettävä sisä- tai ulkopaikallissijaa. Paikallissijojen
funktioista saamani tulokset vastaavat hyvin niitä tietoja, joita suomenoppijoiden oletetaan
hallitsevan, kun he kirjoittavat suomenkielisiä tuotoksia.
Asiasanat: korpuspohjainen tutkimus, oppijansuomi, paikallissijan funktio, ruotsi, suomi
Lähteet
ISK = Hakulinen, Auli − Maria Vilkuna − Riitta Korhonen − Vesa Koivisto − Tarja Riitta Heinonen − Irja
Alho 2004. Iso suomen kielioppi. Suomalaisen Kirjallisuuden Seuran Toimituksia 950. Helsinki:
Suomalaisen Kirjallisuuden Seura.
Jantunen, Jarmo Harri 2011. Kansainvälinen oppijansuomen korpus (ICLFI): typologia, taustamuuttujat ja
annotointi. − Annekatrin Kaivapalu (peatoim.), Lähivõrdlusi. Lähivertailuja 21, 86−105. Eesti
Rakenduslingvistika Ühing. Tallinn.
Lepäsmaa, Anna-Liisa − Leena Silfverberg 1998, 2009. Suomen kielen alkeisoppikirja. Helsinki: Oy Finn
Lectura Ab.
Määttä, Tuija 2011. Ruotsinkielisten alkeistason suomenoppijoiden paikallissijojen käytöstä. − Annekatrin
Kaivapalu (peatoim.), Lähivõrdlusi. Lähivertailuja 21, 154−184. Eesti Rakenduslingvistika Ühing.
Tallinn.
61
Viron kielen vaikutus suomen kielen verbien ja niiden rektioiden oppimiseen
Nissilä, Leena
Opetushallitus
leena.nissila@oph.fi
Tarkastelen virolaisten suomen kielen oppimista, erityisesti verbin- ja rektionvalintoja sekä
oppijan lähtökielen, opiskeluajan ja verbin tiettyjen ominaisuuksien vaikutusta niihin.
Tutkimusaineistona ovat 111 vironkielisen ja 15 venäjänkielisen suomenoppijan tuotokset
käännöstestissä, jossa tuli kääntää virosta suomeen 175 testilausetta. Vironkielisten aineisto
sisältää 19 425 ja venäjänkielisten 2625 verbin- ja rektionvalintaa. Pyrin tarkastelemaan myös
toisen kielen tuottamisprosessia ja erityisesti oppijoiden tekemiä vastausten editointeja
Scriptlog-aineiston avulla.
Aineiston analyysi osoittaa, että suomen kielen verbin- ja rektionvalinnat ovat
haastavia myös edistyneille virolaisille kielenoppijoille. He saavat verbin- ja
rektionvalintatestissä venäjänkielisiä paremmat tulokset, mutta heillä on vaikeuksia erityisesti
silloin, kun verbi on harvinainen tai viron ja suomen verbit ovat muodoltaan tai
merkitykseltään erilaisia. Haasteellisia ovat myös sellaisten verbien rektionvalinnat, joilla on
virossa ja suomessa eri rektiosija.
Verbien oppimiseen vaikuttavat taajuus, opiskeluaika, sanahahmon vastaavuus ja
tietyin ehdoin merkitysvastaavuus. Rektioiden oppimiseen vaikuttavat opiskeluaika ja
rektiosija sekä tietyin ehdoin verbin taajuus. Lähtö- ja kohdekielen järjestelmien
samankaltaisuus helpottaa oppijaa, mutta kielenoppijalle helpoimpia ovat kuitenkin frekventit
verbit huolimatta siitä, millaisia muita ominaisuuksia niillä on. Opetuksessa tulisikin
kiinnittää huomiota siihen, että opeteltavat sanat kohdataan usein. Viestintätilanteissa
käytettyjen sanojen frekvenssistä tulisi kerätä systemaattista tietoa opetuksen ja
oppimateriaalin laadinnan tueksi.
Tutkimus osoittaa, että L1-transfer on huomattavasti L2-transferia tuloksellisempaa.
Siitä huolimatta myös äidinkieleltään vironkielisille oppijoille suomen kielen verbien
merkitysten tarkkojen semanttisten erojen oppiminen on haasteellista, koska viron kielen
epäsuora negatiivinen L1-transfer vaikeuttaa sitä. Lähisukukielen opetuksessa tulisikin
huomioida ero sanaston leksikaalisen ja semanttisen kehityksen välillä.
Asiasanat: kielen oppiminen, kontrastiivinen tutkimus, kääntäminen, rektio, suomen
kieli, transfer, verbit, vieraat kielet, viron kieli
Lähteet
Nissilä, Leena 2011: Viron kielen vaikutus suomen kielen verbien ja niiden rektioiden oppimiseen. Oulun
yliopisto: Acta Universitatis Ouluensis B 99. Kirja on luettavissa verkkojulkaisuna osoitteessa:
http://herkules.oulu.fi/isbn9789514296161/isbn9789514296161.pdf.
62
Tuplatekstityksestä avain oppimateriaalikielen ja arkipuheen välisiin eroihin?
Peltola, Katja
Hanken Svenska handelshögskolan
katja.peltola@hanken.fi
Ahonen, Lili
Rijksuniversiteit Groningen
L.M.T.Ahonen@uva.nl
Erot (morfologiset, syntaktiset ja semanttiset, idiomaattisuuden aste) puhutun ja kirjoitetun
kielen välillä korostuvat arkipuheen ja ns. oppikirjakielen välillä. Viime vuosikymmenien
aikana eri kielimuotojen rajat ovat hämärtyneet mm. uusviestinnän seurauksena.
Arkipuhekielisyydet ovat yleistyneet sekä puhutussa mediassa että kirjoitetussa kielessä,
mutta kielenopetuksessa tätä ei juuri ole huomioitu. Yliopistollisen kielenopetuksen
ydinopetuksen tulee pysyä kirjakielessä: tavoitteena on kouluttaa työelämään korrektia kieltä
hallitsevia henkilöitä. Kielitaidon tarve ja opetuksen tarjonta eivät näin ollen kohtaa toisiaan.
Arkipuheen ja oppikirjakielen välisten erojen tasoittamisessa oppijoiden kielitiedossa
voi nähdä haasteen nykyiselle kielenopetukselle: miten sisällyttää oppijoiden kielitietoon
myös operationaalinen puhekielen tuntemus: niin, että sitä ymmärtää ja voi ehkä myös jonkin
verran aktiivisesti käyttää rekistereitä sekoittamatta. EU-alueen työvoiman vapaan liikkuvuuden sekä yleisen kansainvälistymisen seurauksena operationaalisesta puhekielen tuntemuksesta kohdekielellä (target language) on tullut entistä tärkeämpi kielitaidon osa-alue.
Pienimuotoisella pilottikyselyllä (kevät 2011; Peltola-Ahonen-Conijn) kartoitettiin,
missä määrin opiskelijat kokevat arkipuheen ongelmallisena ja löytyisikö tuplatekstityksestä
(osa)ratkaisua mahdolliseen ongelmaan. Tulokset osoittivat, että huomattavalle osalle suomea
vieraana kielenä opiskelleista arkipuhe oli ongelma ja sellaisena turhauttava. Vaikeimpana
pidettiin vierasta sanastoa. Edistyneet opiskelijat kokivat tuplatekstityksen hyödyllisenä
erityisesti lyhentyneiden sanamuotojen ja puhekielisen sanaston ymmärtämisessä ja
hahmottamisessa.
Tuplatekstityksessä harkiten valitun (sisällöllisiä kriteereitä mm. puhekielisyys,
viihteellisyys, puhetiheys, juonellisuus, kulttuurisidonnaisuus - teknisiä kriteereitä mm.
tekninen selkeys, kokonaisuus/katkelma) autenttisen off air -videomateriaalin puhekielisyydet
ja idiomit avataan tuplatekstityksellä seuraavasti:
Ylärivi: arkipuhekielellä: Tuut säki? / Jutskataan sit välkällä?/ Mä pelkäsin ihan
sikana.
Alarivi: yleiskielellä: Tuletko sinäkin?/ Jutellaan sitten välitunnilla./ Minua pelotti
hirveästi.
Vain kirjakielestä poikkeava kieliaines tekstitetään. Oppijalla on apuna taustoittava
teksti ja koko tekstitys tekstitiedostona. Oppijat ohjeistetaan hyvin, ja heidän edellytetään
katsovan materiaali opiskeluasenteella. Oppimistilanne on yksilöllinen.
Tarkoituksena on yrittää kehittää tuplatekstityksestä metodi, jolla operationaalinen
arkipuhekielen tuntemus siirtyisi opetuksen kiva tietää -vyöhykkeeltä ydinopetusta
täydentäviin taitoihin. Videomateriaalin viihteellisyyttä ja/tai kiinnostavuutta hyödyntämällä
puhekielen opetus ei kuormittaisi varsinaista opetusaikaa, vaan sen voisi mahdollisesti jättää
itseopiskelun varaan.
Asiasanat: tuplatekstitys, puhekieli, yleiskieli
63
Merkitysneuvottelut vironoppijoiden ja syntyperäisten vironpuhujien
vuorovaikutuksessa
Pool, Raili
Tarton yliopisto
raili.pool@ut.ee
Esitelmässä käsitellään aloittelevien viroa toisena kielenä oppivien ja viroa äidinkielenään
puhujien suullista vuorovaikutusta. Huomion keskipisteessä ovat merkitysneuvottelut joilla
tarkoitetaan keskustelun niitä osia, joiden kuluessa syntyy tarve selittää erikseen joitakin
ongelmallisia ilmaisuja. Merkitysneuvottelut ovat oleellisia keskustelun sujuvuuden kannalta
ja tarjoavat toisen kielen opiskelijoille myös mahdollisuuksia omaksua uusia kohdekielisiä
ilmaisuja vuorovaikutuksessa. Merkitysneuvottelujen kuluessa käytetään erilaisia
keskustelustrategioita.
Tutkimuksen informantteina on viisi viroa toisena kielenä oppivaa opiskelijaa
(äidinkielet venäjä, udmurtti, romania ja englanti), jotka tutkimuksen suorittamisaikana
opiskelivat viron kielen intensiivikurssilla. Tutkimusmateriaalina ovat oppijoiden keskustelut
syntyperäisten vironpuhujien kanssa (yhteensä tutkimukseen osallistui kolme syntyperäistä
vironpuhujaa). Neljän opiskelijan kanssa on yhden lukuvuoden kuluessa kahden kuukauden
välein tallennettu neljä keskustelua, yhden opiskelijan kanssa kaksi keskustelua. Keskusteltiin
jokapäiväisistä aiheista, ja keskustelujen keskipituus oli 20 minuuttia. Ensimmäisen
nauhoituksen suorittamisaikaan mennessä informantit olivat opiskelleet viron kieltä noin 100
tuntia, neljännen nauhoituksen ajankohtaan mennessä noin 450 tuntia. Kaikilla tutkimukseen
osallistuneilla syntyperäisillä vironpuhujilla oli viron kielen vieraana kielenä opettamisen
kokemusta, mutta kukaan heistä ei ollut tutkittavien opiskelijoiden viron kielen opettaja.
Merkitysneuvotteluja aiheuttavat tilanteet, kun a) syntyperäinen vironpuhuja ei
ymmärrä kielenoppijaa ja tarvitsee lisäselityksiä; b) kielenoppija ei ymmärrä syntyperäistä
vironpuhujaa
ja
ilmaisee
ymmärtämättömyyttä.
Merkitysneuvottelu
päättyy
yhteisymmärryksen saavuttamiseen ja keskustelu voi jatkua. Esitelmässä analysoidaan
merkitysneuvottelun olemusta ja muuttumista vuoden pituisen ajanjakson kuluessa.
Tutkimuskysymykset ovat seuraavat: 1) muuttuuko ja millä tavalla merkitysneuvottelujen
lukumäärä tutkimusajanjakson kuluessa; 2) ovatko merkitysneuvottelujen aiheuttajina
pääasiallisesti oppijan vai syntyperäisen vironpuhujan vuorot; 3) minkälaisten
keskustelustrategioiden avulla merkitysneuvottelut ratkaistaan ja millä tavalla strategiat
oppijoiden kielitaidon kehittyessä muuttuvat. Alustavien yhteenvetojen pohjalta voi todeta,
että keskustelujen onnistumista auttoi suuressa määrin syntyperäisten vironpuhujien viron
kielen vieraana kielenä opettamisen kokemus sekä oppijoita tukevien keskustelustrategioiden
käyttö (toistot, parafrasointi, kääntäminen ym.). Oppijoiden kielitaidon kehittyessä
nonverbaalisten keskustelustrategioiden osapaino sekä tukeutuminen muihin kieliin
ilmaisuvaikeuksien ilmetessä vähenevät.
Asiasanat: vuorovaikutus, merkitysneuvottelut, keskustelustrategiat, viro toisena kielenä
64
Magistraadis kelakaarti ja hengelötunnust taotlemas (maistraatissa Kela-korttia ja
henkilötunnusta hakemassa) eli Suomessa asuvien virolaisten kaksikielisten
yhdyssanojen käyttö keskustelufoorumeilla
Praakli, Kristiina; Heinsoo, Heinike
Tarton yliopisto
kristiina.praakli@ut.ee
Käsittelemme esitelmässämme Suomessa asuvien virolaisten yhdyssanojen muodostustapoja
ja niiden käyttöä viron ja suomen kielen kielikontaktitilanteessa (bilingual interaction).
Esitelmän kieliaineisto on peräisin Suomen virolaisten keskustelufoorumeilta. Kieliaineiston
analysointi perustuu Lars Johansonin malliin (code-coping model, Johanson 1993, 2006).
Kaksikielisessä yhdyssanojen muodostuksessa yhdistyvät viron ja suomen kieli.
Kaksikieliset yhdyssanat sisältävät kummankin kielen elementtejä, joita voi nimittää myös
kieltenvälisiksi kompromissimuodoiksi (compromise forms, Clyne 2003). Monikielisyystutkimuksien periaatteiden mukaan esitelmässä tarkastellaan kaksikielisten yhdyssanojen
muodostus- ja mukautumistapoja viron kieleen, mutta myös niiden käyttöä osallistujien
suorassa dialogissa ja laajemmassakin kommunikaatiossa internetin kontekstissa. Aineisto
osoittaa, että kielikontaktien vaikutus ei ole koskaan yksisuuntaista, vaan molemmat kielet
vaikuttavat toisiinsa. Yhdyssanojen muodostustavat ja niiden käyttö heijastavat myöskin
puhujien suomen kielen osaamista.
Vaikka kaksikielisissä yhdyssanoissa on yleensä kyse innovatiivisista
muodostelmista, niitä ei välttämättä käytetä pelkästään foorumeilla. Kieliaineiston analysointi
ja vertailu Suomen virolaisten haastatteluaineiston kanssa (Praakli 2002–2003, 2005) antaa
olettaa, että niin sanotut „kompromissimuodot“ eivät ole käytössä ainoastaan
verkkoympäristössä, vaan ne ovat saaneet enemmän sijaa myös paljon Suomeen yhteydessä
olevien Viron virolaisten kielirepertuaarissa. Tämä ei sulje pois sitä, että ilmaukset
„lainataan“ myös viron yleis- tai puhekieleen Virossa.
Lähteet
Clyne, Michael 2003. Dynamics of Language Contact. English and Immigrant Languages. Cambridge:
Cambridge University Press.
Heinsoo, Heinike 2006. Liitsubstantiivid soome ja eesti keeles – enne ja nüüd. – Lähivertailuja. Soome-eesti
kontrastiivseminar 8.-9.04.2004 Männikul. Toim. Helle Metslang – Siiri Soidro. Tallinn: Tallinna
Ülikooli Kirjastus, 13-31.
Johanson, Lars 1993. Code-copying in immigrant Turkish. – Immigrant languages in Europe. Ed. Guus Extra,
Ludo Verhoeven. Clevedon & Philadelphia & Adelaide, 197–221.
Johanson, Lars 2006. Turkic language contacts in a typology of code interaction. – Turkic languages in contact.
Ed. Hendrik Boeschoten, Lars Johanson. Turcologica 61. Wiesbaden: Harrassowitz Verlag, 4–26.
Kasik, Reet 2009. Tähelepanekuid eesti ja soome keele liitnimisõnadest. Lähivõrdlusi. Lähivertailuja 19. –
Toim. Annekatrin Kaivapalu. Tallinn: Eesti Rakenduslingvistika Ühing, 9-21.
Praakli, Kristiina 2009. Esimese põlvkonna Soome eestlaste kakskeelne keelekasutus ja koodikopeerimine.
Tartu: Tartu Ülikooli Kirjastus.
Verschik, Anna 2008. Emerging Bilingual Speech: From Monolingualism to Code-Copying. London:
Continuum publishers.
65
Verbit mennä ja lähteä vironkielisen suomenoppijan haasteena
Pällin, Kristi
Tallinnan yliopisto
kristipallin@hot.ee
Vaikka viro ja suomi ovat läheisiä sukulaiskieliä, on minema ja mennä-verbeissä tapahtunut
historiallinen erilliskehitys. Suomessa on säilynyt rakenteellisesti kaksi täydellistä
rinnakkaista paradigmaa mennä : menen ja lähteä : lähden, virossa sen sijan kaksi
vajannaisessa täydennysjakaumassa olevaa paradigmaa minema : lähen. Erilaiset paradigmat
ovat kielenoppijoille haastavia, ne aiheuttavat ongelmia oppimisessa ja kohdekielen käytössä.
Toistaiseksi ei ole oppijoiden ja opettajien käytettävissä ollut myöskään riittävästi
tutkimustietoa siitä, millaiset ovat mennä- ja lähteä-verbien käyttökontekstit natiivisuomessa
(ks. kuitenkin Pällin 2011).
Kontrastiivisen kielentutkimuksen mukaan oppijoille ovat kaikkein vaikeimpia
tapaukset, joissa lähdekielen ilmiölle on kohdekielessä monta eri vastinetta. Helpoimpia ovat
tapaukset, joissa lähdekielen yhtä ilmiötä vastaa kohdekielessä yksi ilmiö. Viron minema :
lähen ja suomen mennä- ja lähteä -paradigmojen suhde on tässä valossa haastellista: onko
mennä- ja lähteä-verbien tapauksessa kyseessä yhden suhde moneen vai monen suhde
moneen?
Esitelmässäni kuvaan frekventeimmät mennä- ja lähteä-verbien käyttöyhteydet ja
säännöllisyydet suomen sanomalehtikorpuksessa. Korpuksesta saadut esimerkkilauseet on
jaettu muotteihin semanttisin perustein, esimerkiksi muottiin joku menee johonkin -lauseet,
joissa elollinen tekijä liikkuu johonkin paikkaan. Analyysista selvisi, että lähteä-verbin käyttö
on aika rajattua mennä-verbiin verrattuna. Natiivisuomen mennä- ja lähteä-verbien käyttöä
vertaan vironkielisten suomenoppijoiden verbikäyttöön suomen oppijankielen korpuksen
ICLFI (International Corpus of Learner Finnish) vironkielisten oppijoiden osakorpuksen
teksteissä.
Asiasanat: toisen kielen omaksuminen, korpustutkimus, natiivikieli, oppijankieli, verbi,
suomi, viro
Lähteet
Pällin, Kristi 2011. Suomen mennä- ja lähteä-verbien korpuspohjainen vertailu konseptuaalisen semantiikan
näkökulmasta. Pro gradu-tutkielma. Tallinnan yliopisto.
http://www.oulu.fi/hutk/sutvi/oppijankieli/
66
Yläkoulun S2-oppijat kirjoittajina
Reiman, Nina; Seilonen, Marja
Jyväskylän yliopisto
nina.reiman@jyu.fi; marja.seilonen@jyu.fi
Kouluikäisten suomi toisena kielenä -oppijoiden suomen kielen taito on viime aikoina ollut
kiinnostuksen kohteena (esim. Halonen 2007, 2009; Kalliokoski 2008; Reiman & Mustonen
2010). Nuorten maahanmuuttajataustaisten oppijoiden kielitaito näyttää kehittyvän eri tapaan
kuin niiden S2-oppijoiden, jotka aloittavat suomen opintonsa vasta aikuisena.
Esitelmämme tavoitteena on valaista nuorten suomenoppijoiden kirjoittamisen taitoa
erilaisissa viestinnällisissä tehtävissä ja kuvata suomenkielisen ympäristön vaikutusta
kielitaitoon. Aineistona on 527 tekstiä, joiden kirjoittajat ovat 7.–9.-luokkalaisia S2-oppilaita.
Kirjoitelmat edustavat neljää eri tekstityyppiä: epämuodollinen ja muodollinen viesti,
mielipide ja narratiivi. Tekstit on arvioitu sekä Eurooppalaisen viitekehyksen kuusiportaisella
että Opetussuunnitelman perusteiden kymmenportaisella taitotasoasteikolla. Kunkin tekstin
on arvioinut kolme koulutettua arvioijaa. Aineisto on kerätty Suomen Akatemian
rahoittamassa, Jyväskylän yliopiston kielten laitoksen ja soveltavan kielentutkimuksen
keskuksen Cefling-hankkeessa. Aineistoa on 13 yläkoulusta, jotka sijaitsevat pääasiassa
eteläisen Suomen isoissa kaupungeissa.
Esitelmässä pohdimme muun muassa seuraavia kysymyksiä:
 Millaiset kielenkäytön tavat ovat tyypillisiä yläkouluikäisten S2-oppijoiden
teksteissä?
 Miten yläkoululaisten S2-oppijoiden kielellinen ilmaisu kehittyy perustasolta
keskitasolle?
 Miten nuorten ja aikuisten S2-oppijoiden tekstit eroavat kielellisesti toisistaan?
Tarkastelemme nuorten kirjoittajien tekstejä laadullisesta näkökulmasta. Pohdimme
muun muassa idiomaattisuuden kehittymistä ja sosiaalisen kontekstin vaikutusta kielitaitoon
ja ilmaisukykyyn. Suomenkielisen ympäristön kielellisten mallien siirtyminen näkyy nuorten
kirjoittajien teksteissä selvemmin kuin aikuisten. Teksteissä voi havaita sosiaalistumista
koulun kielenkäytön konventioihin siten, että oppilaat ovat omaksuneet esimerkiksi tiettyjä
vakiintuneita ilmausmuotteja, jotka tuntuvat olevan tyypillisiä nimenomaan koulun kielelle.
Asiasanat: kielen omaksuminen, kielitaito, kirjoittaminen, maahanmuuttajat, suomen kieli,
toinen kieli, tekstitaito, yläkoulu
Lähteet
Halonen, Mia 2007. Monikielinen Suomi – maahanmuuttajataustaisten koululaisten suomen kielen taidosta.
Nuorisotutkimus 25, 33–49.
Halonen, Mia 2009. Puhutun kielen variantit resurssina monikielisten koululaisten kirjoitelmissa. Virittäjä
113(3), 329–355.
Kalliokoski, Jyrki 2008. Suomi toisena kielenä ja koulussa kirjoittaminen. Teoksessa S. Routarinne – T. UusiHallila (toim.), Nuoret kielikuvassa: kouluikäisten kieli 2000-luvulla. Helsinki: Suomalaisen
kirjallisuuden seura, 349–370.
Reiman, Nina – Sanna Mustonen 2010. Yläkoulun suomi toisena kielenä -oppijoiden kirjoittamistaito. Kasvatus
41(2), 143–153.
67
Contrastive analysis of complex sentences in English and French language
learner corpora
Rutenberga, Vineta
Latvia University
vrutenberga@hotmail.com
The national examination centre task developers and markers try to establish criteria that
could be applicable in assessing foreign language performance cross-linguistically as the
Common European Framework of Reference (CEFR) also postulates that all languages are
learned in a similar manner, moving from simple short texts to more complex and longer
texts. Moreover, the CEFR levels serve as the basis of the secondary school foreign language
curriculum and test specifications because they identify the linguistic structures which
foreign language learners should know at a certain level of language proficiency. However,
the uniform statistical grading procedure that has been applied to ensure the comparability of
the results in different language examinations has possibly created a discrepancy between
English and French language acquisition levels.
Thus, the aim of the research is to examine the syntax of the English and French
language learners as sentence structures in contrast to lexical and morphological structures
are comparable across languages. The English and French learner corpora are used to validate
the examination levels in Latvian Year 12 examinations in English and French by comparing
the frequency of the use of complex sentences at different language performance levels.
In language testing linguistic corpora enable language testers to better understand the
test-takers’ language proficiency level. Moreover, they provide evidence of productive
language skill level and enhance structural analysis. In order to obtain the most relevant data,
the following objectives of the present research were drawn:
a) to compile test-taker written essay corpora in English and French to ensure the
representativeness of the learner used syntactic structures across different
language acquisition levels;
b) to carry out the empirical investigation of syntactic structures;
c) to provide evidence that syntactic structures can be used as the discriminatory
indicators of different language acquisition levels.
d) to compare the syntactic pattern use in English and French at the same language
acquisition levels.
As a theoretical basis for the research, Pienemann’s approach in analysing linguistic
constructions has been chosen as it is directly linked to the stages in the process of language
acquisition. By applying processability theory, Pienemann shows the order how the main
grammatical encoding procedures are activated in syntactic structures in the acquisition of
English as a second language. The complex sentences are classified using Dik’s (1997)
taxonomy of embedded constructions as the taxonomy could be attributed across languages,
which is of major importance as there exist different ways how to produce various embedded
constructions.
The preliminary results show that the number of complex sentences increases in both
English and French learner language with the growth of the language acquisition levels, thus
proving the assumption based on Pienemann’s Pocessability theory that syntax is one of the
parameters signalling a certain level of language acquisition, and that subordinate clauses
serve as a criterial feature for attributing the higher levels at the language examination.
68
Keywords: written learner text corpora, complex sentences, subordinate clauses
References
Biber, Douglas et al. 1998. Corpus Linguistics: Investigating Language Structure and Use. Cambridge:
Cambridge University Press.
Common
European
Framework
of
Reference
for
Languages
http://www.coe.int/t/dg4/linguistic/Source/Framework_EN.pdf (last accessed on 14 January, 2012).
Dik, Simon 1997b. The Theory of Functional Grammar, Part 2: Complex and Derived Constructions.- Kees
Hengeveld (ed.). Berlin: Mouton de Gruyter.
English Profile. Introducing the CEFR for English, (2011) Cambridge: Cambridge University Press.
Halliday, Mak 2005. Computational and Quantitative Studies. J.J.Webster (ed). London and New York:
Continuum.
Hasselgård, Hilde – Johanssen, Stig 2011. Learner Corpora and Contrastive Interlanguage Analysis. In F.
Meunier – S. De Cock – G. Gilquin – M. Paquot (eds), A Taste for Corpora : In honour of Sylviane
Granger. Amsterdam and Philadelphia: John Benjamins.
Jackson, Howard 2007. Key terms in linguistics. New York: Continuum.
Leech, Geoffrey 1992. Corpora and theories of linguistic performance. – Jan Svartvik (ed.), Directions in
Corpus Linguistics, 105-122. Berlin: Mouton de Gruyter.
Leech, Geoffrey 2011. Frequency, corpora and language learning.- Fanny Meunier et al. (eds.), A Taste for
Corpora : In honour of Sylviane Granger. Amsterdam and Philadelphia: John Benjamins.
McEnery, Tony et al. 2006. Corpus-Based Language Studies. An Advanced Resource Book. London and New
York: Routledge.
Pienemann, Manfred 1999. Language Processing and Second Language Development: Processability Theory.
Amsterdam/Philadelphia: John Benjamins.
Saville-Troike, Muriel 2006. Introducing Second Language Acquisition. Cambridge: Cambridge University
Press.
Sinclair, John 2004. Trust the Text: Language, Corpus and Discourse. New York: Routledge.
Svartvik, Jan 1973. Errata: Papers in Error Analysis. Lund: Gleerup/Liber.
69
Korpustutkimus oppijansuomen verbirakenteiden rektioista
Seppälä, Tanja
Oulun yliopisto
tanjasep@mail.student.oulu.fi
Esitelmässäni tarkastelen oppijansuomen verbirakenteiden rektioita. Rektiot ovat vaikeita
opiskelijoille, ja verbirektiot ovat haastavia jopa edistyneille vironkielisille suomenoppijoille
(Nissilä 2011: 106‒107, 308). Tutkimuksessani tarkastelen, mihin muotoon suomenoppijat
taivuttavat jälkimmäisen verbin verbiketjuissa (alkaa tehdä, oppia tekemään) ja
deverbaalisubstantiivin vaativan verbin yhteydessä (aloittaa tekeminen). Tavoitteeni on
verrata, ovatko tietyt kahden tai useamman verbin yhdistelmät suomenoppijoille helpompia
kuin toiset. Lisäksi pyrin tarkastelemaan tuloksia kielen opettamisen ja oppimisen
näkökulmasta.
Oppijankielen korpusten luominen on mahdollistanut viime vuosina
korpuslingvistiikan ja oppijankielen tutkimisen yhdistämisen (Granger 2002: 45). Käytänkin
tutkimusaineistona Kansainvälistä oppijansuomen korpusta (ICLFI), johon on kerätty
ulkomaisissa yliopistoissa suomen kieltä opiskelevien opiskelijoiden tekstejä. Teen
korpuspohjaista kvantitatiivista tutkimusta.
Käsittelen verbirakenteita kolligaatioina. Kolligaatio on kontekstuaalisesta
semantiikasta noussut käsite, jolla tarkoitetaan sanan tai sananmuodon ja sen kanssa
tyypillisesti myötäesiintyvän kieliopillisen kategorian suhdetta (Firth 1968: 181–183, 186;
Jantunen 2004: 21). Kolligaatio on yksi fraseologisen yksikön piirre. Fraseologisella
yksiköllä tarkoitetaan lekseemin ja sen kanssa esiintyvän kielen elementin yhdistelmää.
(Gries 2008: 4–10, 16.) Tutkin työssäni finiittiverbin kanssa kolligoivia verbejä tai
verbikantaisia substantiiveja.
Nykyään myötäesiintymien tarkastelusta puhutaan fraseologisena tutkimuksena, jota
on tehty useiden eri kielitieteellisten teorioiden näkökulmasta kunkin teorian omilla keinoilla
ennenkin (Gries 2008: 10–21). Viime vuosina fraseologinen suuntaus on yleistynyt myös
oppijankielen tutkimuksessa (Ellis 2008: 6). Fraseologisen tutkimussuuntauksen mukaan kieli
omaksutaan, tallennetaan ja prosessoidaan useamman elementin rakenteina (Granger–
Meunier 2008: 247). Fraseologiset piirteet voivat kuitenkin olla erilaisia eri kielissä (Ellis
2008: 8).
Valitsen tutkimani verbiyhdistelmät ja verbit suomenoppijoille suunnatusta Whiten
oppikirjasta Suomen kielioppia ulkomaalaisille, koska teos edustaa suomen kielen
opettamisen näkökulmaa. Tutkin seuraavia yhdistelmiä: verbi ja A-infinitiivi, verbi ja MAinfinitiivi sekä verbi ja deverbaalisubstantiivi. Tarkastelen kaikkea tekstiä korpuksessa eli
suomi vieraana kielenä -kielimuodon yleisiä piirteitä. Käytän korpusaineiston tutkimisessa
apuna WordSmith Tools -ohjelmaa, ja poimin aineistoesimerkit Oppijansuomen korpuksen
teksteistä. Alustavan analyysin perusteella oppijoilla on vaikeuksia verbirakenteiden
muodostamisessa.
Asiasanat: oppijansuomi, korpustutkimus, verbirektiot, kolligaatio, fraseologinen tutkimus
Lähteet
Ellis, Nick C. 2008: Phraseology. The periphery and the heart of language. ‒ Fanny Meunier – Sylviane Granger
(toim.), Phraseology in Foreign Language Learning and Teaching s. 1–13. Amsterdam: John
Benjamins.
70
Firth, J. R. 1968: A synopsis of linguistic theory 1930–55. – F. R. Palmer (toim.), Selected papers of J. R. Firth
1952-59 s. 168–205. Bloomington: Indiana University Press.
Granger, Sylviane 2002: A Bird's-eye view of learner corpus research. – S. Granger – J. Hung – S. Petch-Tyson
(toim.), Computer learner corpora, second language acquisition and foreign language teaching s. 44–
72. Amsterdam: John Benjamins.
Granger, Sylviane – Meunier, Fanny 2008: Phraseology in language learning and teaching. Where to from here?
– Fanny Meunier & Sylviane Granger (toim.), Phraseology in Foreign Language Learning and
Teaching s. 247–252. Amsterdam: John Benjamins.
Gries, Stefan Th. 2008: Phraseology and linguistic theory: A brief survey. – Sylviane Granger & Fanny Meunier
(toim.), Phraseology: an interdisciplinary perspective s. 3–25. Amsterdam: John Benjamins Publishing
Company.
Jantunen, Jarmo Harri 2004: Synonymia ja käännössuomi. Korpusnäkökulma samamerkityksisyyden
kontekstuaalisuuteen ja käännöskielen leksikaalisiin erityispiirteisiin. Joensuun yliopiston humanistisia
julkaisuja 35. Joensuun yliopisto.
Nissilä, Leena 2011: Viron kielen vaikutus suomen kielen verbien ja niiden rektioiden oppimiseen. Väitöskirja.
Acta Universitas Ouluensis. Oulun yliopisto.
White, Leila 2008: Suomen kielioppia ulkomaalaisille. Helsinki: Finn Lectura.
71
Usage-based Grammar of Russian Language as L1: paradigmatic aspect
Shmeleva, Alisa
Tallinn University
lisochka@tlu.ee
The aim of research is to determine how native speaker uses Russian language, what kind of
universal and language-specific regularities occurr at the same time. The description is based
on the synchronic language use where the text frequency of words, forms and
morphosyntactic constructions is considered by two aspects – paradigmatic and syntagmatic.
The research is a part of a larger project Russian Learner Language in Estonia in
which it is compared the usage of Russian Learner Language by gymnasium students as L1
and L2. Part of Russian National Corpus (http://ruscorpora.ru), which is balanced,
morphosyntactically tagged and disambiguated, will be used as a reference corpus.
The research is based on the theoretical starting points that reflect the usage of
language in Corpus Linguistics (eg Sinclar 1995, 2004; Barlow 2005; Barlow, Kemmer 2000;
Kopotev 2004, 2008; Mustajoki 1973, 1988; Kopotev, Mustajoki 2008 etc) and Radical
Construction Grammar (eg Croft 2001, 2007; Fillmore and others 1988; Goldberg 1995,
1997, 2006; Franks 1995 etc).
In this paper paradigmatic aspect of the Russian language use as L1 by gymnasium
students in examination works will be presented on the basis of verbs. Examination works are
written in 2010. Text sample is 51 181 tokens where the number of grammatical word forms
is 11 646. A quantitative analysis of subcorpus Russian as L1 was done by means of
statistics-based program WordSmith Tools (WST), obtained data were linguistically
interpreted.
Data of text frequency word forms were obtained by using WST subprogram
WordList. On this basis were found lemmas, frequency of various grammatical word forms
and Part-of-Speech. WTS subprogram Corcondace was used for morphological analysis to
determine precisely Part-of-Speech and word forms. On the basis of obtained data it is
possible to provide a description of written language use by gymnasium students from
paradigmatic aspect and compile a frequency dictionary of text sample.
Verb as a center of the sentence was chosen to provide a description of paradigmatic
representation of word forms. Verb’s forms classification is based on the category of aspect,
since it is the most important grammatical verb’s feature in Russian language.
The results of analysis demonstrate that imperfective aspect usage prevails in
indicative, imperative and conditional mood (together 5119 forms) in examination works by
gymnasium students. Perfective aspect is used two times less (together 2485 forms). There is
distinct difference between representation of singular and plural forms in language use
regardless of the verb aspect (together singular 3678, plural 1249). It should be taken into
account that differences in aspect usage (as well as in singular and plural) are not
homogenous and pervade, but are linked to certain mood and grammatical (tense) forms. The
point is that verb’s forms morphological paradigm has no match and couldn’t have it with
forms of usage-paradigm – the last is characterized by imbalance and hierarchy.
On the basis of text frequency it occurs that forms are used frequently or infrequently (see
Figure 1). For instance verbs in imperfective aspect indicative mood singular in the third
person present tense are used more frequently (1797 times) than verbs in perfective aspect
used only 154 times. The same situation is with verbs in indicative mood in the first and
second person singular and plural, they are used infrequently too. Imperative and conditional
72
aspect forms are hardly ever used. Frequently used forms are on the top of usage-paradigm,
less frequently is on the bottom of this paradigm. There are more or less similarly used forms
between them. For instance infinitive is equally used both in imperfective aspect (969 times)
and perfectives aspect (952 times) etc.
So usage-paradigm of the verb’s forms is hierarchy that is formed on the basis of text
frequency from ranked forms. At the second stage it is planned to find out the most frequent
morphosyntactic constructions (usually consisted of 3 units) in language usage by
gymnasium students, to consider variation of lexical-grammatical constructions and
preferences in selection of the forms to determine to what extent selection of the forms
depends on the type of constructions and word’s semantics.
Keywords: frequency grammar, usage-based grammar, corpus-driven research, L1
73
Agentittomat ilmaukset edistyneillä suomenoppijoilla
Siitonen, Kirsti
Turun yliopisto
kisiito@utu.fi
1990-luvulla keräämäni laajan testimateriaalin ja 2000-luvun alussa tekemäni kyselyn
perusteella olen todennut, että suomenoppijat ainakin testitehtävissä ovat taipuvaisia
preferoimaan agentillisia ilmauksia agentittomien kustannuksella. He toisin sanoen valitsevat
äidinkielistä suomenpuhujaa useammin aktiivisen verbimuodon tai transitiiviverbin sen
sijaan, että valitsisivat passiivimuodon tai nollapersoonan tai intransitiivisen verbin. (Siitonen
1999; Siitonen 2000.)
Kielenoppijalla sanotaan olevan tarve uutta kieltä hahmottaessaan löytää agentti tai
ymmärtää agenttistruktuurit opittavassa kielessä (vrt. Ellis 2008). Saattaa olla häiritsevää, jos
hyvin muodostetut lauseet eivät tarjoa mahdollisuutta tähän. Bill VanPatten (2008) on
esittänyt ns. ensimmäisen substantiivin periaatteen, jonka mukaan oppijalla – tosin
ensikielestä riippuen – on taipumus hahmottaa lauseen ensimmäinen substantiivi tai
pronomini ensisijaisesti subjektiksi tai agentiksi, jos muut seikat eivät osoita oletusta hyvin
epätodennäköiseksi.
Esityksessäni on tarkoitus edistyneiden suomenoppijoiden korpusmateriaaliin (LAS2,
ks. Ivaska–Siitonen 2009) pohjaten antaa kuva itsenäisesti kirjoitettujen tekstien passiivi- ja
nollapersoonatapauksista sekä intransitiiviverbeistä, joilla on transitiivinen pari, ja niiden
agentillisista vastineista niin edistyneiden suomenoppijoiden kuin äidinkielisten
suomenpuhujienkin teksteissä. Hypoteesinani on, että suomenoppija pyrkii eksplikoimaan
agentin esimerkiksi seuraavasti: Tutkijat ovat huomanneet, että… versus Tutkimuksissa on
huomattu, että…; Tästä voimme nähdä, että… versus Tästä voi nähdä, että…; Tästä
näemme, että... versus Tästä näkyy, että…
Haluan selvittää, miten suuri määrä kutakin edellä mainittua agentitonta ilmausta
oppijankorpuksessa on suhteessa natiivikirjoittajien tekstien vastaaviin ilmauksiin. Lisäksi on
tarkoitus saada selville, minkälaiset piirteet ovat tyypillisiä edistyneiden oppijoiden
agentittomille ilmauksille. Hypoteesinani on, että agentittomia ilmauksia kyllä on mutta
vähemmän kuin natiiveilla. Lisäksi oletan, että sanajärjestys saattaa olla epäidiomaattinen ja
että nollapersoonatapaukset rajoittuvat vain muutamiin lähes samanlaisina toistuviin
fraasimaisiin kokonaisuuksiin (vrt. prefabs, Granger 1998). Tenttivastaukset ja
tutkielmatekstin luonnokset tekstilajeina saattavat tosin luonteensa vuoksi ohjata molempia
kirjoittajaryhmiä keskenään samantyyppisiin ratkaisuihin.
Ensimmäiset oppijoiden aineistosta kerätyt passiivitapaukset vaikuttavat korrekteilta.
Sanajärjestyksen mahdolliset poikkeamat saattavat selittyä laajemmasta kontekstista käsin:
Artikkelin kehityksessä maailman kielissä erotetaan 4 vaihetta (las2-1tt01te07lo131); Sitä
paitsi leikeissä ja peleissä luodaan ryhmän yhteishenkeä .jossa merkataan tärkeimmät
kohteet ja osoitteet . ( kirjasto , taetteri jne.) (las2-1tt01te12lo36). Ensimmäiset aineistosta
saadut nollapersoonat ovat idiomaattisia – ongelmana näyttää kuitenkin olevan se, että
nollapersoona peräkkäisissä lauseissa viittaa eri agentteihin: Kielioppi usein ei kiinnosta
oppilaita niin paljon sen takia Sitä varten voi käyttää elävää kieltä ( artikkelit , chatit jne),
laatia tehtäviä ,joissa pitaisi analysoida , vertailla .Esimerkiksi, voi analysoida erialisia
1
Kunkin esimerkin lopussa oleva koodi kertoo sen sijainnin LAS2-korpuksessa.
74
uutisotsikkoja , pohtia siitä ,miten voisi korjata ne . Sanaluokkien opetuksessa voi ehdottaa
oppilaille etsiä eroavia sanoja ryhmässä ,Esim. miten voi ilmaista aikaa , paikkaa ? (las21tt01te06lo12).
Ensisijaisena tavoitteena on siis selvittää, toistuuko testein saatu tulos tiettyjen
rakenteiden välttämisestä myös korpuksessa eli aliedustuvatko nämä rakenteet ja
yliedustuvatko niitä vastaavat aktiivirakenteet tutkimusaineistossa vertailuaineistoon nähden.
Lisäksi halutaan selvittää, mitkä ovat suomenoppijoiden agentittomien ilmausten tyypilliset
piirteet.
Asiasanat: agentiton ilmaus, edistynyt oppija, nollapersoona, passiivi, välttäminen
Lähteet
LAS2 = Edistyneiden suomenoppijoiden korpus, Lauseopin arkisto, Turun yliopisto.
Ellis, Rod 2008. The Study of Second Language Acquisition. 2nd ed. Oxford: Oxford University Press.
Granger, Sylviane 1998. Prefabricated patterns in advanced EFL writing: Collocations and formulae. – A. P. S.
Cowie (ed.), Phraseology, Theory Analysis and Applications, 145–160. Oxford: Oxford University
Press.
Ivaska, Ilmari – Siitonen, Kirsti 2009. Syntaktisesti koodattu oppijankielen korpus: mahdollisuuksia ja
ongelmia. – Eslon, Pille – Õim, Katre (eds), Korpusuuringute metodoloogia ja märgendamise
probleemid, 54–71. Eesti keele ja kultuuri instituuti toimetised 11. Tallinna: Tallinna Ülikool.
Siitonen, Kirsti 1999. Agenttia etsimässä. U-verbijohdokset edistyneen suomenoppijan ongelmana. Suomalaisen
ja yleisen kielitieteen laitoksen julkaisuja 63. Turku: Turun yliopisto.
Siitonen, Kirsti 2000. Nollapersoonalauseet edistyneen suomenoppijan käytössä ja tulkittavina. – Sananjalka 42,
157–166.
VanPatten, Bill 2008. Input processing in adult second language acquisition. – VanPatten, Bill – Williams,
Jessica (eds), Theories in Second Language Acquisition. An Introduction, 115–135. New York:
Routledge.
75
Lähdekielen vaikutus ja kielitaitotaso: vironkielisten oppijoiden sisäpaikallissijojen
käyttö oppijansuomen korpuksessa
Siivelt, Keaty
Tallinnan yliopisto
ksiivelt@tlu.ee
Lähdekielen vaikutuksen tutkimisessa ohitetaan usein mahdollisuus, että lähdekielen vaikutus
vaihtelee kielitaitotasoittain sekä määrällisesti että luonteltaan. On väitetty, että oppija ei
pysty hyödyntämään lähdekielen positiivista vaikutusta ennen kuin hänen kohdekielensä taito
on riittävän kehittynyt (esim. Giaccobe 1992). Varsinkin lähisukukielen morfologian
omaksumisessa on osoitettu olevan positiivinen korrelaatio lähdekielen positiivisen
vaikutuksen ja kielitaitotason välillä (Kaivapalu 2005).
Tutkimuksessani tarkastelen vironkielisten suomen oppijoiden sisäpaikallissijojen
käyttöä Kansainvälisessä oppijansuomen korpuksessa (International Corpus of Learner
Finnish – ICLFI)1, lähtökohtana yleiseurooppalaisen viitekehyksen (EVK 2003)
kielitaitotasot A1—C2. Tutkimukseni tavoitteena on selvittää, miten eri kielitaitotasoilla
olevat vironkieliset oppijat käyttävät suomen sisäpaikallissijoja ja millainen on mahdollinen
lähdekielen vaikutus kielitaitotasoittain. Sisäpaikallissijojen käyttö antaa mahdollisuuden
tutkia sekä kielteistä että myönteistä lähdekielen vaikutusta, joka on lähdekielen vaikutuksen
ja oppijan kielitaitotason suhteen tutkimisen kannalta metodologisesti ensisijaisesti tärkeää
(Kaivapalu & Martin 2007: 134) Esitelmässäni analysoin myös lähdekielen osajärjestelmien
kuten fonologian, morfologian ja morfosyntaksin mahdollista yhteisvaikutusta kohdekielen
käyttöön.
Aikaisempien tutkimusten perusteella keskityn seuraaviin hypoteeseihin:
1) sisäpaikallissijojen käytön frekvenssi ja tarkkuus kasvavat kielitaidon kehittymisen
mukaan;
2) lähde- ja kohdekielen fonologian, morfologian ja morfosyntaksin yhtäaikainen
samankaltaisuus vahvistaa lähdekielen positiivista vaikutusta;
3) lähde- ja kohdekielen fonologian ja morfologian erilaisuus vaikuttaa kohdekielen käyttöön
enemmän kuin morfosyntaksin samankaltaisuus.
Asiasanat: toisen kielen omaksuminen; oppijankielen korpustutkimus, lähdekielen vaikutus,
kielitaitotaso, viro, suomi
Lähteet
Giaccobbe, J. 1992. A cognitive view of the role of the role of L1 in the L2 acquisition process. Second
Language Research 8(3), 232−250.
EVK = Eurooppalainen viitekehys. Kielten oppimisen, opettamisen ja arvioinnin yhteinen eurooppalainen
viitekehys, Council of Europe, 2003, WSOY.
Kaivapalu, Annekatrin 2005. Lähdekieli kielenoppimisen apuna. Jyväskylä Studies in Humanities 44. Jyväskylä:
University of Jyväskylä.
Kaivapalu, Annekatrin – Martin, Maisa 2007. Morphology in transition: plural inflection of Finnish nouns by
Estonian and Russian learners. – Acta Linguistica Hungarica
1
http://www.oulu.fi/hutk/sutvi/oppijankieli/
76
Language Exchange: A Tool for the Collection of an Automatically Annotated
Learner Corpus
Smiley, Charese
Indiana University
chsmiley@indiana.edu
Corpus annotation by trained annotators is both expensive and time consuming. The
collection of learner data is especially difficult because of the lack of electronically submitted
data as most learner essays and homework assignments are hand-written (Granger 2003;
Granger 2004). This paper proposes a solution to this problem which capitalizes on the fact
that untrained users of a website or software application are often quite willing to provide
annotation services for free. This trend can be seen on Web 2.0 websites such as Amazon1,
where users give product reviews and rankings at no cost, and Wikipedia2, where users write
and correct articles for free.
Within the domain of language learning, Lang-83 provides a platform where users can
write journal entries in their target language and receive feedback and corrections to their
journal from speakers of that language. These corrections could be captured and interpreted
as annotations which could be collected and used as a learner corpus by researchers.
However, Lang-8 lacks a systematic platform for error correction and codified error
annotation scheme making its data difficult for researchers to repurpose.
For this project, I constructed Language Exchange (LE), a website which allows users
to correct L2 journal entries. The keystrokes made by users while correcting the journals are
then collected into an annotated corpus automatically. After correcting a journal entry, the
user may choose to supply additional annotation through a simplified error annotation
scheme. This project assumes no linguistic expertise, save knowledge of the learner’s target
language, corrections that can be easily converted to corpus annotations and the types of
additional annotation the layperson can provide.
Recently, researchers have begun to utilize knowledge from non-experts to acquire
and annotate linguistic data and have found that results are on par with controlled laboratory
studies (Munro et al. 2010; Wang et al. 2010). New crowd-sourced linguistic corpora include
an open corpus of Russian texts (Bocharov et al. 2011), paraphrases (Chklovski 2005), and
semantic data (Vickrey et al. 2008). The users in my preliminary case study found the
website and journal correction mechanism easy to use and understand suggesting it is
possible to collect a large annotated corpus of learner data from non-expert annotators.
However, users varied in the degree to which they could concretely articulate their reasons
for making annotations.
Keywords: learner corpus annotation, learner corpus collection, crowd-sourcing
1
http://www.amazon.com
http://www.wikipedia.org
3
http://www.lang-8.com
2
77
References
Bocharov, Victor – Svetlana Bichineva – Dmitry Granovsky – Natalia Ostapuk – Maria Stepanova. 2011.
Quality Assurance Tools in the OpenCorpora Project.
Chklovski, Timothy 2005. Collecting paraphrase corpora from volunteer contributors. Paper presented at the
Proceedings of the 3rd international conference on Knowledge capture, Banff, Alberta, Canada.
Granger, Sylviane. 2003. Error-tagged learner corpora and CALL: A promising synergy. CALICO Journal
20.465-80.
— 2004. Computer Learner Corpus Research: Current Status and Future Prospects. Language and Computers
52.123-45.
Munro, Robert – Steven Bethard – Victor Kuperman – Vicky Lai Tzuyin – Robin Melnick – Christopher
Potts – Tyler Schnoebelen – Harry Tily. 2010. Crowdsourcing and language studies: the new
generation of linguistic data. Paper presented at the Proceedings of the NAACL HLT 2010 Workshop
on Creating Speech and Language Data with Amazon's Mechanical Turk, Los Angeles, California.
Vickrey, David – Aaron Bronzan – William Choi – Aman Kumar – Jason Turner-Maier – Arthur Wang –
Daphne Koller. 2008. Online word games for semantic data collection. Paper presented at the
Proceedings of the Conference on Empirical Methods in Natural Language Processing, Honolulu,
Hawaii.
Wang, Aobo – Cong Duy Vu Hoang – Min-Yen Kan. 2010. Perspectives on Crowdsourcing Annotations for
Natural Language Processing. http://hdl.handle.net/1900.100/3266: National University of Singapore.
78
The (under)use of partitive plural predicatives in learners of Finnish from related and
non-related L1 backgrounds: The same side of a slightly different coin
Spoelman, Marianne
University of Oulu
marianne.spoelman@oulu.fi
As the use of the partitive, a typical subject, object and predicative case characterizing Finnic
languages such as Finnish and Estonian, seems to remain a constant struggle for L2 learners
of Finnish, this study investigates the use of partitive plural predicatives in the writings of
Estonian, German and Dutch learners of Finnish as a foreign language. The current corpus
study is part of a larger study on the use of the partitive case in Finnish learner language.
Being very closely related languages, Finnish and Estonian have a similar subject and
object case alternation. Concerning these case alternations, the partitive is used in case of
unboundedness and negative polarity. However, as the Finnish nominative-partitive
predicative case alternation does not find its equivalent in Estonian, Finnish partitive
predicatives generally correspond to Estonian nominative predicatives (e.g. Finnish: Lapset
olivat vielä nuoria-Part.Pl; Estonian: Lapsed olid veel noored-Nom.Pl 'The children were still
young.'). Presuming that L1 influence emerges as a result of the L1-L2 similarities assumed
by the learner, the convergence concerning subject and object case-marking and the
divergence concerning predicative case-marking could possibly act as a trigger for negative
L1 influence to occur in the Estonian learners' use of partitive predicatives. Because learners
from non-related and typologically different L1 backgrounds such as German and Dutch are
neither familiar with the Finnish partitive case-alternation, the overall aim of the study is to
identify and address possible differences and similarities in the use of partitive plural
predicatives by Estonian learners of Finnish and German and Dutch learners of Finnish.
Research materials were selected from the International Corpus of Learner Finnish
(ICLFI), aligned to the CEFR levels of proficiency and analyzed on the basis of a combined
frequency-error analysis involving relative frequencies of occurrence, partitive predicative
over- and underuse errors and obligatory contexts for partitive predicatives.
As will be discussed, all learner corpora were particularly at the lower proficiency
levels characterized by the frequent replacement of partitive plural predicatives by
nominative predicatives. However, partitive plural predicatives were in the Estonian learner
corpus generally substituted by nominative plural predicatives and in the remaining learner
corpora mainly by nominative singular (i.e. uninflected) predicatives, suggesting a tendency
to rely on L1 morphosyntax versus a tendency to simplify. It will nevertheless be argued that
these seemingly different phenomena also have much in common.
Keywords: Finnish learner language, common phenomena in foreign language learning
79
How useful is an annotated learner corpus?
Štindlová, Barbora
Technical University, Liberec
bara.stindlova@gmail.com
Rosen, Alexandr
Charles University, Prague
alexandr.rosen@ff.cuni.cz
The paper is based on an ongoing project of a learner corpus of Czech, built mainly from
transcribed hand-written essays, with errors corrected and labelled according to a three-level
annotation scheme, of a size planned to reach 2 mil. words (Hana et al., 2010, Štindlová et al.,
2012). As a crucial property for the annotation of a morphologically rich language, the multilevel approach allows for successive emendation of a single form, potentially incorrect due to
its spelling, morphemic structure, morphosyntactic categories, word-order position or lexical
choice. The scheme also allows for annotating deviations in discontinuous sequences of
words, and for representing syntactic relations relevant to violated agreement or valency
patterns. Automatic tools supplement manual annotation (by morphosyntactic tagging and by
assigning error labels decidable by formal rules). Methods of fully automatic annotation are
investigated and tested (based on spell and grammar checkers).
The aims of the paper are as follows:
1. To evaluate the following aspects of the corpus design vis-à-vis the needs (i) of the
corpus user and (ii) of teaching Czech as a second or foreign language (L2): error
annotation scheme, error taxonomy, annotation results, and automatic annotation
methods, including standard linguistic annotation.
2. To examine the issues of classification of errors into domains (spelling, morphology,
morphosyntax, lexicon), with a focus on consistency. In a morphologically rich language
such as Czech, the type of error may not be obvious – in jsem ruskáadj ‘I am Russian’
(correctly: jsem Ruskanoun or jsem ruská studentka), the error could be in spelling,
omission or lexical substitution. In je dobrym student ‘[he] is a good student’ (correctly:
je dobrý student or je dobrým studentem) the choice is between a spelling error in a
morphosyntactically faulty form, or a spelling error in one form and a morphosyntactic
error on the other.
3. To identify needs for extending the annotation by markup of different types (e.g.,
achievement of a communication goal).
While pursuing the aims we ask ourselves the crucial question: does the annotation
bring expected results? I.e., we need to know if the annotation is sufficiently reliable and
consistent, if it is usable for L2 teaching and research, which parts of the annotation scheme
and the error taxonomy are problematic, which parts of the error taxonomy should be omitted
or extended, and which automatic annotation methods are most promising.
To evaluate the annotation results and practicality of the annotation scheme we
compute inter-annotator agreement on a doubly-annotated data sample. These scores are
supplemented by an analysis of user needs and their satisfaction, based on a corpus user
survey, and by an identification of gaps in methods and tools for teaching Czech as L2, and
an evaluation of chances to fill them up using the annotated data. Automatic methods are
evaluated using hand-corrected samples.
80
Keywords: learner corpus, Czech, emendation, error annotation, error taxonomy, multi-level
annotation
References
Hana, Jirka – Alexandr Rosen – Svatava Škodová – Barbora Štindlová 2010. Error-tagged learner corpus of
Czech. – Proceedings of the Fourth Linguistic Annotation Workshop, Uppsala: Association for
Computational Linguistics.
Štindlová, Barbora – Svatava Škodová – Alexandr Rosen – Jirka Hana 2012. Annotating foreign learners’
Czech. – Ziková, M. and Docekal, M., editors, Slavic Languages in Formal Grammar. Proceedings of
FDSL 8.5, Brno 2010, pages 205–219, Frankfurt am Main. Peter Lang.
81
Computer Assisted Language learning and Estonian e-learning courses
for the beginners
Teral, Maarika; Rammo, Sirje
University of Tartu
maarika.teral@ut.ee
The main aim of this presentation is the start of the e-learning courses of Estonian for the
beginners at the University of Tartu and the problems connected to the creating and
conducting of the courses. The presentation outlines the positive and negative sides of the
computer assisted language learning; the special linguistic characteristics of Estonian that
make its learning and teaching via Internet different from teaching and learning of the other
languages are also discussed.
The courses “Eesti keele kursus algtasemele“ and „Eesti keele algkursus
videomaterjalide põhjal“, which were first launched in 2010 and 2011, were aimed at the
adult learners. The students who had registered for the courses came from different continents
and states and learned Estonian for personal (f. ex. family connections to Estonia) or workrelated reasons.
In 2012, a new course of Estonian vocabulary will start. On all the courses the
students gain introductory knowledge of Estonian and develop active skills in Estonian.
Courses activities are structured around access to online resources and communication via
social media (Skype).
During the conducted courses, when analyzing the results of learners work and
communicating with them both orally and via e-mails several questions arose. To discover
the attitude of the students towards the computer assisted Estonian courses and to answer the
question, which language skills can be learned most effectively, data was and is collected via
a questionnaire survey. The preliminary results indicate, that some of the positive features
(e.g. possibility for the students to plan their time and learning schedule) and negative
features (e.g. learning process is time-consuming and requires high motivation) which were
stressed in research made upon computer assisted language learning of other languages also
emerge in computer assisted Estonian learning.
Keywords: Estonian, computer assisted language learning, Estonian e-learning courses for
beginners, computer assisted Estonian learning for grown-up learners
References
Davies, Graham 2003. Computer Assisted Language Learning: Where are we now and where are we going?
http://www.camsoftpartners.co.uk/docs/Futurelab_CALL_Article.htm
ICT4LT 2011 = ICT4LT Information and Communication Tehnology for Language Teachers
http://www.ict4lt.org/en/
Teral, Maarika – Sirje Rammo – Birute Klaas 2009. Arvutipõhisest keeleõppest. Teadusmõte Eestis (V)
Humanitaarteadused, 35–42. Tallinn: Eesti Teaduste Akadeemia.
82
Kysymisen taidon kehittyminen taitotasolta toiselle L2-suomessa ja -ruotsissa
Toropainen, Outi; Lahtinen, Sinikka
Jyväskylän yliopisto
outi.toropainen@jyu.fi; sinikka.r.lahtinen@jyu.fi
Esitelmämme tavoite on selvittää, millä tavalla toisenkielen kysymisen taito erilaisissa
kirjallisissa viestintätilanteissa kehittyy. Aineistomme koostuu perusopetuksen ja lukion
suomi toisena kielenä ja ruotsi toisena kotimaisena kielenä -oppilaiden kirjoittamista
sähköpostiviesteistä, joiden taitotason kolme koulutettua arvioijaa on arvioinut viitekehyksen
kuusiportaisen taitotasoasteikon mukaan. Tutkimuksemme on osa Suomen Akatemian
rahoittamaa Topling-tutkimushanketta, jossa tarkastellaan kirjoittamisen kehittymistä
Suomen koulujärjestelmässä. Oppilaiden kirjoittamat viestit ovat aihepiiriltään ja
tavoitteeltaan vaihtelevia. Viestin sisältöön vaikuttaa merkittävästi myös sen ajateltu
vastaanottaja, joka on annettu tehtävänannoissa. Näin aineistomme kysymykset vaihtelevat
muodollisen viestintätilanteen kysymyksistä epämuodollisen viestintätilanteen kysymyksiin.
Tutkimuksessa hyödynnetään Ellis & Barkhuizenin (2005: 112) oppijankielen
funktioihin ja muotoihin suuntautuvaa analyysimallia, jonka mukaan erilaisia kielellisiä
funktioita ilmaistaan erilaisin lingvistisin muodoin ja rakentein. Olemme poimineet
aineistostamme kysymykset, jotka noudattavat rakenteeltaan tai funktioltaan kysymystä. Näin
tarkastelun kohteena olevassa aineistossamme on kysymyssanalla alkavia niin sanottuja
hakukysymyksiä, kysymyspartikkelilla (-kO) ja käänteisellä sanajärjestyksellä alkavia
verbialkuisia vaihtoehtokysymyksiä sekä väitelauseita, jotka päättyvät kysymysmerkkiin.
Tarkoituksenamme on selvittää, millä tavalla kysymyksiä muodostetaan ja millaisissa
funktioissa niitä käytetään kielitaidon kehittyessä. Tulokset antavat lisäksi tietoa toisen kielen
oppimisen ja omaksumisen mahdollisesta polusta silloin, kun toinen kielistä on pääasiassa
muodollisen opetuksen kautta opittu (ruotsi) ja toinen puolestaan myös ympäristön käyttämä
kieli (suomi). Toistaiseksi vastaavia tutkimuksia oppijankielen kysymyksistä ja kysymisen
taidon kehittymisestä on pääasiassa vain englannin kielestä, eikä ruotsin osalta ole tarkasteltu
yhteyksiä taitotasoihin. Tutkimuksemme tulokset palvelevat näin myös suomi toisena kielenä
ja ruotsi toisena kotimaisena kielenä -opetusta.
Asiasanat: suomi toisena kielenä, ruotsi toisena kielenä, taitotasot, kirjoittaminen,
kysyminen
Lähteet
Ellis, Rod – Barkhuizen, Gary (2005): Analysing Learner Language. Oxford Applied Linguistics. Oxford:
Oxford University Press.
83
Investigating morphological complexity by means of iCALL log data
Trosterud, Trond
University of Tromsø
trond.trosterud@uit.no
At the University of Tromsø, we have developed an iCALL system for learning North Sami,
Oahpa (Antonsen et. al. 2009). Oahpa logs all student queries, 233 000 entries during the 3
years the program has been operative, including the feedback given by the system. For almost
half of the queries, the students have picked the inflection task. Query sets are drawn
arbitrarily, and the task is to give the correct wordform.
Treating the log data from all students as one corpus of learner data makes it possible
to study both the students’ knowledge of the Sami inflectional system, and the learning
process itself (by means of longitudinal studies). As an illustration, we here give the data for
the indicative and conditional verb inflection. Two log entries are given below (columns 1 =
id, 4 = user input, 5 = 0/1 = false/correct, 6 = correct answer, 7 = target morphosyntactic
word).
31216|morfa_V|2009-03-27|heiviidet|0|heiviide|heivet+V+Ind+Prt+Du2
31217|morfa_V|2009-03-27|billahuvve|1|billahuvve|billahuvvat+V+Ind+Prt+Pl3
For each set, he student chooses tense-mood combination, and the systems presents 5
infinitives at a time, combined with one of the nine personal pronouns (s1 ... p3). For each
randomly drawn person/number-value, the percentage of correct student answers found in the
log as a whole (N=35505) is shown below.
Corpus investigations of person-number usage (Trosterud 2004) show that Sg is the
most common number, and that Du is marginal, with 3rd person more common than 1st and
2nd (depending upon genre). The data from the Oahpa log show a totally different pattern,
thus showing that usage frequency is not the factor governing learnability. The forms best
mastered by the users are rather the ones with the simplest morphology: The outstanding Prs
Pl1 form is identical to the infinitive, and 3rd dual has a characteristic -ba suffix. The two
most difficult indicative present forms are Sg1, Sg2, the only forms in this paradigm that
84
show consonant gradation. Despite being central in communication, these two forms are thus
the most problematic ones for the learners. For past tense, the top 3 forms are the only ones
without consonant gradation, again singling it out as the main explanative factor. This is the
more remarkable, as even-syllabic Prt Sg1 exhibits a root vowel alternation (diphthong
simplification). The rest of the forms in the past tense paradigm show little variation, but 3rd
person comes out on top. For conditional, there is no stem variation; here the database is also
smaller (N=1522). Data from the nominal declension show that the most problematic case is
illative singular, which has both stem vowel alternation and diphthong simplification, but no
consonant gradation.
A preliminary conclusion is that the following hierarchy may explain the log data,
with the most difficult process to the left:
stem vowel alternation > consonant gradation > root vowel alternation > suffixation
> conversion
The talk will look at each stem type (bi- and trisyllabic and contract) separately,
distinguish frequent and less frequent lexemes, look at the effect of co-occurrence of several
morphological processes, and also take into account data from the other parts of speech.
Keywords: North Sami, language learning, morphology
References
Antonsen, Lene – Huhmarniemi, Saara – Trosterud, Trond 2009. Interactive pedagogical programs based on
constraint grammar. NEALT Proceedings Series; Volum 4. s. 10-17
Trosterud, Trond 2006. Homonymy in the Uralic Two-Argument Agreement Paradigms. Helsinki: Mémoires de
la Société Finno-Ougrienne 251
85
Russian-Finnish bilingual pupils’ writing tasks
Ullakonoja, Riikka; Nieminen, Lea; Haapakangas, Eeva-Leena; Huhta, Ari
University of Jyväskylä
riikka.ullakonoja@jyu.fi
Alderson, J. Charles
Lancaster University
The presentation focuses on Russian-Finnish bilingual pupils’ writing tasks in Finnish and
Russian that were collected during the first phase of DIALUKI-project (www.jyu.fi/dialuki).
The pupils are on grades 3-6 in an ordinary Finnish school, but their heritage language (the
language spoken at home) is Russian. The group (n=168) is very heterogeneous for example
because it includes both pupils who have immigrated to Finland only during the past year or
so and pupils who have been born in Finland. Writing performance of the pupils seems to be
very different among the pupils, especially in Russian, which is primarily used as a spoken
language among the majority of the pupils. According to Protassova (2004: 224-233) heritage
speakers of Russian living outside of Russia are likely to make mistakes in writing because
they lack experience of written Russian.
The writing tasks were collected as a part of a larger set of linguistic and
psycholinguistic tasks used in DIALUKI-project during autumn 2010 – spring 2011. The
pupils wrote one writing task per language. In Finnish the pupils wrote a letter to a Finnish
friend, a narrative of something that had happened or opinion text. In Russian they could
choose between two topics and write their opinion about it.
After data collection, three raters evaluated the writing tasks using Common European
Framework of Reference for foreign languages scales (CEFR). The CEFR-level gives us an
indication of each pupil’s writing skills in both languages. Our analysis is based on the
comparison between each pupil’s CEFR-level in both languages. Thus, we established four
sub-groups of the pupils: 1) both languages strong, 2) both languages weak, 3) Russian weak
+ Finnish strong and 4) Finnish strong + Russian weak. Then, we compared the background
variables of the pupils and their performance in the writing tasks.
We are mainly interested in how bilingualism is manifested in the writing tasks. Our
findings from Russian correspond to those of Protassova (2004), who has found that
inexperience in written Russian is manifested in spelling (mixing the two alphabets as well as
writing the words “as they are pronounced”). Previous studies have not, to our knowledge,
been conducted in such a large scale for Finnish. Our findings from Finnish show that
bilingualism is seen in various ways e.g. in the morphological level. To conclude,
bilingualism is a complicated phenomena and it is not evident that immigrants will
“automatically” grow to be bilingual both through spoken and written media in both of their
languages.
Keywords: Finnish as a target language, Russian as a first language, writing, CEFR
References
Protassova, Jelena. 2004. Fennorossy: zhizn’ i upotreblenie jazyka. Sankt-Peterburg: Zlatoust.
86
Aspects of a construction grammar based approach to the teaching of Finnish infinite
constructions in the Finnish as a foreign language classroom
Wessel, Katri Annika
Munich University
katri.wessel@lmu.de
The aim of the paper is to present and discuss (preliminary) results of a project which is being
carried out at the Department of Fennougristics/Uralistics at Munich University. The project
focuses on the question of how an approach that is based on construction grammar can
contribute to the teaching of Finnish as a foreign language (especially to native speakers of
German or native speakers of other languages who study Finnish in a German speaking
environment) as well as to developing a theory of (primarily Finnish to German) translation
based on syntactic features.
Within this framework the paper focuses on infinite constructions of Finnish. As
phenomena that considerably differ from the learners’ mother tongue(s) tend to represent
challenges in the acquisition of a foreign language, the paper focuses on infinite constructions
which differ from their German counterparts, such as some –mA-infinitives or participle and
infinitive constructions which can replace subordinate clauses. In the paper examples of
infinite constructions, which learners acquire at different stages of their learning of Finnish,
are examined from the perspective of construction grammar and compared to their German
counterparts. Conclusions which this comparison of infinite constructions and their
counterparts implies for the teaching of Finnish as a foreign language on different levels of
acquisiton are not only considered in theory, but also discussed in the light of experience in
the classroom.
Keywords: infinite constructions, construction grammar, teaching of Finnish as a foreign
language
References
Boas, Hans. C. 2008. Determining the structure of lexical entries and grammatical constructions in Construction
Grammar. – Annual Review of Cognitive Linguistics 6, 113-144.
Bybee, Joan 2001. Main clauses are innovative, subordinate clauses are conservative: consequences for the
nature of constructions. Bybee, Joan – Noonan, M. (eds.). Complex sentences in grammar and
discourse. Essays in honor of Sandra A. Thompson. Amsterdam: Benjamins.
Goldberg, Adele 1997. Construction Grammar. – Brown, E.K. – Miller, J.E. (eds.). Concise Encyclopedia of
Syntactic Theories. New York: Elsevier Science Limited.
Haberzettl, Stefanie 2006. Konstruktionen im Zweitspracherwerb. – Fischer, Kerstin – Stefanowitsch, Anatol
(eds.). Konstruktionsgrammatik. Von der Anwendung zur Theorie. Tübingen: Stauffenburg. 55-77.
Hakulinen, Auli (ed.). 1983. Näkökulmia kielen rakenteisiin. Nykysuomen rakenne ja kehitys 1. SKS-Tietolipas,
93. Helsinki: SKS.
Herlin, Ilona. – Visapää, Laura (eds.) 2005. Elävä kielioppi. Suomen infiniittisten rakenteiden dynamiikkaa.
Helsinki: Suomalaisen Kirjallisuuden Seura.
Skribnik, Elena 2005. From complex sentence structures to complex predicates: some grammaticalization
patterns in Siberian languages. – Sprachtypologie und Universalienforschung 58(1), 139–148.
87
Idiom principle in second language use
Vetchinnikova, Svetlana
University of Helsinki
svetlana.vetchinnikova@helsinki.fi
SLA research seems to have reached a stage where most scholars would take it for granted
that multi-word units (MWUs) and collocations in particular present particular difficulties for
L2 learners (Schmitt 2004, Meunier & Granger 2008, Granger 2009). Evidence seems to
suggest that very often the trouble lies in their apparent inability to reproduce these
(formulaic) sequences correctly, that is, exactly matching the standard forms (e.g. Howarth
1998, Nesselhauf 2005, De Cock 2000). Very often the reason behind such infelicities is
believed to be transfer from one’s mother tongue (e.g. Gyllstad 2007, Paquot 2008) and/or
tendency to operate on the open-choice rather than on the idiom principle (Granger 1998,
Kjellmer 1991), or even downright unavailability of the idiom principle to L2 learners (Wray
2002).
At the same time there is another possible explanation of this phenomenon. Mauranen
(2005, 2009) maintains that if a word combination used by a non-native speaker still achieves
its communicative purpose, slight variation in its form is negligible and can be termed
approximation. Idiom principle as it was conceptualised by Sinclair (1987, 1991) tolerates
variation in form: words are co-selected into a unit of meaning not only by verbatim
association or collocation, but also by colligation, or association with a grammatical class of
items, and semantic preference, or association with a semantic set of items. Therefore, a
certain structural or semantic approximation in a MWU would be completely in line with the
model of a unit of meaning, and a MWU showing such approximations can still be claimed to
be produced on the idiom principle.
My data consists of drafts written by EFL students for their Master’s theses which are
collected longitudinally and compiled into several individual for each student corpora. In
order to create lists of potential MWUs used in each of the corpora, I will run them through a
phraseological engine ConcGram (Greaves 2009). The program automatically finds all the
co-occurrences of two words in a corpus irrespective of positional or constituency variation.
To test the mechanism of approximation, I will compare lists of concgrams generated from
student corpora with lists of concgrams generated from the matched reference corpora
compiled from the bibliography of each student’s thesis.
Preliminary results suggest that at least half of all the co-occurrences in the student
writings exactly match the co-occurrences in the reference corpora demonstrating continuity
between the lexical input of the L2 writers and their output. The cases where the cooccurrences do not match exactly can therefore throw light on the idiom principle in second
language use and the associated mechanism of approximation.
Keywords: SLU, idiom principle, unit of meaning, approximation, concgrams
References
De Cock, Sylvie. 2000. Repetitive phrasal chunkiness and advanced EFL speech and writing. – Christian Mair –
Marianne Hundt (eds.), Corpus Linguistics and linguistic theory, 51-68. Amsterdam: Rodopi.
Granger, Sylviane. 1998. Prefabricated patterns in advanced EFL writing: Collocations and formulae. –
Anthony P. Cowie (ed.), Phraseology, 145-160. Oxford: Clarendon.
88
Granger, Sylviane. 2009. The contribution of learner corpora to second language acquisition and foreign
language teaching: A critical evaluation. – Karin Aijmer (ed.), Corpora and language teaching, 13-31.
Amsterdam: John Benjamins.
Greaves, Chris. 2009 ConcGram 1.0: A phraseological search engine. Amsterdam: John Benjamins.
Gyllstad, Henrik. 2007. Testing English Collocations: Developing Receptive Tests for Use with Advanced
Swedish Learners. PhD thesis.
Howarth, Peter. 1998. The Phraseology of learners’ academic writing. – Anthony P. Cowie (ed.), Phraseology,
161-186. Oxford: Clarendon.
Kjellmer Goran. 1991. A mint of phrases. – Karin Aijmer – Bengt Altenberg (eds.), English Corpus Linguistics:
Studies in honour of Jan Svartvik, 111-127. London : Longman.
Mauranen, Anna. 2005. English as a Lingua Franca—an unknown language? – Giuseppina Cortese – Anna
Duszak (eds.), Identity, community, discourse: English in intercultural settings, 269–293. Frankfurt:
Peter Lang.
Mauranen, Anna. 2009. Chunking in ELF: Expressions for managing interaction. – Journal of Intercultural
Pragmatics 6(2). 217-233.
Meunier, Fanny & Granger, Sylviane (eds.). 2008. Phraseology in foreign language learning and Teaching.
Amsterdam: John Benjamins.
Nesselhauf, Nadja. 2005. Collocations in a learner corpus. Amsterdam: Benjamins.
Paquot, Magali. 2008. Exemplification in learner writing: A cross-linguistic perspective. – Meunier, Fanny –
Granger, Sylviane (eds.), Phraseology in foreign language learning and teaching, 101- 119.
Amsterdam: John Benjamins.
Schmitt, Norbert (ed.). 2004. Formulaic sequences: Acquisition, processing and use. Amsterdam: John
Benjamins.
Sinclair, John McH. 1987. Collocation: a progress report. – Ross Steele – Terry Treadgold (eds.), Language
topics: Essays in honour of Michael Halliday, 319-331. Amsterdam: John Benjamins.
Sinclair, John. 1991. Corpus, concordance, collocation. Oxford: Oxford University Press.
Wray, Alison. 2002. Formulaic language and the lexicon. Cambridge: Cambridge University Press.
89
Dialogia työyhteisössä: kansainvälisten sairaanhoitajaopiskelijoiden käsityksiä
ammatillisen kielitaidon kehittymisen tuen muodoista
Virtanen, Aija
Jyväskylän yliopisto
aija.virtanen@jyu.fi
Maahanmuuttajataustaisen terveydenhoitoalalla työskentelevän henkilöstön kielitaito on
herättänyt paljon julkista keskustelua: mitä on esimerkiksi sairaanhoitajien riittävä kielitaito
tällä sektorilla (ks. Kela & Komppa 2011)? Kysymys ei koske vain Suomen rajojen
ulkopuolelta rekrytoitua työvoimaa vaan myös Suomessa alalle opiskelevia maahanmuuttajia.
Tämän ryhmän kielitaitokysymykset eivät ole keskusteluissa kuitenkaan nousseet vielä esiin.
Tässä
esitelmässä
keskityn
englanninkielisen
sairaanhoitajakoulutuksen
kansainvälisten opiskelijoiden käsityksiin ammatillisen kielitaitonsa kehittymiseen
vaikuttavista tekijöistä: millaista kielellisestä tukea työharjoitteluiden aikana saadaan? Mikä
tukee kielitaidon kehittymistä ja mikä on kehittymisen esteenä?
Teoreettisena lähtökohtana on sosiokognitiivinen lähestymistapa, jossa yhdistyvät
sosiokulttuuriset (Vygotsky 1978, van Lier 2004) ja dialogiset näkökulmat (Bakhtin 1986,
Linell 2009, Dufva ym. 2011). Kieli ja siihen liittyvät käsitykset nähdään dynaamisina,
jaettuina ja varioivina ilmiönä: kielessä on paitsi kognitiivinen myös sosiaalinen ulottuvuus.
Tutkimus on osa Suomi työkielenä: sosiokognitiivinen näkökulma maahanmuuttajien
ammatilliseen kielitaitoon -tutkimushanketta.
Aineisto koostuu englanninkielisessä koulutusohjelmassa toista vuotta opiskelevien
kansainvälisten opiskelijoiden teemahaastatteluista, joissa on keskitytty etenkin
työharjoittelussa kohdattuihin kielenkäyttötilanteisiin sairaalaympäristössä. Aineisto on
litteroitu puolikarkeasti sekä analysoitu sisällönanalyyttisin menetelmin ja hyödyntäen
dialogista käsitysanalyysia (Aro 2009), jossa huomion kohteena ovat etenkin aineistossa
esiintyvät jaetut äänet ja eri tahoille asettuva toimijuus.
Tulokset osoittavat, että erityisesti ohjaavien hoitajien ja asiakkaiden kanssa
käytävällä dialogilla on tärkeä rooli: toistuvat kielenkäyttötilanteet ja niissä saatava
kielellinen tuki ovat olennaisessa osassa ammatillisen kielitaidon kehittymisessä. Tähän
osalliseksi pääseminen vaatii myös muiden työyhteisön jäsenien halukkuutta olla dialogin
osapuolina.
Asiasanat: ammatillinen kielitaito, dialogisuus, käsitykset, sosiokulttuurisuus, suomi toisena
kielenä, terveydenhoito
Lähteet
Aro, Mari 2009. Speakers and doers: Polyphony and agency in children’s beliefs about foreign language
learning. Jyväskylä Studies in Humanities 118. Jyväskylä: Jyväskylän yliopisto.
Bakhtin, Mikhail Mikhailovich 1986. Speech genres and other late essays. Austin: University of Texas Press.
Dufva, Hannele – Aro, Mari – Suni, Minna – Salo, Olli-Pekka 2011. Onko kieltä olemassa? Teoreettinen
kielitiede, soveltava kielitiede ja kielen oppimisen tutkimus. – Esa Lehtinen – Sirkku Aaltonen – Merja
Koskela – Elina– Mariann Skog-Södersved (toim.), AFinLA-e: Soveltavan kielitieteen tutkimuksia 3,
22–34. Jyväskylä: AFinLA.
Kela, Maria – Komppa, Johanna. 2011. Sairaanhoitajan työkieli: yleiskieltä vai ammattikieltä? Funktionaalinen
näkökulma ammattikielen oppimiseen toisena kielenä. – Puhe ja kieli 31, (4), 173–192.
Lave, Jean – Wenger, Etienne. 1991. Situated learning:Legitimate peripheral participation. Cambridge:
Cambridge University Press.
90
Linell, Per 2009. Rethinking language, mind, and world dialogically. Charlotte, NC: IAP Press.
van Lier, Leo 2004. The ecology and semiotics of language learning. A sociocultural perspective. Boston:
Kluwer Academic Publishers.
Vygotsky, Lev Semyonovich 1978. Mind in society: The development of higher psychological processes.
Cambridge, MA: Harvard University Press.