Mallar för specifikationer - Demografiska databasen
Transcription
Mallar för specifikationer - Demografiska databasen
Forskarservicehandbok Demografiska databasen Datum:.............................................. 2010-04-15 Version: ............................................. version 1.6 Projekt: .................................................... L_IF05 Namn: ......................................... Carin Hedlund Användarhandbok för forskarservice 2 Innehållsförteckning Innehållsförteckning........................................................................................................................... 3 Mål och syfte med forskarservicehandboken..................................................................................... 6 Övergripande mål ........................................................................................................................................6 Målgrupp ......................................................................................................................................................6 Syfte ...............................................................................................................................................................6 Dokument och mallar ......................................................................................................................... 7 Övrigt ................................................................................................................................................... 8 Projekt...........................................................................................................................................................8 Miniuttag.......................................................................................................................................................8 Uttagsnummer och avtalsnummer .............................................................................................................8 Diarienummer ..............................................................................................................................................8 Forskarservicerutiner ......................................................................................................................... 9 Checklista .......................................................................................................................................... 11 Specifikation...................................................................................................................................... 12 Mallar för specifikationer..........................................................................................................................14 Avtal ................................................................................................................................................... 15 Mallar för avtal ..........................................................................................................................................15 Kravspecifikation .............................................................................................................................. 16 Mall för kravspecifikation.........................................................................................................................16 Dokumentation, test och kvalitetssäkring av framtaget forskaruttag............................................. 17 Test av uttag - systemutvecklarna ............................................................................................................17 Mall för test.................................................................................................................................................17 Kundens dokumentation ...........................................................................................................................17 Mallar för dokumentation.........................................................................................................................18 Kvalitetssäkring/verifiering av uttag........................................................................................................18 Mall för kvalitetssäkring/verifiering ........................................................................................................18 Mall för utvärderingsenkät till kunden....................................................................................................19 Översikt över inregistrerat kyrkoboksmaterial och perioder........................................................... 20 Sundsvallsregionen.....................................................................................................................................20 Skellefteåregionen ......................................................................................................................................21 Försöksförsamlingarna..............................................................................................................................21 Linköpingsregionen....................................................................................................................................22 Norra inlandsregionen ...............................................................................................................................23 Församlingar inregistrerade av externa samarbetspartner ...................................................................24 Översikt över parallella material ...................................................................................................... 25 Användarhandbok för forskarservice 3 Mer om våra församlingar................................................................................................................ 26 Källbeskrivningar ......................................................................................................................................26 Andra dokument om församlingarna.......................................................................................................26 Anteckningar om ologiskheter ..................................................................................................................27 Etnicitet.............................................................................................................................................. 28 Allmänt om indikatorer.............................................................................................................................29 Beskrivning av indikatorerna ...................................................................................................................30 Indikator för anmärkning .................................................................................................................................... 30 Indikator för dödsorsak........................................................................................................................................ 30 Indikator för yrke ................................................................................................................................................. 30 Indikator för namn ............................................................................................................................................... 30 Indikator för boställe ............................................................................................................................................ 31 Indikator för relationer ........................................................................................................................................ 31 Tabellverket ....................................................................................................................................... 32 Allmänt........................................................................................................................................................32 Bortfallet i Tabellverksmaterialet.............................................................................................................32 Bortfall, länskoder ................................................................................................................................................ 33 Dödsorsker ..................................................................................................................................................34 Att göra uttag från tabellverket................................................................................................................34 Skapa uttagsfilen ................................................................................................................................................... 35 Export av uttagsfilen............................................................................................................................................. 35 Dokumentation ...................................................................................................................................................... 35 LinnéDb ............................................................................................................................................. 36 Initial hantering för att skapa LinnéDb.............................................................................................................. 36 Teknisk miljö ......................................................................................................................................................... 36 Tillgänglighet för forskning ......................................................................................................................37 Rutiner vid hantering av LinnéDb ...........................................................................................................37 Grundläggande villkor ......................................................................................................................................... 37 Roller och rutiner för forskarservice på Linnedb.............................................................................................. 37 Tillståndsgruppen ................................................................................................................................................ 37 Forskare ................................................................................................................................................................. 37 Ämnesexpert ......................................................................................................................................................... 37 Forskarserviceansvarig........................................................................................................................................ 38 Utredare................................................................................................................................................................. 38 Systemutvecklare.................................................................................................................................................. 38 System-/databasadministratörer ....................................................................................................................... 38 Forskarservicerutiner för uttag från LinnéDb................................................................................................... 38 Checklista............................................................................................................................................................... 39 Systemadministrativa rutiner vid forskarservice på Linnedb .......................................................................... 40 Inför uppstart av ett uttagsprojekt ........................................................................................................................... 40 När uttaget är färdigt:.............................................................................................................................................. 40 Dokumentation kring uttag från LinnéDb ......................................................................................................... 40 Forskarservicerollen ......................................................................................................................... 41 Forskarservicerollen ......................................................................................................................... 41 Några tankar kring Demografiska databasens material och forskarservice........................................41 Popum .................................................................................................................................................................... 41 Forskarservice i praktiken ................................................................................................................................... 44 Olika sätt att analysera Popum-material inom forskning................................................................................. 45 Exempel forskningsfråga...................................................................................................................................... 47 Exempel Forskningsfråga..................................................................................................................................... 49 Användarhandbok för forskarservice 4 Yrken...........................................................................................................................................................51 Några allmänna principer .................................................................................................................................... 51 Några punkter att observera................................................................................................................................ 51 Forskarservicerollen ..................................................................................................................................53 Uppgift - specifikation av beställning................................................................................................................. 53 Krav på utredare................................................................................................................................................... 53 DDB’s material - Befolkningsdatabasen ............................................................................................................. 54 ”Svagheter” i materialen som måste beaktas ..................................................................................................... 55 Några erfarenheter från forskaruttag......................................................................................................58 Ofullständiga datum ............................................................................................................................................. 58 Familjestorlek........................................................................................................................................................ 58 Relationer............................................................................................................................................................... 59 Flyttning................................................................................................................................................................. 59 Attester................................................................................................................................................................... 60 Etnicitet .................................................................................................................................................................. 60 Närvaro för små barn ........................................................................................................................................... 60 Födelse- och dop i Skellefteå ................................................................................................................................ 61 Yrken...................................................................................................................................................................... 61 Källor som saknas ................................................................................................................................................. 62 Offert, Prislistor och debiteringsunderlag ....................................................................................... 64 Mallar för offert .........................................................................................................................................64 Debitering för uttag ur Popum .................................................................................................................64 Debitering för uttag ur Tabellverket........................................................................................................64 Gästforskarpolicy .............................................................................................................................. 65 Litteratur............................................................................................................................................ 65 Kundadministration .......................................................................................................................... 65 Användarhandbok för forskarservice 5 Mål och syfte med forskarservicehandboken Övergripande mål Detta dokument skall fungera som vägledning vid forskaruttag från databasens material. Det bör också leda till att vi arbetar efter gemensamma regler och med ett likartat arbetssätt vid forskaruttag. Målgrupp Dokumentets målgrupp är alla som arbetar med forskarservice. Syfte Syftet är att så heltäckande som möjligt beskriva de aktuella rutinerna vid forskaruttag, samt lyfta fram viktiga egenskaper och problem i DDB:s material som kräver särskild hantering vid forskaruttag. Även de ’kända’ problem som ännu inte dokumenterats men som ’gamla FOU’ känner till och hanterar med ryggmärgen bör komma på pränt i denna forskarservicehandbok för att underlätta för de nya utredarna att snabbare bli insatta i forskarservice. I forskarservicehandboken ingår även de mallar som behövs under olika moment rörande forskarservice. Forskarservicehandboken skall ge en beskrivning av följande moment: - Översikt över inregistrerat kyrkoboksmaterial och perioder - Egenheter hos vissa församlingar och regioner - Översikt över parallella material - Gällande forskarservicerutiner och checklista - Att tänka på vid dialogen med forskaren (Erfarenheter från Sören och Inez) - Debiteringspolicy; prislistor, kostnadsberäkningar och offerter (mallar och aktuella priser) - Att skriva specifikation utifrån forskarens önskemål (mall skall användas) - Att tänka på när man skriver kravspecifikation (mall skall användas) - Kvalitetssäkring och kontroll av framtaget forskaruttag (mall skall användas) - Dokumentation till forskaren, vad som bör ingå, vad som ej ska tas med (mall skall användas) - Övrig dokumentation kring uttaget - Avtal som beställaren ska skriva på (mall skall användas) - Utvärderingsenkät som bifogas med uttaget till beställaren (mall skall användas) - En beskrivning av typiska problemställningar som forskarservicepersonal kan möta, och föreslå lösningar för dessa. - Kundadministration – ett system för att hantera kunderna, ta fram unika uttagsnummer och avtalsnummer. Systemet är sökbart på forskares namn, uttagsnummer, avtalsnummer, diarienummer, datum, forskningsområde samt olika variabler och nyckelord. Användarhandbok för forskarservice 6 - Samtliga dokument som rör ett forskaruttag ska ha samma uttagsnummer, avtalsnummer och diarienummer Dokument och mallar För de dokument som används i samband med forskarservice har mallar tagits fram. Dessa skall alltid användas. Följande dokument och mallar finns. Specifikation av uttag från Tabellverk och från Popum3. Svenska och engelska versioner. Kravspecifikation. Test. Verifiering/ kvalitetssäkring. Dokumentation av uttag till kunden från Popum3 och från Tabellverket. Svenska och engelska versioner. Utvärderingsenkät. Svensk och engelsk version. Avtal. Svensk och engelsk version. Offert. Svensk och engelsk version. Samtliga mallar finns tillgängliga på vårt intranät Company Home > DDB > Mallar > Forskarservice När uttaget är klart, skall projektledaren för uttaget överlämna dokumentet till forskarserviceansvarig (Carin) för dokumentation av uttaget, samt lägga upp dem på vårt intranät Alfresco. Dokument Ansvarig inom projektet för dokumentet Specifikation Utredare Kravspecifikation Systemutvecklare Testdokumentation systemutvecklare som gjort test Kvalitetssäkrings-/ utredare eller utvecklare som gjort kvalitetssäkring (verifiering) Verifieringsdokument Kundens dokumentation Systemutvecklare Offert (kopia) administration (Siv) (ej på Alfresco) Avtal (kopia) administration (Siv) (ej på Alfresco) Användarhandbok för forskarservice 7 Övrigt Projekt Uttag skall betraktas som projekt med ansvarig projektledare. Specifikationen ses som projektbeskrivning. När specifikation och kravspecifikation är godkända, ska inga ytterligare förändringar göras. Ingen direktkontakt ska ske mellan system och forskare, diskussioner ska alltid ske i samråd med ansvarig utredare. Miniuttag Miniuttag- avser 1 – 2 dagars kodning med kort dokumentation och kontroll. Endast i vissa fall sker kvalitetssäkring (verifiering). Ingen kravspecifikation behövs och endast en enklare specifikation. Totalt max 3 dagar. Uttagsnummer och avtalsnummer Uttagsnummer och avtalsnummer tas fram via Kundadministrationssystemet, FosAdm, och anges i samtliga dokument av uttaget. Till varje uttag anges ett unikt nummer Uåålll (U-uttag, åå- 2 sista siffrorna i aktuellt år, lll- löpnummer inom året). Till varje uttag kan det finnas en till flera kunder, varje kund skriver på ett eget avtal som numreras Kåålll (K-avtal, åå- 2 sista siffrorna i aktuellt år, llllöpnummer inom året). Det kan därför finnas flera avtal till ett uttag. Om kunden senare får en komplettering i form av miniuttag till aktuellt uttag kan i vissa fall samma avtal gälla, varför ett avtal kan knytas till flera uttag. Kundadministrativa systemet, FosAdm, används för att hålla ordning på kunderna, uttagen och avtalen. Diarienummer Samtliga dokument som rör ett forskaruttag ska ha samma diarienummer. Detta diarienummer tas fram av administration. 8 Forskarservicerutiner ( 2007-06-11 Uttagsgruppen, 2008-10-08 IF Styrgruppen) 1. Kunden kommer med en frågeställning och förfrågan på uttag till DDB. Kunden kan även skriftligen ange sina önskemål på befintlig specifikationsblankett som finns på vår hemsida. 2. Kunden och utredaren tar tillsammans fram en ”grovspecifikation”, specifikationsmallen skall användas. Utredaren ansvarar för att forskarserviceansvarig får ”grovspecifikationen” i god tid före terminsplaneringen. Forskarserviceansvarig ger uttaget ett unikt uttagsnummer samt för in uttaget på listan över aktuella forskaruttag. Vid terminsplaneringen bestäms vilka, utredare och systemutvecklare, som skall ingå i projektet. Förfrågningar om uttag som inkommer under terminen planeras in i mån av tid och ansvariga utredare och systemutvecklare utses. 3. För större uttag utarbetar utredaren och forskarserviceansvarig en offert till kunden i samråd med platschefen i Umeå, med ”grovspecifikationen” som underlag. För mindre uttag anges ett kostnadsförslag på annat sätt. Den färdiga offerten skickas i två exemplar av utredaren till kunden för godkännande och underskrift. Med offerten biläggs specifikationen och avtal, som anger på vilket sätt DDB:s material får utnyttjas. Befintliga mallar för offert och avtal skall användas. 4. Kunden återsänder godkänd offert och avtal. Om kunden inte är beredd att acceptera offerten, kan ny specifikation och offert omformas till den kostnad kunden är beredd att betala. 5. Platschefen i Umeå godkänner offerten genom sitt undertecknande av densamma. Ett exemplar återsänds till kunden. Det andra exemplaret lämnas till administration för arkivering. 6. Kunden och utredaren tar tillsammans fram en mer detaljerad specifikation där det tydligt framgår hur kunden vill ha sitt material, format på filer och variabler samt kriterier för de olika variablerna. Specifikationen slutförs i samarbete med systemutvecklare. Mall för specifikationen skall användas. 7. Kunden skall (interna kunder skriftligen) godkänna specifikationen innan programmering av uttaget påbörjas. 8. Systemutvecklaren utformar en kravspecifikation utifrån specifikationen, vid behov i samråd med utredaren. Mall för kravspecifikationen skall användas. Kraven skall vara utformade på ett mätbart sätt. 9. Utredare läser och godkänner kravspecifikationen. 10. Systemutvecklaren genomför uttaget i enlighet med kravspecifikationen. 11. Systemutvecklaren testar det framtagna materialet, skapar statistik samt dokumenterar detta enligt framtagen testmall. 12. Systemutvecklaren färdigställer dokumentation till kunden över uttaget. Befintlig mall skall användas för detta ändamål. 13. Utredare kvalitetssäkrar/verifierar och godkänner uttaget, både filer och den framtagna dokumentationen. Kvalitetssäkringen/verifieringen dokumenteras med befintlig mall. 14. Administration tar fram ett diarienummer för uttaget. Administration skriver räkning, som sänds tillsammans med uttag, av föreståndaren underskrivet avtal om nyttjande av DDB-material, följebrev, dokumentation och framtagen utvärderingsblankett till kunden. Utvärderingsblankett bifogas ej till mini-uttag. Det är viktigt att avtalsnummer, uttagsnummer och diarienummer finns i dokumentationen. 15. Kunden är ansvarig för kontroll av sitt material och skall inom tre månader påpeka eventuella felaktigheter för kostnadsfri korrektion, såvida ingen annan tidsperiod överenskommit. 9 16. Systemutvecklaren arkiverar en säkerhetskopia av uttaget. 17. Projektledaren sammanställer all dokumentation forskarserviceansvarig att uttaget är levererat. kring uttaget och meddelar 18. Projektledaren lägger in slutrapporten för projektet på intranätet Alfresco. För vanliga uttag består slutrapporten av specifikation, kravspecifikation, test, kvalitetssäkring/verifiering och kundens dokumentation. För miniuttag består slutrapporter av specifikation och kundens dokumentation och ev. testdokument. 19. Projektledaren utvärderar projektet tillsammans med övriga projektdeltagare, sammanställer utvärderingen och skickar den till forskarserviceansvarig. 20. Forskarserviceansvarig sammanställer och arkiverar den undertecknade specifikationen, kravspecifikationen, dokumentation av tester, kvalitetssäkring/verifiering, slutdokumentationen samt en kopia av avtalet och offerten. 21. Styrgruppen för information och forskarservice granskar och godkänner slutrapporten som finns på intranätet Alfresco. 22. Efter överenskommen tidpunkt raderas uttagets testtabeller ur databasen. 10 Checklista No Aktivitet/ansvarig Utredare System Kunden 1 Frågeställningen X 2 Specifikation X 3 Offert X 4 Accept X 5 Avtal X 6 Kravspecifikation (allt måste vara mätbart) 7 Godkänd kravspecifikation 8 Uttag & test mot kravspecifikation. X 9 Statistik & test av uttaget dokumenteras X 10 Dokumentation tas fram till kunden X 11 Kvalitetssäkring av uttaget, filer och kundens dokumentation, samt godkännande av uttaget. Föreståndaren ADM X x X X X X X X Kvalitetssäkringen dokumenteras. 12 Ta fram och sammanställa inför leverens; dnr, avtal, räkning, filer, kundens dokumentation, utvärderingsblankett, följebrev, etc. X 13 Leverans X 14 Backup av uttag på CD X X X Filer, programvara, dokumentation 15 Rensning testtabeller 16 Slutrapport på DDB:s intranät 17 Arkivering Personalchef Umeå X X X 11 Specifikation Kunden kommer med en frågeställning och förfrågan på uttag till DDB. Kunden kan även skriftligen ange sina önskemål på befintlig specifikationsblankett som finns på vår hemsida. Kunden och utredaren tar därefter tillsammans fram en mer detaljerad specifikation och använder då samma mall för specifikationen, den finns även på nätet. Specifikationen ska överensstämma med kundens frågeställning och tas fram i samråd med kunden. Framtagen mall ska användas. Utredarna ska använda gemensamma regler och mallar för att skriva specifikationerna. Specifikationen ska vara skriven på ett enkelt och tydligt sätt så att den inte kan feltolkas. Specifikationen ska innehålla kundens övergripande frågeställning och syfte med uttaget. Ska tydligt ange hur kunden vill ha sina data för att kunna analysera dem (datumhantering, missing value, avskiljare mellan variablerna, filformat). Ska innehålla urvalskriterier för uttaget, valda tidsperioder, församlingar och regioner. Regler för att hantera; ofullständiga datum, saknade värden, felaktiga och ologiska uppgifter samt regler för att generera nya variabler ska klart framgå. Ska skrivas så att den kan fungera som underlag till systemutvecklarna när de tar fram kravspecifikationen. När specifikationen är klar ska kunden godkänna den innan den lämnas vidare till systemutvecklaren. Interna kunder godkänner skriftligen specifikationen. Inga förändringar ska göras av godkänd specifikation. Eventuella förändringar och tillägg får hanteras som nya uttag (miniuttag). Godkänd specifikation läggs upp på intranätet Specifikationen överlämnas därefter till systemutvecklarna och oklarheter diskuteras och löses gemensamt av utredare och systemutvecklare. Om ändringar görs läggs den nya versionen upp på intranätet, där versionshanteringen gör det möjligt att spåra ev. förändringar. Specifikation, kravspecifikation och kundens material (filer och dokumentation) ska överensstämma. 12 Problem med att skriva forskarspecifikation Hur kan man från forskarens frågeställning ta fram en specifikation? Vad är viktigt att tänka på? Hur vet vi att vi har samsyn med beställaren? Hur hanteras ologiska och felaktiga uppgifter i våra material i samband med uttagen: dels de källtrogna dels de som är felaktigt inregistrerade dels de som är felaktigt genererade o Hur informeras forskarna om detta? o Hur hanteras de vid analyser? I avsnittet ’Forskarservicerollen’ hanteras många av de problem som kan uppstå och förslag på lösningar av problemen presenteras. Några exempel på problem som kan uppstå när man skriver specifikation listas nedan. Ofullständiga datum, är en ständig källa till problem. I nya PERSON-tabellen försöker man nu hantera detta när det är möjligt via nya regler, men det finns fortfarande kvar ett mindre antal av ofullständiga datum. I källtabellerna finns problemet kvar med ofullständiga datum, som är källtrogna, vilket orsakar olika typer av datumproblem. vilka regler för datumhanteringen kan användas och i vilka specifika fall? Närvaro, att fastställa när en individ finns i församlingen Är det när individen finns noterad i någon källa? Endast när individen finns skriven i husförhörslängden dvs. är boende i församlingen? Hur hanteras de individer som är skrivna på sidor över ’obefintliga’ och under ’okänd ort’? Hur hanteras informationen när det saknas start och/eller slutdatum på noteringen? Små barn som föds och inte skrivits in i husförhörslängden direkt, ska deras närvaro genereras från moderns närvaro om moderns finns närvarande vid barnets födelse? Yrken. I källorna finns yrken angivna vid speciella tillfällen och en fastställd tidpunkt (ex. död, vigsel) men även för en tidsperiod som i husförhörslängden. Vilka yrken ska väljas och när? Vid vilken tidpunkt gäller yrket i husförhörslängden, vid start eller slut? Hur hanteras yrken där något datum saknas på noteringen? Vems yrke finns egentligen på noteringen, TYREL och TYAGA? 13 Om yrket ska gälla vid en viss händelse och yrkesuppgift saknas då, ska yrke före eller efter denna händelse väljas, vilka regler gäller för olika händelser, hur långa tidsintervall är lämpliga att söka inom? Om flera yrkesuppgifter finns på samma notering, vilket av yrkena är ’huvud’yrket? Ska yrke hämtas från annan individs notering, via barnets notering i FD-boken? Faderns yrke finns ofta angivet i FD-boken på barnets notering och ibland kan även moderns yrke finnas där. Regioner och församlingar Några problem med att hantera hela ’olänkade’ regioner o PNR som ej är unika delade identiteter (flera personer har fått samma identitet) dubbla identiteter (samma person har olika identiteter) variabler som har olika värde i olika församlingar (ologiskheter) ex. kön. o Dubbel närvaro, individen kan finnas i flera församlingar samtidigt o Olika relationer i olika församlingar o Olika namn i olika församlingar Hur ska prioriteringarna göras, finns oskrivna regler som brukar användas? Relationer De olika regionerna och församlingarna har inregistrerats med olika verktyg och olika regler har använts vid inregistreringen. Ett problem som har uppstått är att fastställa om relationer mellan barn och föräldrar är biologisk eller ej, eftersom helt olika regler har använts. För de gamla församlingarna (SUL, SKE och försöksförsamlingarna) sattes endast biologisk relation, RBES= 1, om det klart framgick i källan, d.v.s. var utskrivet. Övriga, troliga biologiska relationer och okända, fick värde för obestämd relation, RBES = 0. För senare inregistrerade regioner, (LIN och NIL) med Regina, sätts värde 1 om det inte klart framgår att barnet-föräldern har en annan typ av relation. Mallar för specifikationer Mallar finns för specifikationer för uttag från Popum3 och från Tabellverket, både på svenska och på engelska. Se avsnittet ’Dokument och mallar’. 14 Avtal För större uttag utarbetar ansvarig utredare och forskarserviceansvarig en offert till kunden i samråd med platschefen i Umeå, med ”grovspecifikationen” som underlag. Den färdiga offerten skickas i två exemplar av utredaren till kunden för godkännande och underskrift. Med offerten biläggs specifikationen och avtal, som anger på vilket sätt DDB:s material får utnyttjas. Befintliga mallar för offert och avtal skall användas. Kunden återsänder godkänd offert och avtal innan uttaget kan påbörjas. Vid leverens, skickas av föreståndaren underskrivet avtal om nyttjande av DDB-material, tillsammans med uttag, följebrev, dokumentation och utvärderingsblankett till kunden. Det är viktigt att avtalsnummer, uttagsnummer och diarienummer finns med i samtliga dokument. Mallar för avtal Mallar finns för avtal både på svenska och engelska, se avsnittet ’Dokument och mallar’. 15 Kravspecifikation Kravspecifikationen beskriver vad som ska göras inte hur det ska göras. I kravspecifikationen kan även beslutsträd och beslutstabeller finnas med istället för att skriva allt i klartext. Variabler och varifrån de hämtas ska alltid skrivas i klartext. Systemutvecklaren utformar en kravspecifikation utifrån specifikationen, vid behov i samråd med utredaren. För varje variabel i uttaget specificeras konkreta regler som namnges. Problem som uppstår och oklarheter ska diskuteras med utredaren, ej med kunden. Mall för kravspecifikationen skall användas. Kraven skall vara utformade på ett mätbart sätt. Kraven ska numreras så att det är enkelt att testa det färdiga materialet mot kravspecifikationen Kravspecifikationen är uppdelad efter hur variablerna hör samman och för varje uppdelning finns ett antal krav. Kraven namnges så att de börjar med första bokstaven i uppdelningsnamnet och ett påföljande nummer, ex. P5 = person krav 5. Varje krav ska ha ett unikt regelnamn. Utredare läser och godkänner kravspecifikationen innan själva kodningen påbörjas. Godkänd kravspecifikation läggs upp på intranätet. Om ändringar görs läggs den nya versionen upp på intranätet, där versionshanteringen gör det möjligt att spåra ev. förändringar. Systemutvecklaren genomför uttaget i enlighet med kravspecifikationen. Specifikation, kravspecifikation, slutdokumentation och framtaget material ska överensstämma. Systemutvecklarna tester koden mot reglerna i kravspecifikationen och gör kontroller av filerna mot kravspecifikationen. Kvalitetssäkring och verifiering av de framtagna filerna och av kundens dokumentation görs av utredarna mot kravspecifikationen Mall för kravspecifikation Mall finns för kravspecifikation. Se avsnittet ’Dokument och mallar’. 16 Dokumentation, test och kvalitetssäkring av framtaget forskaruttag Det framtagna materialet kontrolleras noggrant för att upptäcka ev. felaktigheter och för att öka kvaliteten på levererat material. Kontroller görs av ansvariga för det aktuella uttaget, även statistik körs på filer och på variabler. Kontroller och kvalitetssäkring/verifiering ska dokumenteras med framtagna mallar. Uttagsnummer och avtalsnummer skall finnas med på samtliga dokument. Test av uttag - systemutvecklarna Systemutvecklarna testar de framtagna filerna mot kravspecifikationen och ansvarar för att resultatet från testerna och statistiken granskas och utvärderas. Om fel upptäcks och förändringar görs av program, bör nya tester göras på de nya filerna. Resultatet från testerna samt statistiken dokumenteras och skickas till utredarna samt till forskarserviceansvarig. Testdokumentet och statistiken läggs upp på vårt intranät och uppdateras om ny version tas fram. Test av kod och filer Testar koden mot kravspecifikationen. Testar materialet mot kravspecifikationen Tar fram relevant statistik för de olika variablerna i filerna och analyserar denna för att upptäcka eventuella felaktigheter eller konstigheter Dokumenterar testerna i separat internt dokument, framtagen mall ska användas. Mall för test Mall finns för test. Se avsnittet ’Dokument och mallar’. Kundens dokumentation Systemutvecklarna tar fram dokumentation för uttaget: Mall finns för dokumentationen både för uttag från Popum3 och från Tabellverket, på svenska och på engelska. Godkänd dokumentation läggs upp på vårt intranät. Systemutvecklarna tar fram dokumentation till kunden som beskriver filernas utseende och med postbeskrivning där samtliga variabler beskrivs i filerna. Dokumentation ska även innehålla regler för genererade variabler samt beskrivning av samtliga använda koder och dess värdemängder med förklaringar. Urvalskriterier, version av databasen, relaterade dokument samt uppgift om ansvariga för uttaget ska ingå i dokumentationen. 17 Även viss relevant statistik över filernas innehåll bör finnas med i kundens dokumentation, men ingen analys ska göras. Eventuella egenheter i materialet eller hos enstaka variabler förklaras på ett enkelt sätt i dokumentationen. Kundens dokumentation ska vara skriven på så sätt så att den är förståelig för kunden, framtagen mall ska användas. Dokumentationen ska godkännas av utredare eller av forskarserviceansvarig. Uttagsnummer, avtalsnummer samt datum skall anges i dokumentet. SQL-frågor och teknisk information om program ska ej ingå. Ingen systemdokumentation ska skickas till kunden. Mallar för dokumentation Mallar finns för kundens dokumentation både för Popum3 och för Tabellverket, på svenska och på engelska. Se avsnittet ’Dokument och mallar’. Kvalitetssäkring/verifiering av uttag Utredarna kvalitetssäkrar därefter filerna och kundens dokumentation mot kravspecifikationen, specifikationen och Popum. Framtagen statistik granskas och analyseras. Eventuella problem som upptäcks i Popum som påverkar uttaget och som kan ha betydelse för kundens analyser, kommenteras i kundens dokumentation. Även testdokumentationen granskas och ska godkännas. De problem som upptäcks dokumenteras och meddelas ansvariga systemutvecklare för åtgärd. Ny verifiering görs efter åtgärd och dokumentet uppdateras. Verifieringsdokumentet läggs upp på vårt intranät. Annan systemutvecklare än de som gjort uttaget kan göra kvalitetssäkring av uttaget. Kvalitetssäkringen dokumenteras enligt den framtagna mallen. Kvalitetssäkringen görs inte av programkoden. Ingen kvalitetssäkring av miniuttag till studenterna görs. Interna erfarna forskare kvalitetssäkrar sina egna uttag. Utredaren kvalitetssäkrar endast kundens dokumentation och den framtagna statistiken på variablerna i uttaget. Interna oerfarna forskare gör viss egen kvalitetssäkringen. Mall för kvalitetssäkring/verifiering Mall finns för kvalitetssäkring/verifiering. Se avsnittet ’Dokument och mallar’. 18 Kundens utvärdering av uttag Tillsammans med uttaget skickar utredaren med en utvärderingsblankett till kunden (ej för mini-uttag) för ifyllande. Här har kunden möjlighet att delge oss sina synpunkter på servicen, kvalitén på levererat material och dokumentation. Forskarserviceansvarig sammanställer utvärderingsenkäterna årsvis. Vid gästforskarbesök gör föreståndaren en utvärdering tillsammans med gästforskaren. Mall för utvärderingsenkät till kunden Mall för utvärderingsenkät finns både på svenska och på engelska. Se avsnittet ’Dokument och mallar’. 19 Översikt över inregistrerat kyrkoboksmaterial och perioder Lista februari 2010. Aktuell lista finns på intranätet Sundsvallsregionen Husförhör Länkade församlingar Födelse & Dop Lysning & Vigsel Död & begravning Flyttning Anmärkning Alnö 1803-1894 1780-1895 1803-1895 1803-1894 1850-1895 Attmar 1814-1896 1770-1894 1814-1894 1814-1894 1869-1897 Dålig bokföring 1860-68 Galtström 1807-1891* 1780-1894 1803-1891 1807-1891 1862-1891 *Mantalsregister 1846-62 Hässjö 1814-1901 1780-1895 1814-1895 1814-1895 1850-1894 Indal 1814-1900 1780-1894 1814-1894 1814-1895 1861-1894 Ljustorp 1803-1901 1780-1794 1803-1894 1803-1894 1845-1894 Njurunda 1816-1891 1780-1894 1816-1892 1816-1892 1852-1892 Tynderö 1811-1900 1780-1894 1811-1894 1811-1894 1861-1894 Lagfors 1860-1891 1862-1895 1846-1860, 1863-1897 1862-1898 1861-1891 Lögdö 1819-1892 1766-1895 1819-1895 1819-1896 1861-1880* *Flyttning saknas 1872-77 Selånger 1813-1894 1803-1894 1803-1894 1812-1894 1858-1894 Skön 1803-1893 1784-1894 1803-1894 1803-1894 1850-1895 Skönsmon 1882-1893 1890-1894 1890-1895 1890-1894 1890-1895 Sundsvalls stad 1803-1892 1860-1894 1803-1820* 1860-1894 1860-1894 1839-1849** * Endast lysning 1872-1894 **Endast utflyttning Svartvik 1860-1900* 1860-1895** 1860-1895** 1860-1895** Saknas Sättna 1806-1899 1780-1794 1806-1894 1806-1894 1858-1894 Timrå 1803-1895* 1783-1895 1803-1895 1803-1895 1850-1895 Tuna 1804-1896 1780-1898 1804-1894 1804-1894 1822-1895 Olänkade församlingar Graninge 1780-1892 Häggdånger 1780-1894 Liden 1780-1895 20 Allt före 1860 skadat av brand Skönsmon separat församling från 1883, men ingår i Skön i Popum *Från SCB vart 10:e år **Från SCB årligt *Mantalsregister 1852-65 Skellefteåregionen Husförhör Födelse & Dop Lysning & Vigsel Död & begravning Flyttning Anmärkning Länkade församlingar Byske 1871-1897 1875-1894 1875-1894 1875-1894 1875-1894 Egen församling från 1875. Jörn 1831-1901 1849-1895 1869-1895 1855-1895 1855-1894 Norsjö 1831-1899 1811-1895 1811-1895 1842-1895 Skellefteå 1720-1900 (1901) 1699-1899 1801-1894 1815-1821 1831-1894 1831-1894 Ytterstfors 1846-1870 1838-1869 * 1838-1869 1846-1866 * I Skellefteå? Födelse & Dop Lysning & Vigsel Död & begravning Många brandskadade böcker Olänkade församlingar Burträsk 1740-1894 Lövånger 1691-1894 Försöksförsamlingarna Husförhör Flyttning Anmärkning Länkade församlingar Fleninge 1819-1890 1819-1890* 1819-1890 1819-1890 1820-1890 * Informationen kompletterad från tidigare källor. Gullholmen 1794-1899, 1837-1922 1800-1900 1802-1900 1800-1900 1838-1900 Locknevi 1821-1899 1821-1899* 1821-1899 1821-1899 1821-1899 * Informationen kompletterad från tidigare källor. Nedertorneå 1818-1896 1818-1896* 1783-1895 1814-1895 1820-1895 * Informationen kompletterad från tidigare källor. Svinnegarn 1817-1895* 1817-94* 1803-1894 1803-1894 1841-1894 * Informationen kompletterad från tidigare källor. Trosa 1799-1895* 1799-1895* 1817-1894 1817-1895 1861-1895 *Informationen kompletterad från tidigare källor. 21 Linköpingsregionen Husförhör Födelse & Dop Lysning & Vigsel Död & Flyttning begravning Anmärkning Länkade församlingar Björsäter 1792-1896 1633-1894 1792-1894 1603-1895 1821-1895 Grebo 1795-1896 1661-1894 1795-1894 1661-1895 1816-1895 Kaga 1808-1899* 1694-1894 1808-1894 1694-1894 1813-1894 * Luckor Kärna 1807-1894 1695-1894 1807-1894 1695-1894 1812-1894 * Luckor Landeryd 1789-1895 1635-1894 1789-1894 1635-1895 1811-1895 Rappestad 1797-1895 1656-1899 1797-1889 1677-1889 1831-1904 Rystad 1788-1895 1629-1895 1788-1895 1629-1895 1832-1895 Slaka 1788-1896 1633-1894 1788-1894 1635-1894* 1801-1894* * Luckor Vikingstad 1737-1897* 1633-1895 1737-1895 1633-1895 1738-1901* * Luckor Vårdsberg 1788-1899 1656-1894 1788-1894 1656-1894 1805-1894 * Luckor Värna 1802-1895 1657-1894* 1802-1894 1661-1895* 1802-1895 * Luckor Sankt Lars 1789-1900 1633-1895 1789-1894 1633-1894 1801-1895* * Luckor 1796-1895 1700-1895 1796-1894 1700-1895 1815-1894 Björkeberg 1635-1894 1747-1894 1747-1895 Flistad 1694-1895 1809-1895 1831-1895 1756-1895* 1634-1894 1756-1894 1634-1894 1813-1894 *Luckor 1747-1890 1635-1894 1747-1894 1635-1895 1747-1895* * Luckor Olänkade församlingar Askeby Gammalkil Kättilstad Ledberg Lillkyrka 1667-1895 1744-1750, 1806-1894 Linköpings 1774-1895 1664-1899 domkyrko-församling 1774-1894 1664-1895 1788-1894 Ljung 1791-1894 1694-1894 1791-1894 1694-1895 1801-1895 Nykil 1789-1900 1634-1899 1789-1894 1645-1814 1803-1894 Sjögestad 1797-1895 1656-1889 1797-1889 1679-1889* 1831-1898 Skeda 1747-1896* 1693-1894** 1754-1894 1640-1895 1754-1894*** Stjärnorp 1811-1894 1760-1895 1811-1895 1815-1895 1815-1895 Svinstad 1807-1894* 1688-1894 1768-1894 1703-1894 1768-1894** Tjärstad 1639-1894 1791-1895 1793-1900 1633-1894 1793-1894 1633-1894 1793-1894* Vist 1792-1899 1640-1894 1792-1894 1640-1895 1809-1894 Vreta kloster 1751-1896 1633-1894 1751-1894 1633-1895 1751-1894* Törnevalla *Luckor 1791-1795 * Luckor *Lucka 1768-1787 ** Lucka 1718-1754 *** Lucka 1772-1806 * Luckor ** Även 1768-1769 1825-1895 * Luckor Ulrika 22 * Luckor Vårdnäs Åtvid 1812-1823 1696-1894 1790-1896 1638-1894 1822-1895 1781-1895 1790-1894 1695-1894* 1811-1894* * Även 1791 Örtomta 1712-1895* 1633-1894 1712-1894* 1633-1895 1741-1895* * Luckor Östra Harg 1763-1788, 1635-1894 1821-1835, 1858-1860 1871-1899 1760-1894 1763-1764, 1817, 1833-1894 1630-1894 1848-1895 1789-1895 Lysning & Vigsel Död & begravning Östra Skrukeby Norra inlandsregionen Husförhör Födelse & Dop Flyttning Anmärkning Länkade församlingar Frostviken 1813-1901 1841-1901 1842-1900 1842-1901 1858-1900 in 1861-1900 ut 1842-1900 1842-1900 1842-1901 1746-1798 1804-1866 1746-1853 1746-1849 1746-1852 1758-1905 1759-1903 1742-1903 1744-1903 1865-1894 1758-1780 1701-1895 1701-1895 1701-1895 1868-1895 1719-1901 1720-1751 1719-1742 1861-1895 1792-1900 1792-1901 Frostvikens lappförsamling 1842-1900 Föllinge 1813 Föllinge lappförsamling Gällivare 1861-1890 in 1892-1900 in 1863-1899 ut Hede. lappförsamling Hotagen Hotagens lappförsamling Jokkmokk 1782-1897 Jukkasjärvi 1763-1900 Karesuando/ Enotekis 1816-1895 1813-1923 1814-1897 1813-1897 1855-1895 Kvikkjokk 1781-1878 1784-1897 1784-1894 1784-1897 1829-1837 1880-1897 1862-1894 Undersåker Undersåkers Vilhelmina 1821-1867 1780-1792 1804-1896 1757-1781 1783-1895 1784-1846 1878-1895 1780-1895 1880-1895 in 1879-1895 ut 1786-1895 1814-1895 1790-1895 1829- 1837 1862- 1894 23 Församlingar inregistrerade av externa samarbetspartner Datastugan Kaxås Olänkad församling Husförhör Offerdal Födelse & Dop Lysning & Vigsel Död & begravning Flyttning Anmärkning 1760-1898 Kulturarkivet Nordanstig Olänkade församlingar Husförhör Födelse & Dop Lysning & Vigsel Död & begravning Bergsjö 1688-1921 1895-1924 Gnarp 1677-1913 1688-1867 Harmånger 1688-1894 1851-1924 Hassela 1688-1894 1852-1889 Ilsbo 1735-1894 1847-1862 Jättendal 1688-1860 1837-1878 Flyttning Anmärkning ArkivData Norrköping Olänkad församling St Olai Husförhör Födelse & Dop Lysning & Vigsel Död & begravning Flyttning Anmärkning 1817-1827 1800-1861 1800-1806 1841-1844 1865-1876 1827-1844 1863-1874 1877-1883 1887-1894 1880-1891 1861-1895 24 Översikt över parallella material Parallella material i Sundsvallsregionen Material Excerperat Registrerat Postbeskrivning Område Anmärkning Avräkningsböcker Ja Ja Ja Matfors Fattigvårdshandlingar Ja Ja Ja Vet ej Fängelsekyrkböcker + Ja Fångrullar Ja Ja Regionen Handelsstatistik Ja ja Industristatistik Ja Ja Ja vet ej Sjukjournaler Ja Ja Ja Sundsvall, Härnösand Anders har fil med länkar för Alnö till Sundsvalls journaler Skolmaterial skolmatriklar och examenskataloger Ja Ja ja Skön, Kubikenborg 1883 - 1916 1829, 1836 Västernorrland Mantalslängd Alnö, Skön Timrå, 1800 Avlöning Ja Ja ja Kubikenborg Sockenprotokoll Ja Ja Ja Ljusta? 25 1877 – 1895 Mer om våra församlingar Källbeskrivningar Till församlingarna i Popum finns en Källbeskrivning som beskriver samtliga inregistrerade källor. Tidsperiod för respektive källa med ev. luckor Volymbeteckning, både arkivets och DDB:s Variabler som finns angivna i källans rubrik Uppgift om källan är svårläst, uppgifter som saknas i källan eller under en viss period, egenheter hos den aktuella volymen som produktionsenheten har uppmärksammat. En förteckning över prästerskapet i församlingen under den period som vi har inregistrerat. Lista över orter i församlingen med sidhänvisning i respektive husförhörsvolym Betygssystem med förklaringar Källbeskrivningarna finns i pdf-format Company Home > DDB > Kallor > Kyrkobok > Församlingar Sundsvallsregionen. Samtliga församlingar, finns även som häfte. Skellefteåregionen. Burträsk & Lövånger, Byske, Jörn, Norsjö, Skellefteå och Ytterstfors, finns även som häfte. Norra inlandsregionen. Föllinge lappförsamling, Undersåker lappförsamling, Gällivare, Jokkmokk, Jukkasjärvi, Karesuando och Kvikkjokk. Linköpingsregionen. Askeby, Björsäter, Grebo, Kaga, Linköping (domkyrkoförsamlingen), Ljung, Rystad, Sankt Lars, Skeda, Stjärntorp, Vreta Kloster, Värna och Åtvid. Försöksförsamlingarna saknas på Alfresco. Finns som häften för Svinnegarn, Trosa, Fleninge och Locknevi. Nedertorneå och Gullholmen finns bara ett exemplar var av, i en pärm. Andra dokument om församlingarna För Skellefteåregionen finns både på intranätet och som häfte, Församlingsbeskrivning för 1724-1899, Boende Skellefteå regionen. För Norra inlandsregionen finns utöver Källbeskrivningarna ett gemensamt dokument för Jokkmokk och Kvikkjokk, ett dokument om Gällivare respektive om Vilhelmina. Det finns även tre dokument med iakttagelser, problem och lösningar från den manuella länkningen i Gällivare, Jokkmokk respektive Karesuando. 26 Anteckningar om ologiskheter Det finns två tabeller på Popum3 med kommentarer som produktionsenhetens personal skrivit ner under arbetets gång. Det finns anteckningar om själva noteringen, tabell NOTANT, och anteckningar om personen, tabell PNRANT. Det är excerpistens kommentar och ingen kommentar som finns i källan. Prästens kommentarer finns samlade i församlingens anmärkningstabell, ANM. Båda tabellerna finns för hela Linköpngsregionen och Norra inlandsregionen. För Skellefteåregionen finns tabell PNRANT för Jörn och Norsjö församlingar och tabell NOTANT finns för Jörn, Norsjö och Lövånger församlingar. Tabellerna saknas helt för tidigare registrerade församlingar. Tabell NOTANT innehåller kommentarer om själva noteringen, postnr länkvariabel, som gjorts i samband med in- och uttypslänkningen samt vid den manuella länkningen. Ex. GEL 9111177 ei biol. mor Ex. GEL 9115043 Hon finns på sidan 266 med sin föräldrar, fel strivet Tabell PNRANT innehåller kommentarer om individen, länkvariabel pnr, som skrivits in i samband med den manuella länkningen och relationslänkningen. Ex. JRN 826003309 Utflyttningsattesten har återlämnats och därför är det 2 överblivna kort Ex. JRN 824002841 Barnets moder har dött i Skellefteå före 1834 och således vet jag ej om de nya föräldrarna är styvföräldrar eller fosterföräldrar. 27 Etnicitet När Demografiska databasen började registrera Norra Inlandsregionen uppstod ett önskemål från forskarhåll att kunna särskilja vilka individer i befolkningen som är samer. Någon specifik variabel för etnicitet finns emellertid inte i vårt kyrkoboksmaterial. Det innebär inte att information som explicit eller implicit berör individernas etniska tillhörighet saknas i kyrkböckerna. De noteringar som finns baseras i de flesta fall på bedömningar som har gjorts av den svenske prästen och blir därför i stor utsträckning föremål för tolkning. Demografiska databasen har beslutat att inte skapa någon etnicitetsvariabel eller etnicitetstabell som läggs upp i vår databas. Vid förfrågan från forskare kan vi emellertid, efter beslut av föreståndaren, ta fram någon eller några etnicitetsindikatorer. I Norra Inlandsregionen ingår fem särskilda lappförsamlingar, Föllinge, Undersåker, Hotagen, Frostviken samt Hede/Tännäs, där samtliga kyrkobokförda får betraktas som samer. För dessa församlingar skapas inga indikatorer eftersom församlingstillhörigheten i detta fall konstituerar etniciteten. Men i de flesta andra församlingar i Norra Inlandsregionen finns både samer och icke-samer och vanligtvis finns inte heller några särskilda sidor eller kolumner i kyrkböckerna som delar in invånarna efter etnicitet eller ursprung. Individerna kan i kyrkböckerna finnas antecknade som finnar, norrmän, lappar, ryssar, svenskar, eller helt sakna notering om etnicitet. I samband med forskaruttag under 2006 med forskare knutna till CBS och CESAM utarbetades ett antal indikatorer som kan underlätta för forskaren att identifiera och särskilja individer med olika etnicitet i norra inlandsregionens församlingar. Indikatorerna bygger på kyrkböckernas information om individerna, men har även kompletterats med information från andra källor, framtagen av de forskare som ingick i detta samarbete. Det måste understrykas att dessa indikatorer inte bestämmer att en individ är same, utan enbart identifierar individer för vilka det finns information som kan användas för att bedöma hans/hennes etnicitet. Indikatorer hämtas från den information som redan finns i kyrkböckerna, och i vår databas, exempelvis yrken, anmärkningar, boställen, dödsorsaker och släktskap. Vi tillför inga nya variabler eller tabeller till kyrkböckerna eller till vår databas Popum3. Eftersom kyrkböckernas noteringar baserats på den enskilde prästens bedömning är det upp till varje enskild forskare att bestämma hur denna information skall tolkas. Demografiska databasen gör ingen egen bedömning av detta, dvs. tar inte ställning till om en individ är same eller ej, utan markerar bara att information finns som tyder på att det kan vara så. Initiativet till att utarbeta dessa indikatorer togs fram av Carin Hedlund vid Demografiska databasen i samband med ett forskaruttag under 2006 i samarbete med Gabriella Nordin, Per Axelsson och Peter Sköld vid Cesam. Dessa forskare har bidragit med två typer av kompletterande information: Den första är en sammanställning över samiska släktnamn som de sammanställt utifrån Johannes Marainens arbeten om Karesuando samesläkten och Jukkasjärvi samesläkten. Den andra är en sammanställning över samiska boställen, för församlingarna Karesuando, Gällivare, Jukkasjärvi och Jokkmokk. I samband med deras uttag lades dessa upp som tabeller. De listor och tabeller med indikatorer som har skapats har tagits fram för Skölds, Axelssons och Nordins forskningsprojekt, och är forskargruppens egendom. Demografiska databasen har inte något ansvar för innehållet. De kan dock, enligt ett särskilt avtal, användas av andra forskare, efter tillstånd av DDB:s föreståndare. Den forskare som önskar använda indikatorer skall i sin förfrågan om uttag skriftligen ange varför dessa behövs, vilka forskningsfrågor som skall diskuteras, och även precisera vilka indikatorer som är av intresse för den aktuella frågeställningen. Forskaren kan även själv ta fram regler för att skapa indikatorer. DDB:s föreståndare fattar därefter beslut om indikatorer skall lämnas ut till forskaren, eller ej. Den 5 mars 2008 träffades en överenskommelse mellan Demografiska databasen och forskarna Peter Sköld, Per Axelsson och Gabriella Nordin med följande innebörd: 28 andra forskare får använda deras framtagna material med samiska boställen och samiska släktnamn för de församlingar som ingår i NIL-regionen vid generering av indikatorer för att försöka fastställa etnicitet ( församlingarna Karesuando, Gällivare, Jukkasjärvi, Jokkmokk) forskare som använder sig av detta material ska informeras om att ange Peter Sköld, Per Axelsson samt Gabriella Nordin som källa när de publicerar sin forskning Sköld, Axelsson och Nordin skall informeras när andra forskare vill använda sig av deras material, samt också få information om vilka dessa forskare är. Det är upp till varje forskare att själv bestämma vilken typ av indikator som han/hon vill ha med i sitt uttag, precisera dessa i ett dokument och komma in med en förfrågan till DDB:s föreståndare. Allmänt om indikatorer De indikatorer som har utarbetats bygger på den information som finns i källorna, som kan användas för att indikera etnicitet. Den finns alltså redan i Popum3, men inte som egna tabeller och variabler. För två av indikatorerna, släktnamn och boställe, används det material som tagits fram av forskarna Nordin, Sköld och Axelsson i samband med deras uttag. Information om boställen och släktnamn finns tillgänglig för församlingarna Karesuando, Gällivare, Jukkasjärvi och Jokkmokk. Följande indikatorer finns framtagna i dagsläget och det kan tänkas att de kommer att uppdateras oregelbundet. Det handlar om: samiska släktnamn (efternamn), samiska boställen samt de boställen där ordet lapp ingår, dödsorsaker som anger att individen vistats på fjället (något osäker indikator), anmärkningarna från samtliga källor där det i texten finns uppgift om lapp, fjäll eller renar, yrken i klartext med uppgift om lapp, nomad, renägare samt motsvarande yrkeskoder en indikator som anger om någon i kärnfamiljen har någon av de föregående indikatorerna ifylld. individer som är kyrkobokförda i någon av de särskilda lappförsamlingarna betraktas per definition som samer. Den relationsrelaterade indikatorn kan skapas först när alla andra indikatorer har påförts befolkningen i respektive församling och där används även relationstabellen i Popum3 för att fastställa släktskapet mellan barn och föräldrar resp. mellan syskon. Vill forskaren skapa egna indikatorer utifrån egna regler kan detta genereras i samband med forskaruttag, efter forskarens önskemål. Information i indikator kan presenteras på olika sätt. Dels kan man för varje indikator sätta värde 1 om det någonstans finns en indikation om etnicitet enligt de regler som gäller för just den indikatorn. Saknas denna indikation helt sätts värde 0. Det går även att räkna antalet noteringar där någon indikator förekommer. Här föreligger ett metodologiskt problem eftersom det totala antalet noteringar för varje individ får stor betydelse. En individ som flyttat mycket har fler noteringar än en individ som bott på samma plats hela livet. En fördel med denna metod kan dock vara, att om en individ har många noteringar och enbart någon enstaka notering visar indikation på same, är det en svagare indikation än om individen har många noteringar som indikerar att individen kan vara same. Här krävs dock att man tar hänsyn till antalet noteringar. En kvot som anger andelen noteringar som innehåller någon form av etnicitet i relation till 29 det totala antalet noteringar kan även tas fram. Det går även att få ut information om hur många noteringar som visar indikation på etnicitet, procentuellt sett. Beskrivning av indikatorerna Här kommer en beskrivning av samtliga indikatorer att göras. Det beskrivs vilken information som är underlag till indikatorerna och var informationen hämtats från. Viktigt att notera är att när den maskinella genomsökningen sker av den källtrogna klartexten i anmärkningarna och dödsorsakerna sker ingen kontroll av var i klartexten det sökta ordet finns med, eller i vilket sammanhang. Forskarna bör därför själva studera dessa klartexter för att få sammanhanget klart för sig och utifrån detta göra sin egen bedömning. Indikator för anmärkning Denna indikator kontrollerar en individs samtliga anmärkningar på alla noteringar och markerar om det finns någon anmärkning som innehåller information om lapp, fjäll eller renar. Samtliga anmärkningstexter i tabell ANM kontrolleras maskinellt och om något eller några av de angivna sökorden återfinns i den löpande texten sätts indikatorn = 1. Ingen kontroll sker av i vilket sammanhang sökorden finns med i texten. Informationen finns i vår databas i tabellen ANM variabel ANM (anmärkning). Indikator för dödsorsak Denna indikator kontrollerar individens dödsorsak och markerar om dödsorsaken har med fjäll att göra. Även här sker en automatisk genomsökning av alla dödsorsaker i tabell DB och när ordet fjäll uppträder sätts indikatorn = 1 oberoende av var i texten ordet finns. Informationen finns i vår databas i tabellen DB variabel DODORS (dödsorsak) Indikator för yrke Denna indikator visar om det finns information i yrkessträngen som kan tyda på att individen är same. Informationen hämtas dels från tabellen YRKETXT som innehåller själva klartexten i variabel YRKE som hämtats källtroget från samtliga källor, och från tabellen YRKE som innehåller det kodade yrket i variabel TYKOD. (lista över koder och klartexter se dokument ’Information om indikatorer’) Endast individens egna yrken kontrolleras, dels för den källtrogna klartexten och även för de kodade yrkena. Kontroll görs mot både kod och klartext eftersom den källtrogna klartexten kan innehålla förkortningar och olika stavningsvarianter varför det är svårt att ange de rätta sökbegreppen. Samtliga yrken är kodade och vid kodningen sker kontroll mot samtliga kända stavningsvarianter och förkortningar. Indikator för namn Denna indikator kontrollerar en individs samtliga efternamn från alla noteringar och markerar om det finns något namn som har samiskt ursprung. Listan över samiska släktnamn har uppdaterats när nya församlingar och nya uttag gjorts av Axelsson, Sköld och Nordin. DDB har överfört informationen till en tabell. Dessa släktnamn testas mot databasens tabell NAMNTXT där individernas samtliga namn finns källtroget. (lista med samiska släktnamn se dokument ’Information om indikatorer’). 30 Observera att de samiska släktnamnen ofta är samma namn med något olika stavning. Det beror på att vår information skall vara källtrogen och prästen har ibland stavat samma namn på flera olika sätt. Informationen om samtliga källtrogna namn finns i vår databas, Popum3, i tabellen NAMNTXT. Forskargruppen Sköld, Axelsson och Nordins lista över samiska släktnamn för församlingarna Karesuando, Gällivare, Jukkasjärvi och Jokkmokk återfinns även som tabell ETNL.SAMNAMN i Popum3. Listan och tabellen är deras egendom och vi på DDB har inte något ansvar för innehållet, utan den är framtagen för deras forskningsprojekt. Indikator för boställe Denna indikator kontrollerar en individs samtliga boställen från alla noteringar och markerar om det finns något boställe som har samiskt ursprung. De församlingar som räknas som lappförsamlingar får automatiskt en indikator för etnicitet för alla individer i församlingen då alla räknas som lappar enligt prästen. Dessa lappförsamlingar var icke-territoriella och inte geografiskt definierade. Samma boställen finns både i lappförsamlingen och i den ”svenska” församlingen. När man ska sätta indikator i lappförsamlingarna handlar det om kyrkobokföringsförsamling – inte om ett speciellt boställe. För de andra församlingarna sätts en indikator för ett speciellt boställe. Listan över specifika samiska boställen har tagits fram av Per Axelsson och Gabriella Nordin på Cesam i samband med deras uttag för församlingarna Karesuando, Gällivare, Jukkasjärvi och Jokkmokk. Underlaget har hämtats från arbeten av Filip Hultblad, Nils Arell och Ernst Manker. Den har uppdaterats när nya församlingar har inkluderats i databasen och nya uttag har gjorts. (lista med samiska boställen se dokument ’Information om indikatorer’). DDB har överfört informationen till en tabell som ägs av forskargruppen och som DDB inte tar något ansvar för. Tabellen ETNL.SAMBY återfinns under DDB:s databas Popum3. Kontroll sker mot tabellen BOSTTXT, variabel BST som innehåller boendeinformation från husförhörslängderna där individen fanns skriven, både som ortsnamn och som anmärkningstext för sidan Förutom att specifika boställen identifieras, söks också följande text i boställessträngen: LAPP, LAPPAR, LAPPARNE, LAPPBOKEN, LAPPNYBYGGE Informationen om samtliga boställen finns i vår databas Popum3 i tabell BOSTTXT variabel BST. Information om samiska boställesnamn för församlingarna Karesuando, Gällivare, Jukkasjärvi och Jokkmokk finns en lista som forskargruppen Sköld, Axelsson och Nordin har tagit fram. Tabellen ETNL.SAMBY i Popum3 är en kopia av denna lista. Listan och tabellen är forskargruppens egendom, utarbetad forskningsprojekt och vi på DDB har inte något ansvar för innehållet. Indikator för relationer Denna indikator kontrollerar om en individs biologiska föräldrar eller syskon har någon indikator som visar att de kan vara samer. Denna indikator sätts sist. Den går igenom samtliga biologiska föräldrar och syskon, både hel- och halvsyskon till individen och kontrollerar om någon av dem har värde 1 i någon av sina andra indikatorer, i så fall sätts värde 1 för relaterad person. För att hitta de relaterade individerna används relationstabellen REL i Popum3 varifrån individens biologiska föräldrar och syskon plockas fram (RBES < 2). Därefter kontrolleras om någon eller några av dessa har någon av de ovanstående indikatorerna ifylld. 31 Tabellverket Utbildning har genomförts angående forskaruttag från Tabellverket, i form av ett forskaruttag. Samtliga dokument finns samlade på Alfresco under IF17 Utbildning Tabellverket. Under utbildningen togs upp problem som finns i materialet och hur man kan lösa detta, var information kan hämtas om det saknas i den primära tabellen mm. Allmänt Endast för tio län registrerades månadsuppgifter, senare togs de fälten bort från inregistreringen. Månadsuppgifterna kan endast hittas i den kompletta registreringen. Detta gäller endast för mortalitetsformulär, inte för folkmängdsformulären. 1802 ändrades tabellerna, men eftersom prästerna ibland använde gamla formulär för att redovisa i, överensstämmer inte alltid formulären med årtalen. T.ex. användes formulär 20 (giltig fram till 1801) in på 1800-talet. Tilläggen i de nya tabellerna var ex. för folkmängd med olika formulär för land och stad. regtyp1 = komplett registrerade formulär med månadsuppgifter 0-12. Registreras allt enligt källan och har inte summering gjorts över året av prästen kan slutsumman/rad saknas för året. regtyp2 =nedskuret registrerat mortalitetsformulär formulär, endast månad=0, dvs. årsvis. Registrerades inte månadsuppgifter, endast årssumman som alltid finns med. Excerpisterna summerade månadsuppgifterna om uppgiften saknades Prefixet _sum för en variabel = summerad uppgift för ett kön. Prefixet _tot för en variabel = totalt summerad uppgift för båda könen. Tabellen GEOFORM finns för alla befintliga formulär, även om formuläret i övrigt saknar innehåll Vilka tabeller som finns i vilka formulär, och var de ligger, se Tabellverket reference - Variabelbeskrivning. Konstigheter se- Källor/Tabellverk/Variabelbeskrivning/ DB-beskrivning TV (eng)V42.doc Bortfallet i Tabellverksmaterialet Kan gälla bortfall av Hela församlingen, alla formulär saknas. Eftersom vi inte säkert vet vilka församlingar som existerade under tiden 1749-1859, så finns en viss osäkerhet om saknade församlingar. De församlingar som Landsarkivet uppgivit som saknade, brända, förkomna finns upptecknade i en tabell. Någon volym inom församlingen saknas oftast beroende på att volymen var så skadad att Landsarkivet inte kunde leverera volymen till DDB för registrering. Uppgifter om volymen kan hämtas från tabellen DDB.ANMVOL som registrerats in från källberedningsuppgifterna på den DEDIK-kod som församlingen ursprungligen registrerades in på. Bortfall av tabeller inom formuläret. Tabell med uppgift om sakande församlingar och luckor lucka.SaknadFrs 32 Bortfall, länskoder Prästerna skickade församlingsuppgifterna till prosteriet som sammanställde dessa och sände vidare till stiftet som sammanställde uppgifterna för stiftet och slutligen sände de sammanställda uppgifterna till landshövdingen. Uppgifterna för ett stift och län kunde vara olika genom att läns och stiftsgräns inte alltid sammanföll, en församling som ingick i ett stift kunde ibland vara delad av en länsgräns. För dessa församlingar var prästen ålagd att inge uppgifter för varje församlings- och länsdel. Prosterisammanställningen kan vara bra som komplement och kontrollkälla. I Jämtland fanns bara pastorattabeller för några församlingar vilka har registrerats in för att inte få vita fläckar. De skapade dedik koderna för bl.a. pastorattabellerna omfördes senare till geoid kod (geografiskt områdes kod) för Tabellverket. Tabellverket registrerades på församlingsnivå. Församlingar slogs ibland samman inom en tidsperiod ex. i Gotlands län. Böckerna kom från olika landsarkiv och vissa krävde att böckerna skulle hämtas personligen av någon från DDB. I vissa fall var det svårt att få vilka församlingar som fanns för ett visst län och under en angiven period. Det var svårt för landsarkiven att lista församlingarna för ett län eftersom böckerna sorterades i bokstavsordning och inte länsvis. När vi listade våra önskemål för ett län kan någon församling ha missats eftersom vi inte hade uppgift om vilka församlingar som existerat under tidsperioden inom ett län. Dessutom uppgav Landsarkivet att vissa församlingar saknades eller var brända men trots det kunde de finnas, ofta insatta i en annan volym. Det hände också att det uppgavs att böckerna inte lämnas ut för registrering, då de var så skadade, men vi fick dem ändå senare ibland efter lagning. Vissa församlingar hade mortalitetsuppgifter i en volym och folkmängd i en annan. En församlings volym kunde innehålla även andra församlingar och vissa var uppdelade på annat sätt eller saknade namn. Trots att vi begärde att få allt var vi tvungna att specificera, sedan fick vi bocka av vilka vi fått. Det finns dock en möjlighet att det materialet som saknas - de vita fläckarna - finns trots allt. Vissa formulär år inom en församling kan saknas, se tabellerna DDB, ANMVOL och DDB.ANMTXT Längst bak i vissa formulär finns uppgifter(specifikationer) på angränsade församlingar i pastoratet eller i prosteriet. Ibland finns centrala uppgifter med där. Om en församling saknas kan den återfinnas i en angränsande församlings specifikationsuppgift. För folkmängdsformulär finns dessa specifikationsuppgifter endast för landsförsamlingarna, inte för stadsförsamlingarna. Det finns en tabell över saknade församlingar lucka.SaknadFrs i Tabverk. Den innehåller uppgift om saknade församlingar/uppgifter som lansarkivet informerat om. Listan är kompletterad av DDB om dessa saknade församlingar förekommit med uppgifter i någon annan närliggande församlings specifikation dvs. SPEC = 1 och i så fall i mort SPECMORT=1 och/eller i folk SPECFOLK=1. Agneta har även kompletterat denna tabell med de församlingar från ddb.geoindex, som inte finns som egna församlingar (bara i annan församlings specifikation) dvs. som inte har egna inregistrerade formulär och som inte var med på listan från Landsarkivet. Dessa kompletteringar har blankt ’ ’ i fälten Arkiv samt Anm, och har alltid spec = 1. Det finns även några församlingar som bara har folkmängdsuppgifter. Dessa uppgifter kan även enkelt plockas fram ur databasen med en SQL-fråga: “select distinct(a.geoid) from ddb.geoform a where a.geoid not in ( select distinct(b.geoid) from ddb.geoform b where b.formnr < 100);” Totalt finns det 178 församlingar/del av församlingar i tabellen, varav 83 församlingar är uppgivna från Landsarkivet. I tabellen GEOSPEC finns alla i Tabellverket förkommande församlingar, även församlingar från specifikationerna. Ytterligare kringuppgifter för församlingarna finns i tabellen GEOFORM. 33 Mortalitetsuppgifter finns årsvis, folkmängd vart femte år, men i början vart tredje år. I mortalitetsformulär 50 tillkommer det folkmängdsuppgifter varje år, som återfinns som komplementuppgift i bastabell. Ett problem uppstod för de böcker som kopierades. Vissa uppgifter som fanns i bokens häftning försvann(svårläst) - till exempel en kolumn i en kalkyltabell med uppgift om kvinnor. GEOID (geografisk områdeskod)ersatte senare Dedikkoden (församlingskoden) i Tabellverket. Ibland kunde två församlingar vara upptagna samtidigt(sammanslagna) i samma formulär, ibland hade en del av en församling eller två församlingar fått samma dedik. Tyvärr förkommer också att samma geoid över tidsperioden fått olika länsuppgifter(skall rättas). Det finns fall där ett geoid tillhört ett län för ett antal år och senare bytt län som exemplet Piteå, som tillhörde Västerbotten men flyttades(1809) till Norrbotten. Skaraborg och Älvsborg innehöll en mängd små församlingar som oftast skrevs in på moderförsamlingen. Supraförsamlingar är benämning för de församlingar där en präst som t.ex. hade i uppgift att fylla i formulär för tre församlingar men slog ihop uppgifterna till en och i formulärhuvudet angav att detta formulär omfattad de tre församlingarna. Dödsorsker I ”Mortalitets- och folkmängdstabeller, Källbeskrivning” finns de sjukdomar som var förtryckta i de olika formulären. De förtryckta sjukdomar plus fritexter som prästerna skrev har DDB gjort om till en femsiffrig kod, dvs. varje dödsorsak fick en femställig bokstavskod som i princip var en förkortning av originaltexten. Men identiska bokstavskombinationer användes ibland för flera olika klartexter. Bokstavskodningen var inte helt konsekvent eller systematisk, vilket orsakade en del praktiska problem. Samma bokstavskombination användes i några fall också för helt olika sjukdomar. Problemet innefattar även att samma kodning användes för förtryckta och för icke-förtryckta dödsorsaker. Under registreringsperioden registrerades fritextuppgiften (koden + klartexten). Om sjukdomen skrevs över någon förtryckt text, registrerades den som fritext och kodades alltid specifikt. Man registrerade aldrig den förtryckta dödsorsaker om värde saknades - om ingen dog under perioden i den dödsorsaken registrerades inte raden. I vissa fall var prästen väldigt tydlig i att beskriva sjukdom, i andra fall antecknades bara sjukdomsbenämning kortfattat. De fasta sjukdomskoderna beskrivs i - Tabellverk/dokumentation/registrering/Kontroll 2/sjukdomslistorna. Det finns olika varianter hur sjukdomarna kodades även för de förtyckte. (t.ex. barnsbörd= barns, babör och smittkoppor= koppo, kåppo ). Att göra uttag från tabellverket I samband med att specifikationen tas fram, fastställs regler för hur man ska hämta informationen. Om det saknas information i en tabell, finns det ofta uppgift att hämta från någon annan tabell. För varje variabel i uttaget sätter man upp regler från vilka tabeller och variabler som informationen ska hämtas, enligt en prioriteringsordning. Agnetas tips om hur hon går tillväga vid forskaruttag. Hämta först uppgift från källan(excerperad), sedan från genererad uppgift och därefter tas uppgift en annan tabell där samma uppgift finns (sekundär källa för variabeln). Jämför med uppgifter i kyrkobok. För forskaren kanske det inte har betydelse om varifrån uppgifterna har hämtats och hur prästerna har fört in sina uppgifter, huvudsaken att man upplyser om varför och vad man har hämtat uppgifterna. 34 Forskaren har en frågeställning och det är vår uppgift att ta fram de rätta variablerna, besluta vilka regler som gäller och vilka tabeller vi ska söka i. Man kan ta med både den excerperade och den genererade koden när något saknats, det är upp till användaren att bestämma vad som ska användas. Det är viktigt att uppdatera, kontrollera, testa och se att summan är densamma i båda fallen. Alla beslut som fattas och vilka prioriteringar som gäller ska dokumenteras. Skapa uttagsfilen Agnetas tips om hur hon skapar filen: Create table xxx och ladda in den största tabellen. Uppdatera variablerna med information från de andra tabellerna (insert). Kontrollera mellan varje steg. Prioritera varifrån uppgifterna ska hämtas ifall de saknas i någon tabell. Prioriteringen ska finnas med i kravspecifikationen. Testa, uppdatera och testa, uppdatera om igen. Ett problem som man kan träffa på är att i tabell MDODE1CIV kan finnas rader där bara kvinnor har dött alternativt bara män. För Regtyp = 2 finns endast totala antalet (totalsumman) och inte för varje månad, för Regtyp = 1 finns även månadsuppgifter. Saknas total-uppgifter kan man hitta uppgifterna i en annan tabell eftersom det ofta finns samma uppgifter på flera ställen. Viktigt att ha bestämt vilken prioritetsordning som ska gälla. Ett formulär kan vara skadat och mycket är bortrivet eller så har kanske prästen inte antecknat allt. I Tabellverket Reference - kan man se i vilka tabeller vi kan hitta informationen som vi söker. Alfresco/Tabellverk/Variabeldokumentation under namnet DB-beskrivning TV (eng)V42.doc Export av uttagsfilen När filerna är skapade: gör alltid en test efter ’insert’ gör en dokumentation för varje ’insert’ i testdokumentet så det blir det verifierat att allt är med. Det är viktigt att varje steg, varje val i förstudiet verifieras. Om något går fel kan man gå tillbaka för att kanske göra på ett annat sätt. Ha kvar formid för att underlätta test. Ta senare bort fält som ej ska vara med. Använd semikolonavskiljare mellan variablerna. Ta med rubrikrad. Dokumentation I kundens dokumentation tar man upp de problemen som uppstått och ser till att vara klar och tydlig om vad man gjort och vad som hänt med uttaget. Klargör skillnaden mellan källtroget, excerperat, om prästen eller vi själva summerat och vad det innebär. Var tydlig med de prioriteringar som gjorts. 35 LinnéDb Databasen LinnéDb omfattar uppgifter från olika register och databaser som sammanställts av Statistiska Centralbyrån. Uppgifterna är hämtade från register som handhas av SCB och Socialstyrelsen, men innefattar också uppgifter från Västerbottens hälsoundersökning som ägs av Västerbottens läns landsting och databasen Betula som ägs av psykologiska institutionen vid Umeå universitet. Initial hantering för att skapa LinnéDb 1. Alla överföringar mellan Västerbottens hälsoundersökningar (VHU), Betula, SCB, Socialstyrelsen och DDB sker med personligt ombud. 2. Materialen från Betula och VHU överförs till SCB som krypterade textfiler. 3. På SCB sker en avidentifering. Alla personnummer i de olika materialen ersätts med ett löpnummer, LinneId. Detta kommer att användas för att koppla samman information om individen inom databasen. Kopplingen mellan personnummer och LinneId, nyckelfilen, sparas vid SCB för att möjliggöra framtida uppdateringar och tillägg av material. 4. Det avidentifierade materialet från VHU, Betula och SCB överförs som textfiler till DDB Umeå. 5. SCB levererar nyckelfilen till Socialstyrelsen som använder den för att avidentifiera sitt material. 6. Socialstyrelsen levererar sitt avidentifierade material som textfiler till DDB samt den eventuellt uppdaterade nyckelfilen till SCB. 7. Textfilerna verifieras för att säkerställa att det är samma material som utgick från databasägarna, förutom avidentifiering. 8. Materialet byggs samman till en relationsdatabas och lagras på en server vid DDB 9. En slutverifiering genomförs av den färdiga databasen. Teknisk miljö All hantering av databasen LinnéDb sker i ett slutet nätverk vid Demografiska databasen i Umeå. DDB:s lokaler är utrustade med skalskydd. Server och router för LinnéDb-nätet är placerade i ett serverrum med dubbelt skalskydd. Endast den personal som har tillstånd att använda LinnéDb och aktivt behöver nyttja databasen ansluts till nätverket. Analyser av databasmaterial ska ske i ett speciellt grupprum med dubbelt skalskydd. Klienterna är av två typer, tunna klienter och vanliga klienter. Grundprincipen är att använda tunna klienter men ibland finns behov att använda viss programvara som inte fungerar med tunna klienter och då får vanliga klienter användas. Operativsystem för klienterna är Windows XP. Microsoft Office finns på alla klienter, olika analysverktyg, t ex SPSS och ArcGis, installeras vid behov, systemutvecklingsprogramvara installeras hos systemutvecklarna. Alla klienter är försedda med kortläsare och autentisering sker med användarnamn och lösenord. Operativsystem på servern är Windows Server 2008 och som databashanterare används IBM DB2. 36 Tillgänglighet för forskning Endast forskare som verkar inom forskningsprogrammet ALC har möjlighet att få tillgång till LinnéDb. De olika forskarnas tillgång till data regleras av beslut fattade i ”Tillståndsgruppen” som består av: Anders Brändström, Centrum för befolkningsstudier Gunnar Malmberg, Kulturgeografiska institutionen Anna Sundström, Psykologiska institutionen Lars Weinehall, Institutionen för folkhälsa och klinisk medicin Tillståndsgruppen har till uppgift att bevaka att LinnéDb endast används för de ändamål som anges i projektbeskrivningen för ALC, i etikansökan till regionala etikprövningsnämnden och i beställningen till SCB och Socialstyrelsen. Tillgängligheten kan gälla hela eller delar av databasen och är tidsbegränsad. Beslut om tillgänglighet måste också godkännas av ägarna till Betula och VHU. I samband med uttag av vissa variabler skall även SCB alternativt Socialstyrelsen informeras. Demografiska databasens rutiner för forskarserviceadministration skall tillämpas vid uttag från LinnéDb. En Lathund över forskarservicerutinerna har tagits fram till ALC-forskarna, som finns upplagd på Alfresco under ALC, där finns även Specifikationsmall för uttag från LinnéDb. Rutiner vid hantering av LinnéDb Grundläggande villkor All personal som på något sätt kommer i kontakt med sekretessbelagt material skall underteckna särskilt förbehåll om tystnadsplikt enligt Sekretesslagen (1980:100) 14 kap 9 §. Roller och rutiner för forskarservice på Linnedb Det finns sju roller gällande hantering av forskaruttag i Linnémiljön. Tillståndsgruppen • • Bevakar att LinnéDb endast används för de ändamål som anges i projektbeskrivningen för ALC, i etikansökan till regionala etikprövningsnämnden och i beställningar till SCB och Socialstyrelsen. Bedömer specifikationer och ger i tillämpliga fall klartecken för uttaget. Forskare • • • • Tar fram specifikation tillsammans med ämnesexpert. Deltar i möten. Tar fram data på egen hand (vissa uttag) Ansvarar för kvalitetssäkring av erhållet uttag Ämnesexpert • • • • • Har kunskap om sitt material. Tar fram specifikation tillsammans med forskare. Medverkar på alla uttagsmöten. Assisterar forskare som gör uttaget själv. Assisterar forskare vid kvalitetssäkring av deras uttag 37 • • Assisterar systemutvecklare/utredare vid frågor. Analyserar framtagen statistik på data i uttaget om ämnesexpert och systemutvecklare deltagit i uttaget. Forskarserviceansvarig • • • • Tar emot specifikationer. Planerar vid behov in resurser. Skickar specifikationen till tillståndsgruppen för godkännande. Ansvarar för att avtal och förbehåll skrivs på av respektive forskare Utredare • • • • Ordförande i arbetsgruppen som utför uttaget. Kallar till möten i arbetsgruppen. Läser testdokumentationen. Verifierar att alla variabler finns med i uttag framtagna av systemutvecklare. Systemutvecklare • • • • • • Tar fram uttaget. Testar uttaget och skriver testdokumentation. Dokumenterar uttaget. Deltar i möten när specifikationen är klar. Ger behörighet för genererat material till berörda forskare. Tar bort behörighet från genererat material när tid för tillgänglighet löpt ut. System-/databasadministratörer • • • Administrerar den tekniska miljön / databasen. Ger behörighet till forskare i uttag där systemutvecklare ej ingår. Tar bort behörigheter från forskare i uttag där systemutvecklare ej ingår när tid för tillgänglighet löpt ut. Forskarservicerutiner för uttag från LinnéDb LinnéDb kommer endast att vara tillgänglig för forskare som verkar inom ALC och de olika forskarnas tillgång till data regleras av beslut i en särskild grupp, Tillståndsgruppen. Inga data från LinnéDB som kan knytas till en enskild individ får lämna det slutna nätverket vid DDB. Alla analyser av sådana data ska ske vid klientmaskiner i detta nätverk. Analyserna ska ske i grupprummet med dubbelt skalskydd. I tjänsterummen får endast uttag och förberedelse för uttag från databasen göras. Analysresultat som inte går att knyta till enskilda individer får lämna det slutna nätverket. DDBs rutiner för forskarserviceadministration skall tillämpas vid uttag från LinnéDb: 1. Forskare specificerar önskemål om uttag med hjälp av ämnesexpert(-er). Befintlig specifikationsmall som finns att tillgå på DDB:s intranät ska användas. I specifikationen ska syfte, motivering, frågeställning, urvalskriterier, variabelnamn och tabellinformation etc. uppges. 2. Specifikationen lämnas till forskarserviceansvarig vid DDB som vidarebefordrar den till Tillståndsgruppen för bedömning. 3. Tillståndsgruppen bedömer specifikationen och ger i tillämpliga fall klartecken för uttaget. De avgör också om etikprövning krävs. 4. Forskarserviceansvarig planerar vid behov resurser för uttaget. Uttag kan ske på följande sätt: a. Forskaren tar fram data på egen hand. 38 b. Ämnesexpert assisterar forskare i framtagandet av data. c. Systemutvecklare tar fram data och dokumenterar uttaget. Utredare fungerar som ordförande i arbetsgruppen. 5. Forskare undertecknar avtal och förbehåll om användningen av data från LinnéDb. 6. Uttaget kvalitetssäkras i samband med leverans. Forskaren är alltid huvudansvarig för kvalitetssäkring. För alternativ b och c i punkt 4, det vill säga i de fall då forskaren inte själv gjort uttaget, assisterar ämnesexpertis forskaren vid kvalitetssäkring av uttaget. Eventuellt utsedd utredare granskar testdokumentation och att samtliga variabler finns med i uttaget. 7. När tillgänglighetstiden för uttaget gått ut tas forskarens rättigheter till materialet bort. Checklista Nummer hänvisar till Forskarservicerutinerna ovan N o Aktivitet/ ansvarig Utredare System 1 Frågeställningen 2 Specifikation 4c 3 Avtal 4c 4 Uttag & test 4c 5 Statistik över uttaget 4c 4c 4c 6 Dokumentation av uttag 4c 4a, 4b 4b 7 Kvalitetssäkring av uttag 4c 8 Leverans av filer kundens dokumentation 4c 9 Backup av uttag på CD, filer, programvara, dokumentation 4c 10 Rensning av testtabeller 4c 11 Slutrapport på DDB:s intranät 4c Forskare Ämnesexpert X X X X X 4a, 4b X 4c Föreståndare 4a, 4b 4c X Forskarserviceansvarig 4a, 4b 4b 4b, 4c 4b 4a, 4b 39 Systemadministrativa rutiner vid forskarservice på Linnedb I samband med forskarservice på Linnedb behöver ett antal systemadministrativa uppgifter utföras både i form av att lägga upp utrymmen för filer och att skapa rättigheter för inblandade parter. Nedan följer en sammanställning av dessa uppgifter. Samtliga uppgifter utförs av uttagets systemutvecklare. Om ingen systemutvecklare finns med i uttaget kontaktas i första hand databasadministratör och i andra hand systemadministratör. En grundförutsättning är att personerna som ska tilldelas rättigheter har en användare på Linnedb-servern, denna läggs i första hand upp av systemadministratören. Inför uppstart av ett uttagsprojekt 1. En mapp, uttagsmappen, skapas under \\yggdrasil\users\public\uttag med samma namn som forskaruttagets nummer. 2. Alla som ska arbeta med att ta fram uttaget ges fullständiga rättigheter till uttagsmappen. 3. Ett schema skapas på databasen Linnedb med samma namn som forskaruttagets nummer i samband med att första tabellen skapas. 4. Rättigheter för objekt på detta schema tilldelas de som ska arbeta med uttaget. När uttaget är färdigt: Beroende på önskemål från beställarna utförs den ena eller bägge av följande uppgifter: • Beställarna ges fullständiga rättigheter till uttagsmappen. • Beställarna ges läsrättigheter till uttagets tabeller alternativt vyer på Linnedb. Dokumentation kring uttag från LinnéDb Såväl DDB-medarbetare som forskare inom ALC måste ha tillgång till samma dokument och det är viktigt att samma version finns tillgänglig för samtliga som hanterar uttagen. Följande rutiner för hantering av dokument gäller: 1. Kaisu lägger upp en mapp på ALC – Linnéuttag och på DDB – Projekt – U med namnet på projektet. 2. Projektledaren lägger in aktuell specifikationen (checka ut/in vid uppdatering), och senare kundens dokumentation, under ALC – Linnéuttag och skapar en länk till samma mapp på DDB – Projekt – U. 3. Interna dokument (kravspecifikation, test och verifiering) ska inte kunden ha tillgång till, så de läggs under DDB-mappen. För att länka till ett dokument mellan mappar, gör så här: 1) kopiera filen (klicka på den här symbolen och sedan kopiera) 2) gå till mappen där länken ska vara 3) gå till Hylla genom att klicka på pilen bredvid Navigator 4) klicka sedan på Urklipp och sedan Klistra in som länk. Klart! Denna länk kommer att uppdateras samtidigt som ursprungsfilen och om den flyttas så ändras länkadressen. Originalfilen läggs under ALC och länken under DDB. 40 Forskarservicerollen Några tankar kring Demografiska databasens material och forskarservice Sören Edvinsson 2007-02-26 Dessa sidor är föranledda av den workshop kring forskarservice vi hade i början av januari där vi diskuterade erfarenheterna vi som tidigare arbetat med forskarservice haft. Syftet var att det skulle ske en kunskapsöverföring till de nya utredarna som framöver kommer att ha huvudansvaret i kontakterna med beställande forskare vid datauttag från Demografiska databasen. Mia Sandberg Hiltonen väckte tanken att jag skulle kunna sammanställa något kring principer för forskaruttag samt erfarenheter av sådana som kan vara värda att föra vidare och diskutera. Jag har därför nu skrivit ner några reflektioner kring Demografiska databasens material och kring forskarservice och då i första hand med tanke på kyrkboksmaterialet. Förhoppningen är att dessa sidor ska bidra till att göra utredarens roll tydligare och att vi dessutom ska bli mer medvetna om vad det är vi bidrar med när vi levererar data till forskare. Det bör understrykas att dessa frågor egentligen inte har diskuterats på ett sammanhållet sätt tidigare inom den f.d. fou-avdelningen, så uppfattningarna får främst stå för hur jag själv uppfattat uppgiften. Däremot bygger tankarna till stor del på de riktlinjer för databasens verksamhet som formulerades redan på 70- och 80-talet. Inledningsvis diskuterar jag något kring vad Popum är som en slags utgångspunkt, därefter tar jag upp något om hur vi bör se på vår roll i forskarservice och avslutningsvis diskuterar jag några rent praktiska aspekter i konstruktionen för forskaruttag. Jag uppmärksammar några saker som kan vara bra att ha i åtanke vid forskaruttag och jag visar också på hur våra data kan struktureras för att användas i framförallt demografiska studier, i synnerhet som livsförloppsdata. Popum Först kan det behöva sägas några ord om vad som karaktäriserar befolkningsdatabasen Popum. Vi behöver såväl för oss själva som för externa användare ha klart för oss vad det är för typ av material vi arbetar med - vad det står för och vad det inte står för. Konceptuellt kan Popum sägas bestå av två typer av databaser, dels en källdatabas och dels en användardatabas. De respektive databaserna består i sin tur av ett antal olika tabeller. Källdatabasen representerar den källnära informationen. Vi ska utifrån de ingående tabellerna i princip kunna rekonstruera informationen som den var i källan. Den strukturerade informationen i databasen gör det möjligt att på ett enkelt sätt komma åt information från källan och att använda den för uppdateringar av variabler (för enskilda forskarbehov eller för av DDB skapade variabler). I användardatabasen finns information som baseras på uppgifterna i källdatabasen, men där dessa nya variabler är skapade utifrån ett regelverk skapat av oss. På det sättet kan vi utnyttja de samlade uppgifterna så optimalt som möjligt. Som en vägledning för arbetet med att skapa databasen, formulerades tidigt fem allmänna krav (se Demografiska databasen vid Umeå universitet. En presentation av verksamheten, Umeå 1985, s 14). Jag vill här påminna om de två första kraven: Systemet ska vara källtroget, dvs datainsamlingen skall kunna jämföras och kontrolleras mot de autentiska källorna och i databehandlingen skall varje fristående källa kunna urskiljas och analyseras. Systemet ska vara fullständigt, dvs all väsentlig relevant information skall ingå i datainsamlingen. 41 Demografiska databasen har alltså sedan starten arbetat utifrån principen att registreringen ska ske källtroget. Vid inregistreringsskedet avstår vi från att rätta eventuella fel (även om de skulle vara uppenbara), likaså inför vi inte tolkningar i någon större utsträckning. Informationen i Popums källdatabas ska avspegla källan så troget som möjligt. Motiven för detta är flera. Utifrån forskarsynpunkt är det viktigt att det i detta skede inte sker någon form av avgörande manipulation av källinformationen. Vi vet inte i förväg hur databasens uppgifter kommer att användas. Det är t o m möjligt att någon vill studera felförekomster i kyrkböcker (mer om forskningsbehov, se nedan). Vidare så medför det förhållandet att informationen ska användas för uppdatering av variabler, att tolkningar av själva grunduppgifterna bör undvikas. Genom att omedelbart rätta till uppgifter vid registrering, har vi redan antagit vissa förhållanden som kanske inte alls stämmer och som kan göra att det blir felaktigheter i den konstruerade informationen. Exempelvis kan det leda till att vi länkar samman personer felaktigt. Dessutom kräver alla former av tolkning utförliga regler för att undvika skiljaktigheter mellan olika excerpister i hur det görs. Men även om grundprincipen vid registrering är att den ska ske källtroget, sker ändå vissa tolkningar redan i detta skede. I de flesta fall kan de ses som tämligen triviala och ofarliga tolkningar, men likafullt är de just tolkningar. För vår egen skull är det viktigt att försöka identifiera vilka typer av tolkningar som görs (något jag tycker vi skulle behöva analysera ytterligare). Här är några exempel: Vi påför ibland koder omedelbart. Detta gäller t ex församlingsuppgifter Vi identifierar komponenter inom noteringar och sätter dem på dess rätta plats, t ex om civilstånd är fört på olika platser inom en husförhörsnotering (eller kanske på sidan) för uppgiften ändå till rätt variabel. På det sättet släpper vi grundstrukturen på information inom sidan, något som gör att den inte längre är helt källtrogen Vi påför en del implicita uppgifter. Om en hel familjegrupp flyttar och flyttningsdatum endast angetts på noteringen för huvudpersonen, åsätts övriga familjemedlemmar samma flyttningsdatum Vi identifierar hur personer är relaterade till varandra på samma sida. I familjegrupper på husförhörssidor listas oftast fadern först, därefter modern och slutligen barnen. Oftast är familjerelationerna uppenbara i dessa fall. Men det kan också finnas enstaka relaterade personer där det inte är lika tydligt vem denne är relaterad till. Om någon änka anges som mor till någon på samma sida, kan det vara svårt att avgöra vem hon är relaterad till enbart utifrån sidans information Vi påför vissa uppgifter som inte är explicita, t ex personers kön utan att det uttryckligen anges. Namn kan dock sägas vara en tämligen tydlig indikator på kön. Angivelser som hustru, son eller dotter kan kanske anses som ett explicit angivande av kön osv Det som den ”källtrogna” registreringen (som den återfinns i källdatabasen) resulterar i är således inte källan, men den ska representera källan i så stor utsträckning som möjligt. Vore det källan, skulle vårt arbete vara onödigt. Det innebär att i princip all information ska ingå, enligt det andra allmänna kravet ovan. (Detta har inte alltid varit fallet, och frågan är om det stämmer nu heller). Vad vi bidrar med är att vi organiserar informationen och gör att den stora mängden data blir bearbetningsbar och analyserbar med våra moderna resurser. Att databasen representerar källan får dock vissa följder. Vissa negativa egenskaper i originalkällan kommer därigenom att finnas kvar i databasen. Nedan följer några exempel på sådana problem. Motsägelser. Vi kan t ex ibland finna att personer är förda som inflyttade efter deras död (något som faktiskt kunde vara enligt föreskrifterna hur böcker fördes). Vidare så kan vi återfinna samma person boende i flera församlingar vid samma tidpunkt eller att personen inte överförts omedelbart vid flyttning mellan församlingar. Saknade data. Detta är ett vanligt fenomen. I synnerhet för det äldre materialet har det många gånger varit svårt att identifiera tidpunkten när en persons närvaro på en hsuförhörssida 42 Felaktigheter. Det kan vara felaktigt födelsedatum, födelseförsamling, namn m.m. I en del fall är det uppenbarligen fråga om rena felskrivningar av prästen. ”Fuzzy” data. Exempel på detta är datum som ofta anges enbart med år när vi egentligen behöver exakta datum för våra forskaruttag. Ett relaterat problem är att datum kan anges på olika sätt och med olika precisionsgrad. Rumsangivelser (varifrån man föddes eller var man flyttade t ex) kan också vara vaga. Även sådana uppgifter som yrken och dödsorsaker skulle kunna betraktas som suddiga eller oklara. Precisionen på de angivelser som ges i kyrkböckerna är ofta tämligen låg och varierar dessutom över tid och rum. Den andra delen av Popum representeras av användardatabasen. Här har bearbetningar gjorts som gör att databasen blir mer användarvänlig. Den gör också att Popum kan uppfylla de grundläggande krav och förutsättningar för databasen som har formulerats. Jag tar här upp några som är relevanta i det här sammanhanget: Det ska vara möjligt att få fram de uppgifter som rör en person vid viss tidpunkt. På det sättet kan man säga att vi kan komma åt det som motsvarar en folkräkningsbefolkning Det ska vara möjligt att få fram uppgift om person över tid. Vi kan således bygga upp livsbiografier Det ska vara möjligt att återskapa informationen från originalkällan, dvs man ska kunna identifiera all information som hör till aktuell notering Kvaliteten på informationen i databasen är begränsad till originalkällans kvalitet, dvs vi förbättrar inte informationen genom att ta in uppgifter från annat håll (detta är något som nog ändå har gjorts i en del fall, i synnerhet när kyrkböcker har saknats för vissa perioder i en del församlingar) (Övriga krav gäller sådant som att det ska vara enkelt att bygga ut databasen och att databasen ska ständigt underhållas och dokumenteras.) Dessa kännetecken för Popum är de som gör databasen till en så unik källa. Vi kan utifrån den samlade informationen i den digitaliserade versionen av kyrkböckerna, definiera befolkningen såväl vid en bestämd tidpunkt som följa alla ingående personer över tid i den mån de finns i våra församlingar, men med de begränsningar som källans kvalitet sätter. Innan vi går över till hur vi praktiskt utför forskarservice, vill jag redogöra för något om karaktären av individinformationen i databasen. En central skiljelinje är den mellan händelser och tillstånd. Kyrkböckerna bygger till stor del på redovisning av händelser. Dessa är främst av demografisk respektive kyrklig art. Demografiska händelser är födelse, giftermål, flyttningar, död. Kyrkliga händelser är dop, giftermål (även här), begravning, husförhör, nattvard osv. Vi kan tänka oss även andra övergångar som födda sitt första barn, föda sitt andra barn, bli änkling osv. Tillstånd är däremot beskrivningar av personen. Tillstånd kan vara oföränderliga, som kön (jag bortser från möjligheterna av könsbyte), eller tidsberoende, som yrke och civilstånd. I många fall kan dessa tillstånd konstrueras utifrån händelser. Händelsen giftermål exempelvis ger civilståndet gift och partners dödsfall ger civilståndet änka/änkling. Händelsen indikerar också det föregående civilståndet, som att övergången till änka/änkling förutsätter ett föregående civilstånd gift. Händelsen giftermål kan däremot förutsätta såväl civilstånden ogift, änka/änkling och frånskiljd. I en del fall saknas emellertid uppgift om själva händelsen. Så kan vi ibland ha uppgift om att en person är gift eller änkling utan att vi har datum när händelsen som ledde fram till civilståndet inträffade. För civilståndet ogift är det snarare fråga om en icke-händelse. Vidare finns en massa andra variabler som kan ses som tillstånd. Vi kan t ex anse den 43 som är barn av en ogift mor som utomäktenskaplig genom hela livet om vi så önskar - vi kan låta det hanteras som oföränderligt tillstånd. Utifrån händelser uppgivna i kyrkböckerna kan därför personers civilståndhistoria konstrueras. Händelserna gör att personerna övergår i nytt tillstånd och om dessa händelser är fullständigt redovisade får vi exakta start- och slutdatum för civilstånden. Saknas exakta datum för händelsen, kan ändå personers civilståndshistoria rekonstrueras utifrån perioduppgifter som anger det aktuella tillståndet. För andra tillstånd kan detta inte utföras på samma sätt. Ett exempel på det senare är yrkestillhörighet eller social ställning. Kyrkböckerna är fyllda av yrkesuppgifter. Dessa uppgifter är emellertid enbart tillståndsbeskrivande. Kyrkböckerna saknar uppgift om händelsen yrkesbyte. Prästen hade ingen anledning att kontinuerligt uppdatera den informationen (om han ibland gjorde det har vi ingen möjlighet att bedöma att så var fallet). I stället vet vi att personen hade det yrket vid en viss tidpunkt alternativt under eller inom en viss tidsperiod. Har vi yrkesuppgiften från en händelsekälla, som t ex lysnings- och vigselbok, vet vi att han (nästan enbart han) hade det yrket vid den tidpunkten. Har vi uppgiften från en periodkälla (husförhörslängden), vet vi att han hade det yrket åtminstone någon gång under den tidsperiod källan gällde (eller prästen bedömde att han hade det då). Vi kan nog ofta förutsätta att uppgiften gällde för hela perioden, men vi kan inte vara säkra. Det kunde ske uppdateringar under noteringens giltighetstid, vilket i så fall kan innebära att yrket egentligen inte var aktuellt vid noteringens startdatum utan först senare. Vanligare är troligen att yrket angavs när prästen förde in personen i husförhörslängden, men att eventuella yrkesförändringar under noteringstiden inte medförde några förändringar av yrket i källan. Forskarservice i praktiken En grundprincip för DDB är att databasen ska representera källan så troget som möjligt. En viktig anledning för detta är att forskare som kan tänkas ha användning av information registrerad i kyrkböcker ska kunna få dessa i digitaliserad form från DDB. En annan utgångspunkt är att forskaren i princip själv ska ta de avgörande besluten för hur materialet ska behandlas. Vi kan se det som att detta arbetsmoment ska motsvara den forskningsprocess som forskaren annars skulle utfört om han/hon hade suttit i arkivet och tagit fram och bearbetat sitt forskningsunderlag. Forskaren ska kunna göra källkritiska värderingar och göra bedömningar av fullständighet, relevans m.m., alltså de centrala moment som normalt ingår i forskningsprocessen. Lägg märke till att jag ovan skrev ”i princip” när det gällde utgångspunkten att forskaren själv ska fatta (kan med fördel läsas dubbeltydigt) alla beslut. I det praktiska arbetet med forskaruttag går det sällan till på det sättet att forskaren själv tar alla centrala beslut. Det är i det här skedet som utredarna har en viktig roll. De är förmedlare mellan den beställande forskaren och de systemutvecklare som sköter själva programmeringen. Utredarna hjälper forskaren att förstå materialet, ställer relevanta frågor kring hur uttaget ska utformas, vilka variabler som ska med, hur datafilerna ska struktureras osv. I diskussionen mellan den beställande forskaren och utredaren bör också datauttagets utformning i förhållande till analysmetoder behandlas. Är det möjligt att genomföra undersökningen med de tänkta analysmetoderna? I många fall kan utredarna då också bli konsulter i fråga om relevanta analysmetoder. Beträffande val av variabler, så är många uppgifter i databasen av sådan art att forskaren godtar de redan givna värdena. Demografiska databasen har ju själv gjort en hel del upparbetningar i användardatabasen vilka kan anses vara tämligen säkra. Det är sådana uppgifter där man på ett optimalt sätt behandlat den registrerade informationen och där klara och entydiga regler kan skapas. Det gäller exempelvis vilken uppgift om födelsedatum som ska prioriteras. Många av de uppgifter som återfinns i 44 bland annat persontabellen men även i andra tabeller i användardatabasen är konstruerade data av sådan art att vi med stor tillförsikt menar att vi kan garantera deras kvalitet. I de flesta fall har forskaren ingen anledning att konstruera dessa variabler på andra sätt, men det är viktigt att möjligheten till egna definitioner ska finnas. Likaså är det viktigt att forskaren ska vara medveten om eventuella implikationer av att använda sådana variabler när det kan vara av betydelse. Även i andra fall överlåter forskaren mycket av besluten på oss. Många forskare har god kunskap om det grundläggande källmaterialet, medan andra (som kanske kommer från utlandet eller representerar discipliner där man ofta har begränsad erfarenhet av historiska källor) har mer summarisk kunskap. Oavsett om man har den goda kunskapen om källmaterialet eller om den är mer begränsad, så har många forskare svårt att fullständigt förstå vad det innebär att uppgifterna ligger i en databas, vilka effekterna blir av saknade eller ofullständiga data eller att de sökta uppgifterna återfinns på olika ställen i databasen och med motsägande uppgifter. Därför önskar många forskare att vi ger förslag på hur variabler bäst definieras utifrån våra erfarenheter. Vi känner databasens innehåll och struktur bättre och vi har kunskap om vilka regler som använts vid konstruktionen av variabler vid tidigare uttag. Men även om de flesta forskare är tacksamma för att vi ger förslag och att det oftast också är bekvämast för oss, bör vi ändå bibehålla vår ambition att det egentliga och definitiva beslutet ska tas av forskaren. I praktiken innebär det i de flesta fall att vi informerar om de olika möjligheter som finns och kanske också eventuella konsekvenser av de olika valen. För forskaren är det förstås av yttersta vikt att vara medveten om sådana saker. Den dialog som vi för med forskaren kan ses som ett sätt att informera denne om databasen och göra honom/henne införstådd med karaktären av informationen i de beställda datafilerna. På det sättet kan forskaren behandla de beställda data på ett riktigt sätt. Det kan även vara på sin plats att påminna om det forskningsetiska problemet som kan uppstå vid återanvändning av variabeldefinitioner från andra forskaruttag. I de flesta fall behöver det knappast ses som något problem, men vi bör åtminstone fundera över om vi kommer in på någon annan forskares forskningsidéer när vi utnyttjar erfarenheterna från den personens uttag. Olika sätt att analysera Popum-material inom forskning Jag ska här kort ge en kort redogörelse för två olika sätt att använda DDB:s material för forskning, samt visa på vad de respektive analysmetoderna medför för konstruktionen av filer för forskaruttag. I första hand anknyter angreppssätten till demografisk forskning, men grundprinciperna används också i andra former av studier. Naturligtvis finns det också en mängd andra metoder att analysera detta material, men de två nämnda kan sägas representera huvudinriktningarna för demografiska analyser och de påvisar också på ett bra sätt potentialen med DDB:s material. Det digitaliserade kyrkboksmaterialet i den form DDB har upparbetat den lämpar sig väl för en mängd skilda typer av studier. Inom det demografiska forskningsfältet har flera olika angreppssätt använts. DDB-materialet är såväl rikt som väl anpassat för dessa forskningsfält och det kan analyseras utifrån flera olika demografiska analysmetoder. Först några ord om hur vi kan definiera den population vi undersöker. Traditionellt har en stor del av demografiska analyser utförts genom att händelser har relaterats till en riskbefolkning. Det centrala är då att samma befolkning representeras såväl i täljaren (som oftast anger demografiska händelser) som i nämnaren (som utgör riskpopulationen). Vanligtvis använder vi vad som brukar kallas den rättsliga befolkningen, alltså den befolkning som är skriven inom ett visst område (de jure-befolkningen i kontrast till de facto-befolkningen som syftar på den faktiskt boende befolkningen eller att folk identifieras på den plats 45 där de faktiskt befinner sig). Området kan vara av olika omfattning eller på olika indelningsnivåer, men i vårt material är i allmänhet grundindelningen de enskilda församlingarna. Den rättsliga befolkningen befann sig inte nödvändigtvis i det studerade området även om ambitionen med kyrkobokföringen var att folk skulle vara skrivna där de bodde. Det hände förstås att folk befann sig på resa och kunde råka ut för händelser på främmande ort (t ex att de dött). I dessa fall var ändå den egentliga boendeorten inom den församling där de var skrivna. Men det förekom också att folk tillbringade längre tidsperioder hemifrån, t ex när de arbetade på främmande ort, kanske som säsongsarbetare. I sådana fall hade de ändå anknytning till hemförsamlingen. Under senare delen av 1800-talet var det emellertid tämligen vanligt i många områden (t ex Sundsvall) att folk befann sig på dessa orter under flera år (i praktiken boende där) utan att skriva sig i församlingen. I de flesta fall kommer vi åt den rättsliga befolkningen genom husförhörslängderna (observera att det förekommer att husförhörslängderna för en församling innehåller byar som egentligen inte tillhör aktuell församling). Från 1860 skulle man också ange de s.k. obefintliga. Det var sådana som befann sig på okänd ort och som således inte hade tagit ut det obligatoriska flyttbetyget. Formellt skulle de fortfarande räknas till deras gamla hemförsamling tills dess närmare uppgift om ny bostadsort framkommit. I de flesta fall bör obefintliga inte räknas som boende i församlingen. Vi har nämligen ingen aning om deras eventuella demografiska händelser. De kan inte bidra till täljaren så att säga i analyserna, och därför bör de också uteslutas ur nämnaren. I kyrkböckerna finner vi en hel del uppgifter om demografiska händelser hos församlingsbor där händelserna inträffat i annan församling. Det kan vara att personer har dött på annat ställe eller att de fött barn i annan församling. Uppgifter om detta skulle skickas till hemförsamling, varför vi kan finna sådant infört i denna församlings födelseböcker, dödböcker och vigselböcker. På det sättet har vi ändå uppgifter för täljaren i våra tillgängliga källor, trots att händelserna inte inträffat inom vårt geografiska område. Observera att för äldre tid, 1600- och 1700-talet och även tidigt 1800-tal saknas ofta händelser på annan ort i hemförsamlingens ministeriallängder. Detta kan gälla t ex soldater som dött i fälttåg i främmande land. Möjligen kan sådana uppgifter ändå anges i husförhörslängderna. På motsvarande sätt kan vi finna en hel del händelser i kyrkböckerna för en församling som hänför sig till personer som inte var boende där. Personen kan ha dött i församlingen. Denna uppgift fördes således in även i den församling där dödsfallet skedde, samtidigt som attest skickades till hemförsamlingen. För dessa personer har vi således uppgifter för täljaren medan de saknas för nämnaren, vilket gör att vi för de flesta demografiska analyser inte kan användas. Vad innebär då detta för de demografiska analyserna? För att veta att vi har samma befolkning i täljare som nämnare bör vi utgå från den rättsliga befolkning som representeras i husförhörslängderna. Endast händelser för sådana som vid tidpunkten för händelsen var redovisad i församlingens husförhörslängd tas med. Ett specialproblem är spädbarn som inte fördes in i längderna omedelbart och därför kom att sakna husförhörsnärvaro om de dog tidigt. För att inte analysen ska bli felaktig måste vi finna ett sätt att komma runt det. En metod är att undersöka om modern var närvarande i församlingen vid tidpunkten för barnets födelse (alltså att vi tar hänsyn till moderns närvaro i församlingen för bestämningen av barnets närvaro). Vi kan således göra demografiska analyser genom att helt enkelt beräkna antalet händelser i en riskpopulation mot just denna riskpopulation. De demografiska händelserna kan vara sådana som hänför sig till församlingsmedlemmar och som inträffar under en viss tidsperiod. Ofta brukar riskpopulationen representeras av vad som kallas medelfolkmängden. Medelfolkmängden kan beräknas på olika sätt, som t ex befolkningen vid mittidpunkten i en period, men oftare väljer man befolkningen 46 vid periodens början respektive slut, summerar dessa och delar summan med två. Denna medelfolkmängd kan vara totalbefolkningen i en församling, men den kan också vara indelad i kategorier som olika åldrar, efter kön, social grupp osv. Genom att beräkna kvoterna för enskilda åldersgrupper (och kön) kan man få fram åldersspecifika tal, något som sedan även kan användas för beräkningar av livslängdstabeller. Sådana tabeller används främst för studier av dödlighet och överlevnad men kan i princip användas även för andra typer av studier. Livslängdstabeller (eller life tables) är ett sätt att summera den totala erfarenheten under en tidsperiod tvärs över alla åldersgrupper. Den används för att beräkna medellivslängden. Denna medellivslängd hänför sig då till en så kallad syntetisk kohort, alltså det är inte medellivslängden för en grupp människor som föddes under samma tidsperiod utan den representerar i stället erfarenheterna i de olika åldersgrupperna sammanslagna för en gemensam tidsperiod. Eftersom Popum tillåter oss att identifiera samtliga personer som var närvarande vid viss tidpunkt utifrån husförhörslängderna, kan vi på det sättet ta fram data för att definiera medelfolkmängd. Och de demografiska händelserna för aktuell period är, som redan antytts, möjliga att ta fram. Jag ska här ge ett förenklat exempel på hur ett sådant datauttag skulle kunna se ut. I händelsefilen finner vi alla relevanta händelser som vi sen kan ange i täljaren. Från närvarofilen kan vi skapa medelfolkmängden (befolkningen i nämnaren) som vi relaterar händelserna till. Detta kan vi göra dels för befolkningen i sin helhet, men vi kan också dela upp analysen efter kön, ålder, social grupp eller liknande. Vi kan också välja att studera enskilda dödsorsaker och dödsorsaksgrupper och jämföra den mellan olika åldrar, kön osv. Exempel forskningsfråga. Dödlighet i Sundsvall 1860-1870. Vi gör två filer. En händelsefil och en närvarofil (för beräkning av medelfolkmängd). Händelsefil. Alla dödsfall bland personer med hemförsamling Sundsvalls stad 1860-1870. Identitet Födelsedatum Dödsdatum Ev. beräknad dödsålder Kön Civilstånd Yrke (som underlag för egen social indelning i stora grupper) Dödsorsak i klartext (för vidare bearbetning) Närvarofil. Alla som var närvarande 1/1 1860, samt alla som var närvarande 31/12 1870. År (1860 eller 1870) Identitet 47 Födelsedatum Ev beräknad ålder Kön Civilstånd Yrke (som underlag för egen social indelning i stora grupper) Nu medger emellertid Popum även andra och på många sätt mer givande analysmetoder. Med traditionella demografiska mått som bygger på beräkning av allmänna tal, åldersspecifika tal, könspecifika tal osv. blir det svårt att undersöka vad som bestämmer nivåerna. Är det social tillhörighet, ålder, kön, civilstånd, bostadsort eller något annat? Det går att ta fram uppgifter för de enskilda komponenterna, men vill vi ta hänsyn till flera faktorer samtidigt kommer antalet fall i varje underavdelning snabbt att bli för litet. Vi måste kunna hantera flera faktorer samtidigt i analysen. Om vi dessutom kan hantera tid på ett bättre sätt i analysen vore det en fördel. Den longitudinella karaktären av information och möjligheten att bygga upp livsbiografier är vad som gör DDB:s material så unikt. Våra data är mycket lämpliga för livsförloppsanalys eller ”life course analysis”. Life course analysis kan sägas vara ett angreppssätt inom forskning, som innefattar olika typer av metoder men som inte nödvändigtvis behöver vara statistiska. Den inriktning jag vill lyfta fram i det här sammanhanget är emellertid den rent statistiska användningen inom den del av dessa analyser som ofta benämns ”event history analysis”. Cox regression är en sådan metod, men jag ska inte gå närmare in i själva analysmetoden här. I stället ska jag ta upp lite av de krav på data som ställs för att kunna genomföra sådana analyser. Event history analysis används för att studera riskerna för att en händelse ska ske och med möjlighet att relatera detta till olika förklarande variabler. Det kan vara t ex dödsfall. I vilken mån ökar risken för död om man är av ett visst kön, tillhör en särskild social grupp, bor inom ett visst område m.m.. En av de stora komplikationerna i sådana analyser är hantering av tid. Det kan emellertid lösas med DDB:s material. Vad sådana analyser kräver är således att vi har en starttidpunkt för när personen kan börja observeras och vara utsatt för risken av en händelse, och en sluttidpunkt för när antingen händelsen sker eller om observationen upphör innan aktuell händelse inträffat. Utifrån dessa uppgifter kan vi beräkna den tid personen varit utsatt för risken av att drabbas av händelsen. Vidare så behövs en indikator för den händelse som ska mätas. Det kan vara död som då får sägas vara en definitiv händelse, men det kan också vara händelser som kan upprepas, som giftermål eller barns nedkomst utifrån föräldrars perspektiv. Denna indikatorvariabel kan också användas om personen försvinner ut innan händelsen inträffat. Då kan variabeln ange värden för exempelvis utflyttad eller kvarlevande vid slutet av DDB:s registrering. Till detta kan läggas olika typer av förklarande variabler (kön, äktenskaplig börd, civilstånd, boendeort, social ställning m.m.). Det är i detta fall viktigt att de hanteras på ett riktigt sätt så att värdena på de förklarande variablerna är giltiga för början av observationsintervallet. I annat fall kan det helt snedvrida analysen, om man låter uppgifter giltiga för ett senare tillfälle vara giltiga redan från startdatum. Analysen kan också utföras med tidsberoende variabler, t ex att någon byter social ställning. Det löser man enklast genom att dela upp personens närvaro i flera delar. När någon byter från dräng till bonde, låter man en post i datafilen avslutas vid detta datum och med indikator på att noteringen censurerats (posten avslutas utan att aktuell händelse skett). I stället skapas en ny post där startdatum blir datum för byte av social ställning och där variabeln för social ställning har fått det nya värdet. 48 Motsvarande uppdelningar av närvaroperioder blir också aktuella när personer flyttar ut och in i våra församlingar. Om vi kan följa en person från det den är 20 år till det han är 30 då han flyttar ut, leder detta till en post. Om personen kommer tillbaka några år senare leder detta till en ny post som inleds vid inflyttningsdatum. De enskilda posterna är således inte unika för personer i sig utan de är unika för person och närvaroperiod. Följande figur kan användas för att illustrera hur de olika civilstånd en person har genom livet kan användas för att dela upp den sammanlagda närvaron i olika poster. Här låtsas vi att vi inte tar hänsyn till andra tidsberoende variabler. Händelseindikatorn (eller slutindikatorn) används för att ange hur närvaron avslutades. Om vi skulle använda denna person för studier av dödlighet, är det endast i sjätte posten som det sker en händelse av den art vi vill mäta. I övriga poster avslutas närvaron genom högercensurering. Post Startdatum Slutdatum Händelseindikator Civilstånd 1 1800 1822 Censurering (ingen händelse sker) Ogift 2 1822 1830 Utflyttad Gift 3 1833 1836 Censurering (ingen händelse sker) Gift 4 1836 1839 Utflyttad Änka 5 1841 1842 Censurering (ingen händelse sker) Okänt 6 1842 1844 Död Gift Figur 1. Exempel för konstruktion av poster med tidsberoende variabler U nkn ow n 1800 M arried M arried U nm arried 1822 1830 1833 M arried W idow 1836 1839 1841 1842 1844 1800 – födelse 1822 – gifterm ål 1830 – gift v id slut av observ ation, utflyttad 1833 – gift m ed sam m a partn er som tidigare v id början av observ ation , inflyttad 1836 – partner dör 1839 – än ka v id slut av observ ation, u tflyttad 1841 – inflyttad 1842 – om gifte 1844 – gift v id slut av observ ation , död Här ges slutligen ett exempel på hur en fil för en sådan analys skulle kunna se ut. Exempel Forskningsfråga. Dödlighet i Sundsvall 1860-1870. Vi gör en fil, med alla som har någon närvaro under perioden 1860-1870. Pnr 49 Startdatum för närvaroperiod (om personen inleder närvaron före 1 januari 1860 sätts ändå startdatum till 1860-01-01) Slutdatum för närvaroperiod (om personen avslutar närvaron efter 31 december 1870 sätts ändå slutdatum till 1870-12-31) Längd av närvaroperiod (beräknat från slutdatum-startdatum.) Indikator för typ av slut 1. Död 2. Utflyttad 3. Censurerad 1870-12-31 4. Annan censurering (skulle kanske kunna slås ihop med 3) Dödsorsak i klartext (för vidare bearbetning) Födelsedatum Kön Civilstånd Yrke (som underlag för egen social indelning i stora grupper) Kommentar: Beroende på analysprogram kan tid hanteras olika. Har man ett program som klarar vänstertrunkering, kan man låta start representeras av ålder vid startdatum och slut av ålder vid slutdatum. SPSS kan däremot inte hantera vänstertrunkering (alltså att personer börjar observeras vid olika ålder), varför tid kommer att hanteras som längd av närvarotid, medan den ålder som personer är i får hanteras som förklarande variabel utifrån beräkning av ålder vid startdatum. 50 Yrken Sören Edvinsson augusti 2007 Några allmänna principer Demografiska databasen tillhandahåller yrken såväl i kodad som okodad form. I de flesta sammanhang används de kodade yrkena av de beställande forskarna. Den kodning som vi tillhandahåller (den som finns i KODYRK) innebär att vi placerar in standardiserade textsträngar i ett betydelsebärande klassifikationssystem. Varje unikt standardiserad yrkessträng som innehåller någon form av betydelsebärande skillnad, leder till en egen sexsiffrig kod. De två beteckningarna ”Skomakare” och ”Gårdsskomakare” får därför separata koder. I det alternativa kodningssystemet HISCO, som ännu inte implementerats på DDB:s material, sammanförs olika beteckningar under samma kod om de kan anses referera till samma yrke. Enligt exemplet ovan så förs båda beteckningarna till Allmänna skomakare. Även om kodningen enligt KODYRK ingår i ett klassifikationssystem är det viktigt att komma ihåg att placeringen många gånger är osäker. Vi vet inte om personen med titel ”Handlande” stod för en stor eller liten verksamhet, något vi egentligen skulle behöva känna till för korrekt klassificering. Ofta saknas nödvändig information för att finna rätt inplacering. Det är också viktigt att komma ihåg en principiell fråga. Egentligen vill vi klassificera individer, men det klassifikationssystem vi tillhandahåller klassificerar unika textsträngar. Det är därför nödvändigt att beställaren förstår vad de kodade yrkena står för och att han/hon tar beslutet om hur yrkena ska klassificeras. Det är alltid möjligt att skapa egna klassifikationssystem utifrån våra koder, eftersom de ska representera alla varianter på beteckningar, om än i viss standardiserad form. Många eller de flesta forskare väljer att använda den fullständiga yrkeskoden, vilket gör att de själva kan klassificera yrkena efter deras studiers behov. Alla klassificeringssystem bör ju vara anpassade till de speciella frågeställningar och de teoretiska utgångspunkterna som studien utgår ifrån. Några punkter att observera Här följer några punkter som kan vara bra att tänka på i diskussionen med beställande forskare när det gäller utformningen av yrkesvariabeln. ”Yrkena” i KODYRK representerar inte enbart rena yrken. I många fall har vi att göra med titlar, utbildningsgrad, förtroendeuppdrag, familjeställning, etnicitet och nationalitet osv. Vi har för närvarande inget enkelt sätt att renodla vad som är yrken, men vi har ändå en ”skräpkategori” i de sexställiga koder som börjar på 9. I många fall kan det vara att rekommendera att bortse från dessa. Observera emellertid att en del beteckningar ändå kan vara av intresse för inplacering socialt, såsom de koder som rör fattiga eller födorådstagare. Många noteringar innehåller flera yrkesbeteckningar. Om man vill göra ett urval bland dessa yrken, måste vi utforma regler för hur de ska väljas. Man kanske väljer att bortse från alla som börjar på 9 enligt ovan. Sen kan man välja att rakt över ta det första yrket, men man kan också välja andra principer som att ta det ”bästa” yrket, alltså det med lägst nummer. I det senare fallet måste man i så fall vara medveten om att man då konstant kommer att välja de med agrara näringar först i de fall beteckningarna finns inom samma statusnivå. Uppgifter om flera yrken i samma notering kan antingen innebära att personen innehade båda yrkena samtidigt, såsom torpare och skomakare, men det kan också vara så att personen har förändrat yrkesbeteckning under noteringens giltighetstid (dvs husförhörsnoteringar), t ex en soldat som övergått till att bli torpare. I originalkällan framgår detta i allmänhet av att det äldre 51 Inplaceringen i sociala grupper är inte enbart beroende av TYKOD. I variabeln TYFD finns värden som har betydelse för detta. Såväl skomakargesäll som skomakarlärling får koden för skomakare i TYKOD, men med koder för gesäll respektive lärling i tyfd. I synnerhet skomakarlärlingen kan ju inte anses som en yrkesutbildad arbetare, vilket enbart koden i TYKOD antyder. De två variablerna TYREL och TYAGA indikerar båda att det inte är aktuell person som innehar det yrke som anges. Det är emellertid viktigt att särskilja de två variablerna. TYREL indikerar beteckningar av typ Bondhustru eller Torpardotter. Vi vet vad maken respektive fadern tillhörde för grupp även om han inte benämns uttryckligen. I TYAGA däremot är yrkesbeteckningen angiven direkt på den aktuella personen, men att personen namnges i någon annans notering. Vi finner detta förhållande framförallt i Födelse- och dopboken där det kan stå ”Bonden Johan Olssons och hans hustru Anna Persdotters son Olof”. Noteringen kommer att stå på den nyfödde Olof, som då får yrkesbeteckningen bonde, men variabeln TYAGA indikerar att det är den uppgivna fadern som egentligen hade den beteckningen. Det här gör att vi kan behöva gå till barnens yrkesuppgifter med TYAGA>0 för att få fram samtliga angivna yrken på en person. Det skulle i och för sig kunna förenkla om TYREL och TYAGA kunde sammanföras, men detta skulle skapa problem när det i födelseboken skulle stå ”Bonddottern Anna Ersdotters oäkta dotter Sara”. I det fallet behöver såväl TYREL (dotter) som TYAGA (mors yrkesangivelse) användas. Yrkesuppgifter anges egentligen främst för hushållsföreståndare. Gifta kvinnors eller hemmavarande barns yrkesverksamhet är därför underrapporterad. I många fall är forskaren heller inte ute efter yrkesverksamheten i sig. Yrkesuppgiften bildar underlag för social inplacering. För majoriteten av individerna kommer emellertid ett sådant underlag att saknas. En vanlig lösning är att låta hela hushållet klassificeras efter hushållsföreståndarens yrke. Regler för hur detta ska göras måste klarläggas i diskussionen med forskaren. Uppgifterna om yrken kommer såväl från händelsenoteringar (födelse, död, vigsel, flyttningar) som periodnoteringar (husförhörslängder). Från händelsenoteringar vet vi att personen hade det yrket vid det tillfället. Från händelsenoteringar vet vi att personen hade yrket någon gång under noteringsperioden. I allmänhet brukar vi sätta det angivna yrket till hela den aktuella perioden. Egentligen vet vi inte exakta datumet för yrkesförändringen utifrån våra källor (utom i enstaka fall när någon övertar verksamhet som en gård t ex). De olika tidsperspektiven i olika källtyper ger möjligheter till skilda sätt att hantera vilket yrke som väljs för en person. Ska vi prioritera yrket från en notering som omsluter viss tidpunkt eller ska vi i stället välja det yrke som angetts närmast denna tidpunkt? Forskare kan välja yrken utifrån en mängd skilda kriterier, såsom det ”bästa yrke” som en person haft, yrket vid giftermål, yrket vid en viss ålder (t ex 40) osv. I alla dessa fall får forskaren förstås se upp med att inte reglerna snedvrider resultaten. För en person som dog och flyttade ut före 30 års ålder, måste ”bästa yrke” i många fall vara förhållandevis okvalificerat eftersom de ännu inte har haft möjlighet att göra yrkesmässig karriär eller överta näringsverksamhet. Sådana problem ligger i den beställande forskarens ansvar att känna till, men ibland kan man behöva påminna om denna typ av problem som lätt förbises. Avslutningsvis måste forskaren vara med och fastställa hur reglerna ska utformas för att bestämma yrke vid viss tidpunkt. Ska det enbart vara yrken som omsluter denna tidpunkt? I så fall kan vi nästan aldrig använda uppgifter från händelsenoteringar. Om vi vill välja yrken från såväl händelse- som periodnoteringar kan vi behöva bestämma vilket som ska väljas om flera alternativ finns. Det kan göras t ex genom att ta det tidsmässigt mest närliggande, men det finn också andra alternativ. Vi behöver antagligen ha möjlighet att välja ett yrke inom en tidsrymd före eller efter den givna tidpunkten. Låter vi den tidsrymden bli alltför omfattande kommer det emellertid att skapa problem för analysen. De lämpligaste metoderna bör därför bestämmas i samråd med den beställande forskaren. 52 Forskarservicerollen Inez Egerbladh 2007-04-23 Nedan ges några reflektioner om forskarservicerollen som komplettering till Sörens underlag. Uppgift - specifikation av beställning Att överföra forskares önskemål om data till objekt och variabler anpassade till de data som finns i Popum/Tabverk och att ange operationella definitioner av objekt och variabler för att underlätta systemerares programmering av uttaget. Utredare skall inte förväntas handleda externa forskare i frågeställningar eller metoder. Det är uppgifter som normalt ligger på utsedda handledare. Att ge förslag till forskningsfrågor på basis av kunskap om intern och extern forskning (t ex via andras uttag) kan dessutom vara en etiskt känslig fråga. Det gäller också utnyttjande av andra forskares specifikationer för uttagen. Däremot bör utredare informera om vilka andra forskare som använder DDB’s material för snarlika frågeställningar som beställarna anger. Handledning ges även ifråga om kyrkböckernas innehåll/innebörd och hur de kan svara mot forskares önskemål. Det händer – tyvärr alltför ofta - att en forskare har en ganska allmänt formulerad målsättning för sin forskning och därför efterfrågar mängder av variabler. Då krävs att utredaren formulerar frågor som tvingar forskaren att tydliggöra målen, så att uttaget kan bli ett relevant underlag för forskningen. Detta gäller fr.a. forskare som har ”gratis”uttag,. De som betalar brukar vara mer förberedda, särskilt om de har externfinansierade projekt. Å andra sidan kan betalande forskare ofta vara krävande såtillvida att de vill maximera åtkomsten av DDB-data till låg penning. Då gäller det för utredare att begränsa önskemålen till den kostnad forskarna är beredda att betala. Prioriteringen måste givetvis göras av forskaren själv. Offert är därvidlag viktig! Och – vid behov – diskussion med Anders. Särskilda skäl kan föreligga för att tillhandanhålla mer data till en relativt liten kostnad, t.ex. för doktorander utan projektmedel, för pilotstudier som skall vara underlag för ansökningar om medel och för att stimulera till en ökad användning av vissa data (bl.a. Tabellverket). Måhända bör åtminstone några av utredarna ha grundläggande kunskaper i demografi (demografiska mått) för att öka förståelsen för vissa forskares önskemål. Alla bör dock ta del av Gun Alm Stenflos översiktliga presentation av demografiska förhållanden i Skellefteå och Sundsvallsregionen. Den är värdefull också vid diskussioner av val av församlingar i uttagen. Krav på utredare Kunskap om DDB’s material – dess styrka och svagheter – och förmåga att informera forskarna härom på ett sätt som gör det möjligt för dessa att använda DDB’s data på ett relevant sätt för sina önskemål. Det innebär att efterfrågade variabler enligt forskares definitioner inte alltid kan tillgodoses. Innebörden av DDB’s variabler måste klargöras och även anges tydligt i den postbeskrivning som levereras tillsammans med datafilerna. 53 Ibland efterfrågas variabler som kräver generering av information från befintliga DDB-data, vilket innebär att den erforderliga programmeringstiden ökar. Detta bör därför i möjligaste mån undvikas såvida det inte finns beprövade rutiner/regler (system). Rekommendation: De externa forskare föreslås få de variabler som behövs för att de själva skall kunna utföra genereringar. Exempel på undantag utgör variabler som avser ålder och släktskapsrelationer. Vi måste givetvis se till att föreslagna objekt/variabler anpassas till krav som ställs på data i de analysverktyg som de externa forskarna avser att använda – om inte forskarna vet det själva, vilket vi borde kunna förutsätta! Typexempel: Datumvariabler som skall se ut på ett visst sätt i SPSS och inte är utformade som i Popum. Oftast måste de efterfrågade variablerna uppdelas i olika datafiler. Förslag kan ges av oss, men det är beställaren som avgör på basis av hur han/hon kommer att analysera materialet. Vissa föredrar att få breda filer, medan andra vill ha många mindre filer för egen bearbetning innan data länkas samman för analyserna. DDB’s material - Befolkningsdatabasen Jag förutsätter att alla känner till styrkan i DDB’s material /kyrkböckerna. Vi skall också förvänta oss att de externa kunderna tar del av den info om materialen som finns t.ex. i Ulla Jeub Nilsdotters publikation på nätet om innehållet i kyrkböckerna på svenska och engelska (Parish Records). Vid diskussioner om objekt och variabler är det också en fördel om utredaren kan illustrera med exempel från sql-tabellerna, vilket i sin tur kräver kunskap om hur sql-frågor formuleras. Därigenom tydliggörs översättningen från källa till variabler i databaserna. Personligen brukar jag ytterst sällan använda Indiko för att illustrera materialet, eftersom uttaget baseras på en upparbetad databas, användardatabas. Det är viktigt att utredare känner till svagheterna i materialet/sql-tabellerna vid operationaliseringen av objekt och variabler. Det innebär inte att vi skall framhäva alla svagheter för externa forskare - särskilt inte om de kan vara konsekvenser av DDB’s inregistrering eller kodning. Alla ”petitesser/teknikaliteter” - detaljer av vikt för programmeringen - skall diskuteras mellan systemerare och utredare, inte mellan externa forskare och utredare/systemerare. Externa forskare skall inte förväntas känna till eller förstå alla detaljer i hur vi hanterat materialen som resulterat i de data som finns i sql-tabellerna. Specifikationen av objekt och variabler skall i största möjliga utsträckning vara utformad så att en systemerare inte skall behöva ägna mängder med tid för att hantera avvikelser/ konstigheter i data. Vi kan dessutom inte förutsätta att beställaren kan hantera ”konstigheterna”, inte ens om han eller hon granskar förekommande information i Indiko. Dylika fall kan rensas ut på ett effektivt sätt genom att skapa en uppsättning förutsättningar eller regler. Exempel: Om det i RELtabellerna finns en dubbel uppsättning av biologiska föräldrar skall individen ifråga inte medtas i uttaget om uppgifter om föräldrarna är av vikt. Oftast handlar det om ett blygsamt bortfall av PNR. En katalog bör upprättas med de samlade erfarenheterna från forskare och systemerare för att underlätta specifikationer med beaktande av problem vid definiering av objekt och variabler. Observera att alla tänkbara ”konstigheter” inte behöver diskuteras med de externa forskarna. Det kan skapa en bild av att DDB’s data är undermåliga. 54 Vidare, en katalog bör skapas där systemerarnas regler eller ”standard-”/ ”rutin”lösningar för att hantera variabler finns samlade. Det är till gagn för såväl utredare som systemerare så att samma efterfrågade variabel inte hanteras på olika sätt beroende på DDB-person. ”Svagheter” i materialen som måste beaktas Nedan anges några exempel som delvis berörts av Sören! Beakta att problemens omfattning varierar i tid och rum. Generellt bör exempelvis husförhörslängderna från 1700-talet användas med försiktighet, och de specifika problem som uppstår när hela eller delar av husförhörslängdsvolymer saknas måste identifieras (t ex när data baserats på mantalslängder och folkräkningar eller annat material). - Befolkning närvarande i församling vid viss tidpunkt eller ”population at risk” Vanligen används uppgifter ur boendetabellen på ortnivå (BOORT) för att definiera närvarande befolkning i församlingen vid en viss tidpunkt. Men närvaro enligt BOBDAT-BOSDAT kan existera i boendetabellen även om individen inte är närvarande enligt källans uppgifter i rubriker. Ett klassiskt är exempel är rubriken OBEFINTLIGA (ortkod 999). De är alltså inte en del av den närvarande befolkningen. Men observera att det finns även andra koder som visar att de antingen inte är närvarande eller att de är skrivna i annan församling (se koderna för ORT och SUBORT)! Vi kan heller inte förutsätta att alla som har OKÄND ORT finns i församlingen. Så kan exempelvis individer listade som obefintliga 1860 ff tidigare ha redovisats som boende på okänd ort. Nolldatum i BOBDAT och/eller BOSDAT i en post komplicerar bedömningen av närvarande befolkning. Kräver egentligen beaktande av datum och in/uttyper i föregående respektive efterföljande poster. Observera också att samma årtal utan uppgifter om månad och dag (xxxx0000) kan förekomma i flera poster; inte bara som BOSDAT i en post och BOBDAT i nästa post utan även i BOBDAT och BOSDAT i samma post och dessutom som BOBDAT i nästa post alternativt som BOSDAT i föregående post. Hur dessa problem skall hanteras måste avgöras av beställaren. Oftast måste dock utredaren ange alternativa förslag. OBS I popum3 har noll-datum i sista boendepostens bosdat ersatts av skapade värden i PERSONtabellens frsbosdat. Beakta hur detta datum genererats! Ofullständiga datum Dylika förekommer i stort sett i alla datumvariabler, även för demografiska händelser och skapar problem vid beräkning av tex ålder och närvarotider. Ofta brukar 0000 i månad-dag schablonmässigt ersättas av 0630 men den principen kan ibland skapa problem i närvarotider i form av överlappningar, särskilt då närvarotiderna skall finnas för relaterade individer. Yrke Yrke vid viss tidpunkt är ofta efterfrågat. Problem: Uppgifter saknas i YRKE-tabellen vid berörd tidpunkt. Ett vanligt förfaringssätt är att söka efter yrkesuppgifter vid tidigare eller senare tidpunkt. Beställaren skall då bestämma hur lång tid före/efter som är relevant. Observera att det för fr.a.män oftast finns yrken noterade på barnens födelseposter! Det är ett gammalt önskemål att komplettera 55 yrke-tabellen med uppgifterna som föräldrar från födelse- och dopböckerna för att slippa söka via reltabellen (barnen) och yrke-tabellen för alla barn. Beakta också innebörden av yrkeskoderna när ”bästa” yrke efterfrågas. Om man endast väljer lägsta kod kommer exempelvis jordbruksyrken att prioriteras framför andra näringar. Beakta förekomsten av implicita yrken. I rubriker förekommer ibland yrken, t ex tjänstefolk, arbetare vid xx . De bör ha införts även på individnivå vid inregistrering åtminstone i de gamla församlingarna/regionerna, men jag vet inte hur fallet är i NIL. Vidare, uppgifter om bönder när yrke saknas och endast data om jordbruksfastighetsinnehav finns (hemmansnummer/mantal) har införts i en särskild tabell för SKE-regionen. Ibland efterfrågas HISCO-koderna som komplement. De finns i nu-läget inte tillgängliga i Popum! Flyttningar Intyp/uttyp med värdet 0 i LANK genererar flyttningar med flyttningsklass 9. Men det handlar inte alltid om flyttningar. Exempel: En del av den sista hf-volymen för Skellefteå saknas (Kågedalen). Individerna har uttyp 0 i föregående hf, såvida inte senare händelser har identifierats. Med de är alltså inte utflyttade. Ett annat exempel är generering av flera flyttningsposter när överlappningar tidsmässigt finns i källorna vid förändringar i församlingen som i fallet Ytterstfors och Byske. Å andra sidan finns flyttningar till annan församling noterade för individer som berörts av administrativa förändringar i församlingar inom regionerna. De har alltså inte flyttat. En särskild kod för uttyp har tidigare föreslagits (men inte tillämpats). Företeelsen finns i både SKE och SUL. OBS In- och utflyttningsförsamlingar saknas när luckor finns i hf och flyttningslängder saknas. Det skapar problem fr.a. i SUL, t.ex. Svartvik. Beakta att flyttningar mellan orter genererats när individer i ort i en hfvolym återfinns i annan ort i nästa hf; dvs uttyp respektive intyp = 1. Datum för flyttningen är då relaterat till volymåret; något annat kan ju inte anges. Lägesbestämda data Koordinatdata finns i särskilda sql-tabeller. Punktkoordinater finns för orter i SKE och SUL regionerna och för boställen i Locknevi (svårhanterade pga problem i länk mellan rad i hf och boställe). Vidare finns någonstans filer med uppgifter om boställen i vissa församlingar i Linköpingregionen. Även församlingarna har koordinatdata. Punktkoordinater från SCB, som avser kyrkans läge i församlingen enligt förekomst under senare delen av 1900-talet, är länkade till dedik-koden (se dediktabellen). Tidsbestämda polygondata – församlingsgränser – finns via NAD för landsbygdsförsamlingarna. I tabellen NADLANK finner du kopplingen till den kod som församlingen har i publikationen om Sveriges församlingar genom tiderna. Här har också 0-datum i underlaget NAD ersatts av relevanta datum. Däremot är länken mellan dedik-koden till RSVkoden och NADkoden inte säkerställd. Ett embryo finns, men den tabellen innehåller fel och är inte komplett. Dessutom finns koordinatdata för gränser, större vattendrag och större vägar på 1800-talet i SKE och SUL. 56 Underlag för beräkning av avstånd mellan orter Lägesbestämda data på ortnivå finns för SKE och SUL i särskilda sql-tabeller. Observera att koordinaterna anges för suborter (subort xxx00 avser ort) i SKE men för ort i SUL. I enstaka fall saknas koordinater eftersom orten inte kunnat lokaliseras; den kan t.ex ha ödelagts på ett relativt tidigt stadium. En annan orsak är att individerna inte har uppgifter om boende; det gäller i församlingar där luckor i hf kompletterats med data från folkräkningar och mantalslängder. Koordinaterna x och y anges i sql-tabellerna med en alltför hög detaljeringsgrad för att vara relevant. Tänk på att fyra siffror visar kilometernivån - avstånd från ekvatorn och nollmeridianen – vilket är den mest efterfrågade nivån. Beställaren bör alltså ange nivå när avståndsvariabler efterfrågas. För övrigt, beakta att individernas boendeort endast baserats på husförhörslängderna hitintills. Kompletterande uppgifter kan finnas i de andra källorna. Dito avstånd mellan församlingar Koordinater för församlingar återfinns i en särskild tabell (SCB-data). De avser kyrkans läge i församlingen. Men i DDB-data anges ofta städer som destination. För att få avstånd från en församling till en stad (t ex Stockholm) måste därför en församling i staden väljas. Uppgifter om städernas församlingar finns publicerade länsvis 1860 ff (sammanställningar ur folkräkningar). Boende - SUBORT Observera att i tabellen xxxBOENDE finns uppgifter om boende på de suborter som källan angivit, men också på orten om suborter inte finns. I sistnämnda fall har koderna 00 i de sista positionerna. Eftersom företeelsen suborter förekommer osystematiskt över tiden, bär tabellen endast användas om man är ute att fånga befolkningen redovisad tex på vissa industrier eller när man vill veta av vilken anledning en individ har en okänd boendeort Den sporadiska företeelsen innebär också att uppgifterna inte beaktats vid generandet av flyttningar i volymskarvar (vilket gjorts i fallet byte av bostadsort). Boende – BOFRS De data som finns i Popum3 för Skellefteå i tabellerna BOORT och BOENDE är konstruerade från ortkoderna som speglar läget efter alla utbrytningar av församlingar av den ursprungliga Skellefteå landsförsamling; dvs här anges en boendeförsamling som ofta inte är den församling från vilka källuppgifterna hämtats (NOFRS). Etnicitet I nuvarande ANM finns uppgifter om etnicitet. Jag vill uppmärksamma alla att uppgifter även finns i rubriker i hf, inte minst i NIL (t ex lappar, ryssar) Dessutom finns lappar i särskilda hf-volymer i åtminstone GEL. 57 Några erfarenheter från forskaruttag Carin Hedlund 2007-08-30 Kunden ska vara delaktig i alla beslut för att fastställa regler och för hanteringen av materialet. Vi kan ta fram underlag och dokumentation som underlättar detta arbete och tillsammans diskutera fram hur forskarens frågeställning kan besvaras med information från vårt material i en specifikation. Där ska även regler för att generera nya variabler ingå. Att sätta en ’flagg-’-variabel när en variabel är uppdaterad kan vara lämpligt. Ofullständiga datum Då många datum är ofullständiga kan det ställa till med problem eftersom vissa analysprogram kräver ett fullständigt datum. Ibland är forskaren endast intresserad av årtalet, men för att analysera krävs ett fullständigt datum. Då kan mer generella regler gälla för att uppdatera datumet. I andra fall är det viktigt för forskaren att kunna ’ringa in’ en händelse under året. För att fastställa kronologin är det då viktigt att reglerna för att generera fullständigt datum tar hänsyn till samtliga händelser under det aktuella året eller åren. Kronologin mellan händelserna framgår av noteringsnummer (NONR) på de respektive noteringarna. Husförhörsländen sträcker sig dock över en längre period och respektive källas noteringdatum har högre prioritet än motsvarande händelse noterad i husförhörslängden. I uttaget kan det vara lämpligt att både ta med det källtrogna datumet och det uppdatera datumet samt bifoga statistik för samtliga datum i uttaget. Där anges för varje datum andelen fullständiga, andelen där endast månad uppdaterats, endast dag och där både månad och dag uppdaterats. Forskaren har då möjlighet att själv bestämma vilket datum som ska användas, dra konsekvenser av de uppdateringar som gjorts eller att själv skapa nya regler för att uppdatera de ofullständiga datumen. Familjestorlek Att fastställa en familjs storlek vid en viss tidpunkt utifrån informationen från en sida i husförhörslängden. Problem finns då flera av datum är ofullständiga, några kan sakna datum och det är svårt att avgöra när individerna finns där samtidigt. Ett annat problem är vilka individer som ska räknas in i familjen. Överst i hushållet finns husbonden med sin familj, därefter andra släktingar t ex far- och morföräldrar, allra längst ner på sidan tjänstefolket. Ska samtliga i hushållet räknas in i familjen eller ska de betraktas som olika familjer? En individ kan ingå som barn i familjen men under husförhörsperioden bilda egen familj och flytta längre ner på samma sida. Vid omflyttningar anges ofta endast årtalet och om individen bildat ny familj på sidan kan vigseldatum, inflyttad partners inflyttningsdatum eller eget barns födelsedatum användas som underlag för att fastställa de olika familjernas tidsperioder. En son kan även under husförhörsperioden bo kvar på samma ställe men överta huvudmannaskapet (husbonde) för hushållet. Släktingar kan även ingå i hushållet som tjänstefolk. I enstaka fall kan även fosterbarn, tjänstefolk och inhyses vara skrivna i hushållet på rader mellan kärnfamiljens medlemmar eftersom husförhörslängden sträcker sig över en längre period och nyfödda barn skrivs in på lediga rader längre ner. Små barn kan sakna egna husförhörsnoteringar. Prästen kanske inte skrev in dem direkt vid födelsen. Barnets närvaro i församlingen och i familjen kan då genereras från biologiska moders närvaro, om hon 58 finns närvarande när barnet föds. Hur lång tid det kan ta innan prästen för in barnet tillsammans med familjen kan variera mellan församlingarna, men även mellan prästerna och ibland skriver prästen in barnet när en ny husförhörsvolym startar. Hur länge barnets närvaro ska genereras från moderns närvaro diskuteras och bestäms tillsammans med beställaren. Ska vuxna barn som finns på sidan räknas in i familjen eller betraktas som en egen familj, är sådant som måste bestämmas tillsammans med forskaren. Även vid vilken ålder kan man betraktas som vuxen. Utifrån relationstabellen kan olika relationer fastställas, men där anges inga relationstider, utan dessa kan beräknas från boende via husförhörssida, födelsedatum (eget och biologiskt barns), dödsdatum, flyttningar och vigseldatum. Ska samtliga barn tas med i familjen, biologiska barn, styv- och fosterbarn och ska de uteslutas efter en viss ålder?. En individ kan inte tillhöra två familjer samtidigt även om han/hon finns skriven på samma husförhörssida men på olika rader. För att räknas till samma familj krävs ofta att familjemedlemmarna har en relation till varandra, dvs. finnas i tabellen REL. Att de ska bo tillsammans vid en viss tidpunkt, dvs. finnas i samma husförhörsvolym, samma sida och på raderna under varandra, så att ingen individ som inte ingår i familjen finns skriven mellan familjemedlemmarna. En relaterad person kan finnas skriven under denna individ, eftersom personen som därefter finns skriven kan ha bildat en ny egen familj. Även tidsperioderna för familjemedlemmarna ska samtliga ha ett startdatum på sin notering som är före eller lika med den aktuella tidpunkten och ett slutdatum som ligger efter eller är lika med den aktuella tidpunkten. Relationer Fosterrelationer inregistreras endast till fosterfar. Vem som är fostermor vid en viss tidpunkt måste då fastställa utifrån den kvinna som mannen är gift med vid denna tidpunkt. Samma barn kan därför ha flera olika fosterrelationer till familjemedlemmarna under en husförhörsperiod om någon av fosterföräldrarna dör och den andre gifter om sig. Ett annat problem är barnbarn som bor hos sina morföräldrar sedan födelse och fått relationen barn till dessa. Dessa barn har då ofta två mödrar, i vissa fall är morfar den enda fadern. Barnets egen mor blir även då syster till barnet och moderns syskon blir både syskon och moster och moster till barnet. Det är inte många fall men de ställer till problem vid uttagen och kontrollerna. Flyttning För en individ som inte är skriven i församlingen, men som dör där, skapas en flyttningsnotering. För individer som tar ut flyttningsbetyg men aldrig flyttar, skrivs in som utflyttade och sedan som återflyttade. Flyttningsförsamling för samma flyttning kan vara olika i husförhörslängden och i flyttningslängden. I husförhörslängden anges t.ex. att individen flyttat till Stockholm men i flyttningslängden anges en specifik församling i Stockholm. Det finns även fall där flyttningen endast är noterad i antingen flyttningslängden eller i husförhörslängden. Flyttningar inom församlingen förs endast i husförhörslängden. Vissa problem uppstår när församlingar delas (administrativa flyttningar) som sker fram för allt i Skellefteå. Flyttningar med flyttningsförsamling 99992, 99993 eller 99997 bör ej tas med bland flyttningarna. För församlingarna, regionerna i tidigare version av Popum genererades flyttningsuppgifter för samtliga personer i flyttgruppen i flyttningslängden. Därefter har en FLYTT-tabell genererats där samtliga flyttningar både från husförhörslängden och från flyttningslängden ingår och sammanförts. För LINoch NIL-regionerna har endast huvudmannen för flyttningen uppgifterna, de övriga i gruppen saknar dessa uppgifter i flyttningslängden. Uppgift kan finnas i husförhörslängden och flyttningsgruppen för 59 familjemedlemmar kan fastställas utifrån dessa uppgifter; relaterade familjemedlemmar som står skrivna tillsammans i husförhörslängden med samma flyttningsuppgifter. Tabellen FLYTT har ej genererats för LIN- och NIL-regionerna. Attester För händelser som skett i annan församling än hemförsamlingen skickas attester om detta mellan församlingarna. Information om detta kan hittas i anmärkningarna. Ex. efter anmärkningskoden HAG finns uppgift om lysning och vigsel. Etnicitet Eftersom det är omöjligt att fastställa säkert vem som är same eller ej överlämnas det till forskaren. Som underlag kan olika indikatorer tas fram som forskaren kan ha till hjälp för att fastställa etnicitet. Några sådan indikatorer är - Samiska släktnamn. En tabell med samiska släktnamn har tagits fram av Peter Sköld, Gabriella Nordin och Per Axelsson. DDB har gjort en överenskommelse med dem att om att andra forskare får tillgång denna tabell om de anger dem som källa samt att vi informerar Peter, Per och Gabriella när andra forskare vill använda deras material. - Yrken med uppgift om ’lapp’ , ’rennäring’ etc. En yrkestabell med samiska yrkesbeteckningar har tagits fram - Orter och boställen som i rubriken på husförhörslängdsidan anger att det är lappar som är skrivna där. Även tabell över samiska boställen har tagits fram av Peter Sköld, Gabriella Nordin och Per Axelsson. DDB har gjort en överenskommelse med dem att om att andra forskare får tillgång denna tabell om de anger dem som källa samt att vi informerar Peter, Per och Gabriella när andra forskare vill använda deras material. - Anmärkningstexter som innehåller uppgift om ’lapp’, ’renar’ etc - Dödsorsaker med uppgifter om ’lapp’ och ’renar’. - Släktskap, någon av individens barn, far eller mor har uppgift om ’lapp’. För varje sådan indikator sätts en flagga med värde 1 (uppgift finns) eller 0 (uppgift saknas). Utifrån dessa flaggor och övriga information kan forskaren själv försöka bedöma vilken etnicitet som individen ska ha. Se dokument Information om indikatorer, Carin Hedlund 2008-08-08. Närvaro för små barn Barn skrivs inte alltid in i husförhörslängden när de föds utan det kan ta flera år innan de förs in i husförhörslängden. Dessa barns närvaro brukar då fastställas från den biologiska modern, om hon finns skriven i husförhörslängden vid barnets födelse och barnet är noterad i födelse- och dopboken. Om modern flyttar ut från församlingen innan barnet hinner skrivas in i husförhörslängden och barnet saknar egna noteringar om flyttning eller död, kan man påföra barnet moderns flyttningsuppgifter. Hur lång tid det kan ta innan prästen för in barnet tillsammans med familjen kan variera mellan församlingarna, men även mellan prästerna. Ibland skriver prästen in barnet först när en ny husförhörsvolym startar. Hur länge barnets närvaro ska genereras från moderns närvaro diskuteras och bestäms tillsammans med beställaren 60 Födelse- och dop i Skellefteå Vissa FD-böcker var i dåligt skick att de inte inregistrerades utan istället ’återskapades’ de från Familjeregistret, (Ljungs register) som täcker perioden 1699-1859, varför endast de barn som överlevt viss ålder finns med i de konstruerade FD-böckerna. Familjeregistret är rekonstruerat från husförhörslängderna för perioden 11699-1850. I ett senare skede har man inregistrerat de ursprungliga FD-böckerna för perioden 1800-1859, de tidigare perioderna saknas. Vid denna inregistrering tog endast tagit de barn med, som inte fanns med i Familjeregistret. De flesta av dessa barn är dödfödda eller har dött tidigt. Ett problem är tvillingar, då den ena dött tidigt och den andra överlevt och finns med i den konstruerade FD-volymen. Dessa tvillingar har då olika källhänvisningar. I den konstruerade volymen saknas även uppgifter om dopet, diverse anmärkningar mm. De konstruerade FD-volymerna löper inte över samma år som de ursprungliga FD-volymerna. I vol 52 är några av barnen på sidorna 45 och 209 skrivna som anmärkning. I vol 53 finns vissa sidor i slutet med barns om saknas i FD men som har uppgift i HL. I vol 54 saknas ofta datum. Barn på sidan 133 är inskrivna 1851 men är födda 1852. Rekonstruerade: Vol 52 1826-1842, vol 53 1843-1850, vol 54 1851-1859 Inregistrerade kompletteringar: C:9 1831-1847, C:10 1840-1847, C:11 1848-1859 Yrken Det kan finnas flera yrkesuppgifter på en och samma notering, yrke kan saknas för en viss tidpunkt men finns vid andra tidpunkter, individen kan helt sakna egna yrken men har på sin egen notering uppgift om relaterade personers yrken. Några vanliga sätt att lösa detta är: Med bästa yrke avses det yrke som har den lägsta koden. Väljs ofta om flera yrken finns på den aktuella noteringen. Endast riktiga yrken tas med, ej titlar etc. Endast yrken inom följande intervall betraktas som yrken; 110000≤TYKOD≤699999 och 994000≤TYKOD≤994999. För vuxna män, > 19 år, ska endast egna yrken tas med, YRKEAGA = 0 och TYREL = 0. För vuxna ogifta kvinnor, > 19 år, väljs yrket med följande prioriterings ordning o kvinnans egen yrkesnotering med YRKEAGA = 0 och TYREL = 0 o fars yrke från kvinnans notering YRKAGA =1 och.TYREL = 0 o faderns yrkesnotering med YRKEAGA=0 och TYREL = 0. För gifta kvinnor väljs yrket med följande prioritering o från kvinnans egen yrkesnotering med YRKEAGA = 3 (partners yrke) o från partners yrkesnotering YRKEAGA=0, om de är gifta vid aktuellt datum. För barn, individer < 20 år tas yrkesuppgift o från barnets notering eget yrke vid aktuellt datum, YRKEAGA=0 och TYREL = 0. o från barnets notering, fars yrke vid aktuellt datum, YRKEAGA=1. o från barnets notering, mors yrke vid aktuellt datum, YRKEAGA =2. o från biologiska faderns notering för den aktuella närvaroperioden YRKEAGA=0, RTYP=1 och RBES<2 61 o från foster/styvfars yrke för den aktuella närvaroperioden om biologisk far saknas RTYP=1, RBES2,3. Foster/styvfar skall finnas på samma husförhörssida som barnet. Vid den aktuella tidpunkten o från mors egna yrke vid denna närvaroperiod från moderns notering, RTYP=2 och RBES<2. För vuxna individer som har egna barn kan ytterligare yrkesuppgifter hämtas från barnets FDnotering, RTYP = 4-6, RBES = 1 och YRKEAGA = 1-2. Källor som saknas Vissa församlingar saknar för vissa perioder någon eller några av källorna. Exempel är Galtström som har mantalsregister 1846-62 istället för husförhörslängder, Svartvik som saknar flyttningar helt och för de andra källorna hämtas information från SCB vart 10:e år mellan 1860-95. I Skellefteå är materialet bränt varför vissa variabler kan sakna information från vissa sidor och många datum saknas helt eller är ofullständiga. Dessa problem framgår delvis av den sammanställning som finns under avsnittet ’Översikt över inregistrerat kyrkoboksmaterial och perioder’. Närvaro saknas på sågverksort Det finns problem med hur befolkningen har förts i husförhörslängderna för vissa av sågverksorterna i Sundsvallsregionen. Svartvik blev egen församling först 1860 och - 1900, ingick tidigare i Njurunda. I Svartvik församling finns endast orten Svartvik, ortkod 1. I Njurunda finns Svartvik som ort, med ortkod 70, mellan åren 1850 – 1853, 1879 – 1881, 1889 – 1890, men saknas 1854 – 1878, 1882 – 1888. Merparten av de 32 sågverksorterna i Sundsvallsregionen visar att husförhörslängder tillkommit i samband med sågverkens tillkomst. De år som sågverksorterna saknar egen befolkning har prästerna fört befolkningen till de tillhörande byarna i församlingen. Sågverksort och tillhörande by Alnö: FRÖST med Myrnäset BÖHLE med Strand ÖDE med Alvik NYSÄTER med Nyvik RÖDE med Rödestrand HOFVID med Johannesvik JERVIK med Eriksdal NÄSET med Stornäset Njurunda: ÄNGOM med Klampenborg ESSVIKEN med Essvik Skön: TUNABÄCK med Ortviken 62 Dubbel närvaro Det kan förekomma dubbel närvaro i två församlingar i Sundsvallsregionen (Skön och Sundsvall) och i Skellefteåregionen (där församlingar delats). I Skellefteåregionen är dock ortkoden unika, oberoende av vilken av Skellefteåförsamlingarna som den för tillfället tillhör. Individerna finns i två parallella husförhörslängder samtidigt under en viss period, de har inte skrivits ut från den ena längden när närvaron startar i den nya husförhörslängden. Hushållsproblem I Skellefteå på 1700-talet sträcker sig husförhörslängden över långa tidsperioder varför makarna inte alltid var skrivna tillsammans. Först när ny volym togs i bruk skrevs hustrun och ev. barn in tillsammans med mannen, trots att de troligen bott tillsammans hela tiden. Kan ställa till med problem när familj och hushåll ska tas fram. Bör därför inte göra uttag på Skellefteå före 1801. Volymskarvar Volymskarvar mellan två husförhörslängder. Om individen är omskriven mellan två volymer anges endast årtalet för start och slut. Två olika förfaringssätt finns. Volymen slutar samma år som nästa volym startar dvs. slutdatum 18570000 i ena volymen och startdatum 1857 i nästa volym. Här är det viktigt att individen inte får dubbel närvaro under året. En konstlad ’lucka’ i närvaron kan uppstå om den ena volymen slutar 18570000 och nästa volym startar 18580000. 63 Offert, Prislistor och debiteringsunderlag För större uttag utarbetar utredaren och forskarserviceansvarig en offert till kunden i samråd med platschefen i Umeå, med ”grovspecifikationen” som underlag. För mindre uttag anges ett kostnadsförslag på annat sätt. Den färdiga offerten skickas i två exemplar av utredaren till kunden för godkännande och underskrift. Med offerten biläggs specifikationen och avtal, som anger på vilket sätt DDB:s material får utnyttjas. Befintliga mallar för offert och avtal skall användas. Kunden återsänder godkänd offert och avtal. Om kunden inte är beredd att acceptera offerten, kan ny specifikation och offert omformas till den kostnad kunden är beredd att betala. Platschefen i Umeå godkänner offerten genom sitt undertecknande av densamma. Ett exemplar återsänds till kunden. Det andra exemplaret lämnas till administration för arkivering. Kopia av offerten ska lämnas till forskarserviceransvarig. Mallar för offert Mallar finns för offert på svenska och på engelska. Se avsnittet ’Dokument och mallar’. Debitering för uttag ur Popum Uttag offereras kostnadsfritt efter det att kunden tagit kontakt med utvecklingsvdelningen och beställningen diskuterats och specificerats. Personalchefen i Umeå tar fram offert i samråd med utredare. Följande priser tjänar som riktlinje: Upp till 16 timmars programmering Upp till 40 timmars programmering Upp till 80 timmars programmering Därutöver 490 kr/tim 3 000 kr 6 000 kr 12 000 kr även Miniuttagen För konsultation, framtagande av specifikation samt kontroller och tester av datafiler före leverans debiteras 600 kr/tim, 20 timmar avsätts kostnadsfritt för kunden. Debitering för uttag ur Tabellverket För Tabellverket och andra aggregerade material beräknas kostnaden utifrån uttagets omfattning och struktur. 64 Gästforskarpolicy Gästforskare vid CBS erbjuds ett kostnadsfritt uttag som motsvarar 160 timmar systemerar tid och 40 timmar utredartid samt att 40 timmar avsätts av forskare vid besöket. Litteratur Lämplig litteratur: Källbeskrivningarna för respektive församling Nilsdotter Jeub, Ulla : Parish Records. 19th Century Ecclesiastical Registers. Umeå 1993 Alm Stenflo, Gun: Demographic description of the Skellefteå and Sundsvall regions during the 19th century. Umeå 1994. Kundadministration Kort beskrivning av systemet kommer att läggas in när systemet är helt klart. 65