Mallar för specifikationer - Demografiska databasen

Transcription

Mallar för specifikationer - Demografiska databasen
Forskarservicehandbok
Demografiska databasen
Datum:.............................................. 2010-04-15
Version: ............................................. version 1.6
Projekt: .................................................... L_IF05
Namn: ......................................... Carin Hedlund
Användarhandbok för forskarservice
2
Innehållsförteckning
Innehållsförteckning........................................................................................................................... 3
Mål och syfte med forskarservicehandboken..................................................................................... 6
Övergripande mål ........................................................................................................................................6
Målgrupp ......................................................................................................................................................6
Syfte ...............................................................................................................................................................6
Dokument och mallar ......................................................................................................................... 7
Övrigt ................................................................................................................................................... 8
Projekt...........................................................................................................................................................8
Miniuttag.......................................................................................................................................................8
Uttagsnummer och avtalsnummer .............................................................................................................8
Diarienummer ..............................................................................................................................................8
Forskarservicerutiner ......................................................................................................................... 9
Checklista .......................................................................................................................................... 11
Specifikation...................................................................................................................................... 12
Mallar för specifikationer..........................................................................................................................14
Avtal ................................................................................................................................................... 15
Mallar för avtal ..........................................................................................................................................15
Kravspecifikation .............................................................................................................................. 16
Mall för kravspecifikation.........................................................................................................................16
Dokumentation, test och kvalitetssäkring av framtaget forskaruttag............................................. 17
Test av uttag - systemutvecklarna ............................................................................................................17
Mall för test.................................................................................................................................................17
Kundens dokumentation ...........................................................................................................................17
Mallar för dokumentation.........................................................................................................................18
Kvalitetssäkring/verifiering av uttag........................................................................................................18
Mall för kvalitetssäkring/verifiering ........................................................................................................18
Mall för utvärderingsenkät till kunden....................................................................................................19
Översikt över inregistrerat kyrkoboksmaterial och perioder........................................................... 20
Sundsvallsregionen.....................................................................................................................................20
Skellefteåregionen ......................................................................................................................................21
Försöksförsamlingarna..............................................................................................................................21
Linköpingsregionen....................................................................................................................................22
Norra inlandsregionen ...............................................................................................................................23
Församlingar inregistrerade av externa samarbetspartner ...................................................................24
Översikt över parallella material ...................................................................................................... 25
Användarhandbok för forskarservice
3
Mer om våra församlingar................................................................................................................ 26
Källbeskrivningar ......................................................................................................................................26
Andra dokument om församlingarna.......................................................................................................26
Anteckningar om ologiskheter ..................................................................................................................27
Etnicitet.............................................................................................................................................. 28
Allmänt om indikatorer.............................................................................................................................29
Beskrivning av indikatorerna ...................................................................................................................30
Indikator för anmärkning .................................................................................................................................... 30
Indikator för dödsorsak........................................................................................................................................ 30
Indikator för yrke ................................................................................................................................................. 30
Indikator för namn ............................................................................................................................................... 30
Indikator för boställe ............................................................................................................................................ 31
Indikator för relationer ........................................................................................................................................ 31
Tabellverket ....................................................................................................................................... 32
Allmänt........................................................................................................................................................32
Bortfallet i Tabellverksmaterialet.............................................................................................................32
Bortfall, länskoder ................................................................................................................................................ 33
Dödsorsker ..................................................................................................................................................34
Att göra uttag från tabellverket................................................................................................................34
Skapa uttagsfilen ................................................................................................................................................... 35
Export av uttagsfilen............................................................................................................................................. 35
Dokumentation ...................................................................................................................................................... 35
LinnéDb ............................................................................................................................................. 36
Initial hantering för att skapa LinnéDb.............................................................................................................. 36
Teknisk miljö ......................................................................................................................................................... 36
Tillgänglighet för forskning ......................................................................................................................37
Rutiner vid hantering av LinnéDb ...........................................................................................................37
Grundläggande villkor ......................................................................................................................................... 37
Roller och rutiner för forskarservice på Linnedb.............................................................................................. 37
Tillståndsgruppen ................................................................................................................................................ 37
Forskare ................................................................................................................................................................. 37
Ämnesexpert ......................................................................................................................................................... 37
Forskarserviceansvarig........................................................................................................................................ 38
Utredare................................................................................................................................................................. 38
Systemutvecklare.................................................................................................................................................. 38
System-/databasadministratörer ....................................................................................................................... 38
Forskarservicerutiner för uttag från LinnéDb................................................................................................... 38
Checklista............................................................................................................................................................... 39
Systemadministrativa rutiner vid forskarservice på Linnedb .......................................................................... 40
Inför uppstart av ett uttagsprojekt ........................................................................................................................... 40
När uttaget är färdigt:.............................................................................................................................................. 40
Dokumentation kring uttag från LinnéDb ......................................................................................................... 40
Forskarservicerollen ......................................................................................................................... 41
Forskarservicerollen ......................................................................................................................... 41
Några tankar kring Demografiska databasens material och forskarservice........................................41
Popum .................................................................................................................................................................... 41
Forskarservice i praktiken ................................................................................................................................... 44
Olika sätt att analysera Popum-material inom forskning................................................................................. 45
Exempel forskningsfråga...................................................................................................................................... 47
Exempel Forskningsfråga..................................................................................................................................... 49
Användarhandbok för forskarservice
4
Yrken...........................................................................................................................................................51
Några allmänna principer .................................................................................................................................... 51
Några punkter att observera................................................................................................................................ 51
Forskarservicerollen ..................................................................................................................................53
Uppgift - specifikation av beställning................................................................................................................. 53
Krav på utredare................................................................................................................................................... 53
DDB’s material - Befolkningsdatabasen ............................................................................................................. 54
”Svagheter” i materialen som måste beaktas ..................................................................................................... 55
Några erfarenheter från forskaruttag......................................................................................................58
Ofullständiga datum ............................................................................................................................................. 58
Familjestorlek........................................................................................................................................................ 58
Relationer............................................................................................................................................................... 59
Flyttning................................................................................................................................................................. 59
Attester................................................................................................................................................................... 60
Etnicitet .................................................................................................................................................................. 60
Närvaro för små barn ........................................................................................................................................... 60
Födelse- och dop i Skellefteå ................................................................................................................................ 61
Yrken...................................................................................................................................................................... 61
Källor som saknas ................................................................................................................................................. 62
Offert, Prislistor och debiteringsunderlag ....................................................................................... 64
Mallar för offert .........................................................................................................................................64
Debitering för uttag ur Popum .................................................................................................................64
Debitering för uttag ur Tabellverket........................................................................................................64
Gästforskarpolicy .............................................................................................................................. 65
Litteratur............................................................................................................................................ 65
Kundadministration .......................................................................................................................... 65
Användarhandbok för forskarservice
5
Mål och syfte med forskarservicehandboken
Övergripande mål
Detta dokument skall fungera som vägledning vid forskaruttag från databasens material. Det bör också
leda till att vi arbetar efter gemensamma regler och med ett likartat arbetssätt vid forskaruttag.
Målgrupp
Dokumentets målgrupp är alla som arbetar med forskarservice.
Syfte
Syftet är att så heltäckande som möjligt beskriva de aktuella rutinerna vid forskaruttag, samt lyfta fram
viktiga egenskaper och problem i DDB:s material som kräver särskild hantering vid forskaruttag.
Även de ’kända’ problem som ännu inte dokumenterats men som ’gamla FOU’ känner till och hanterar
med ryggmärgen bör komma på pränt i denna forskarservicehandbok för att underlätta för de nya
utredarna att snabbare bli insatta i forskarservice.
I forskarservicehandboken ingår även de mallar som behövs under olika moment rörande
forskarservice.
Forskarservicehandboken skall ge en beskrivning av följande moment:
-
Översikt över inregistrerat kyrkoboksmaterial och perioder
-
Egenheter hos vissa församlingar och regioner
-
Översikt över parallella material
-
Gällande forskarservicerutiner och checklista
-
Att tänka på vid dialogen med forskaren (Erfarenheter från Sören och Inez)
-
Debiteringspolicy; prislistor, kostnadsberäkningar och offerter (mallar och aktuella priser)
-
Att skriva specifikation utifrån forskarens önskemål (mall skall användas)
-
Att tänka på när man skriver kravspecifikation (mall skall användas)
-
Kvalitetssäkring och kontroll av framtaget forskaruttag (mall skall användas)
-
Dokumentation till forskaren, vad som bör ingå, vad som ej ska tas med (mall skall användas)
-
Övrig dokumentation kring uttaget
-
Avtal som beställaren ska skriva på (mall skall användas)
-
Utvärderingsenkät som bifogas med uttaget till beställaren (mall skall användas)
-
En beskrivning av typiska problemställningar som forskarservicepersonal kan möta, och föreslå
lösningar för dessa.
-
Kundadministration – ett system för att hantera kunderna, ta fram unika uttagsnummer och
avtalsnummer. Systemet är sökbart på forskares namn, uttagsnummer, avtalsnummer,
diarienummer, datum, forskningsområde samt olika variabler och nyckelord.
Användarhandbok för forskarservice
6
-
Samtliga dokument som rör ett forskaruttag ska ha samma uttagsnummer, avtalsnummer och
diarienummer
Dokument och mallar
För de dokument som används i samband med forskarservice har mallar tagits fram. Dessa skall alltid
användas.
Följande dokument och mallar finns.

Specifikation av uttag från Tabellverk och från Popum3. Svenska och engelska versioner.

Kravspecifikation.

Test.

Verifiering/ kvalitetssäkring.

Dokumentation av uttag till kunden från Popum3 och från Tabellverket. Svenska och engelska
versioner.

Utvärderingsenkät. Svensk och engelsk version.

Avtal. Svensk och engelsk version.

Offert. Svensk och engelsk version.
Samtliga mallar finns tillgängliga på vårt intranät Company Home > DDB > Mallar > Forskarservice
När uttaget är klart, skall projektledaren för uttaget överlämna dokumentet till forskarserviceansvarig
(Carin) för dokumentation av uttaget, samt lägga upp dem på vårt intranät Alfresco.
Dokument
Ansvarig inom projektet för dokumentet
Specifikation
Utredare
Kravspecifikation
Systemutvecklare
Testdokumentation
systemutvecklare som gjort test
Kvalitetssäkrings-/
utredare eller utvecklare som gjort kvalitetssäkring (verifiering)
Verifieringsdokument
Kundens dokumentation
Systemutvecklare
Offert (kopia)
administration (Siv) (ej på Alfresco)
Avtal (kopia)
administration (Siv) (ej på Alfresco)
Användarhandbok för forskarservice
7
Övrigt
Projekt
Uttag skall betraktas som projekt med ansvarig projektledare.
Specifikationen ses som projektbeskrivning.
När specifikation och kravspecifikation är godkända, ska inga ytterligare förändringar göras.
Ingen direktkontakt ska ske mellan system och forskare, diskussioner ska alltid ske i samråd med
ansvarig utredare.
Miniuttag
Miniuttag- avser 1 – 2 dagars kodning med kort dokumentation och kontroll.
Endast i vissa fall sker kvalitetssäkring (verifiering).
Ingen kravspecifikation behövs och endast en enklare specifikation.
Totalt max 3 dagar.
Uttagsnummer och avtalsnummer
Uttagsnummer och avtalsnummer tas fram via Kundadministrationssystemet, FosAdm, och anges i
samtliga dokument av uttaget. Till varje uttag anges ett unikt nummer Uåålll (U-uttag, åå- 2 sista
siffrorna i aktuellt år, lll- löpnummer inom året). Till varje uttag kan det finnas en till flera kunder, varje
kund skriver på ett eget avtal som numreras Kåålll (K-avtal, åå- 2 sista siffrorna i aktuellt år, llllöpnummer inom året). Det kan därför finnas flera avtal till ett uttag. Om kunden senare får en
komplettering i form av miniuttag till aktuellt uttag kan i vissa fall samma avtal gälla, varför ett avtal kan
knytas till flera uttag.
Kundadministrativa systemet, FosAdm, används för att hålla ordning på kunderna, uttagen och avtalen.
Diarienummer
Samtliga dokument som rör ett forskaruttag ska ha samma diarienummer. Detta diarienummer tas fram
av administration.
8
Forskarservicerutiner
( 2007-06-11 Uttagsgruppen, 2008-10-08 IF Styrgruppen)
1. Kunden kommer med en frågeställning och förfrågan på uttag till DDB. Kunden kan även
skriftligen ange sina önskemål på befintlig specifikationsblankett som finns på vår hemsida.
2. Kunden och utredaren tar tillsammans fram en ”grovspecifikation”, specifikationsmallen skall
användas. Utredaren ansvarar för att forskarserviceansvarig får ”grovspecifikationen” i god tid före
terminsplaneringen. Forskarserviceansvarig ger uttaget ett unikt uttagsnummer samt för in uttaget
på listan över aktuella forskaruttag. Vid terminsplaneringen bestäms vilka, utredare och
systemutvecklare, som skall ingå i projektet. Förfrågningar om uttag som inkommer under terminen
planeras in i mån av tid och ansvariga utredare och systemutvecklare utses.
3. För större uttag utarbetar utredaren och forskarserviceansvarig en offert till kunden i samråd med
platschefen i Umeå, med ”grovspecifikationen” som underlag. För mindre uttag anges ett
kostnadsförslag på annat sätt. Den färdiga offerten skickas i två exemplar av utredaren till kunden
för godkännande och underskrift. Med offerten biläggs specifikationen och avtal, som anger på
vilket sätt DDB:s material får utnyttjas. Befintliga mallar för offert och avtal skall användas.
4. Kunden återsänder godkänd offert och avtal. Om kunden inte är beredd att acceptera offerten, kan
ny specifikation och offert omformas till den kostnad kunden är beredd att betala.
5. Platschefen i Umeå godkänner offerten genom sitt undertecknande av densamma. Ett exemplar
återsänds till kunden. Det andra exemplaret lämnas till administration för arkivering.
6. Kunden och utredaren tar tillsammans fram en mer detaljerad specifikation där det tydligt
framgår hur kunden vill ha sitt material, format på filer och variabler samt kriterier för de olika
variablerna. Specifikationen slutförs i samarbete med systemutvecklare. Mall för specifikationen
skall användas.
7. Kunden skall (interna kunder skriftligen) godkänna specifikationen innan programmering av
uttaget påbörjas.
8. Systemutvecklaren utformar en kravspecifikation utifrån specifikationen, vid behov i samråd med
utredaren. Mall för kravspecifikationen skall användas. Kraven skall vara utformade på ett mätbart
sätt.
9. Utredare läser och godkänner kravspecifikationen.
10. Systemutvecklaren genomför uttaget i enlighet med kravspecifikationen.
11. Systemutvecklaren testar det framtagna materialet, skapar statistik samt dokumenterar detta
enligt framtagen testmall.
12. Systemutvecklaren färdigställer dokumentation till kunden över uttaget. Befintlig mall skall
användas för detta ändamål.
13. Utredare kvalitetssäkrar/verifierar och godkänner uttaget, både filer och den framtagna
dokumentationen. Kvalitetssäkringen/verifieringen dokumenteras med befintlig mall.
14. Administration tar fram ett diarienummer för uttaget. Administration skriver räkning, som sänds
tillsammans med uttag, av föreståndaren underskrivet avtal om nyttjande av DDB-material,
följebrev, dokumentation och framtagen utvärderingsblankett till kunden. Utvärderingsblankett
bifogas ej till mini-uttag. Det är viktigt att avtalsnummer, uttagsnummer och diarienummer finns i
dokumentationen.
15. Kunden är ansvarig för kontroll av sitt material och skall inom tre månader påpeka eventuella
felaktigheter för kostnadsfri korrektion, såvida ingen annan tidsperiod överenskommit.
9
16. Systemutvecklaren arkiverar en säkerhetskopia av uttaget.
17. Projektledaren sammanställer all dokumentation
forskarserviceansvarig att uttaget är levererat.
kring
uttaget
och
meddelar
18. Projektledaren lägger in slutrapporten för projektet på intranätet Alfresco. För vanliga uttag
består slutrapporten av specifikation, kravspecifikation, test, kvalitetssäkring/verifiering och
kundens dokumentation. För miniuttag består slutrapporter av specifikation och kundens
dokumentation och ev. testdokument.
19. Projektledaren utvärderar projektet tillsammans med övriga projektdeltagare, sammanställer
utvärderingen och skickar den till forskarserviceansvarig.
20. Forskarserviceansvarig sammanställer och arkiverar den undertecknade specifikationen,
kravspecifikationen, dokumentation av tester, kvalitetssäkring/verifiering, slutdokumentationen
samt en kopia av avtalet och offerten.
21. Styrgruppen för information och forskarservice granskar och godkänner slutrapporten som finns
på intranätet Alfresco.
22. Efter överenskommen tidpunkt raderas uttagets testtabeller ur databasen.
10
Checklista
No
Aktivitet/ansvarig
Utredare
System
Kunden
1
Frågeställningen
X
2
Specifikation
X
3
Offert
X
4
Accept
X
5
Avtal
X
6
Kravspecifikation (allt måste
vara mätbart)
7
Godkänd kravspecifikation
8
Uttag & test mot
kravspecifikation.
X
9
Statistik & test av uttaget
dokumenteras
X
10
Dokumentation tas fram till
kunden
X
11
Kvalitetssäkring av uttaget, filer
och kundens dokumentation,
samt godkännande av uttaget.
Föreståndaren
ADM
X
x
X
X
X
X
X
X
Kvalitetssäkringen
dokumenteras.
12
Ta fram och sammanställa inför
leverens; dnr, avtal, räkning,
filer, kundens dokumentation,
utvärderingsblankett, följebrev,
etc.
X
13
Leverans
X
14
Backup av uttag på CD
X
X
X
Filer, programvara,
dokumentation
15
Rensning testtabeller
16
Slutrapport på DDB:s intranät
17
Arkivering
Personalchef
Umeå
X
X
X
11
Specifikation

Kunden kommer med en frågeställning och förfrågan på uttag till DDB. Kunden kan även
skriftligen ange sina önskemål på befintlig specifikationsblankett som finns på vår hemsida.

Kunden och utredaren tar därefter tillsammans fram en mer detaljerad specifikation och
använder då samma mall för specifikationen, den finns även på nätet.

Specifikationen ska överensstämma med kundens frågeställning och tas fram i samråd med
kunden.

Framtagen mall ska användas.

Utredarna ska använda gemensamma regler och mallar för att skriva specifikationerna.

Specifikationen ska vara skriven på ett enkelt och tydligt sätt så att den inte kan feltolkas.

Specifikationen ska innehålla kundens övergripande frågeställning och syfte med uttaget.

Ska tydligt ange hur kunden vill ha sina data för att kunna analysera dem (datumhantering,
missing value, avskiljare mellan variablerna, filformat).

Ska innehålla urvalskriterier för uttaget, valda tidsperioder, församlingar och regioner.

Regler för att hantera; ofullständiga datum, saknade värden, felaktiga och ologiska uppgifter
samt regler för att generera nya variabler ska klart framgå.

Ska skrivas så att den kan fungera som underlag till systemutvecklarna när de tar fram
kravspecifikationen.

När specifikationen är klar ska kunden godkänna den innan den lämnas vidare till
systemutvecklaren. Interna kunder godkänner skriftligen specifikationen.

Inga förändringar ska göras av godkänd specifikation. Eventuella förändringar och tillägg får
hanteras som nya uttag (miniuttag). Godkänd specifikation läggs upp på intranätet

Specifikationen överlämnas därefter till systemutvecklarna och oklarheter diskuteras och löses
gemensamt av utredare och systemutvecklare. Om ändringar görs läggs den nya versionen upp
på intranätet, där versionshanteringen gör det möjligt att spåra ev. förändringar.

Specifikation, kravspecifikation och kundens material (filer och dokumentation) ska
överensstämma.
12

Problem med att skriva forskarspecifikation



Hur kan man från forskarens frågeställning ta fram en specifikation?
Vad är viktigt att tänka på?
Hur vet vi att vi har samsyn med beställaren?

Hur hanteras ologiska och felaktiga uppgifter i våra material i samband med uttagen:

dels de källtrogna

dels de som är felaktigt inregistrerade

dels de som är felaktigt genererade
o
Hur informeras forskarna om detta?
o
Hur hanteras de vid analyser?
I avsnittet ’Forskarservicerollen’ hanteras många av de problem som kan uppstå och förslag på
lösningar av problemen presenteras. Några exempel på problem som kan uppstå när man skriver
specifikation listas nedan.
Ofullständiga datum, är en ständig källa till problem. I nya PERSON-tabellen försöker man nu
hantera detta när det är möjligt via nya regler, men det finns fortfarande kvar ett mindre antal av
ofullständiga datum. I källtabellerna finns problemet kvar med ofullständiga datum, som är
källtrogna, vilket orsakar olika typer av datumproblem.

vilka regler för datumhanteringen kan användas och i vilka specifika fall?
Närvaro, att fastställa när en individ finns i församlingen

Är det när individen finns noterad i någon källa?

Endast när individen finns skriven i husförhörslängden dvs. är boende i församlingen? Hur
hanteras de individer som är skrivna på sidor över ’obefintliga’ och under ’okänd ort’?

Hur hanteras informationen när det saknas start och/eller slutdatum på noteringen?

Små barn som föds och inte skrivits in i husförhörslängden direkt, ska deras närvaro genereras
från moderns närvaro om moderns finns närvarande vid barnets födelse?
Yrken. I källorna finns yrken angivna vid speciella tillfällen och en fastställd tidpunkt (ex. död,
vigsel) men även för en tidsperiod som i husförhörslängden.

Vilka yrken ska väljas och när?

Vid vilken tidpunkt gäller yrket i husförhörslängden, vid start eller slut?

Hur hanteras yrken där något datum saknas på noteringen?

Vems yrke finns egentligen på noteringen, TYREL och TYAGA?
13

Om yrket ska gälla vid en viss händelse och yrkesuppgift saknas då, ska yrke före eller efter
denna händelse väljas, vilka regler gäller för olika händelser, hur långa tidsintervall är lämpliga
att söka inom?

Om flera yrkesuppgifter finns på samma notering, vilket av yrkena är ’huvud’yrket?
Ska yrke hämtas från annan individs notering, via barnets notering i FD-boken? Faderns yrke
finns ofta angivet i FD-boken på barnets notering och ibland kan även moderns yrke finnas där.

Regioner och församlingar

Några problem med att hantera hela ’olänkade’ regioner
o
PNR som ej är unika

delade identiteter (flera personer har fått samma identitet)

dubbla identiteter (samma person har olika identiteter)

variabler som har olika värde i olika församlingar (ologiskheter) ex. kön.
o
Dubbel närvaro, individen kan finnas i flera församlingar samtidigt
o
Olika relationer i olika församlingar
o
Olika namn i olika församlingar
Hur ska prioriteringarna göras, finns oskrivna regler som brukar användas?
Relationer
De olika regionerna och församlingarna har inregistrerats med olika verktyg och olika regler har
använts vid inregistreringen. Ett problem som har uppstått är att fastställa om relationer mellan
barn och föräldrar är biologisk eller ej, eftersom helt olika regler har använts.
För de gamla församlingarna (SUL, SKE och försöksförsamlingarna) sattes endast biologisk
relation, RBES= 1, om det klart framgick i källan, d.v.s. var utskrivet. Övriga, troliga biologiska
relationer och okända, fick värde för obestämd relation, RBES = 0.
För senare inregistrerade regioner, (LIN och NIL) med Regina, sätts värde 1 om det inte klart
framgår att barnet-föräldern har en annan typ av relation.
Mallar för specifikationer
Mallar finns för specifikationer för uttag från Popum3 och från Tabellverket, både på svenska och på
engelska. Se avsnittet ’Dokument och mallar’.
14
Avtal
För större uttag utarbetar ansvarig utredare och forskarserviceansvarig en offert till kunden i samråd
med platschefen i Umeå, med ”grovspecifikationen” som underlag. Den färdiga offerten skickas i
två exemplar av utredaren till kunden för godkännande och underskrift. Med offerten biläggs
specifikationen och avtal, som anger på vilket sätt DDB:s material får utnyttjas. Befintliga mallar
för offert och avtal skall användas.
Kunden återsänder godkänd offert och avtal innan uttaget kan påbörjas.
Vid leverens, skickas av föreståndaren underskrivet avtal om nyttjande av DDB-material,
tillsammans med uttag, följebrev, dokumentation och utvärderingsblankett till kunden. Det är
viktigt att avtalsnummer, uttagsnummer och diarienummer finns med i samtliga dokument.
Mallar för avtal
Mallar finns för avtal både på svenska och engelska, se avsnittet ’Dokument och mallar’.
15
Kravspecifikation
Kravspecifikationen beskriver vad som ska göras inte hur det ska göras.
I kravspecifikationen kan även beslutsträd och beslutstabeller finnas med istället för att skriva allt i
klartext. Variabler och varifrån de hämtas ska alltid skrivas i klartext.

Systemutvecklaren utformar en kravspecifikation utifrån specifikationen, vid behov i samråd
med utredaren.

För varje variabel i uttaget specificeras konkreta regler som namnges.

Problem som uppstår och oklarheter ska diskuteras med utredaren, ej med kunden.

Mall för kravspecifikationen skall användas.

Kraven skall vara utformade på ett mätbart sätt. Kraven ska numreras så att det är enkelt att
testa det färdiga materialet mot kravspecifikationen

Kravspecifikationen är uppdelad efter hur variablerna hör samman och för varje uppdelning
finns ett antal krav. Kraven namnges så att de börjar med första bokstaven i uppdelningsnamnet
och ett påföljande nummer, ex. P5 = person krav 5. Varje krav ska ha ett unikt regelnamn.

Utredare läser och godkänner kravspecifikationen innan själva kodningen påbörjas. Godkänd
kravspecifikation läggs upp på intranätet.

Om ändringar görs läggs den nya versionen upp på intranätet, där versionshanteringen gör det
möjligt att spåra ev. förändringar.

Systemutvecklaren genomför uttaget i enlighet med kravspecifikationen.

Specifikation, kravspecifikation, slutdokumentation och framtaget material ska överensstämma.

Systemutvecklarna tester koden mot reglerna i kravspecifikationen och gör kontroller av filerna
mot kravspecifikationen. Kvalitetssäkring och verifiering av de framtagna filerna och av
kundens dokumentation görs av utredarna mot kravspecifikationen
Mall för kravspecifikation
Mall finns för kravspecifikation. Se avsnittet ’Dokument och mallar’.
16
Dokumentation, test och kvalitetssäkring av framtaget forskaruttag
Det framtagna materialet kontrolleras noggrant för att upptäcka ev. felaktigheter och för att öka
kvaliteten på levererat material. Kontroller görs av ansvariga för det aktuella uttaget, även statistik körs
på filer och på variabler. Kontroller och kvalitetssäkring/verifiering ska dokumenteras med framtagna
mallar.
Uttagsnummer och avtalsnummer skall finnas med på samtliga dokument.
Test av uttag - systemutvecklarna
Systemutvecklarna testar de framtagna filerna mot kravspecifikationen och ansvarar för att resultatet
från testerna och statistiken granskas och utvärderas. Om fel upptäcks och förändringar görs av
program, bör nya tester göras på de nya filerna. Resultatet från testerna samt statistiken dokumenteras
och skickas till utredarna samt till forskarserviceansvarig.
Testdokumentet och statistiken läggs upp på vårt intranät och uppdateras om ny version tas fram.
Test av kod och filer

Testar koden mot kravspecifikationen.

Testar materialet mot kravspecifikationen

Tar fram relevant statistik för de olika variablerna i filerna och analyserar denna för att upptäcka
eventuella felaktigheter eller konstigheter

Dokumenterar testerna i separat internt dokument, framtagen mall ska användas.
Mall för test
Mall finns för test. Se avsnittet ’Dokument och mallar’.
Kundens dokumentation
Systemutvecklarna tar fram dokumentation för uttaget: Mall finns för dokumentationen både för uttag
från Popum3 och från Tabellverket, på svenska och på engelska.
Godkänd dokumentation läggs upp på vårt intranät.

Systemutvecklarna tar fram dokumentation till kunden som beskriver filernas utseende och med
postbeskrivning där samtliga variabler beskrivs i filerna. Dokumentation ska även innehålla
regler för genererade variabler samt beskrivning av samtliga använda koder och dess
värdemängder med förklaringar.

Urvalskriterier, version av databasen, relaterade dokument samt uppgift om ansvariga för
uttaget ska ingå i dokumentationen.
17

Även viss relevant statistik över filernas innehåll bör finnas med i kundens dokumentation, men
ingen analys ska göras.

Eventuella egenheter i materialet eller hos enstaka variabler förklaras på ett enkelt sätt i
dokumentationen.


Kundens dokumentation ska vara skriven på så sätt så att den är förståelig för kunden,
framtagen mall ska användas.
Dokumentationen ska godkännas av utredare eller av forskarserviceansvarig.

Uttagsnummer, avtalsnummer samt datum skall anges i dokumentet.

SQL-frågor och teknisk information om program ska ej ingå.

Ingen systemdokumentation ska skickas till kunden.
Mallar för dokumentation
Mallar finns för kundens dokumentation både för Popum3 och för Tabellverket, på svenska och på
engelska. Se avsnittet ’Dokument och mallar’.
Kvalitetssäkring/verifiering av uttag

Utredarna kvalitetssäkrar därefter filerna och kundens dokumentation mot kravspecifikationen,
specifikationen och Popum. Framtagen statistik granskas och analyseras. Eventuella problem
som upptäcks i Popum som påverkar uttaget och som kan ha betydelse för kundens analyser,
kommenteras i kundens dokumentation. Även testdokumentationen granskas och ska
godkännas. De problem som upptäcks dokumenteras och meddelas ansvariga systemutvecklare
för åtgärd. Ny verifiering görs efter åtgärd och dokumentet uppdateras.
Verifieringsdokumentet läggs upp på vårt intranät.
Annan systemutvecklare än de som gjort uttaget kan göra kvalitetssäkring av uttaget.

Kvalitetssäkringen dokumenteras enligt den framtagna mallen.

Kvalitetssäkringen görs inte av programkoden.

Ingen kvalitetssäkring av miniuttag till studenterna görs.

Interna erfarna forskare kvalitetssäkrar sina egna uttag. Utredaren kvalitetssäkrar endast
kundens dokumentation och den framtagna statistiken på variablerna i uttaget.

Interna oerfarna forskare gör viss egen kvalitetssäkringen.
Mall för kvalitetssäkring/verifiering
Mall finns för kvalitetssäkring/verifiering. Se avsnittet ’Dokument och mallar’.
18
Kundens utvärdering av uttag
Tillsammans med uttaget skickar utredaren med en utvärderingsblankett till kunden (ej för mini-uttag)
för ifyllande. Här har kunden möjlighet att delge oss sina synpunkter på servicen, kvalitén på levererat
material och dokumentation.
Forskarserviceansvarig sammanställer utvärderingsenkäterna årsvis.
Vid gästforskarbesök gör föreståndaren en utvärdering tillsammans med gästforskaren.
Mall för utvärderingsenkät till kunden
Mall för utvärderingsenkät finns både på svenska och på engelska. Se avsnittet ’Dokument och mallar’.
19
Översikt över inregistrerat kyrkoboksmaterial och perioder
Lista februari 2010. Aktuell lista finns på intranätet
Sundsvallsregionen
Husförhör
Länkade församlingar
Födelse &
Dop
Lysning &
Vigsel
Död &
begravning
Flyttning
Anmärkning
Alnö
1803-1894
1780-1895
1803-1895
1803-1894
1850-1895
Attmar
1814-1896
1770-1894
1814-1894
1814-1894
1869-1897
Dålig bokföring 1860-68
Galtström
1807-1891*
1780-1894
1803-1891
1807-1891
1862-1891
*Mantalsregister 1846-62
Hässjö
1814-1901
1780-1895
1814-1895
1814-1895
1850-1894
Indal
1814-1900
1780-1894
1814-1894
1814-1895
1861-1894
Ljustorp
1803-1901
1780-1794
1803-1894
1803-1894
1845-1894
Njurunda
1816-1891
1780-1894
1816-1892
1816-1892
1852-1892
Tynderö
1811-1900
1780-1894
1811-1894
1811-1894
1861-1894
Lagfors
1860-1891
1862-1895
1846-1860,
1863-1897
1862-1898
1861-1891
Lögdö
1819-1892
1766-1895
1819-1895
1819-1896
1861-1880* *Flyttning saknas 1872-77
Selånger
1813-1894
1803-1894
1803-1894
1812-1894
1858-1894
Skön
1803-1893
1784-1894
1803-1894
1803-1894
1850-1895
Skönsmon
1882-1893
1890-1894
1890-1895
1890-1894
1890-1895
Sundsvalls stad
1803-1892
1860-1894
1803-1820*
1860-1894
1860-1894
1839-1849** * Endast lysning
1872-1894 **Endast utflyttning
Svartvik
1860-1900*
1860-1895**
1860-1895** 1860-1895**
Saknas
Sättna
1806-1899
1780-1794
1806-1894
1806-1894
1858-1894
Timrå
1803-1895*
1783-1895
1803-1895
1803-1895
1850-1895
Tuna
1804-1896
1780-1898
1804-1894
1804-1894
1822-1895
Olänkade församlingar
Graninge
1780-1892
Häggdånger
1780-1894
Liden
1780-1895
20
Allt före 1860 skadat av
brand
Skönsmon separat
församling från 1883, men
ingår i Skön i Popum
*Från SCB vart 10:e år
**Från SCB årligt
*Mantalsregister 1852-65
Skellefteåregionen
Husförhör
Födelse &
Dop
Lysning &
Vigsel
Död &
begravning
Flyttning
Anmärkning
Länkade församlingar
Byske
1871-1897
1875-1894
1875-1894
1875-1894
1875-1894
Egen församling från 1875.
Jörn
1831-1901
1849-1895
1869-1895
1855-1895
1855-1894
Norsjö
1831-1899
1811-1895
1811-1895
1842-1895
Skellefteå
1720-1900
(1901)
1699-1899
1801-1894
1815-1821
1831-1894
1831-1894
Ytterstfors
1846-1870
1838-1869
*
1838-1869
1846-1866 * I Skellefteå?
Födelse &
Dop
Lysning &
Vigsel
Död &
begravning
Många brandskadade böcker
Olänkade församlingar
Burträsk
1740-1894
Lövånger
1691-1894
Försöksförsamlingarna
Husförhör
Flyttning
Anmärkning
Länkade församlingar
Fleninge
1819-1890
1819-1890*
1819-1890
1819-1890
1820-1890
* Informationen
kompletterad från tidigare källor.
Gullholmen
1794-1899,
1837-1922
1800-1900
1802-1900
1800-1900
1838-1900
Locknevi
1821-1899
1821-1899*
1821-1899
1821-1899
1821-1899
* Informationen
kompletterad från tidigare källor.
Nedertorneå
1818-1896
1818-1896*
1783-1895
1814-1895
1820-1895
* Informationen
kompletterad från tidigare källor.
Svinnegarn
1817-1895*
1817-94*
1803-1894
1803-1894
1841-1894
* Informationen
kompletterad från tidigare källor.
Trosa
1799-1895*
1799-1895*
1817-1894
1817-1895
1861-1895
*Informationen
kompletterad från tidigare källor.
21
Linköpingsregionen
Husförhör Födelse
& Dop
Lysning
& Vigsel
Död &
Flyttning
begravning
Anmärkning
Länkade församlingar
Björsäter
1792-1896 1633-1894
1792-1894 1603-1895
1821-1895
Grebo
1795-1896 1661-1894
1795-1894 1661-1895
1816-1895
Kaga
1808-1899* 1694-1894
1808-1894 1694-1894
1813-1894
* Luckor
Kärna
1807-1894 1695-1894
1807-1894 1695-1894
1812-1894
* Luckor
Landeryd
1789-1895 1635-1894
1789-1894 1635-1895
1811-1895
Rappestad
1797-1895 1656-1899
1797-1889 1677-1889
1831-1904
Rystad
1788-1895 1629-1895
1788-1895 1629-1895
1832-1895
Slaka
1788-1896 1633-1894
1788-1894 1635-1894* 1801-1894*
* Luckor
Vikingstad
1737-1897* 1633-1895
1737-1895 1633-1895
1738-1901*
* Luckor
Vårdsberg
1788-1899 1656-1894
1788-1894 1656-1894
1805-1894
* Luckor
Värna
1802-1895 1657-1894*
1802-1894 1661-1895* 1802-1895
* Luckor
Sankt Lars
1789-1900 1633-1895
1789-1894 1633-1894
1801-1895*
* Luckor
1796-1895 1700-1895
1796-1894 1700-1895
1815-1894
Björkeberg
1635-1894
1747-1894
1747-1895
Flistad
1694-1895
1809-1895
1831-1895
1756-1895* 1634-1894
1756-1894 1634-1894
1813-1894
*Luckor
1747-1890 1635-1894
1747-1894 1635-1895
1747-1895*
* Luckor
Olänkade församlingar
Askeby
Gammalkil
Kättilstad
Ledberg
Lillkyrka
1667-1895
1744-1750, 1806-1894
Linköpings
1774-1895 1664-1899
domkyrko-församling
1774-1894 1664-1895
1788-1894
Ljung
1791-1894 1694-1894
1791-1894 1694-1895
1801-1895
Nykil
1789-1900 1634-1899
1789-1894 1645-1814
1803-1894
Sjögestad
1797-1895 1656-1889
1797-1889 1679-1889* 1831-1898
Skeda
1747-1896* 1693-1894** 1754-1894 1640-1895
1754-1894***
Stjärnorp
1811-1894 1760-1895
1811-1895 1815-1895
1815-1895
Svinstad
1807-1894* 1688-1894
1768-1894 1703-1894
1768-1894**
Tjärstad
1639-1894
1791-1895
1793-1900 1633-1894
1793-1894 1633-1894
1793-1894*
Vist
1792-1899 1640-1894
1792-1894 1640-1895
1809-1894
Vreta kloster
1751-1896 1633-1894
1751-1894 1633-1895
1751-1894*
Törnevalla
*Luckor 1791-1795
* Luckor
*Lucka 1768-1787
** Lucka 1718-1754
*** Lucka 1772-1806
* Luckor ** Även 1768-1769
1825-1895
* Luckor
Ulrika
22
* Luckor
Vårdnäs
Åtvid
1812-1823 1696-1894
1790-1896 1638-1894
1822-1895
1781-1895
1790-1894 1695-1894* 1811-1894*
* Även 1791
Örtomta
1712-1895* 1633-1894
1712-1894* 1633-1895
1741-1895*
* Luckor
Östra Harg
1763-1788, 1635-1894
1821-1835,
1858-1860
1871-1899
1760-1894
1763-1764,
1817,
1833-1894
1630-1894
1848-1895
1789-1895
Lysning
& Vigsel
Död &
begravning
Östra Skrukeby
Norra inlandsregionen
Husförhör
Födelse
& Dop
Flyttning
Anmärkning
Länkade församlingar
Frostviken
1813-1901
1841-1901
1842-1900
1842-1901
1858-1900 in
1861-1900 ut
1842-1900
1842-1900
1842-1901
1746-1798
1804-1866
1746-1853
1746-1849
1746-1852
1758-1905
1759-1903
1742-1903
1744-1903
1865-1894
1758-1780
1701-1895
1701-1895
1701-1895
1868-1895
1719-1901
1720-1751
1719-1742
1861-1895
1792-1900
1792-1901
Frostvikens
lappförsamling
1842-1900
Föllinge
1813
Föllinge
lappförsamling
Gällivare
1861-1890 in
1892-1900 in
1863-1899 ut
Hede.
lappförsamling
Hotagen
Hotagens
lappförsamling
Jokkmokk
1782-1897
Jukkasjärvi
1763-1900
Karesuando/ Enotekis
1816-1895
1813-1923
1814-1897
1813-1897
1855-1895
Kvikkjokk
1781-1878
1784-1897
1784-1894
1784-1897
1829-1837
1880-1897
1862-1894
Undersåker
Undersåkers
Vilhelmina
1821-1867
1780-1792
1804-1896
1757-1781
1783-1895
1784-1846
1878-1895
1780-1895
1880-1895 in
1879-1895 ut
1786-1895
1814-1895
1790-1895
1829- 1837
1862- 1894
23
Församlingar inregistrerade av externa samarbetspartner
Datastugan Kaxås
Olänkad församling
Husförhör
Offerdal
Födelse & Dop
Lysning & Vigsel
Död & begravning
Flyttning Anmärkning
1760-1898
Kulturarkivet Nordanstig
Olänkade församlingar
Husförhör Födelse & Dop
Lysning & Vigsel
Död & begravning
Bergsjö
1688-1921
1895-1924
Gnarp
1677-1913
1688-1867
Harmånger
1688-1894
1851-1924
Hassela
1688-1894
1852-1889
Ilsbo
1735-1894
1847-1862
Jättendal
1688-1860
1837-1878
Flyttning Anmärkning
ArkivData Norrköping
Olänkad församling
St Olai
Husförhör Födelse & Dop
Lysning & Vigsel Död & begravning Flyttning Anmärkning
1817-1827
1800-1861
1800-1806
1841-1844
1865-1876
1827-1844
1863-1874
1877-1883
1887-1894
1880-1891
1861-1895
24
Översikt över parallella material
Parallella material i Sundsvallsregionen
Material
Excerperat Registrerat Postbeskrivning Område
Anmärkning
Avräkningsböcker
Ja
Ja
Ja
Matfors
Fattigvårdshandlingar Ja
Ja
Ja
Vet ej
Fängelsekyrkböcker + Ja
Fångrullar
Ja
Ja
Regionen
Handelsstatistik
Ja
ja
Industristatistik
Ja
Ja
Ja
vet ej
Sjukjournaler
Ja
Ja
Ja
Sundsvall,
Härnösand
Anders har fil med
länkar för Alnö till
Sundsvalls journaler
Skolmaterial
skolmatriklar och
examenskataloger
Ja
Ja
ja
Skön,
Kubikenborg
1883 - 1916
1829, 1836
Västernorrland
Mantalslängd
Alnö,
Skön
Timrå, 1800
Avlöning
Ja
Ja
ja
Kubikenborg
Sockenprotokoll
Ja
Ja
Ja
Ljusta?
25
1877 – 1895
Mer om våra församlingar
Källbeskrivningar
Till församlingarna i Popum finns en Källbeskrivning som beskriver samtliga inregistrerade källor.

Tidsperiod för respektive källa med ev. luckor

Volymbeteckning, både arkivets och DDB:s

Variabler som finns angivna i källans rubrik

Uppgift om källan är svårläst, uppgifter som saknas i källan eller under en viss period, egenheter
hos den aktuella volymen som produktionsenheten har uppmärksammat.

En förteckning över prästerskapet i församlingen under den period som vi har inregistrerat.

Lista över orter i församlingen med sidhänvisning i respektive husförhörsvolym

Betygssystem med förklaringar
Källbeskrivningarna finns i pdf-format Company Home > DDB > Kallor > Kyrkobok > Församlingar
Sundsvallsregionen. Samtliga församlingar, finns även som häfte.
Skellefteåregionen. Burträsk & Lövånger, Byske, Jörn, Norsjö, Skellefteå och Ytterstfors, finns även
som häfte.
Norra inlandsregionen. Föllinge lappförsamling, Undersåker lappförsamling, Gällivare, Jokkmokk,
Jukkasjärvi, Karesuando och Kvikkjokk.
Linköpingsregionen. Askeby, Björsäter, Grebo, Kaga, Linköping (domkyrkoförsamlingen), Ljung,
Rystad, Sankt Lars, Skeda, Stjärntorp, Vreta Kloster, Värna och Åtvid.
Försöksförsamlingarna saknas på Alfresco. Finns som häften för Svinnegarn, Trosa, Fleninge och
Locknevi. Nedertorneå och Gullholmen finns bara ett exemplar var av, i en pärm.
Andra dokument om församlingarna
För Skellefteåregionen finns både på intranätet och som häfte, Församlingsbeskrivning för 1724-1899,
Boende Skellefteå regionen.
För Norra inlandsregionen finns utöver Källbeskrivningarna ett gemensamt dokument för Jokkmokk
och Kvikkjokk, ett dokument om Gällivare respektive om Vilhelmina.
Det finns även tre dokument med iakttagelser, problem och lösningar från den manuella länkningen i
Gällivare, Jokkmokk respektive Karesuando.
26
Anteckningar om ologiskheter
Det finns två tabeller på Popum3 med kommentarer som produktionsenhetens personal skrivit ner
under arbetets gång. Det finns anteckningar om själva noteringen, tabell NOTANT, och anteckningar
om personen, tabell PNRANT.
Det är excerpistens kommentar och ingen kommentar som finns i källan. Prästens kommentarer finns
samlade i församlingens anmärkningstabell, ANM.
Båda tabellerna finns för hela Linköpngsregionen och Norra inlandsregionen. För Skellefteåregionen
finns tabell PNRANT för Jörn och Norsjö församlingar och tabell NOTANT finns för Jörn, Norsjö
och Lövånger församlingar. Tabellerna saknas helt för tidigare registrerade församlingar.
Tabell NOTANT innehåller kommentarer om själva noteringen, postnr länkvariabel, som gjorts i
samband med in- och uttypslänkningen samt vid den manuella länkningen.
Ex. GEL
9111177
ei biol. mor
Ex. GEL
9115043
Hon finns på sidan 266 med sin föräldrar, fel strivet
Tabell PNRANT innehåller kommentarer om individen, länkvariabel pnr, som skrivits in i samband
med den manuella länkningen och relationslänkningen.
Ex. JRN
826003309
Utflyttningsattesten har återlämnats och därför är det 2 överblivna kort
Ex. JRN
824002841 Barnets moder har dött i Skellefteå före 1834 och således vet jag ej om de
nya föräldrarna är styvföräldrar eller fosterföräldrar.
27
Etnicitet
När Demografiska databasen började registrera Norra Inlandsregionen uppstod ett önskemål från
forskarhåll att kunna särskilja vilka individer i befolkningen som är samer. Någon specifik variabel för
etnicitet finns emellertid inte i vårt kyrkoboksmaterial. Det innebär inte att information som explicit
eller implicit berör individernas etniska tillhörighet saknas i kyrkböckerna. De noteringar som finns
baseras i de flesta fall på bedömningar som har gjorts av den svenske prästen och blir därför i stor
utsträckning föremål för tolkning. Demografiska databasen har beslutat att inte skapa någon
etnicitetsvariabel eller etnicitetstabell som läggs upp i vår databas. Vid förfrågan från forskare kan vi
emellertid, efter beslut av föreståndaren, ta fram någon eller några etnicitetsindikatorer.
I Norra Inlandsregionen ingår fem särskilda lappförsamlingar, Föllinge, Undersåker, Hotagen,
Frostviken samt Hede/Tännäs, där samtliga kyrkobokförda får betraktas som samer. För dessa
församlingar skapas inga indikatorer eftersom församlingstillhörigheten i detta fall konstituerar
etniciteten.
Men i de flesta andra församlingar i Norra Inlandsregionen finns både samer och icke-samer och
vanligtvis finns inte heller några särskilda sidor eller kolumner i kyrkböckerna som delar in invånarna
efter etnicitet eller ursprung. Individerna kan i kyrkböckerna finnas antecknade som finnar, norrmän,
lappar, ryssar, svenskar, eller helt sakna notering om etnicitet.
I samband med forskaruttag under 2006 med forskare knutna till CBS och CESAM utarbetades ett
antal indikatorer som kan underlätta för forskaren att identifiera och särskilja individer med olika
etnicitet i norra inlandsregionens församlingar. Indikatorerna bygger på kyrkböckernas information om
individerna, men har även kompletterats med information från andra källor, framtagen av de forskare
som ingick i detta samarbete.
Det måste understrykas att dessa indikatorer inte bestämmer att en individ är same, utan enbart
identifierar individer för vilka det finns information som kan användas för att bedöma hans/hennes
etnicitet. Indikatorer hämtas från den information som redan finns i kyrkböckerna, och i vår databas,
exempelvis yrken, anmärkningar, boställen, dödsorsaker och släktskap. Vi tillför inga nya variabler eller
tabeller till kyrkböckerna eller till vår databas Popum3. Eftersom kyrkböckernas noteringar baserats på
den enskilde prästens bedömning är det upp till varje enskild forskare att bestämma hur denna
information skall tolkas. Demografiska databasen gör ingen egen bedömning av detta, dvs. tar inte
ställning till om en individ är same eller ej, utan markerar bara att information finns som tyder på att det
kan vara så.
Initiativet till att utarbeta dessa indikatorer togs fram av Carin Hedlund vid Demografiska databasen i
samband med ett forskaruttag under 2006 i samarbete med Gabriella Nordin, Per Axelsson och Peter
Sköld vid Cesam. Dessa forskare har bidragit med två typer av kompletterande information: Den första
är en sammanställning över samiska släktnamn som de sammanställt utifrån Johannes Marainens
arbeten om Karesuando samesläkten och Jukkasjärvi samesläkten. Den andra är en sammanställning
över samiska boställen, för församlingarna Karesuando, Gällivare, Jukkasjärvi och Jokkmokk. I
samband med deras uttag lades dessa upp som tabeller. De listor och tabeller med indikatorer som har
skapats har tagits fram för Skölds, Axelssons och Nordins forskningsprojekt, och är forskargruppens
egendom. Demografiska databasen har inte något ansvar för innehållet. De kan dock, enligt ett särskilt
avtal, användas av andra forskare, efter tillstånd av DDB:s föreståndare.
Den forskare som önskar använda indikatorer skall i sin förfrågan om uttag skriftligen ange varför dessa behövs, vilka
forskningsfrågor som skall diskuteras, och även precisera vilka indikatorer som är av intresse för den aktuella
frågeställningen. Forskaren kan även själv ta fram regler för att skapa indikatorer. DDB:s föreståndare fattar därefter
beslut om indikatorer skall lämnas ut till forskaren, eller ej.
Den 5 mars 2008 träffades en överenskommelse mellan Demografiska databasen och forskarna Peter Sköld, Per
Axelsson och Gabriella Nordin med följande innebörd:
28

andra forskare får använda deras framtagna material med samiska boställen och samiska släktnamn för de
församlingar som ingår i NIL-regionen vid generering av indikatorer för att försöka fastställa etnicitet
( församlingarna Karesuando, Gällivare, Jukkasjärvi, Jokkmokk)

forskare som använder sig av detta material ska informeras om att ange Peter Sköld, Per Axelsson samt
Gabriella Nordin som källa när de publicerar sin forskning

Sköld, Axelsson och Nordin skall informeras när andra forskare vill använda sig av deras material, samt
också få information om vilka dessa forskare är.
Det är upp till varje forskare att själv bestämma vilken typ av indikator som han/hon vill ha med i sitt uttag, precisera
dessa i ett dokument och komma in med en förfrågan till DDB:s föreståndare.
Allmänt om indikatorer
De indikatorer som har utarbetats bygger på den information som finns i källorna, som kan användas
för att indikera etnicitet. Den finns alltså redan i Popum3, men inte som egna tabeller och variabler. För
två av indikatorerna, släktnamn och boställe, används det material som tagits fram av forskarna Nordin,
Sköld och Axelsson i samband med deras uttag. Information om boställen och släktnamn finns
tillgänglig för församlingarna Karesuando, Gällivare, Jukkasjärvi och Jokkmokk.
Följande indikatorer finns framtagna i dagsläget och det kan tänkas att de kommer att uppdateras
oregelbundet. Det handlar om:

samiska släktnamn (efternamn),

samiska boställen samt de boställen där ordet lapp ingår,

dödsorsaker som anger att individen vistats på fjället (något osäker indikator),

anmärkningarna från samtliga källor där det i texten finns uppgift om lapp, fjäll eller renar,

yrken i klartext med uppgift om lapp, nomad, renägare samt motsvarande yrkeskoder

en indikator som anger om någon i kärnfamiljen har någon av de föregående indikatorerna
ifylld.

individer som är kyrkobokförda i någon av de särskilda lappförsamlingarna betraktas per
definition som samer.
Den relationsrelaterade indikatorn kan skapas först när alla andra indikatorer har påförts befolkningen i
respektive församling och där används även relationstabellen i Popum3 för att fastställa släktskapet
mellan barn och föräldrar resp. mellan syskon.
Vill forskaren skapa egna indikatorer utifrån egna regler kan detta genereras i samband med
forskaruttag, efter forskarens önskemål.
Information i indikator kan presenteras på olika sätt. Dels kan man för varje indikator sätta värde 1 om
det någonstans finns en indikation om etnicitet enligt de regler som gäller för just den indikatorn.
Saknas denna indikation helt sätts värde 0.
Det går även att räkna antalet noteringar där någon indikator förekommer. Här föreligger ett
metodologiskt problem eftersom det totala antalet noteringar för varje individ får stor betydelse. En
individ som flyttat mycket har fler noteringar än en individ som bott på samma plats hela livet. En
fördel med denna metod kan dock vara, att om en individ har många noteringar och enbart någon
enstaka notering visar indikation på same, är det en svagare indikation än om individen har många
noteringar som indikerar att individen kan vara same. Här krävs dock att man tar hänsyn till antalet
noteringar. En kvot som anger andelen noteringar som innehåller någon form av etnicitet i relation till
29
det totala antalet noteringar kan även tas fram. Det går även att få ut information om hur många
noteringar som visar indikation på etnicitet, procentuellt sett.
Beskrivning av indikatorerna
Här kommer en beskrivning av samtliga indikatorer att göras. Det beskrivs vilken information som är
underlag till indikatorerna och var informationen hämtats från.
Viktigt att notera är att när den maskinella genomsökningen sker av den källtrogna klartexten i
anmärkningarna och dödsorsakerna sker ingen kontroll av var i klartexten det sökta ordet finns med,
eller i vilket sammanhang. Forskarna bör därför själva studera dessa klartexter för att få sammanhanget
klart för sig och utifrån detta göra sin egen bedömning.
Indikator för anmärkning
Denna indikator kontrollerar en individs samtliga anmärkningar på alla noteringar och markerar om det
finns någon anmärkning som innehåller information om lapp, fjäll eller renar. Samtliga anmärkningstexter
i tabell ANM kontrolleras maskinellt och om något eller några av de angivna sökorden återfinns i den
löpande texten sätts indikatorn = 1. Ingen kontroll sker av i vilket sammanhang sökorden finns med i
texten.
Informationen finns i vår databas i tabellen ANM variabel ANM (anmärkning).
Indikator för dödsorsak
Denna indikator kontrollerar individens dödsorsak och markerar om dödsorsaken har med fjäll att göra.
Även här sker en automatisk genomsökning av alla dödsorsaker i tabell DB och när ordet fjäll uppträder
sätts indikatorn = 1 oberoende av var i texten ordet finns.
Informationen finns i vår databas i tabellen DB variabel DODORS (dödsorsak)
Indikator för yrke
Denna indikator visar om det finns information i yrkessträngen som kan tyda på att individen är same.
Informationen hämtas dels från tabellen YRKETXT som innehåller själva klartexten i variabel YRKE
som hämtats källtroget från samtliga källor, och från tabellen YRKE som innehåller det kodade yrket i
variabel TYKOD. (lista över koder och klartexter se dokument ’Information om indikatorer’)
Endast individens egna yrken kontrolleras, dels för den källtrogna klartexten och även för de kodade
yrkena. Kontroll görs mot både kod och klartext eftersom den källtrogna klartexten kan innehålla
förkortningar och olika stavningsvarianter varför det är svårt att ange de rätta sökbegreppen. Samtliga
yrken är kodade och vid kodningen sker kontroll mot samtliga kända stavningsvarianter och
förkortningar.
Indikator för namn
Denna indikator kontrollerar en individs samtliga efternamn från alla noteringar och markerar om det
finns något namn som har samiskt ursprung.
Listan över samiska släktnamn har uppdaterats när nya församlingar och nya uttag gjorts av Axelsson,
Sköld och Nordin. DDB har överfört informationen till en tabell. Dessa släktnamn testas mot
databasens tabell NAMNTXT där individernas samtliga namn finns källtroget. (lista med samiska
släktnamn se dokument ’Information om indikatorer’).
30
Observera att de samiska släktnamnen ofta är samma namn med något olika stavning. Det beror på att
vår information skall vara källtrogen och prästen har ibland stavat samma namn på flera olika sätt.
Informationen om samtliga källtrogna namn finns i vår databas, Popum3, i tabellen NAMNTXT.
Forskargruppen Sköld, Axelsson och Nordins lista över samiska släktnamn för församlingarna
Karesuando, Gällivare, Jukkasjärvi och Jokkmokk återfinns även som tabell ETNL.SAMNAMN i
Popum3. Listan och tabellen är deras egendom och vi på DDB har inte något ansvar för innehållet,
utan den är framtagen för deras forskningsprojekt.
Indikator för boställe
Denna indikator kontrollerar en individs samtliga boställen från alla noteringar och markerar om det
finns något boställe som har samiskt ursprung. De församlingar som räknas som lappförsamlingar får
automatiskt en indikator för etnicitet för alla individer i församlingen då alla räknas som lappar enligt
prästen. Dessa lappförsamlingar var icke-territoriella och inte geografiskt definierade. Samma boställen
finns både i lappförsamlingen och i den ”svenska” församlingen. När man ska sätta indikator i
lappförsamlingarna handlar det om kyrkobokföringsförsamling – inte om ett speciellt boställe. För de
andra församlingarna sätts en indikator för ett speciellt boställe.
Listan över specifika samiska boställen har tagits fram av Per Axelsson och Gabriella Nordin på Cesam
i samband med deras uttag för församlingarna Karesuando, Gällivare, Jukkasjärvi och Jokkmokk.
Underlaget har hämtats från arbeten av Filip Hultblad, Nils Arell och Ernst Manker. Den har
uppdaterats när nya församlingar har inkluderats i databasen och nya uttag har gjorts. (lista med samiska
boställen se dokument ’Information om indikatorer’).
DDB har överfört informationen till en tabell som ägs av forskargruppen och som DDB inte tar något
ansvar för. Tabellen ETNL.SAMBY återfinns under DDB:s databas Popum3. Kontroll sker mot
tabellen BOSTTXT, variabel BST som innehåller boendeinformation från husförhörslängderna där
individen fanns skriven, både som ortsnamn och som anmärkningstext för sidan
Förutom att specifika boställen identifieras, söks också följande text i boställessträngen: LAPP, LAPPAR,
LAPPARNE, LAPPBOKEN, LAPPNYBYGGE
Informationen om samtliga boställen finns i vår databas Popum3 i tabell BOSTTXT variabel BST.
Information om samiska boställesnamn för församlingarna Karesuando, Gällivare, Jukkasjärvi och
Jokkmokk finns en lista som forskargruppen Sköld, Axelsson och Nordin har tagit fram. Tabellen
ETNL.SAMBY i Popum3 är en kopia av denna lista. Listan och tabellen är forskargruppens egendom,
utarbetad forskningsprojekt och vi på DDB har inte något ansvar för innehållet.
Indikator för relationer
Denna indikator kontrollerar om en individs biologiska föräldrar eller syskon har någon indikator som
visar att de kan vara samer. Denna indikator sätts sist. Den går igenom samtliga biologiska föräldrar och
syskon, både hel- och halvsyskon till individen och kontrollerar om någon av dem har värde 1 i någon
av sina andra indikatorer, i så fall sätts värde 1 för relaterad person. För att hitta de relaterade
individerna används relationstabellen REL i Popum3 varifrån individens biologiska föräldrar och
syskon plockas fram (RBES < 2). Därefter kontrolleras om någon eller några av dessa har någon av de
ovanstående indikatorerna ifylld.
31
Tabellverket
Utbildning har genomförts angående forskaruttag från Tabellverket, i form av ett forskaruttag. Samtliga
dokument finns samlade på Alfresco under IF17 Utbildning Tabellverket. Under utbildningen togs upp
problem som finns i materialet och hur man kan lösa detta, var information kan hämtas om det saknas i
den primära tabellen mm.
Allmänt
Endast för tio län registrerades månadsuppgifter, senare togs de fälten bort från inregistreringen.
Månadsuppgifterna kan endast hittas i den kompletta registreringen. Detta gäller endast för
mortalitetsformulär, inte för folkmängdsformulären.
1802 ändrades tabellerna, men eftersom prästerna ibland använde gamla formulär för att redovisa i,
överensstämmer inte alltid formulären med årtalen. T.ex. användes formulär 20 (giltig fram till 1801) in
på 1800-talet. Tilläggen i de nya tabellerna var ex. för folkmängd med olika formulär för land och stad.
regtyp1 = komplett registrerade formulär med månadsuppgifter 0-12.
Registreras allt enligt källan och har inte summering gjorts över året av prästen kan
slutsumman/rad saknas för året.
regtyp2 =nedskuret registrerat mortalitetsformulär formulär, endast månad=0, dvs. årsvis.
Registrerades inte månadsuppgifter, endast årssumman som alltid finns med.
Excerpisterna summerade månadsuppgifterna om uppgiften saknades
Prefixet _sum för en variabel = summerad uppgift för ett kön.
Prefixet _tot för en variabel = totalt summerad uppgift för båda könen.
Tabellen GEOFORM finns för alla befintliga formulär, även om formuläret i övrigt saknar innehåll
Vilka tabeller som finns i vilka formulär, och var de ligger, se Tabellverket reference - Variabelbeskrivning.
Konstigheter se- Källor/Tabellverk/Variabelbeskrivning/ DB-beskrivning TV (eng)V42.doc
Bortfallet i Tabellverksmaterialet
Kan gälla bortfall av
 Hela församlingen, alla formulär saknas. Eftersom vi inte säkert vet vilka församlingar som
existerade under tiden 1749-1859, så finns en viss osäkerhet om saknade församlingar. De
församlingar som Landsarkivet uppgivit som saknade, brända, förkomna finns upptecknade i en
tabell.

Någon volym inom församlingen saknas oftast beroende på att volymen var så skadad att
Landsarkivet inte kunde leverera volymen till DDB för registrering. Uppgifter om volymen kan
hämtas från tabellen DDB.ANMVOL som registrerats in från källberedningsuppgifterna på den
DEDIK-kod som församlingen ursprungligen registrerades in på.

Bortfall av tabeller inom formuläret.
Tabell med uppgift om sakande församlingar och luckor lucka.SaknadFrs
32
Bortfall, länskoder
Prästerna skickade församlingsuppgifterna till prosteriet som sammanställde dessa och sände vidare till
stiftet som sammanställde uppgifterna för stiftet och slutligen sände de sammanställda uppgifterna till
landshövdingen. Uppgifterna för ett stift och län kunde vara olika genom att läns och stiftsgräns inte
alltid sammanföll, en församling som ingick i ett stift kunde ibland vara delad av en länsgräns. För dessa
församlingar var prästen ålagd att inge uppgifter för varje församlings- och länsdel.
Prosterisammanställningen kan vara bra som komplement och kontrollkälla. I Jämtland fanns bara
pastorattabeller för några församlingar vilka har registrerats in för att inte få vita fläckar. De skapade
dedik koderna för bl.a. pastorattabellerna omfördes senare till geoid kod (geografiskt områdes kod) för
Tabellverket.
Tabellverket registrerades på församlingsnivå. Församlingar slogs ibland samman inom en tidsperiod
ex. i Gotlands län. Böckerna kom från olika landsarkiv och vissa krävde att böckerna skulle hämtas
personligen av någon från DDB. I vissa fall var det svårt att få vilka församlingar som fanns för ett
visst län och under en angiven period. Det var svårt för landsarkiven att lista församlingarna för ett län
eftersom böckerna sorterades i bokstavsordning och inte länsvis. När vi listade våra önskemål för ett
län kan någon församling ha missats eftersom vi inte hade uppgift om vilka församlingar som existerat
under tidsperioden inom ett län. Dessutom uppgav Landsarkivet att vissa församlingar saknades eller
var brända men trots det kunde de finnas, ofta insatta i en annan volym. Det hände också att det
uppgavs att böckerna inte lämnas ut för registrering, då de var så skadade, men vi fick dem ändå senare
ibland efter lagning. Vissa församlingar hade mortalitetsuppgifter i en volym och folkmängd i en annan.
En församlings volym kunde innehålla även andra församlingar och vissa var uppdelade på annat sätt
eller saknade namn. Trots att vi begärde att få allt var vi tvungna att specificera, sedan fick vi bocka av
vilka vi fått. Det finns dock en möjlighet att det materialet som saknas - de vita fläckarna - finns trots
allt. Vissa formulär år inom en församling kan saknas, se tabellerna DDB, ANMVOL och
DDB.ANMTXT
Längst bak i vissa formulär finns uppgifter(specifikationer) på angränsade församlingar i pastoratet eller
i prosteriet. Ibland finns centrala uppgifter med där. Om en församling saknas kan den återfinnas i en
angränsande församlings specifikationsuppgift. För folkmängdsformulär finns dessa specifikationsuppgifter endast för landsförsamlingarna, inte för stadsförsamlingarna.
Det finns en tabell över saknade församlingar lucka.SaknadFrs i Tabverk. Den innehåller uppgift om
saknade församlingar/uppgifter som lansarkivet informerat om. Listan är kompletterad av DDB om
dessa saknade församlingar förekommit med uppgifter i någon annan närliggande församlings
specifikation dvs. SPEC = 1 och i så fall i mort SPECMORT=1 och/eller i folk SPECFOLK=1.
Agneta har även kompletterat denna tabell med de församlingar från ddb.geoindex, som inte finns som
egna församlingar (bara i annan församlings specifikation) dvs. som inte har egna inregistrerade
formulär och som inte var med på listan från Landsarkivet. Dessa kompletteringar har blankt ’ ’ i fälten
Arkiv samt Anm, och har alltid spec = 1.
Det finns även några församlingar som bara har folkmängdsuppgifter. Dessa uppgifter kan även enkelt
plockas fram ur databasen med en SQL-fråga: “select distinct(a.geoid) from ddb.geoform a where
a.geoid not in ( select distinct(b.geoid) from ddb.geoform b where b.formnr < 100);”
Totalt finns det 178 församlingar/del av församlingar i tabellen, varav 83 församlingar är uppgivna från
Landsarkivet.
I tabellen GEOSPEC finns alla i Tabellverket förkommande församlingar, även församlingar från
specifikationerna. Ytterligare kringuppgifter för församlingarna finns i tabellen GEOFORM.
33
Mortalitetsuppgifter finns årsvis, folkmängd vart femte år, men i början vart tredje år. I mortalitetsformulär 50 tillkommer det folkmängdsuppgifter varje år, som återfinns som komplementuppgift i
bastabell.
Ett problem uppstod för de böcker som kopierades. Vissa uppgifter som fanns i bokens häftning
försvann(svårläst) - till exempel en kolumn i en kalkyltabell med uppgift om kvinnor.
GEOID (geografisk områdeskod)ersatte senare Dedikkoden (församlingskoden) i Tabellverket. Ibland
kunde två församlingar vara upptagna samtidigt(sammanslagna) i samma formulär, ibland hade en del
av en församling eller två församlingar fått samma dedik. Tyvärr förkommer också att samma geoid
över tidsperioden fått olika länsuppgifter(skall rättas). Det finns fall där ett geoid tillhört ett län för ett
antal år och senare bytt län som exemplet Piteå, som tillhörde Västerbotten men flyttades(1809) till
Norrbotten. Skaraborg och Älvsborg innehöll en mängd små församlingar som oftast skrevs in på
moderförsamlingen. Supraförsamlingar är benämning för de församlingar där en präst som t.ex. hade i
uppgift att fylla i formulär för tre församlingar men slog ihop uppgifterna till en och i formulärhuvudet
angav att detta formulär omfattad de tre församlingarna.
Dödsorsker
I ”Mortalitets- och folkmängdstabeller, Källbeskrivning” finns de sjukdomar som var förtryckta i de olika
formulären.
De förtryckta sjukdomar plus fritexter som prästerna skrev har DDB gjort om till en femsiffrig kod,
dvs. varje dödsorsak fick en femställig bokstavskod som i princip var en förkortning av originaltexten.
Men identiska bokstavskombinationer användes ibland för flera olika klartexter. Bokstavskodningen var
inte helt konsekvent eller systematisk, vilket orsakade en del praktiska problem. Samma
bokstavskombination användes i några fall också för helt olika sjukdomar. Problemet innefattar även att
samma kodning användes för förtryckta och för icke-förtryckta dödsorsaker.
Under registreringsperioden registrerades fritextuppgiften (koden + klartexten). Om sjukdomen skrevs
över någon förtryckt text, registrerades den som fritext och kodades alltid specifikt.
Man registrerade aldrig den förtryckta dödsorsaker om värde saknades - om ingen dog under perioden i
den dödsorsaken registrerades inte raden.
I vissa fall var prästen väldigt tydlig i att beskriva sjukdom, i andra fall antecknades bara
sjukdomsbenämning kortfattat.
De fasta sjukdomskoderna beskrivs i - Tabellverk/dokumentation/registrering/Kontroll 2/sjukdomslistorna.
Det finns olika varianter hur sjukdomarna kodades även för de förtyckte. (t.ex. barnsbörd= barns,
babör och smittkoppor= koppo, kåppo ).
Att göra uttag från tabellverket
I samband med att specifikationen tas fram, fastställs regler för hur man ska hämta informationen. Om
det saknas information i en tabell, finns det ofta uppgift att hämta från någon annan tabell. För varje
variabel i uttaget sätter man upp regler från vilka tabeller och variabler som informationen ska hämtas,
enligt en prioriteringsordning.
Agnetas tips om hur hon går tillväga vid forskaruttag.
Hämta först uppgift från källan(excerperad), sedan från genererad uppgift och därefter tas uppgift en
annan tabell där samma uppgift finns (sekundär källa för variabeln). Jämför med uppgifter i kyrkobok.
För forskaren kanske det inte har betydelse om varifrån uppgifterna har hämtats och hur prästerna har
fört in sina uppgifter, huvudsaken att man upplyser om varför och vad man har hämtat uppgifterna.
34
Forskaren har en frågeställning och det är vår uppgift att ta fram de rätta variablerna, besluta vilka
regler som gäller och vilka tabeller vi ska söka i. Man kan ta med både den excerperade och den
genererade koden när något saknats, det är upp till användaren att bestämma vad som ska användas.
Det är viktigt att uppdatera, kontrollera, testa och se att summan är densamma i båda fallen. Alla beslut
som fattas och vilka prioriteringar som gäller ska dokumenteras.
Skapa uttagsfilen
Agnetas tips om hur hon skapar filen:
 Create table xxx och ladda in den största tabellen.

Uppdatera variablerna med information från de andra tabellerna (insert).

Kontrollera mellan varje steg.

Prioritera varifrån uppgifterna ska hämtas ifall de saknas i någon tabell. Prioriteringen ska finnas
med i kravspecifikationen.

Testa, uppdatera och testa, uppdatera om igen.
Ett problem som man kan träffa på är att i tabell MDODE1CIV kan finnas rader där bara kvinnor har
dött alternativt bara män.
För Regtyp = 2 finns endast totala antalet (totalsumman) och inte för varje månad, för Regtyp = 1 finns
även månadsuppgifter. Saknas total-uppgifter kan man hitta uppgifterna i en annan tabell eftersom det
ofta finns samma uppgifter på flera ställen. Viktigt att ha bestämt vilken prioritetsordning som ska gälla.
Ett formulär kan vara skadat och mycket är bortrivet eller så har kanske prästen inte antecknat allt.
I Tabellverket Reference - kan man se i vilka tabeller vi kan hitta informationen som vi söker.
Alfresco/Tabellverk/Variabeldokumentation under namnet DB-beskrivning TV (eng)V42.doc
Export av uttagsfilen
När filerna är skapade:

gör alltid en test efter ’insert’

gör en dokumentation för varje ’insert’ i testdokumentet så det blir det verifierat att allt
är med.
Det är viktigt att varje steg, varje val i förstudiet verifieras. Om något går fel kan man gå tillbaka för att
kanske göra på ett annat sätt.
 Ha kvar formid för att underlätta test. Ta senare bort fält som ej ska vara med.
 Använd semikolonavskiljare mellan variablerna.

Ta med rubrikrad.
Dokumentation
I kundens dokumentation tar man upp de problemen som uppstått och ser till att vara klar och tydlig
om vad man gjort och vad som hänt med uttaget. Klargör skillnaden mellan källtroget, excerperat, om
prästen eller vi själva summerat och vad det innebär. Var tydlig med de prioriteringar som gjorts.
35
LinnéDb
Databasen LinnéDb omfattar uppgifter från olika register och databaser som sammanställts av Statistiska
Centralbyrån. Uppgifterna är hämtade från register som handhas av SCB och Socialstyrelsen, men innefattar
också uppgifter från Västerbottens hälsoundersökning som ägs av Västerbottens läns landsting och
databasen Betula som ägs av psykologiska institutionen vid Umeå universitet.
Initial hantering för att skapa LinnéDb
1.
Alla överföringar mellan Västerbottens hälsoundersökningar (VHU), Betula, SCB, Socialstyrelsen
och DDB sker med personligt ombud.
2. Materialen från Betula och VHU överförs till SCB som krypterade textfiler.
3. På SCB sker en avidentifering. Alla personnummer i de olika materialen ersätts med ett löpnummer,
LinneId. Detta kommer att användas för att koppla samman information om individen inom
databasen. Kopplingen mellan personnummer och LinneId, nyckelfilen, sparas vid SCB för att
möjliggöra framtida uppdateringar och tillägg av material.
4. Det avidentifierade materialet från VHU, Betula och SCB överförs som textfiler till DDB Umeå.
5. SCB levererar nyckelfilen till Socialstyrelsen som använder den för att avidentifiera sitt material.
6. Socialstyrelsen levererar sitt avidentifierade material som textfiler till DDB samt den eventuellt
uppdaterade nyckelfilen till SCB.
7.
Textfilerna verifieras för att säkerställa att det är samma material som utgick från databasägarna,
förutom avidentifiering.
8. Materialet byggs samman till en relationsdatabas och lagras på en server vid DDB
9. En slutverifiering genomförs av den färdiga databasen.
Teknisk miljö
All hantering av databasen LinnéDb sker i ett slutet nätverk vid Demografiska databasen i Umeå. DDB:s
lokaler är utrustade med skalskydd. Server och router för LinnéDb-nätet är placerade i ett serverrum med
dubbelt skalskydd. Endast den personal som har tillstånd att använda LinnéDb och aktivt behöver nyttja
databasen ansluts till nätverket. Analyser av databasmaterial ska ske i ett speciellt grupprum med dubbelt
skalskydd.
Klienterna är av två typer, tunna klienter och vanliga klienter. Grundprincipen är att använda tunna klienter
men ibland finns behov att använda viss programvara som inte fungerar med tunna klienter och då får
vanliga klienter användas. Operativsystem för klienterna är Windows XP. Microsoft Office finns på alla
klienter, olika analysverktyg, t ex SPSS och ArcGis, installeras vid behov, systemutvecklingsprogramvara
installeras hos systemutvecklarna.
Alla klienter är försedda med kortläsare och autentisering sker med användarnamn och lösenord.
Operativsystem på servern är Windows Server 2008 och som databashanterare används IBM DB2.
36
Tillgänglighet för forskning
Endast forskare som verkar inom forskningsprogrammet ALC har möjlighet att få tillgång till LinnéDb.
De olika forskarnas tillgång till data regleras av beslut fattade i ”Tillståndsgruppen” som består av:

Anders Brändström, Centrum för befolkningsstudier

Gunnar Malmberg, Kulturgeografiska institutionen

Anna Sundström, Psykologiska institutionen

Lars Weinehall, Institutionen för folkhälsa och klinisk medicin
Tillståndsgruppen har till uppgift att bevaka att LinnéDb endast används för de ändamål som anges i
projektbeskrivningen för ALC, i etikansökan till regionala etikprövningsnämnden och i beställningen till SCB
och Socialstyrelsen. Tillgängligheten kan gälla hela eller delar av databasen och är tidsbegränsad. Beslut om
tillgänglighet måste också godkännas av ägarna till Betula och VHU. I samband med uttag av vissa variabler
skall även SCB alternativt Socialstyrelsen informeras.
Demografiska databasens rutiner för forskarserviceadministration skall tillämpas vid uttag från LinnéDb.
En Lathund över forskarservicerutinerna har tagits fram till ALC-forskarna, som finns upplagd på Alfresco
under ALC, där finns även Specifikationsmall för uttag från LinnéDb.
Rutiner vid hantering av LinnéDb
Grundläggande villkor
All personal som på något sätt kommer i kontakt med sekretessbelagt material skall underteckna särskilt
förbehåll om tystnadsplikt enligt Sekretesslagen (1980:100) 14 kap 9 §.
Roller och rutiner för forskarservice på Linnedb
Det finns sju roller gällande hantering av forskaruttag i Linnémiljön.
Tillståndsgruppen
•
•
Bevakar att LinnéDb endast används för de ändamål som anges i projektbeskrivningen för ALC, i
etikansökan till regionala etikprövningsnämnden och i beställningar till SCB och Socialstyrelsen.
Bedömer specifikationer och ger i tillämpliga fall klartecken för uttaget.
Forskare
•
•
•
•
Tar fram specifikation tillsammans med ämnesexpert.
Deltar i möten.
Tar fram data på egen hand (vissa uttag)
Ansvarar för kvalitetssäkring av erhållet uttag
Ämnesexpert
•
•
•
•
•
Har kunskap om sitt material.
Tar fram specifikation tillsammans med forskare.
Medverkar på alla uttagsmöten.
Assisterar forskare som gör uttaget själv.
Assisterar forskare vid kvalitetssäkring av deras uttag
37
•
•
Assisterar systemutvecklare/utredare vid frågor.
Analyserar framtagen statistik på data i uttaget om ämnesexpert och systemutvecklare deltagit i uttaget.
Forskarserviceansvarig
•
•
•
•
Tar emot specifikationer.
Planerar vid behov in resurser.
Skickar specifikationen till tillståndsgruppen för godkännande.
Ansvarar för att avtal och förbehåll skrivs på av respektive forskare
Utredare
•
•
•
•
Ordförande i arbetsgruppen som utför uttaget.
Kallar till möten i arbetsgruppen.
Läser testdokumentationen.
Verifierar att alla variabler finns med i uttag framtagna av systemutvecklare.
Systemutvecklare
•
•
•
•
•
•
Tar fram uttaget.
Testar uttaget och skriver testdokumentation.
Dokumenterar uttaget.
Deltar i möten när specifikationen är klar.
Ger behörighet för genererat material till berörda forskare.
Tar bort behörighet från genererat material när tid för tillgänglighet löpt ut.
System-/databasadministratörer
•
•
•
Administrerar den tekniska miljön / databasen.
Ger behörighet till forskare i uttag där systemutvecklare ej ingår.
Tar bort behörigheter från forskare i uttag där systemutvecklare ej ingår när tid för tillgänglighet löpt ut.
Forskarservicerutiner för uttag från LinnéDb
LinnéDb kommer endast att vara tillgänglig för forskare som verkar inom ALC och de olika forskarnas
tillgång till data regleras av beslut i en särskild grupp, Tillståndsgruppen.
Inga data från LinnéDB som kan knytas till en enskild individ får lämna det slutna nätverket vid DDB. Alla
analyser av sådana data ska ske vid klientmaskiner i detta nätverk. Analyserna ska ske i grupprummet med
dubbelt skalskydd. I tjänsterummen får endast uttag och förberedelse för uttag från databasen göras.
Analysresultat som inte går att knyta till enskilda individer får lämna det slutna nätverket.
DDBs rutiner för forskarserviceadministration skall tillämpas vid uttag från LinnéDb:
1.
Forskare specificerar önskemål om uttag med hjälp av ämnesexpert(-er). Befintlig specifikationsmall
som finns att tillgå på DDB:s intranät ska användas. I specifikationen ska syfte, motivering,
frågeställning, urvalskriterier, variabelnamn och tabellinformation etc. uppges.
2. Specifikationen lämnas till forskarserviceansvarig vid DDB som vidarebefordrar den till
Tillståndsgruppen för bedömning.
3. Tillståndsgruppen bedömer specifikationen och ger i tillämpliga fall klartecken för uttaget. De avgör
också om etikprövning krävs.
4. Forskarserviceansvarig planerar vid behov resurser för uttaget. Uttag kan ske på följande sätt:
a. Forskaren tar fram data på egen hand.
38
b. Ämnesexpert assisterar forskare i framtagandet av data.
c. Systemutvecklare tar fram data och dokumenterar uttaget. Utredare fungerar som ordförande i
arbetsgruppen.
5. Forskare undertecknar avtal och förbehåll om användningen av data från LinnéDb.
6. Uttaget kvalitetssäkras i samband med leverans. Forskaren är alltid huvudansvarig för kvalitetssäkring.
För alternativ b och c i punkt 4, det vill säga i de fall då forskaren inte själv gjort uttaget, assisterar
ämnesexpertis forskaren vid kvalitetssäkring av uttaget. Eventuellt utsedd utredare granskar
testdokumentation och att samtliga variabler finns med i uttaget.
7.
När tillgänglighetstiden för uttaget gått ut tas forskarens rättigheter till materialet bort.
Checklista
Nummer hänvisar till Forskarservicerutinerna ovan
N
o
Aktivitet/
ansvarig
Utredare
System
1
Frågeställningen
2
Specifikation
4c
3
Avtal
4c
4
Uttag & test
4c
5
Statistik över
uttaget
4c
4c
4c
6
Dokumentation
av uttag
4c
4a, 4b
4b
7
Kvalitetssäkring
av uttag
4c
8
Leverans av filer
kundens
dokumentation
4c
9
Backup av uttag
på CD, filer,
programvara,
dokumentation
4c
10
Rensning av
testtabeller
4c
11
Slutrapport på
DDB:s intranät
4c
Forskare
Ämnesexpert
X
X
X
X
X
4a, 4b
X
4c
Föreståndare
4a, 4b
4c
X
Forskarserviceansvarig
4a, 4b
4b
4b, 4c
4b
4a, 4b
39
Systemadministrativa rutiner vid forskarservice på Linnedb
I samband med forskarservice på Linnedb behöver ett antal systemadministrativa uppgifter utföras
både i form av att lägga upp utrymmen för filer och att skapa rättigheter för inblandade parter. Nedan
följer en sammanställning av dessa uppgifter. Samtliga uppgifter utförs av uttagets systemutvecklare.
Om ingen systemutvecklare finns med i uttaget kontaktas i första hand databasadministratör och i andra
hand systemadministratör. En grundförutsättning är att personerna som ska tilldelas rättigheter har en
användare på Linnedb-servern, denna läggs i första hand upp av systemadministratören.
Inför uppstart av ett uttagsprojekt
1. En mapp, uttagsmappen, skapas under \\yggdrasil\users\public\uttag med samma namn som
forskaruttagets nummer.
2. Alla som ska arbeta med att ta fram uttaget ges fullständiga rättigheter till uttagsmappen.
3. Ett schema skapas på databasen Linnedb med samma namn som forskaruttagets nummer i
samband med att första tabellen skapas.
4. Rättigheter för objekt på detta schema tilldelas de som ska arbeta med uttaget.
När uttaget är färdigt:
Beroende på önskemål från beställarna utförs den ena eller bägge av följande uppgifter:
• Beställarna ges fullständiga rättigheter till uttagsmappen.
• Beställarna ges läsrättigheter till uttagets tabeller alternativt vyer på Linnedb.
Dokumentation kring uttag från LinnéDb
Såväl DDB-medarbetare som forskare inom ALC måste ha tillgång till samma dokument och det är viktigt att
samma version finns tillgänglig för samtliga som hanterar uttagen.
Följande rutiner för hantering av dokument gäller:
1.
Kaisu lägger upp en mapp på ALC – Linnéuttag och på DDB – Projekt – U med namnet på
projektet.
2. Projektledaren lägger in aktuell specifikationen (checka ut/in vid uppdatering), och senare kundens
dokumentation, under ALC – Linnéuttag och skapar en länk till samma mapp på DDB – Projekt – U.
3. Interna dokument (kravspecifikation, test och verifiering) ska inte kunden ha tillgång till, så de läggs
under DDB-mappen.
För att länka till ett dokument mellan mappar, gör så här:
1) kopiera filen (klicka på den här symbolen
och sedan kopiera)
2) gå till mappen där länken ska vara
3) gå till Hylla genom att klicka på pilen bredvid Navigator
4) klicka sedan på Urklipp och sedan Klistra in som länk. Klart! Denna länk kommer att uppdateras
samtidigt som ursprungsfilen och om den flyttas så ändras länkadressen. Originalfilen läggs under ALC och
länken under DDB.
40
Forskarservicerollen
Några tankar kring Demografiska databasens material och forskarservice
Sören Edvinsson 2007-02-26
Dessa sidor är föranledda av den workshop kring forskarservice vi hade i början av januari där vi
diskuterade erfarenheterna vi som tidigare arbetat med forskarservice haft. Syftet var att det skulle ske
en kunskapsöverföring till de nya utredarna som framöver kommer att ha huvudansvaret i kontakterna
med beställande forskare vid datauttag från Demografiska databasen. Mia Sandberg Hiltonen väckte
tanken att jag skulle kunna sammanställa något kring principer för forskaruttag samt erfarenheter av
sådana som kan vara värda att föra vidare och diskutera. Jag har därför nu skrivit ner några reflektioner
kring Demografiska databasens material och kring forskarservice och då i första hand med tanke på
kyrkboksmaterialet. Förhoppningen är att dessa sidor ska bidra till att göra utredarens roll tydligare och
att vi dessutom ska bli mer medvetna om vad det är vi bidrar med när vi levererar data till forskare. Det
bör understrykas att dessa frågor egentligen inte har diskuterats på ett sammanhållet sätt tidigare inom
den f.d. fou-avdelningen, så uppfattningarna får främst stå för hur jag själv uppfattat uppgiften.
Däremot bygger tankarna till stor del på de riktlinjer för databasens verksamhet som formulerades
redan på 70- och 80-talet.
Inledningsvis diskuterar jag något kring vad Popum är som en slags utgångspunkt, därefter tar jag upp
något om hur vi bör se på vår roll i forskarservice och avslutningsvis diskuterar jag några rent praktiska
aspekter i konstruktionen för forskaruttag. Jag uppmärksammar några saker som kan vara bra att ha i
åtanke vid forskaruttag och jag visar också på hur våra data kan struktureras för att användas i
framförallt demografiska studier, i synnerhet som livsförloppsdata.
Popum
Först kan det behöva sägas några ord om vad som karaktäriserar befolkningsdatabasen Popum. Vi
behöver såväl för oss själva som för externa användare ha klart för oss vad det är för typ av material vi
arbetar med - vad det står för och vad det inte står för.
Konceptuellt kan Popum sägas bestå av två typer av databaser, dels en källdatabas och dels en
användardatabas. De respektive databaserna består i sin tur av ett antal olika tabeller. Källdatabasen
representerar den källnära informationen. Vi ska utifrån de ingående tabellerna i princip kunna
rekonstruera informationen som den var i källan. Den strukturerade informationen i databasen gör det
möjligt att på ett enkelt sätt komma åt information från källan och att använda den för uppdateringar av
variabler (för enskilda forskarbehov eller för av DDB skapade variabler). I användardatabasen finns
information som baseras på uppgifterna i källdatabasen, men där dessa nya variabler är skapade utifrån
ett regelverk skapat av oss. På det sättet kan vi utnyttja de samlade uppgifterna så optimalt som möjligt.
Som en vägledning för arbetet med att skapa databasen, formulerades tidigt fem allmänna krav (se
Demografiska databasen vid Umeå universitet. En presentation av verksamheten, Umeå 1985, s 14). Jag vill här
påminna om de två första kraven:
 Systemet ska vara källtroget, dvs datainsamlingen skall kunna jämföras och kontrolleras mot de
autentiska källorna och i databehandlingen skall varje fristående källa kunna urskiljas och
analyseras.
 Systemet ska vara fullständigt, dvs all väsentlig relevant information skall ingå i
datainsamlingen.
41
Demografiska databasen har alltså sedan starten arbetat utifrån principen att registreringen ska ske
källtroget. Vid inregistreringsskedet avstår vi från att rätta eventuella fel (även om de skulle vara
uppenbara), likaså inför vi inte tolkningar i någon större utsträckning. Informationen i Popums
källdatabas ska avspegla källan så troget som möjligt. Motiven för detta är flera. Utifrån
forskarsynpunkt är det viktigt att det i detta skede inte sker någon form av avgörande manipulation av
källinformationen. Vi vet inte i förväg hur databasens uppgifter kommer att användas. Det är t o m
möjligt att någon vill studera felförekomster i kyrkböcker (mer om forskningsbehov, se nedan). Vidare
så medför det förhållandet att informationen ska användas för uppdatering av variabler, att tolkningar
av själva grunduppgifterna bör undvikas. Genom att omedelbart rätta till uppgifter vid registrering, har
vi redan antagit vissa förhållanden som kanske inte alls stämmer och som kan göra att det blir
felaktigheter i den konstruerade informationen. Exempelvis kan det leda till att vi länkar samman
personer felaktigt. Dessutom kräver alla former av tolkning utförliga regler för att undvika
skiljaktigheter mellan olika excerpister i hur det görs.
Men även om grundprincipen vid registrering är att den ska ske källtroget, sker ändå vissa tolkningar
redan i detta skede. I de flesta fall kan de ses som tämligen triviala och ofarliga tolkningar, men likafullt
är de just tolkningar. För vår egen skull är det viktigt att försöka identifiera vilka typer av tolkningar
som görs (något jag tycker vi skulle behöva analysera ytterligare). Här är några exempel:
 Vi påför ibland koder omedelbart. Detta gäller t ex församlingsuppgifter
 Vi identifierar komponenter inom noteringar och sätter dem på dess rätta plats, t ex om civilstånd
är fört på olika platser inom en husförhörsnotering (eller kanske på sidan) för uppgiften ändå till
rätt variabel. På det sättet släpper vi grundstrukturen på information inom sidan, något som gör att
den inte längre är helt källtrogen
 Vi påför en del implicita uppgifter. Om en hel familjegrupp flyttar och flyttningsdatum endast
angetts på noteringen för huvudpersonen, åsätts övriga familjemedlemmar samma flyttningsdatum
 Vi identifierar hur personer är relaterade till varandra på samma sida. I familjegrupper på
husförhörssidor listas oftast fadern först, därefter modern och slutligen barnen. Oftast är
familjerelationerna uppenbara i dessa fall. Men det kan också finnas enstaka relaterade personer där
det inte är lika tydligt vem denne är relaterad till. Om någon änka anges som mor till någon på
samma sida, kan det vara svårt att avgöra vem hon är relaterad till enbart utifrån sidans information
 Vi påför vissa uppgifter som inte är explicita, t ex personers kön utan att det uttryckligen anges.
Namn kan dock sägas vara en tämligen tydlig indikator på kön. Angivelser som hustru, son eller
dotter kan kanske anses som ett explicit angivande av kön
 osv
Det som den ”källtrogna” registreringen (som den återfinns i källdatabasen) resulterar i är således inte
källan, men den ska representera källan i så stor utsträckning som möjligt. Vore det källan, skulle vårt
arbete vara onödigt. Det innebär att i princip all information ska ingå, enligt det andra allmänna kravet
ovan. (Detta har inte alltid varit fallet, och frågan är om det stämmer nu heller). Vad vi bidrar med är att
vi organiserar informationen och gör att den stora mängden data blir bearbetningsbar och analyserbar
med våra moderna resurser. Att databasen representerar källan får dock vissa följder. Vissa negativa
egenskaper i originalkällan kommer därigenom att finnas kvar i databasen. Nedan följer några exempel
på sådana problem.
 Motsägelser. Vi kan t ex ibland finna att personer är förda som inflyttade efter deras död (något
som faktiskt kunde vara enligt föreskrifterna hur böcker fördes). Vidare så kan vi återfinna
samma person boende i flera församlingar vid samma tidpunkt eller att personen inte överförts
omedelbart vid flyttning mellan församlingar.
 Saknade data. Detta är ett vanligt fenomen. I synnerhet för det äldre materialet har det många
gånger varit svårt att identifiera tidpunkten när en persons närvaro på en hsuförhörssida
42


Felaktigheter. Det kan vara felaktigt födelsedatum, födelseförsamling, namn m.m. I en del fall är
det uppenbarligen fråga om rena felskrivningar av prästen.
”Fuzzy” data. Exempel på detta är datum som ofta anges enbart med år när vi egentligen
behöver exakta datum för våra forskaruttag. Ett relaterat problem är att datum kan anges på
olika sätt och med olika precisionsgrad. Rumsangivelser (varifrån man föddes eller var man
flyttade t ex) kan också vara vaga. Även sådana uppgifter som yrken och dödsorsaker skulle
kunna betraktas som suddiga eller oklara. Precisionen på de angivelser som ges i kyrkböckerna
är ofta tämligen låg och varierar dessutom över tid och rum.
Den andra delen av Popum representeras av användardatabasen. Här har bearbetningar gjorts som gör
att databasen blir mer användarvänlig. Den gör också att Popum kan uppfylla de grundläggande krav
och förutsättningar för databasen som har formulerats. Jag tar här upp några som är relevanta i det här
sammanhanget:
 Det ska vara möjligt att få fram de uppgifter som rör en person vid viss tidpunkt. På det sättet
kan man säga att vi kan komma åt det som motsvarar en folkräkningsbefolkning
 Det ska vara möjligt att få fram uppgift om person över tid. Vi kan således bygga upp
livsbiografier
 Det ska vara möjligt att återskapa informationen från originalkällan, dvs man ska kunna
identifiera all information som hör till aktuell notering
 Kvaliteten på informationen i databasen är begränsad till originalkällans kvalitet, dvs vi
förbättrar inte informationen genom att ta in uppgifter från annat håll (detta är något som nog
ändå har gjorts i en del fall, i synnerhet när kyrkböcker har saknats för vissa perioder i en del
församlingar)
(Övriga krav gäller sådant som att det ska vara enkelt att bygga ut databasen och att databasen ska
ständigt underhållas och dokumenteras.)
Dessa kännetecken för Popum är de som gör databasen till en så unik källa. Vi kan utifrån den samlade
informationen i den digitaliserade versionen av kyrkböckerna, definiera befolkningen såväl vid en
bestämd tidpunkt som följa alla ingående personer över tid i den mån de finns i våra församlingar, men
med de begränsningar som källans kvalitet sätter.
Innan vi går över till hur vi praktiskt utför forskarservice, vill jag redogöra för något om karaktären av
individinformationen i databasen. En central skiljelinje är den mellan händelser och tillstånd.
Kyrkböckerna bygger till stor del på redovisning av händelser. Dessa är främst av demografisk
respektive kyrklig art. Demografiska händelser är födelse, giftermål, flyttningar, död. Kyrkliga händelser
är dop, giftermål (även här), begravning, husförhör, nattvard osv. Vi kan tänka oss även andra
övergångar som födda sitt första barn, föda sitt andra barn, bli änkling osv. Tillstånd är däremot
beskrivningar av personen. Tillstånd kan vara oföränderliga, som kön (jag bortser från möjligheterna av
könsbyte), eller tidsberoende, som yrke och civilstånd. I många fall kan dessa tillstånd konstrueras
utifrån händelser. Händelsen giftermål exempelvis ger civilståndet gift och partners dödsfall ger
civilståndet änka/änkling. Händelsen indikerar också det föregående civilståndet, som att övergången
till änka/änkling förutsätter ett föregående civilstånd gift. Händelsen giftermål kan däremot förutsätta
såväl civilstånden ogift, änka/änkling och frånskiljd. I en del fall saknas emellertid uppgift om själva
händelsen. Så kan vi ibland ha uppgift om att en person är gift eller änkling utan att vi har datum när
händelsen som ledde fram till civilståndet inträffade. För civilståndet ogift är det snarare fråga om en
icke-händelse. Vidare finns en massa andra variabler som kan ses som tillstånd. Vi kan t ex anse den
43
som är barn av en ogift mor som utomäktenskaplig genom hela livet om vi så önskar - vi kan låta det
hanteras som oföränderligt tillstånd.
Utifrån händelser uppgivna i kyrkböckerna kan därför personers civilståndhistoria konstrueras.
Händelserna gör att personerna övergår i nytt tillstånd och om dessa händelser är fullständigt
redovisade får vi exakta start- och slutdatum för civilstånden. Saknas exakta datum för händelsen, kan
ändå personers civilståndshistoria rekonstrueras utifrån perioduppgifter som anger det aktuella
tillståndet.
För andra tillstånd kan detta inte utföras på samma sätt. Ett exempel på det senare är yrkestillhörighet
eller social ställning. Kyrkböckerna är fyllda av yrkesuppgifter. Dessa uppgifter är emellertid enbart
tillståndsbeskrivande. Kyrkböckerna saknar uppgift om händelsen yrkesbyte. Prästen hade ingen
anledning att kontinuerligt uppdatera den informationen (om han ibland gjorde det har vi ingen
möjlighet att bedöma att så var fallet). I stället vet vi att personen hade det yrket vid en viss tidpunkt
alternativt under eller inom en viss tidsperiod. Har vi yrkesuppgiften från en händelsekälla, som t ex
lysnings- och vigselbok, vet vi att han (nästan enbart han) hade det yrket vid den tidpunkten. Har vi
uppgiften från en periodkälla (husförhörslängden), vet vi att han hade det yrket åtminstone någon gång
under den tidsperiod källan gällde (eller prästen bedömde att han hade det då). Vi kan nog ofta
förutsätta att uppgiften gällde för hela perioden, men vi kan inte vara säkra. Det kunde ske
uppdateringar under noteringens giltighetstid, vilket i så fall kan innebära att yrket egentligen inte var
aktuellt vid noteringens startdatum utan först senare. Vanligare är troligen att yrket angavs när prästen
förde in personen i husförhörslängden, men att eventuella yrkesförändringar under noteringstiden inte
medförde några förändringar av yrket i källan.
Forskarservice i praktiken
En grundprincip för DDB är att databasen ska representera källan så troget som möjligt. En viktig
anledning för detta är att forskare som kan tänkas ha användning av information registrerad i
kyrkböcker ska kunna få dessa i digitaliserad form från DDB. En annan utgångspunkt är att forskaren i
princip själv ska ta de avgörande besluten för hur materialet ska behandlas. Vi kan se det som att detta
arbetsmoment ska motsvara den forskningsprocess som forskaren annars skulle utfört om han/hon
hade suttit i arkivet och tagit fram och bearbetat sitt forskningsunderlag. Forskaren ska kunna göra
källkritiska värderingar och göra bedömningar av fullständighet, relevans m.m., alltså de centrala
moment som normalt ingår i forskningsprocessen.
Lägg märke till att jag ovan skrev ”i princip” när det gällde utgångspunkten att forskaren själv ska fatta
(kan med fördel läsas dubbeltydigt) alla beslut. I det praktiska arbetet med forskaruttag går det sällan till
på det sättet att forskaren själv tar alla centrala beslut. Det är i det här skedet som utredarna har en
viktig roll. De är förmedlare mellan den beställande forskaren och de systemutvecklare som sköter
själva programmeringen. Utredarna hjälper forskaren att förstå materialet, ställer relevanta frågor kring
hur uttaget ska utformas, vilka variabler som ska med, hur datafilerna ska struktureras osv. I
diskussionen mellan den beställande forskaren och utredaren bör också datauttagets utformning i
förhållande till analysmetoder behandlas. Är det möjligt att genomföra undersökningen med de tänkta
analysmetoderna? I många fall kan utredarna då också bli konsulter i fråga om relevanta analysmetoder.
Beträffande val av variabler, så är många uppgifter i databasen av sådan art att forskaren godtar de
redan givna värdena. Demografiska databasen har ju själv gjort en hel del upparbetningar i
användardatabasen vilka kan anses vara tämligen säkra. Det är sådana uppgifter där man på ett optimalt
sätt behandlat den registrerade informationen och där klara och entydiga regler kan skapas. Det gäller
exempelvis vilken uppgift om födelsedatum som ska prioriteras. Många av de uppgifter som återfinns i
44
bland annat persontabellen men även i andra tabeller i användardatabasen är konstruerade data av sådan
art att vi med stor tillförsikt menar att vi kan garantera deras kvalitet. I de flesta fall har forskaren ingen
anledning att konstruera dessa variabler på andra sätt, men det är viktigt att möjligheten till egna
definitioner ska finnas. Likaså är det viktigt att forskaren ska vara medveten om eventuella
implikationer av att använda sådana variabler när det kan vara av betydelse.
Även i andra fall överlåter forskaren mycket av besluten på oss. Många forskare har god kunskap om
det grundläggande källmaterialet, medan andra (som kanske kommer från utlandet eller representerar
discipliner där man ofta har begränsad erfarenhet av historiska källor) har mer summarisk kunskap.
Oavsett om man har den goda kunskapen om källmaterialet eller om den är mer begränsad, så har
många forskare svårt att fullständigt förstå vad det innebär att uppgifterna ligger i en databas, vilka
effekterna blir av saknade eller ofullständiga data eller att de sökta uppgifterna återfinns på olika ställen i
databasen och med motsägande uppgifter. Därför önskar många forskare att vi ger förslag på hur
variabler bäst definieras utifrån våra erfarenheter. Vi känner databasens innehåll och struktur bättre och
vi har kunskap om vilka regler som använts vid konstruktionen av variabler vid tidigare uttag.
Men även om de flesta forskare är tacksamma för att vi ger förslag och att det oftast också är
bekvämast för oss, bör vi ändå bibehålla vår ambition att det egentliga och definitiva beslutet ska tas av
forskaren. I praktiken innebär det i de flesta fall att vi informerar om de olika möjligheter som finns och
kanske också eventuella konsekvenser av de olika valen. För forskaren är det förstås av yttersta vikt att
vara medveten om sådana saker. Den dialog som vi för med forskaren kan ses som ett sätt att
informera denne om databasen och göra honom/henne införstådd med karaktären av informationen i
de beställda datafilerna. På det sättet kan forskaren behandla de beställda data på ett riktigt sätt.
Det kan även vara på sin plats att påminna om det forskningsetiska problemet som kan uppstå vid
återanvändning av variabeldefinitioner från andra forskaruttag. I de flesta fall behöver det knappast ses
som något problem, men vi bör åtminstone fundera över om vi kommer in på någon annan forskares
forskningsidéer när vi utnyttjar erfarenheterna från den personens uttag.
Olika sätt att analysera Popum-material inom forskning
Jag ska här kort ge en kort redogörelse för två olika sätt att använda DDB:s material för forskning, samt
visa på vad de respektive analysmetoderna medför för konstruktionen av filer för forskaruttag. I första
hand anknyter angreppssätten till demografisk forskning, men grundprinciperna används också i andra
former av studier. Naturligtvis finns det också en mängd andra metoder att analysera detta material,
men de två nämnda kan sägas representera huvudinriktningarna för demografiska analyser och de
påvisar också på ett bra sätt potentialen med DDB:s material.
Det digitaliserade kyrkboksmaterialet i den form DDB har upparbetat den lämpar sig väl för en mängd
skilda typer av studier. Inom det demografiska forskningsfältet har flera olika angreppssätt använts.
DDB-materialet är såväl rikt som väl anpassat för dessa forskningsfält och det kan analyseras utifrån
flera olika demografiska analysmetoder.
Först några ord om hur vi kan definiera den population vi undersöker. Traditionellt har en stor del av
demografiska analyser utförts genom att händelser har relaterats till en riskbefolkning. Det centrala är
då att samma befolkning representeras såväl i täljaren (som oftast anger demografiska händelser) som i
nämnaren (som utgör riskpopulationen). Vanligtvis använder vi vad som brukar kallas den rättsliga
befolkningen, alltså den befolkning som är skriven inom ett visst område (de jure-befolkningen i kontrast till
de facto-befolkningen som syftar på den faktiskt boende befolkningen eller att folk identifieras på den plats
45
där de faktiskt befinner sig). Området kan vara av olika omfattning eller på olika indelningsnivåer, men i
vårt material är i allmänhet grundindelningen de enskilda församlingarna. Den rättsliga befolkningen
befann sig inte nödvändigtvis i det studerade området även om ambitionen med kyrkobokföringen var
att folk skulle vara skrivna där de bodde. Det hände förstås att folk befann sig på resa och kunde råka
ut för händelser på främmande ort (t ex att de dött). I dessa fall var ändå den egentliga boendeorten
inom den församling där de var skrivna. Men det förekom också att folk tillbringade längre tidsperioder
hemifrån, t ex när de arbetade på främmande ort, kanske som säsongsarbetare. I sådana fall hade de
ändå anknytning till hemförsamlingen. Under senare delen av 1800-talet var det emellertid tämligen
vanligt i många områden (t ex Sundsvall) att folk befann sig på dessa orter under flera år (i praktiken
boende där) utan att skriva sig i församlingen.
I de flesta fall kommer vi åt den rättsliga befolkningen genom husförhörslängderna (observera att det
förekommer att husförhörslängderna för en församling innehåller byar som egentligen inte tillhör
aktuell församling). Från 1860 skulle man också ange de s.k. obefintliga. Det var sådana som befann sig
på okänd ort och som således inte hade tagit ut det obligatoriska flyttbetyget. Formellt skulle de
fortfarande räknas till deras gamla hemförsamling tills dess närmare uppgift om ny bostadsort
framkommit. I de flesta fall bör obefintliga inte räknas som boende i församlingen. Vi har nämligen
ingen aning om deras eventuella demografiska händelser. De kan inte bidra till täljaren så att säga i
analyserna, och därför bör de också uteslutas ur nämnaren.
I kyrkböckerna finner vi en hel del uppgifter om demografiska händelser hos församlingsbor där
händelserna inträffat i annan församling. Det kan vara att personer har dött på annat ställe eller att de
fött barn i annan församling. Uppgifter om detta skulle skickas till hemförsamling, varför vi kan finna
sådant infört i denna församlings födelseböcker, dödböcker och vigselböcker. På det sättet har vi ändå
uppgifter för täljaren i våra tillgängliga källor, trots att händelserna inte inträffat inom vårt geografiska
område. Observera att för äldre tid, 1600- och 1700-talet och även tidigt 1800-tal saknas ofta händelser
på annan ort i hemförsamlingens ministeriallängder. Detta kan gälla t ex soldater som dött i fälttåg i
främmande land. Möjligen kan sådana uppgifter ändå anges i husförhörslängderna.
På motsvarande sätt kan vi finna en hel del händelser i kyrkböckerna för en församling som hänför sig
till personer som inte var boende där. Personen kan ha dött i församlingen. Denna uppgift fördes
således in även i den församling där dödsfallet skedde, samtidigt som attest skickades till
hemförsamlingen. För dessa personer har vi således uppgifter för täljaren medan de saknas för
nämnaren, vilket gör att vi för de flesta demografiska analyser inte kan användas.
Vad innebär då detta för de demografiska analyserna? För att veta att vi har samma befolkning i täljare
som nämnare bör vi utgå från den rättsliga befolkning som representeras i husförhörslängderna. Endast
händelser för sådana som vid tidpunkten för händelsen var redovisad i församlingens husförhörslängd
tas med. Ett specialproblem är spädbarn som inte fördes in i längderna omedelbart och därför kom att
sakna husförhörsnärvaro om de dog tidigt. För att inte analysen ska bli felaktig måste vi finna ett sätt att
komma runt det. En metod är att undersöka om modern var närvarande i församlingen vid tidpunkten
för barnets födelse (alltså att vi tar hänsyn till moderns närvaro i församlingen för bestämningen av
barnets närvaro).
Vi kan således göra demografiska analyser genom att helt enkelt beräkna antalet händelser i en
riskpopulation mot just denna riskpopulation. De demografiska händelserna kan vara sådana som
hänför sig till församlingsmedlemmar och som inträffar under en viss tidsperiod. Ofta brukar
riskpopulationen representeras av vad som kallas medelfolkmängden. Medelfolkmängden kan beräknas
på olika sätt, som t ex befolkningen vid mittidpunkten i en period, men oftare väljer man befolkningen
46
vid periodens början respektive slut, summerar dessa och delar summan med två. Denna
medelfolkmängd kan vara totalbefolkningen i en församling, men den kan också vara indelad i
kategorier som olika åldrar, efter kön, social grupp osv. Genom att beräkna kvoterna för enskilda
åldersgrupper (och kön) kan man få fram åldersspecifika tal, något som sedan även kan användas för
beräkningar av livslängdstabeller. Sådana tabeller används främst för studier av dödlighet och
överlevnad men kan i princip användas även för andra typer av studier. Livslängdstabeller (eller life
tables) är ett sätt att summera den totala erfarenheten under en tidsperiod tvärs över alla åldersgrupper.
Den används för att beräkna medellivslängden. Denna medellivslängd hänför sig då till en så kallad
syntetisk kohort, alltså det är inte medellivslängden för en grupp människor som föddes under samma
tidsperiod utan den representerar i stället erfarenheterna i de olika åldersgrupperna sammanslagna för
en gemensam tidsperiod.
Eftersom Popum tillåter oss att identifiera samtliga personer som var närvarande vid viss tidpunkt
utifrån husförhörslängderna, kan vi på det sättet ta fram data för att definiera medelfolkmängd. Och de
demografiska händelserna för aktuell period är, som redan antytts, möjliga att ta fram.
Jag ska här ge ett förenklat exempel på hur ett sådant datauttag skulle kunna se ut. I händelsefilen finner
vi alla relevanta händelser som vi sen kan ange i täljaren. Från närvarofilen kan vi skapa
medelfolkmängden (befolkningen i nämnaren) som vi relaterar händelserna till. Detta kan vi göra dels
för befolkningen i sin helhet, men vi kan också dela upp analysen efter kön, ålder, social grupp eller
liknande. Vi kan också välja att studera enskilda dödsorsaker och dödsorsaksgrupper och jämföra den
mellan olika åldrar, kön osv.
Exempel forskningsfråga.
Dödlighet i Sundsvall 1860-1870.
Vi gör två filer. En händelsefil och en närvarofil (för beräkning av medelfolkmängd).
Händelsefil.
Alla dödsfall bland personer med hemförsamling Sundsvalls stad 1860-1870.
Identitet
Födelsedatum
Dödsdatum
Ev. beräknad dödsålder
Kön
Civilstånd
Yrke (som underlag för egen social indelning i stora grupper)
Dödsorsak i klartext (för vidare bearbetning)
Närvarofil.
Alla som var närvarande 1/1 1860, samt alla som var närvarande 31/12 1870.
År (1860 eller 1870)
Identitet
47
Födelsedatum
Ev beräknad ålder
Kön
Civilstånd
Yrke (som underlag för egen social indelning i stora grupper)
Nu medger emellertid Popum även andra och på många sätt mer givande analysmetoder. Med
traditionella demografiska mått som bygger på beräkning av allmänna tal, åldersspecifika tal,
könspecifika tal osv. blir det svårt att undersöka vad som bestämmer nivåerna. Är det social tillhörighet,
ålder, kön, civilstånd, bostadsort eller något annat? Det går att ta fram uppgifter för de enskilda
komponenterna, men vill vi ta hänsyn till flera faktorer samtidigt kommer antalet fall i varje
underavdelning snabbt att bli för litet. Vi måste kunna hantera flera faktorer samtidigt i analysen. Om vi
dessutom kan hantera tid på ett bättre sätt i analysen vore det en fördel.
Den longitudinella karaktären av information och möjligheten att bygga upp livsbiografier är vad som
gör DDB:s material så unikt. Våra data är mycket lämpliga för livsförloppsanalys eller ”life course
analysis”. Life course analysis kan sägas vara ett angreppssätt inom forskning, som innefattar olika typer
av metoder men som inte nödvändigtvis behöver vara statistiska. Den inriktning jag vill lyfta fram i det
här sammanhanget är emellertid den rent statistiska användningen inom den del av dessa analyser som
ofta benämns ”event history analysis”. Cox regression är en sådan metod, men jag ska inte gå närmare
in i själva analysmetoden här. I stället ska jag ta upp lite av de krav på data som ställs för att kunna
genomföra sådana analyser.
Event history analysis används för att studera riskerna för att en händelse ska ske och med möjlighet att
relatera detta till olika förklarande variabler. Det kan vara t ex dödsfall. I vilken mån ökar risken för död
om man är av ett visst kön, tillhör en särskild social grupp, bor inom ett visst område m.m.. En av de
stora komplikationerna i sådana analyser är hantering av tid. Det kan emellertid lösas med DDB:s
material. Vad sådana analyser kräver är således att vi har en starttidpunkt för när personen kan börja
observeras och vara utsatt för risken av en händelse, och en sluttidpunkt för när antingen händelsen
sker eller om observationen upphör innan aktuell händelse inträffat. Utifrån dessa uppgifter kan vi
beräkna den tid personen varit utsatt för risken av att drabbas av händelsen. Vidare så behövs en
indikator för den händelse som ska mätas. Det kan vara död som då får sägas vara en definitiv händelse,
men det kan också vara händelser som kan upprepas, som giftermål eller barns nedkomst utifrån
föräldrars perspektiv. Denna indikatorvariabel kan också användas om personen försvinner ut innan
händelsen inträffat. Då kan variabeln ange värden för exempelvis utflyttad eller kvarlevande vid slutet
av DDB:s registrering.
Till detta kan läggas olika typer av förklarande variabler (kön, äktenskaplig börd, civilstånd, boendeort,
social ställning m.m.). Det är i detta fall viktigt att de hanteras på ett riktigt sätt så att värdena på de
förklarande variablerna är giltiga för början av observationsintervallet. I annat fall kan det helt snedvrida
analysen, om man låter uppgifter giltiga för ett senare tillfälle vara giltiga redan från startdatum.
Analysen kan också utföras med tidsberoende variabler, t ex att någon byter social ställning. Det löser
man enklast genom att dela upp personens närvaro i flera delar. När någon byter från dräng till bonde,
låter man en post i datafilen avslutas vid detta datum och med indikator på att noteringen censurerats
(posten avslutas utan att aktuell händelse skett). I stället skapas en ny post där startdatum blir datum för
byte av social ställning och där variabeln för social ställning har fått det nya värdet.
48
Motsvarande uppdelningar av närvaroperioder blir också aktuella när personer flyttar ut och in i våra
församlingar. Om vi kan följa en person från det den är 20 år till det han är 30 då han flyttar ut, leder
detta till en post. Om personen kommer tillbaka några år senare leder detta till en ny post som inleds
vid inflyttningsdatum. De enskilda posterna är således inte unika för personer i sig utan de är unika för
person och närvaroperiod. Följande figur kan användas för att illustrera hur de olika civilstånd en
person har genom livet kan användas för att dela upp den sammanlagda närvaron i olika poster. Här
låtsas vi att vi inte tar hänsyn till andra tidsberoende variabler. Händelseindikatorn (eller slutindikatorn)
används för att ange hur närvaron avslutades. Om vi skulle använda denna person för studier av
dödlighet, är det endast i sjätte posten som det sker en händelse av den art vi vill mäta. I övriga poster
avslutas närvaron genom högercensurering.
Post
Startdatum
Slutdatum
Händelseindikator
Civilstånd
1
1800
1822
Censurering (ingen händelse sker)
Ogift
2
1822
1830
Utflyttad
Gift
3
1833
1836
Censurering (ingen händelse sker)
Gift
4
1836
1839
Utflyttad
Änka
5
1841
1842
Censurering (ingen händelse sker)
Okänt
6
1842
1844
Död
Gift
Figur 1. Exempel för konstruktion av poster med tidsberoende variabler
U nkn ow n
1800
M arried
M arried
U nm arried
1822
1830
1833
M arried
W idow
1836
1839
1841
1842
1844
1800 – födelse
1822 – gifterm ål
1830 – gift v id slut av observ ation, utflyttad
1833 – gift m ed sam m a partn er som tidigare v id början av observ ation , inflyttad
1836 – partner dör
1839 – än ka v id slut av observ ation, u tflyttad
1841 – inflyttad
1842 – om gifte
1844 – gift v id slut av observ ation , död
Här ges slutligen ett exempel på hur en fil för en sådan analys skulle kunna se ut.
Exempel Forskningsfråga.
Dödlighet i Sundsvall 1860-1870.
Vi gör en fil, med alla som har någon närvaro under perioden 1860-1870.
Pnr
49




Startdatum för närvaroperiod (om personen inleder närvaron före 1 januari 1860 sätts ändå
startdatum till 1860-01-01)
Slutdatum för närvaroperiod (om personen avslutar närvaron efter 31 december 1870 sätts ändå
slutdatum till 1870-12-31)
Längd av närvaroperiod (beräknat från slutdatum-startdatum.)
Indikator för typ av slut
1. Död
2. Utflyttad
3. Censurerad 1870-12-31





4. Annan censurering (skulle kanske kunna slås ihop med 3)
Dödsorsak i klartext (för vidare bearbetning)
Födelsedatum
Kön
Civilstånd
Yrke (som underlag för egen social indelning i stora grupper)
Kommentar: Beroende på analysprogram kan tid hanteras olika. Har man ett program som klarar
vänstertrunkering, kan man låta start representeras av ålder vid startdatum och slut av ålder vid
slutdatum. SPSS kan däremot inte hantera vänstertrunkering (alltså att personer börjar observeras vid
olika ålder), varför tid kommer att hanteras som längd av närvarotid, medan den ålder som personer är i
får hanteras som förklarande variabel utifrån beräkning av ålder vid startdatum.
50
Yrken
Sören Edvinsson augusti 2007
Några allmänna principer
Demografiska databasen tillhandahåller yrken såväl i kodad som okodad form. I de flesta sammanhang
används de kodade yrkena av de beställande forskarna. Den kodning som vi tillhandahåller (den som
finns i KODYRK) innebär att vi placerar in standardiserade textsträngar i ett betydelsebärande
klassifikationssystem. Varje unikt standardiserad yrkessträng som innehåller någon form av
betydelsebärande skillnad, leder till en egen sexsiffrig kod. De två beteckningarna ”Skomakare” och
”Gårdsskomakare” får därför separata koder. I det alternativa kodningssystemet HISCO, som ännu inte
implementerats på DDB:s material, sammanförs olika beteckningar under samma kod om de kan anses
referera till samma yrke. Enligt exemplet ovan så förs båda beteckningarna till Allmänna skomakare.
Även om kodningen enligt KODYRK ingår i ett klassifikationssystem är det viktigt att komma ihåg att
placeringen många gånger är osäker. Vi vet inte om personen med titel ”Handlande” stod för en stor
eller liten verksamhet, något vi egentligen skulle behöva känna till för korrekt klassificering. Ofta saknas
nödvändig information för att finna rätt inplacering. Det är också viktigt att komma ihåg en principiell
fråga. Egentligen vill vi klassificera individer, men det klassifikationssystem vi tillhandahåller
klassificerar unika textsträngar. Det är därför nödvändigt att beställaren förstår vad de kodade yrkena
står för och att han/hon tar beslutet om hur yrkena ska klassificeras. Det är alltid möjligt att skapa egna
klassifikationssystem utifrån våra koder, eftersom de ska representera alla varianter på beteckningar, om
än i viss standardiserad form. Många eller de flesta forskare väljer att använda den fullständiga
yrkeskoden, vilket gör att de själva kan klassificera yrkena efter deras studiers behov. Alla
klassificeringssystem bör ju vara anpassade till de speciella frågeställningar och de teoretiska
utgångspunkterna som studien utgår ifrån.
Några punkter att observera
Här följer några punkter som kan vara bra att tänka på i diskussionen med beställande forskare när det
gäller utformningen av yrkesvariabeln.



”Yrkena” i KODYRK representerar inte enbart rena yrken. I många fall har vi att göra med
titlar, utbildningsgrad, förtroendeuppdrag, familjeställning, etnicitet och nationalitet osv. Vi har
för närvarande inget enkelt sätt att renodla vad som är yrken, men vi har ändå en
”skräpkategori” i de sexställiga koder som börjar på 9. I många fall kan det vara att
rekommendera att bortse från dessa. Observera emellertid att en del beteckningar ändå kan vara
av intresse för inplacering socialt, såsom de koder som rör fattiga eller födorådstagare.
Många noteringar innehåller flera yrkesbeteckningar. Om man vill göra ett urval bland dessa
yrken, måste vi utforma regler för hur de ska väljas. Man kanske väljer att bortse från alla som
börjar på 9 enligt ovan. Sen kan man välja att rakt över ta det första yrket, men man kan också
välja andra principer som att ta det ”bästa” yrket, alltså det med lägst nummer. I det senare fallet
måste man i så fall vara medveten om att man då konstant kommer att välja de med agrara
näringar först i de fall beteckningarna finns inom samma statusnivå.
Uppgifter om flera yrken i samma notering kan antingen innebära att personen innehade båda
yrkena samtidigt, såsom torpare och skomakare, men det kan också vara så att personen har
förändrat yrkesbeteckning under noteringens giltighetstid (dvs husförhörsnoteringar), t ex en
soldat som övergått till att bli torpare. I originalkällan framgår detta i allmänhet av att det äldre
51




Inplaceringen i sociala grupper är inte enbart beroende av TYKOD. I variabeln TYFD finns
värden som har betydelse för detta. Såväl skomakargesäll som skomakarlärling får koden för
skomakare i TYKOD, men med koder för gesäll respektive lärling i tyfd. I synnerhet
skomakarlärlingen kan ju inte anses som en yrkesutbildad arbetare, vilket enbart koden i
TYKOD antyder.
De två variablerna TYREL och TYAGA indikerar båda att det inte är aktuell person som
innehar det yrke som anges. Det är emellertid viktigt att särskilja de två variablerna. TYREL
indikerar beteckningar av typ Bondhustru eller Torpardotter. Vi vet vad maken respektive
fadern tillhörde för grupp även om han inte benämns uttryckligen. I TYAGA däremot är
yrkesbeteckningen angiven direkt på den aktuella personen, men att personen namnges i någon
annans notering. Vi finner detta förhållande framförallt i Födelse- och dopboken där det kan stå
”Bonden Johan Olssons och hans hustru Anna Persdotters son Olof”. Noteringen kommer att
stå på den nyfödde Olof, som då får yrkesbeteckningen bonde, men variabeln TYAGA
indikerar att det är den uppgivna fadern som egentligen hade den beteckningen. Det här gör att
vi kan behöva gå till barnens yrkesuppgifter med TYAGA>0 för att få fram samtliga angivna
yrken på en person. Det skulle i och för sig kunna förenkla om TYREL och TYAGA kunde
sammanföras, men detta skulle skapa problem när det i födelseboken skulle stå ”Bonddottern
Anna Ersdotters oäkta dotter Sara”. I det fallet behöver såväl TYREL (dotter) som TYAGA
(mors yrkesangivelse) användas.
Yrkesuppgifter anges egentligen främst för hushållsföreståndare. Gifta kvinnors eller
hemmavarande barns yrkesverksamhet är därför underrapporterad. I många fall är forskaren
heller inte ute efter yrkesverksamheten i sig. Yrkesuppgiften bildar underlag för social
inplacering. För majoriteten av individerna kommer emellertid ett sådant underlag att saknas.
En vanlig lösning är att låta hela hushållet klassificeras efter hushållsföreståndarens yrke. Regler
för hur detta ska göras måste klarläggas i diskussionen med forskaren.
Uppgifterna om yrken kommer såväl från händelsenoteringar (födelse, död, vigsel, flyttningar)
som periodnoteringar (husförhörslängder). Från händelsenoteringar vet vi att personen hade det
yrket vid det tillfället. Från händelsenoteringar vet vi att personen hade yrket någon gång under
noteringsperioden. I allmänhet brukar vi sätta det angivna yrket till hela den aktuella perioden.
Egentligen vet vi inte exakta datumet för yrkesförändringen utifrån våra källor (utom i enstaka
fall när någon övertar verksamhet som en gård t ex). De olika tidsperspektiven i olika källtyper
ger möjligheter till skilda sätt att hantera vilket yrke som väljs för en person. Ska vi prioritera
yrket från en notering som omsluter viss tidpunkt eller ska vi i stället välja det yrke som angetts
närmast denna tidpunkt? Forskare kan välja yrken utifrån en mängd skilda kriterier, såsom det
”bästa yrke” som en person haft, yrket vid giftermål, yrket vid en viss ålder (t ex 40) osv. I alla
dessa fall får forskaren förstås se upp med att inte reglerna snedvrider resultaten. För en person
som dog och flyttade ut före 30 års ålder, måste ”bästa yrke” i många fall vara förhållandevis
okvalificerat eftersom de ännu inte har haft möjlighet att göra yrkesmässig karriär eller överta
näringsverksamhet. Sådana problem ligger i den beställande forskarens ansvar att känna till,
men ibland kan man behöva påminna om denna typ av problem som lätt förbises.
Avslutningsvis måste forskaren vara med och fastställa hur reglerna ska utformas för att
bestämma yrke vid viss tidpunkt. Ska det enbart vara yrken som omsluter denna tidpunkt? I så
fall kan vi nästan aldrig använda uppgifter från händelsenoteringar. Om vi vill välja yrken från
såväl händelse- som periodnoteringar kan vi behöva bestämma vilket som ska väljas om flera
alternativ finns. Det kan göras t ex genom att ta det tidsmässigt mest närliggande, men det finn
också andra alternativ. Vi behöver antagligen ha möjlighet att välja ett yrke inom en tidsrymd
före eller efter den givna tidpunkten. Låter vi den tidsrymden bli alltför omfattande kommer det
emellertid att skapa problem för analysen. De lämpligaste metoderna bör därför bestämmas i
samråd med den beställande forskaren.
52
Forskarservicerollen
Inez Egerbladh 2007-04-23
Nedan ges några reflektioner om forskarservicerollen som komplettering till Sörens underlag.
Uppgift - specifikation av beställning
Att överföra forskares önskemål om data till objekt och variabler anpassade till de data som finns i
Popum/Tabverk och att ange operationella definitioner av objekt och variabler för att underlätta
systemerares programmering av uttaget.
Utredare skall inte förväntas handleda externa forskare i frågeställningar eller metoder. Det är uppgifter
som normalt ligger på utsedda handledare. Att ge förslag till forskningsfrågor på basis av kunskap om
intern och extern forskning (t ex via andras uttag) kan dessutom vara en etiskt känslig fråga. Det gäller
också utnyttjande av andra forskares specifikationer för uttagen. Däremot bör utredare informera om
vilka andra forskare som använder DDB’s material för snarlika frågeställningar som beställarna anger.
Handledning ges även ifråga om kyrkböckernas innehåll/innebörd och hur de kan svara mot forskares
önskemål.
Det händer – tyvärr alltför ofta - att en forskare har en ganska allmänt formulerad målsättning för sin
forskning och därför efterfrågar mängder av variabler. Då krävs att utredaren formulerar frågor som
tvingar forskaren att tydliggöra målen, så att uttaget kan bli ett relevant underlag för forskningen. Detta
gäller fr.a. forskare som har ”gratis”uttag,. De som betalar brukar vara mer förberedda, särskilt om de
har externfinansierade projekt. Å andra sidan kan betalande forskare ofta vara krävande såtillvida att de
vill maximera åtkomsten av DDB-data till låg penning. Då gäller det för utredare att begränsa
önskemålen till den kostnad forskarna är beredda att betala. Prioriteringen måste givetvis göras av
forskaren själv. Offert är därvidlag viktig! Och – vid behov – diskussion med Anders. Särskilda skäl kan
föreligga för att tillhandanhålla mer data till en relativt liten kostnad, t.ex. för doktorander utan
projektmedel, för pilotstudier som skall vara underlag för ansökningar om medel och för att stimulera
till en ökad användning av vissa data (bl.a. Tabellverket).
Måhända bör åtminstone några av utredarna ha grundläggande kunskaper i demografi (demografiska
mått) för att öka förståelsen för vissa forskares önskemål. Alla bör dock ta del av Gun Alm Stenflos
översiktliga presentation av demografiska förhållanden i Skellefteå och Sundsvallsregionen. Den är
värdefull också vid diskussioner av val av församlingar i uttagen.
Krav på utredare
Kunskap om DDB’s material – dess styrka och svagheter – och förmåga att informera forskarna härom
på ett sätt som gör det möjligt för dessa att använda DDB’s data på ett relevant sätt för sina önskemål.
Det innebär att efterfrågade variabler enligt forskares definitioner inte alltid kan tillgodoses.
Innebörden av DDB’s variabler måste klargöras och även anges tydligt i den postbeskrivning som
levereras tillsammans med datafilerna.
53
Ibland efterfrågas variabler som kräver generering av information från befintliga DDB-data, vilket
innebär att den erforderliga programmeringstiden ökar. Detta bör därför i möjligaste mån undvikas
såvida det inte finns beprövade rutiner/regler (system). Rekommendation: De externa forskare föreslås
få de variabler som behövs för att de själva skall kunna utföra genereringar. Exempel på undantag utgör
variabler som avser ålder och släktskapsrelationer.
Vi måste givetvis se till att föreslagna objekt/variabler anpassas till krav som ställs på data i de
analysverktyg som de externa forskarna avser att använda – om inte forskarna vet det själva, vilket vi
borde kunna förutsätta! Typexempel: Datumvariabler som skall se ut på ett visst sätt i SPSS och inte är
utformade som i Popum.
Oftast måste de efterfrågade variablerna uppdelas i olika datafiler. Förslag kan ges av oss, men det är
beställaren som avgör på basis av hur han/hon kommer att analysera materialet. Vissa föredrar att få
breda filer, medan andra vill ha många mindre filer för egen bearbetning innan data länkas samman för
analyserna.
DDB’s material - Befolkningsdatabasen
Jag förutsätter att alla känner till styrkan i DDB’s material /kyrkböckerna. Vi skall också förvänta oss att
de externa kunderna tar del av den info om materialen som finns t.ex. i Ulla Jeub Nilsdotters
publikation på nätet om innehållet i kyrkböckerna på svenska och engelska (Parish Records). Vid
diskussioner om objekt och variabler är det också en fördel om utredaren kan illustrera med exempel
från sql-tabellerna, vilket i sin tur kräver kunskap om hur sql-frågor formuleras. Därigenom tydliggörs
översättningen från källa till variabler i databaserna. Personligen brukar jag ytterst sällan använda Indiko
för att illustrera materialet, eftersom uttaget baseras på en upparbetad databas, användardatabas.
Det är viktigt att utredare känner till svagheterna i materialet/sql-tabellerna vid operationaliseringen av
objekt och variabler. Det innebär inte att vi skall framhäva alla svagheter för externa forskare - särskilt
inte om de kan vara konsekvenser av DDB’s inregistrering eller kodning. Alla
”petitesser/teknikaliteter” - detaljer av vikt för programmeringen - skall diskuteras mellan systemerare
och utredare, inte mellan externa forskare och utredare/systemerare. Externa forskare skall inte
förväntas känna till eller förstå alla detaljer i hur vi hanterat materialen som resulterat i de data som
finns i sql-tabellerna.
Specifikationen av objekt och variabler skall i största möjliga utsträckning vara utformad så att en
systemerare inte skall behöva ägna mängder med tid för att hantera avvikelser/
konstigheter i data. Vi kan dessutom inte förutsätta att beställaren kan hantera ”konstigheterna”, inte
ens om han eller hon granskar förekommande information i Indiko. Dylika fall kan rensas ut på ett
effektivt sätt genom att skapa en uppsättning förutsättningar eller regler. Exempel: Om det i RELtabellerna finns en dubbel uppsättning av biologiska föräldrar skall individen ifråga inte medtas i uttaget
om uppgifter om föräldrarna är av vikt. Oftast handlar det om ett blygsamt bortfall av PNR.
En katalog bör upprättas med de samlade erfarenheterna från forskare och systemerare för att
underlätta specifikationer med beaktande av problem vid definiering av objekt och variabler. Observera
att alla tänkbara ”konstigheter” inte behöver diskuteras med de externa forskarna. Det kan skapa en
bild av att DDB’s data är undermåliga.
54
Vidare, en katalog bör skapas där systemerarnas regler eller ”standard-”/ ”rutin”lösningar för att
hantera variabler finns samlade. Det är till gagn för såväl utredare som systemerare så att samma
efterfrågade variabel inte hanteras på olika sätt beroende på DDB-person.
”Svagheter” i materialen som måste beaktas
Nedan anges några exempel som delvis berörts av Sören!
Beakta att problemens omfattning varierar i tid och rum. Generellt bör exempelvis husförhörslängderna
från 1700-talet användas med försiktighet, och de specifika problem som uppstår när hela eller delar av
husförhörslängdsvolymer saknas måste identifieras (t ex när data baserats på mantalslängder och
folkräkningar eller annat material).
- Befolkning närvarande i församling vid viss tidpunkt eller ”population at risk”
Vanligen används uppgifter ur boendetabellen på ortnivå (BOORT) för att definiera närvarande befolkning i församlingen vid en viss tidpunkt. Men närvaro enligt BOBDAT-BOSDAT kan existera i
boendetabellen även om individen inte är närvarande enligt källans uppgifter i rubriker. Ett klassiskt är
exempel är rubriken OBEFINTLIGA (ortkod 999). De är alltså inte en del av den närvarande
befolkningen. Men observera att det finns även andra koder som visar att de antingen inte är
närvarande eller att de är skrivna i annan församling (se koderna för ORT och SUBORT)! Vi kan heller
inte förutsätta att alla som har OKÄND ORT finns i församlingen. Så kan exempelvis individer listade
som obefintliga 1860 ff tidigare ha redovisats som boende på okänd ort.
Nolldatum i BOBDAT och/eller BOSDAT i en post komplicerar bedömningen av närvarande
befolkning. Kräver egentligen beaktande av datum och in/uttyper i föregående respektive efterföljande
poster. Observera också att samma årtal utan uppgifter om månad och dag (xxxx0000) kan förekomma
i flera poster; inte bara som BOSDAT i en post och BOBDAT i nästa post utan även i BOBDAT och
BOSDAT i samma post och dessutom som BOBDAT i nästa post alternativt som BOSDAT i
föregående post.
Hur dessa problem skall hanteras måste avgöras av beställaren. Oftast måste dock utredaren ange
alternativa förslag.
OBS I popum3 har noll-datum i sista boendepostens bosdat ersatts av skapade värden i PERSONtabellens frsbosdat. Beakta hur detta datum genererats!
Ofullständiga datum
Dylika förekommer i stort sett i alla datumvariabler, även för demografiska händelser och skapar
problem vid beräkning av tex ålder och närvarotider. Ofta brukar 0000 i månad-dag schablonmässigt
ersättas av 0630 men den principen kan ibland skapa problem i närvarotider i form av överlappningar,
särskilt då närvarotiderna skall finnas för relaterade individer.
Yrke
Yrke vid viss tidpunkt är ofta efterfrågat. Problem: Uppgifter saknas i YRKE-tabellen vid berörd
tidpunkt. Ett vanligt förfaringssätt är att söka efter yrkesuppgifter vid tidigare eller senare tidpunkt.
Beställaren skall då bestämma hur lång tid före/efter som är relevant. Observera att det för fr.a.män
oftast finns yrken noterade på barnens födelseposter! Det är ett gammalt önskemål att komplettera
55
yrke-tabellen med uppgifterna som föräldrar från födelse- och dopböckerna för att slippa söka via reltabellen (barnen) och yrke-tabellen för alla barn.
Beakta också innebörden av yrkeskoderna när ”bästa” yrke efterfrågas. Om man endast väljer lägsta
kod kommer exempelvis jordbruksyrken att prioriteras framför andra näringar.
Beakta förekomsten av implicita yrken. I rubriker förekommer ibland yrken, t ex tjänstefolk, arbetare
vid xx . De bör ha införts även på individnivå vid inregistrering åtminstone i de gamla
församlingarna/regionerna, men jag vet inte hur fallet är i NIL. Vidare, uppgifter om bönder när yrke
saknas och endast data om jordbruksfastighetsinnehav finns (hemmansnummer/mantal) har införts i en
särskild tabell för SKE-regionen.
Ibland efterfrågas HISCO-koderna som komplement. De finns i nu-läget inte tillgängliga i Popum!
Flyttningar
Intyp/uttyp med värdet 0 i LANK genererar flyttningar med flyttningsklass 9. Men det handlar inte
alltid om flyttningar.
Exempel: En del av den sista hf-volymen för Skellefteå saknas (Kågedalen). Individerna har uttyp 0 i
föregående hf, såvida inte senare händelser har identifierats. Med de är alltså inte utflyttade. Ett annat
exempel är generering av flera flyttningsposter när överlappningar tidsmässigt finns i källorna vid
förändringar i församlingen som i fallet Ytterstfors och Byske.
Å andra sidan finns flyttningar till annan församling noterade för individer som berörts av
administrativa förändringar i församlingar inom regionerna. De har alltså inte flyttat. En särskild kod
för uttyp har tidigare föreslagits (men inte tillämpats). Företeelsen finns i både SKE och SUL.
OBS In- och utflyttningsförsamlingar saknas när luckor finns i hf och flyttningslängder saknas. Det
skapar problem fr.a. i SUL, t.ex. Svartvik.
Beakta att flyttningar mellan orter genererats när individer i ort i en hfvolym återfinns i annan ort i nästa
hf; dvs uttyp respektive intyp = 1. Datum för flyttningen är då relaterat till volymåret; något annat kan
ju inte anges.
Lägesbestämda data
Koordinatdata finns i särskilda sql-tabeller. Punktkoordinater finns för orter i SKE och SUL regionerna
och för boställen i Locknevi (svårhanterade pga problem i länk mellan rad i hf och boställe). Vidare
finns någonstans filer med uppgifter om boställen i vissa församlingar i Linköpingregionen.
Även församlingarna har koordinatdata. Punktkoordinater från SCB, som avser kyrkans läge i
församlingen enligt förekomst under senare delen av 1900-talet, är länkade till dedik-koden (se dediktabellen). Tidsbestämda polygondata – församlingsgränser – finns via NAD för
landsbygdsförsamlingarna. I tabellen NADLANK finner du kopplingen till den kod som församlingen
har i publikationen om Sveriges församlingar genom tiderna. Här har också 0-datum i underlaget NAD
ersatts av relevanta datum. Däremot är länken mellan dedik-koden till RSVkoden och NADkoden inte
säkerställd. Ett embryo finns, men den tabellen innehåller fel och är inte komplett.
Dessutom finns koordinatdata för gränser, större vattendrag och större vägar på 1800-talet i SKE och
SUL.
56
Underlag för beräkning av avstånd mellan orter
Lägesbestämda data på ortnivå finns för SKE och SUL i särskilda sql-tabeller. Observera att
koordinaterna anges för suborter (subort xxx00 avser ort) i SKE men för ort i SUL. I enstaka fall
saknas koordinater eftersom orten inte kunnat lokaliseras; den kan t.ex ha ödelagts på ett relativt tidigt
stadium. En annan orsak är att individerna inte har uppgifter om boende; det gäller i församlingar där
luckor i hf kompletterats med data från folkräkningar och mantalslängder.
Koordinaterna x och y anges i sql-tabellerna med en alltför hög detaljeringsgrad för att vara relevant.
Tänk på att fyra siffror visar kilometernivån - avstånd från ekvatorn och nollmeridianen – vilket är den
mest efterfrågade nivån. Beställaren bör alltså ange nivå när avståndsvariabler efterfrågas.
För övrigt, beakta att individernas boendeort endast baserats på husförhörslängderna hitintills.
Kompletterande uppgifter kan finnas i de andra källorna.
Dito avstånd mellan församlingar
Koordinater för församlingar återfinns i en särskild tabell (SCB-data). De avser kyrkans läge i
församlingen. Men i DDB-data anges ofta städer som destination. För att få avstånd från en församling
till en stad (t ex Stockholm) måste därför en församling i staden väljas. Uppgifter om städernas
församlingar finns publicerade länsvis 1860 ff (sammanställningar ur folkräkningar).
Boende - SUBORT
Observera att i tabellen xxxBOENDE finns uppgifter om boende på de suborter som källan angivit,
men också på orten om suborter inte finns. I sistnämnda fall har koderna 00 i de sista positionerna.
Eftersom företeelsen suborter förekommer osystematiskt över tiden, bär tabellen endast användas om
man är ute att fånga befolkningen redovisad tex på vissa industrier eller när man vill veta av vilken
anledning en individ har en okänd boendeort
Den sporadiska företeelsen innebär också att uppgifterna inte beaktats vid generandet av flyttningar i
volymskarvar (vilket gjorts i fallet byte av bostadsort).
Boende – BOFRS
De data som finns i Popum3 för Skellefteå i tabellerna BOORT och BOENDE är konstruerade från
ortkoderna som speglar läget efter alla utbrytningar av församlingar av den ursprungliga Skellefteå
landsförsamling; dvs här anges en boendeförsamling som ofta inte är den församling från vilka
källuppgifterna hämtats (NOFRS).
Etnicitet
I nuvarande ANM finns uppgifter om etnicitet. Jag vill uppmärksamma alla att uppgifter även finns i
rubriker i hf, inte minst i NIL (t ex lappar, ryssar) Dessutom finns lappar i särskilda hf-volymer i
åtminstone GEL.
57
Några erfarenheter från forskaruttag
Carin Hedlund 2007-08-30
Kunden ska vara delaktig i alla beslut för att fastställa regler och för hanteringen av materialet. Vi kan ta
fram underlag och dokumentation som underlättar detta arbete och tillsammans diskutera fram hur
forskarens frågeställning kan besvaras med information från vårt material i en specifikation. Där ska
även regler för att generera nya variabler ingå. Att sätta en ’flagg-’-variabel när en variabel är uppdaterad
kan vara lämpligt.
Ofullständiga datum
Då många datum är ofullständiga kan det ställa till med problem eftersom vissa analysprogram kräver
ett fullständigt datum.
Ibland är forskaren endast intresserad av årtalet, men för att analysera krävs ett fullständigt datum. Då
kan mer generella regler gälla för att uppdatera datumet.
I andra fall är det viktigt för forskaren att kunna ’ringa in’ en händelse under året. För att fastställa
kronologin är det då viktigt att reglerna för att generera fullständigt datum tar hänsyn till samtliga
händelser under det aktuella året eller åren. Kronologin mellan händelserna framgår av
noteringsnummer (NONR) på de respektive noteringarna. Husförhörsländen sträcker sig dock över en
längre period och respektive källas noteringdatum har högre prioritet än motsvarande händelse noterad
i husförhörslängden.
I uttaget kan det vara lämpligt att både ta med det källtrogna datumet och det uppdatera datumet samt
bifoga statistik för samtliga datum i uttaget. Där anges för varje datum andelen fullständiga, andelen där
endast månad uppdaterats, endast dag och där både månad och dag uppdaterats. Forskaren har då
möjlighet att själv bestämma vilket datum som ska användas, dra konsekvenser av de uppdateringar
som gjorts eller att själv skapa nya regler för att uppdatera de ofullständiga datumen.
Familjestorlek
Att fastställa en familjs storlek vid en viss tidpunkt utifrån informationen från en sida i
husförhörslängden.
Problem finns då flera av datum är ofullständiga, några kan sakna datum och det är svårt att avgöra när
individerna finns där samtidigt.
Ett annat problem är vilka individer som ska räknas in i familjen. Överst i hushållet finns husbonden
med sin familj, därefter andra släktingar t ex far- och morföräldrar, allra längst ner på sidan
tjänstefolket. Ska samtliga i hushållet räknas in i familjen eller ska de betraktas som olika familjer?
En individ kan ingå som barn i familjen men under husförhörsperioden bilda egen familj och flytta
längre ner på samma sida. Vid omflyttningar anges ofta endast årtalet och om individen bildat ny familj
på sidan kan vigseldatum, inflyttad partners inflyttningsdatum eller eget barns födelsedatum användas
som underlag för att fastställa de olika familjernas tidsperioder.
En son kan även under husförhörsperioden bo kvar på samma ställe men överta huvudmannaskapet
(husbonde) för hushållet.
Släktingar kan även ingå i hushållet som tjänstefolk. I enstaka fall kan även fosterbarn, tjänstefolk och
inhyses vara skrivna i hushållet på rader mellan kärnfamiljens medlemmar eftersom husförhörslängden
sträcker sig över en längre period och nyfödda barn skrivs in på lediga rader längre ner.
Små barn kan sakna egna husförhörsnoteringar. Prästen kanske inte skrev in dem direkt vid födelsen.
Barnets närvaro i församlingen och i familjen kan då genereras från biologiska moders närvaro, om hon
58
finns närvarande när barnet föds. Hur lång tid det kan ta innan prästen för in barnet tillsammans med
familjen kan variera mellan församlingarna, men även mellan prästerna och ibland skriver prästen in
barnet när en ny husförhörsvolym startar. Hur länge barnets närvaro ska genereras från moderns
närvaro diskuteras och bestäms tillsammans med beställaren.
Ska vuxna barn som finns på sidan räknas in i familjen eller betraktas som en egen familj, är sådant som
måste bestämmas tillsammans med forskaren. Även vid vilken ålder kan man betraktas som vuxen.
Utifrån relationstabellen kan olika relationer fastställas, men där anges inga relationstider, utan dessa
kan beräknas från boende via husförhörssida, födelsedatum (eget och biologiskt barns), dödsdatum,
flyttningar och vigseldatum. Ska samtliga barn tas med i familjen, biologiska barn, styv- och fosterbarn
och ska de uteslutas efter en viss ålder?.
En individ kan inte tillhöra två familjer samtidigt även om han/hon finns skriven på samma
husförhörssida men på olika rader.
För att räknas till samma familj krävs ofta att familjemedlemmarna har en relation till varandra, dvs.
finnas i tabellen REL. Att de ska bo tillsammans vid en viss tidpunkt, dvs. finnas i samma
husförhörsvolym, samma sida och på raderna under varandra, så att ingen individ som inte ingår i
familjen finns skriven mellan familjemedlemmarna. En relaterad person kan finnas skriven under denna
individ, eftersom personen som därefter finns skriven kan ha bildat en ny egen familj. Även
tidsperioderna för familjemedlemmarna ska samtliga ha ett startdatum på sin notering som är före eller
lika med den aktuella tidpunkten och ett slutdatum som ligger efter eller är lika med den aktuella
tidpunkten.
Relationer
Fosterrelationer inregistreras endast till fosterfar. Vem som är fostermor vid en viss tidpunkt måste då
fastställa utifrån den kvinna som mannen är gift med vid denna tidpunkt. Samma barn kan därför ha
flera olika fosterrelationer till familjemedlemmarna under en husförhörsperiod om någon av
fosterföräldrarna dör och den andre gifter om sig.
Ett annat problem är barnbarn som bor hos sina morföräldrar sedan födelse och fått relationen barn till
dessa. Dessa barn har då ofta två mödrar, i vissa fall är morfar den enda fadern. Barnets egen mor blir
även då syster till barnet och moderns syskon blir både syskon och moster och moster till barnet. Det
är inte många fall men de ställer till problem vid uttagen och kontrollerna.
Flyttning
För en individ som inte är skriven i församlingen, men som dör där, skapas en flyttningsnotering.
För individer som tar ut flyttningsbetyg men aldrig flyttar, skrivs in som utflyttade och sedan som
återflyttade.
Flyttningsförsamling för samma flyttning kan vara olika i husförhörslängden och i flyttningslängden. I
husförhörslängden anges t.ex. att individen flyttat till Stockholm men i flyttningslängden anges en
specifik församling i Stockholm.
Det finns även fall där flyttningen endast är noterad i antingen flyttningslängden eller i
husförhörslängden. Flyttningar inom församlingen förs endast i husförhörslängden. Vissa problem
uppstår när församlingar delas (administrativa flyttningar) som sker fram för allt i Skellefteå.
Flyttningar med flyttningsförsamling 99992, 99993 eller 99997 bör ej tas med bland flyttningarna.
För församlingarna, regionerna i tidigare version av Popum genererades flyttningsuppgifter för samtliga
personer i flyttgruppen i flyttningslängden. Därefter har en FLYTT-tabell genererats där samtliga
flyttningar både från husförhörslängden och från flyttningslängden ingår och sammanförts. För LINoch NIL-regionerna har endast huvudmannen för flyttningen uppgifterna, de övriga i gruppen saknar
dessa uppgifter i flyttningslängden. Uppgift kan finnas i husförhörslängden och flyttningsgruppen för
59
familjemedlemmar kan fastställas utifrån dessa uppgifter; relaterade familjemedlemmar som står skrivna
tillsammans i husförhörslängden med samma flyttningsuppgifter. Tabellen FLYTT har ej genererats för
LIN- och NIL-regionerna.
Attester
För händelser som skett i annan församling än hemförsamlingen skickas attester om detta mellan
församlingarna. Information om detta kan hittas i anmärkningarna. Ex. efter anmärkningskoden HAG
finns uppgift om lysning och vigsel.
Etnicitet
Eftersom det är omöjligt att fastställa säkert vem som är same eller ej överlämnas det till forskaren. Som
underlag kan olika indikatorer tas fram som forskaren kan ha till hjälp för att fastställa etnicitet.
Några sådan indikatorer är
-
Samiska släktnamn. En tabell med samiska släktnamn har tagits fram av Peter Sköld, Gabriella
Nordin och Per Axelsson. DDB har gjort en överenskommelse med dem att om att andra
forskare får tillgång denna tabell om de anger dem som källa samt att vi informerar Peter, Per
och Gabriella när andra forskare vill använda deras material.
-
Yrken med uppgift om ’lapp’ , ’rennäring’ etc. En yrkestabell med samiska yrkesbeteckningar
har tagits fram
-
Orter och boställen som i rubriken på husförhörslängdsidan anger att det är lappar som är
skrivna där. Även tabell över samiska boställen har tagits fram av Peter Sköld, Gabriella Nordin
och Per Axelsson. DDB har gjort en överenskommelse med dem att om att andra forskare får
tillgång denna tabell om de anger dem som källa samt att vi informerar Peter, Per och Gabriella
när andra forskare vill använda deras material.
-
Anmärkningstexter som innehåller uppgift om ’lapp’, ’renar’ etc
-
Dödsorsaker med uppgifter om ’lapp’ och ’renar’.
-
Släktskap, någon av individens barn, far eller mor har uppgift om ’lapp’.
För varje sådan indikator sätts en flagga med värde 1 (uppgift finns) eller 0 (uppgift saknas). Utifrån
dessa flaggor och övriga information kan forskaren själv försöka bedöma vilken etnicitet som individen
ska ha.
Se dokument Information om indikatorer, Carin Hedlund 2008-08-08.
Närvaro för små barn
Barn skrivs inte alltid in i husförhörslängden när de föds utan det kan ta flera år innan de förs in i
husförhörslängden. Dessa barns närvaro brukar då fastställas från den biologiska modern, om hon
finns skriven i husförhörslängden vid barnets födelse och barnet är noterad i födelse- och dopboken.
Om modern flyttar ut från församlingen innan barnet hinner skrivas in i husförhörslängden och barnet
saknar egna noteringar om flyttning eller död, kan man påföra barnet moderns flyttningsuppgifter.
Hur lång tid det kan ta innan prästen för in barnet tillsammans med familjen kan variera mellan
församlingarna, men även mellan prästerna. Ibland skriver prästen in barnet först när en ny
husförhörsvolym startar.
Hur länge barnets närvaro ska genereras från moderns närvaro diskuteras och bestäms tillsammans med
beställaren
60
Födelse- och dop i Skellefteå
Vissa FD-böcker var i dåligt skick att de inte inregistrerades utan istället ’återskapades’ de från
Familjeregistret, (Ljungs register) som täcker perioden 1699-1859, varför endast de barn som överlevt
viss ålder finns med i de konstruerade FD-böckerna. Familjeregistret är rekonstruerat från
husförhörslängderna för perioden 11699-1850. I ett senare skede har man inregistrerat de ursprungliga
FD-böckerna för perioden 1800-1859, de tidigare perioderna saknas. Vid denna inregistrering tog
endast tagit de barn med, som inte fanns med i Familjeregistret. De flesta av dessa barn är dödfödda
eller har dött tidigt. Ett problem är tvillingar, då den ena dött tidigt och den andra överlevt och finns
med i den konstruerade FD-volymen. Dessa tvillingar har då olika källhänvisningar. I den konstruerade
volymen saknas även uppgifter om dopet, diverse anmärkningar mm.
De konstruerade FD-volymerna löper inte över samma år som de ursprungliga FD-volymerna. I vol 52
är några av barnen på sidorna 45 och 209 skrivna som anmärkning. I vol 53 finns vissa sidor i slutet
med barns om saknas i FD men som har uppgift i HL. I vol 54 saknas ofta datum. Barn på sidan 133 är
inskrivna 1851 men är födda 1852.
Rekonstruerade: Vol 52 1826-1842, vol 53 1843-1850, vol 54 1851-1859
Inregistrerade kompletteringar: C:9 1831-1847, C:10 1840-1847, C:11 1848-1859
Yrken
Det kan finnas flera yrkesuppgifter på en och samma notering, yrke kan saknas för en viss tidpunkt
men finns vid andra tidpunkter, individen kan helt sakna egna yrken men har på sin egen notering
uppgift om relaterade personers yrken.
Några vanliga sätt att lösa detta är:

Med bästa yrke avses det yrke som har den lägsta koden. Väljs ofta om flera yrken finns på den
aktuella noteringen.

Endast riktiga yrken tas med, ej titlar etc. Endast yrken inom följande intervall betraktas som
yrken; 110000≤TYKOD≤699999 och 994000≤TYKOD≤994999.

För vuxna män, > 19 år, ska endast egna yrken tas med, YRKEAGA = 0 och TYREL = 0.

För vuxna ogifta kvinnor, > 19 år, väljs yrket med följande prioriterings ordning
o kvinnans egen yrkesnotering med YRKEAGA = 0 och TYREL = 0
o fars yrke från kvinnans notering YRKAGA =1 och.TYREL = 0
o faderns yrkesnotering med YRKEAGA=0 och TYREL = 0.

För gifta kvinnor väljs yrket med följande prioritering
o från kvinnans egen yrkesnotering med YRKEAGA = 3 (partners yrke)
o från partners yrkesnotering YRKEAGA=0, om de är gifta vid aktuellt datum.

För barn, individer < 20 år tas yrkesuppgift
o från barnets notering eget yrke vid aktuellt datum, YRKEAGA=0
och TYREL = 0.
o från barnets notering, fars yrke vid aktuellt datum, YRKEAGA=1.
o från barnets notering, mors yrke vid aktuellt datum, YRKEAGA =2.
o från biologiska faderns notering för den aktuella närvaroperioden YRKEAGA=0,
RTYP=1 och RBES<2
61
o från foster/styvfars yrke för den aktuella närvaroperioden om biologisk far saknas
RTYP=1, RBES2,3. Foster/styvfar skall finnas på samma husförhörssida som barnet.
Vid den aktuella tidpunkten
o från mors egna yrke vid denna närvaroperiod från moderns notering, RTYP=2 och
RBES<2.

För vuxna individer som har egna barn kan ytterligare yrkesuppgifter hämtas från barnets FDnotering, RTYP = 4-6, RBES = 1 och YRKEAGA = 1-2.
Källor som saknas
Vissa församlingar saknar för vissa perioder någon eller några av källorna. Exempel är Galtström som
har mantalsregister 1846-62 istället för husförhörslängder, Svartvik som saknar flyttningar helt och för
de andra källorna hämtas information från SCB vart 10:e år mellan 1860-95.
I Skellefteå är materialet bränt varför vissa variabler kan sakna information från vissa sidor och många
datum saknas helt eller är ofullständiga. Dessa problem framgår delvis av den sammanställning som
finns under avsnittet ’Översikt över inregistrerat kyrkoboksmaterial och perioder’.
Närvaro saknas på sågverksort
Det finns problem med hur befolkningen har förts i husförhörslängderna för vissa av sågverksorterna i
Sundsvallsregionen. Svartvik blev egen församling först 1860 och - 1900, ingick tidigare i Njurunda. I
Svartvik församling finns endast orten Svartvik, ortkod 1. I Njurunda finns Svartvik som ort, med
ortkod 70, mellan åren 1850 – 1853, 1879 – 1881, 1889 – 1890, men saknas 1854 – 1878, 1882 – 1888.
Merparten av de 32 sågverksorterna i Sundsvallsregionen visar att husförhörslängder tillkommit i
samband med sågverkens tillkomst. De år som sågverksorterna saknar egen befolkning har prästerna
fört befolkningen till de tillhörande byarna i församlingen.
Sågverksort och tillhörande by
Alnö:
FRÖST med Myrnäset
BÖHLE med Strand
ÖDE med Alvik
NYSÄTER med Nyvik
RÖDE med Rödestrand
HOFVID med Johannesvik
JERVIK med Eriksdal
NÄSET med Stornäset
Njurunda:
ÄNGOM med Klampenborg
ESSVIKEN med Essvik
Skön:
TUNABÄCK med Ortviken
62
Dubbel närvaro
Det kan förekomma dubbel närvaro i två församlingar i Sundsvallsregionen (Skön och Sundsvall) och i
Skellefteåregionen (där församlingar delats). I Skellefteåregionen är dock ortkoden unika, oberoende av
vilken av Skellefteåförsamlingarna som den för tillfället tillhör. Individerna finns i två parallella
husförhörslängder samtidigt under en viss period, de har inte skrivits ut från den ena längden när
närvaron startar i den nya husförhörslängden.
Hushållsproblem
I Skellefteå på 1700-talet sträcker sig husförhörslängden över långa tidsperioder varför makarna inte
alltid var skrivna tillsammans. Först när ny volym togs i bruk skrevs hustrun och ev. barn in
tillsammans med mannen, trots att de troligen bott tillsammans hela tiden. Kan ställa till med problem
när familj och hushåll ska tas fram. Bör därför inte göra uttag på Skellefteå före 1801.
Volymskarvar
Volymskarvar mellan två husförhörslängder. Om individen är omskriven mellan två volymer anges
endast årtalet för start och slut. Två olika förfaringssätt finns.
Volymen slutar samma år som nästa volym startar dvs. slutdatum 18570000 i ena volymen och
startdatum 1857 i nästa volym. Här är det viktigt att individen inte får dubbel närvaro under året.
En konstlad ’lucka’ i närvaron kan uppstå om den ena volymen slutar 18570000 och nästa volym startar
18580000.
63
Offert, Prislistor och debiteringsunderlag
För större uttag utarbetar utredaren och forskarserviceansvarig en offert till kunden i samråd med
platschefen i Umeå, med ”grovspecifikationen” som underlag. För mindre uttag anges ett
kostnadsförslag på annat sätt. Den färdiga offerten skickas i två exemplar av utredaren till kunden
för godkännande och underskrift. Med offerten biläggs specifikationen och avtal, som anger på
vilket sätt DDB:s material får utnyttjas. Befintliga mallar för offert och avtal skall användas.
Kunden återsänder godkänd offert och avtal. Om kunden inte är beredd att acceptera offerten, kan
ny specifikation och offert omformas till den kostnad kunden är beredd att betala.
Platschefen i Umeå godkänner offerten genom sitt undertecknande av densamma. Ett exemplar
återsänds till kunden. Det andra exemplaret lämnas till administration för arkivering. Kopia av
offerten ska lämnas till forskarserviceransvarig.
Mallar för offert
Mallar finns för offert på svenska och på engelska. Se avsnittet ’Dokument och mallar’.
Debitering för uttag ur Popum
Uttag offereras kostnadsfritt efter det att kunden tagit kontakt med utvecklingsvdelningen och
beställningen diskuterats och specificerats. Personalchefen i Umeå tar fram offert i samråd med
utredare. Följande priser tjänar som riktlinje:
Upp till 16 timmars programmering
Upp till 40 timmars programmering
Upp till 80 timmars programmering
Därutöver 490 kr/tim
3 000 kr
6 000 kr
12 000 kr
även Miniuttagen
För konsultation, framtagande av specifikation samt kontroller och tester av datafiler före leverans
debiteras 600 kr/tim, 20 timmar avsätts kostnadsfritt för kunden.
Debitering för uttag ur Tabellverket
För Tabellverket och andra aggregerade material beräknas kostnaden utifrån uttagets omfattning
och struktur.
64
Gästforskarpolicy
Gästforskare vid CBS erbjuds ett kostnadsfritt uttag som motsvarar 160 timmar systemerar tid och 40
timmar utredartid samt att 40 timmar avsätts av forskare vid besöket.
Litteratur
Lämplig litteratur:
Källbeskrivningarna för respektive församling
Nilsdotter Jeub, Ulla : Parish Records. 19th Century Ecclesiastical Registers. Umeå 1993
Alm Stenflo, Gun: Demographic description of the Skellefteå and Sundsvall regions during the 19th century. Umeå
1994.
Kundadministration
Kort beskrivning av systemet kommer att läggas in när systemet är helt klart.
65