Genetische Assoziationsstudien
Transcription
Genetische Assoziationsstudien
Genetische Assoziationsstudien Franziska Ideler Fakultät Statistik Technische Universität Dortmund 15. Oktober 2012 Franziska Ideler 1/62 Überblick Einleitung Grundlegende Begrie Verschiedene Studientypen und Abgrenzungen Statistische Methoden, Programmpakete und Befehle Datenmaterial und Fragestellung Statistische Auswertung Zusammenfassung Literaturverzeichnis Franziska Ideler 2/62 Was sind Assoziationsstudien? Sie überprüfen, ob ein Merkmal (wie zum Beispiel eine Krankheit) von einer bestimmten Variation der Gene innerhalb des menschlichen Genoms abhängt. Gen: "Ein Gen ist die physikalische und funktionelle Einheit der Vererbung." (Wrba et al, S. 169) Genom: "Das Genom des Menschen ist die genetische Gesamtinformation eines einzelnen Menschen" (Wrba et al, S. 168) Franziska Ideler Einleitung 3/62 Exkurs: Grundlegende Begrie der Genetik Genotyp: Der Genotyp umfasst die komplette genetische Ausstattung. Dies ist der Satz von Genen, den die Zellen im Zellkern tragen (vgl. Wrba et al, S. 169). DNA: Ist die Abkürzung für Desoxyribonukleinsäuren, welche aus Basenpaaren besteht. Diese macht den genetischen Code aus (vgl. Murken at al, S. 3 ). Basenpaare: Die vorkommenden Basenpaare sind Adenin (A), Guanin (G), Thymin (T) und Cytosin (C). Franziska Ideler Einleitung 4/62 Exkurs: Grundlegende Begrie der Genetik SNP: Ist die Abkürzung für "Single Nucleotide Polymorphism" (einzelner Nukleotid Polymorphismus) und bezeichnet den Unterschied von einzelnen Basenpaaren in einem DNA-Strang. Sie lassen sich einfach bestimmen und sind somit bei der Verwendung in Assoziationsstudien gut geeignet (vgl. Wrba et al S. 151). Franziska Ideler Einleitung 5/62 Vier verschiedene Typen Es gibt vier verschiedene Studientypen: I Kandidaten-Gen-Studien I Kandidaten-Polymorphismus-Studien I ne mapping studies I Genom-weite Assoziationsstudien (GWAS) Franziska Ideler Einleitung 6/62 Kandidaten-Polymorphismus-Studien I I I es besteht a priori Hypothese über Funktion des SNPs baut auf vorherige wissenschaftliche Untersuchungen, die andeuten, dass der oder die zu untersuchenden SNPs mit einem Merkmal (einer Krankheit) zusammenhängen. Ziel ist zu entscheiden, ob SNP Merkmal beeinusst. (vgl. Foulkes (2009), S. 2) Franziska Ideler Einleitung 7/62 Kandidaten-Gen-Studien I I I I Es werden einzelne SNPs innerhalb bestimmter Gene betrachtet. Auswahl der SNPs mit Hilfe des Linkage Disequilibrium (LD) exakter Ort der zu untersuchenden Genvariation nicht bekannt, also werden nahegelegene SNPs untersucht Diese SNPs werden als Marker bezeichnet. (vgl. Foulkes (2009), S. 2) Franziska Ideler Einleitung 8/62 ne mapping studies I I unterscheiden sich von den beiden Kandidaten-Studien Ziel ist es die exakte Lokalisation der Genvariante, welche das Merkmal verursacht, zu bestimmen. (vgl. Foulkes (2009), S. 3) Franziska Ideler Einleitung 9/62 Genom-weite Assoziationsstudien (GWAS) I I I I ähneln Kandidaten-Gen-Studien Unterschied: es wird eine wesentlich höhere Anzahl an SNPs untersucht sehr umfangreich; hoher Rechenaufwand ersetzen Kandidaten-Gen-Studien aber nicht; diese liefern genauere Ergebnisse (vgl. Foulkes (2009), S. 3 f) Franziska Ideler Einleitung 10/62 Abgrenzungen Genotyp und Genexpression I I I I Wissenschaftliche Erkenntnisse über Genotyp und Genexpression gehen in die selbe Richtung. Aber: In Assoziationsstudien wird ausschlieÿlich der Genotyp untersucht. Genotyp: exakte genetische Ausstattung (vgl. Wrba et al, S. 169) Genexpression: Vorgang durch den die in den Genen vorliegende Information umgesetzt und wirksam wird (vgl. Wrba et al, S. 72) (vgl. Foulkes (2009), S. 4 f) Franziska Ideler Einleitung 11/62 Abgrenzugnen Populations- und Familien-basierte Untersuchungen I I I Familien-basierte Untersuchungen: Gene der einzelnen Individuen sind untereinander korreliert Populations-basierte Untersuchungen: im Idealfall keine Korrelation Für Assoziationsstudien werden nur Populations-basierte Untersuchungen verwendet. (vgl. Foulkes (2009), S. 6 f) Franziska Ideler Einleitung 12/62 Abgrenzungen Assoziationen und Populationsgenetik I I Populationsgenetik beschäftigt sich mit der Veränderung des Genpools einer Population. Assoziationsstudien haben das Ziel Zusammenhänge aufzudecken. (vgl. Foulkes (2009), S. 7) Franziska Ideler Einleitung 13/62 Statistische Methoden, Programmpakete und Befehle Franziska Ideler Statistische Methoden, Programmpakete und Befehle 14/62 Notationen Gegeben sei ein Stichprobenumfang von n Individuen bei denen Genotypen von p SNPs sowie m Covariablen untersucht wurden. Dann I I I steht yi für das i te Individuum unter Beobachtung mit i = 1, . . . , n . ist xij die Ausprägung (des Genotyps) des i ten Individuums für den j -ten SNP mit i = 1, . . . , n und j = 1, . . . , p . wird mit zik die Ausprägung der k -ten Covariable für das i -te Individuum angegeben, wobei i = 1, . . . , n und i = k , . . . , m. (vgl. Foulkes (2009), S. 30) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 15/62 Notationen I Fettgedruckte römische Buchstaben stehen für Vektoren: I I I I x = (x1 , . . . , xn )T xj = (x1j , . . . , xnj )T Groÿe römische Buchstaben drücken Matrizen aus: n ×p . X = (x1 , . . . , xp ) ∈ R Griechische Buchstaben wie α, β, γ stehen für Modellparameter bei einer Schätzung. (vgl. Foulkes (2009), S. 30) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 16/62 Notationen für Genotypen I I I I Der Genotyp des j -ten SNPs bei dem i ten Individuum ist dargestellt durch xij . Ein SNP wird durch ein Basenpaar (Basen: A, C, G, T) repräsentiert. Die seltenere Base wird einem kleinen Buchstaben zugeordnet, die häugere einem groÿen. Mögliche Ausprägungen des Genotyps: AA, Aa, aa (vgl. Foulkes (2009), S. 30) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 17/62 Paket Genetics I Paket zum Umgang mit genetischem Datenmaterial I zu laden durch library(genetics) I einfaches Erzeugen von absoluten und relativen Häugkeiten der Genotypen I dazu: genotype(daten, sep="") I daten: eindimensionaler Vektor mit Auistung von Genotypen (vgl. Foulkes (2009), S. 22) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 18/62 Violinplot I Möglichkeit zur graphischen Darstellung univariater Daten I "Weiterentwicklung" eines Boxplots I nutzt die Dichtefunktion I Name: Form erinnert an Violine I in R laden durch: library("vioplot") (vgl. Sarkar (2008), S. 47 sowie Kampstra (2008), S. 2) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 19/62 Einschub: Kerndichtefunktion Figure : Kerndichtefunktion set.seed(123) BSP <- c(rnorm(15,0,5)) bsp <- c(15,BSP,rep(-5,3)) [1] 15.0000000 -2.8023782 -1.1508874 7.7935416 [9] -6.3253062 -3.4342643 -2.2283099 6.1204090 [17] -5.0000000 -5.0000000 -5.0000000 Franziska Ideler 0.3525420 1.7990691 0.6464387 2.0038573 8.5753249 2.3045810 0.5534136 -2.7792057 Statistische Methoden, Programmpakete und Befehle 20/62 Beispiel Violinplot Figure : Beispiel Boxplot/Violinplot Min. 1st Qu. -6.3250 -3.1180 Franziska Ideler Median Mean 3rd Qu. Max. 0.3525 0.6015 2.1540 15.0000 Statistische Methoden, Programmpakete und Befehle 21/62 Beanplot I Möglichkeit zur graphischen Darstellung univariater Daten I "Weiterentwicklung" eines Violinplots I nutzt Stripchart I Name: Form erinnert an Bohne I in R laden durch: library("beanplot") (vgl. Kampstra (2008), S. 3 ) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 22/62 Einschub: Stripchart Figure : Stripchart [1] 15.0000000 -2.8023782 -1.1508874 [5] 0.3525420 0.6464387 8.5753249 2.3045810 [9] -6.3253062 -3.4342643 -2.2283099 [13] 1.7990691 7.7935416 6.1204090 2.0038573 0.5534136 -2.7792057 [17] -5.0000000 -5.0000000 -5.0000000 Franziska Ideler Statistische Methoden, Programmpakete und Befehle 23/62 Beispiel Beanplot Figure : Beispiel Boxplot/Beanplot Min. 1st Qu. Median -6.3250 -3.1180 Franziska Ideler Mean 3rd Qu. Max. 0.3525 0.6015 2.1540 15.0000 Statistische Methoden, Programmpakete und Befehle 24/62 2 × 3 Kontingenztafel aa Ereignis (E + ) kein Ereignis (E − ) Genotyp Aa AA n11 n12 n13 n1· n21 n22 n23 n2· n ·1 n·2 n·3 n Table : Darstellung der Genotypen in einer 2 × 3 Kontingenztafel (vgl. Foulkes (2009), S. 38) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 25/62 2 × 2 Kontingenztafel Genotyp aa oder Aa AA Ereignis (E + ) kein Ereignis (E − ) n11 n12 n1· n21 n22 n2· n ·1 n ·2 n Table : Darstellung der Genotypen in einer 2 × 2 Kontingenztafel (vgl. Foulkes (2009), S. 39) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 26/62 Odds Ratio - Chancenverhältnis I Odds: die Chancen für ein Ereignis (E + ) unter der Voraussetzung zu einer Gruppe G zu gehören OG I = P (E + |G )/(1 − P (E + |G )) Odds Ratio: das Verhältnis zwischen der Chance auf ein Ereignis (E + ) unter der Voraussetzung zu der Gruppe A (GA ) zu gehören und der Chance auf ein Ereignis (E + ) unter der Voraussetzung zu der Gruppe B (GB ) zu gehören ORGA ,GB = OGA OGB = P (E + A )/(1 − P (E |GA )) B )/(1 − P (E + |GB )) + |G P (E + |G (vgl. Foulkes (2009), S. 38) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 27/62 Odds Ratio 2 × 3 Kontingenztafel Genotyp Ereignis (E ) + kein Ereignis (E − ) aa Aa AA n11 n21 n·1 n12 n22 n·2 n13 n23 n·3 n1· n2· n Daraus ergibt sich exemplarisch für die Odds: P (E + |aa)/(1 − P (E + |aa)) = (n11 /n·1 )/(n21 /n·1 ) Und somit für die Odds Ratios: ORaa,AA = (n11 /n·1 )/(n21 /n·1 ) n11 n23 = (n13 /n·3 )/(n23 /n·3 ) n21 n13 (vgl. Foulkes (2009), S. 22) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 28/62 Odds Ratio 2 × 2 Kontingenztafel Genotyp Ereignis (E ) + kein Ereignis (E − ) aa oder Aa AA n11 n21 n·1 n12 n22 n·2 n1· n2· n Alternativ mit 2 × 2 Kontingenztafel: ˆ OR = n11 n22 (n11 /n·1 )/(n21 /n·1 ) = (n12 /n·2 )/(n22 /n·2 ) n21 n12 (vgl. Foulkes (2009), S. 38) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 29/62 Testverfahren I I I Franziska Ideler Tests auf Unabhängigkeit Qualitative Tests I χ2 -Test I exakter Test nach Fisher Quantitative Tests I Zwei Stichproben t-Test I Wilcoxon-Rangsummentest Statistische Methoden, Programmpakete und Befehle 30/62 χ2 -Test I H0 I : OR = 1 vs. Teststatistik X H1 : OR 6= 1 2 2 = P (Oij − Eij ) ∼ χ2 (r −1)(c −1) E i ,j ij n n mit Eij = i · ·j und Oij = nij n und c : Anzahl der Reihen und der Spalten der Kontingenztafel. Ablehnen von H0 bei X 2 > c 2 c :1 − α-Quantil der χ (r −1)(c −1) -Verteilung Befehl in R: chisq.test(X) I r I I I (vgl. Foulkes (2009), S. 39 f) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 31/62 Exakter Test nach Fisher I nur bei 2 × 2-Tafeln anwendbar I H0 : OR = 1 vs H1 : OR 6= 1 I Teststatistik: n11 ∼ Hyp (n, n1· , n·1 ) I Ablehnen von H0 bei cα/2 ≥ n11 oder c1−α/2 ≤ n11 I cα/2 I und c1−α/2 : Quantile der Hypergeometrischen Verteilung Befehl in R: fisher.test() (vgl. Hartung et al, S. 416) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 32/62 Zwei Stichproben t-Test I H0 I I : µ1 6= µ2 und ȳ2 arith. Mittel der Gruppen Ablehnen von H0 bei t < Tα/2,n1 +n2 −2 oder t I H1 µ1 und µ2 sind die Mittelwerte zweier Gruppen ȳ1 − ȳ2 ∼ Tn1 +n2 −2 Teststatistik: t = q sp2 [1/n1 + 1/n2 ] I ȳ1 I : µ1 = µ2 vs > T1−α/2,n1 +n2 −2 Befehl in R: t.test() (vgl. Foulkes (2009), S.44) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 33/62 Wilcoxon Rangsummentest I H0 : F (y1 ) = F (y2 ) vs. H1 : F (y1 ) 6= F (y2 ) und F (y2 ): Verteilungen der beiden Gruppen P P Teststatistik: WN = 2i =j ni=1 R (yji ) R (yji ): Ränge der kombinierten Stichprobe I F (y1 ) I I Pn Pm k =1 T (yji − yjk ) + k =1 T (yji − yjk ), i = 1, ..., n , j = 1, 2 0 für U < 0 T (U ) = 1 für U ≥ 0. I R (yji ) I I I I = + > w+ Ablehnen bei W + < w + α oder W 1− α2 2 w ist Verteilung unter H0 Befehl in R: wilcox.test() (vgl. Büning und Trenkler S. 131 ) Franziska Ideler Statistische Methoden, Programmpakete und Befehle 34/62 Datenmaterial und Fragestellung Franziska Ideler Datenmaterial und Fragestellung 35/62 Datensätze I The Human Genome Diversity Project (HGDP) I The Virco Data I Franziska Ideler The Functional SNPs Associated with Muscle Size and Strenghth (FAMuSS) Datenmaterial und Fragestellung 36/62 Datenmaterial 1: HGDP Stichprobenumfang I n = 1064 Variablen I Identikationsnummer (ID) I Geschlecht (Gender) I ethnische Abstammung (Population) I Herkunftsland (Geographic.origin) I Allgemeinere Beschreibung der Herkunft(Geographic.area) I Ausprägung der Basen von vier SNPs (Bsp.: AKT1.C0756A) Franziska Ideler Datenmaterial und Fragestellung 37/62 Datenmaterial 1: HGDP AKT1. ID Gender Population Geographic.origin Geographic.area C0756A HGDP00980 F Biaka Pygmies Central African Republic Central Africa CA HGDP01406 M Bantu Kenya Central Africa CA HGDP01266 M Mozabite Algeria (Mzab) Northern Africa AA HGDP01006 F Karitiana Brazil South America AA HGDP01220 M Daur China China AA HGDP01288 M Han China China AA Table : Auszug aus dem HGDP-Datensatz Franziska Ideler Datenmaterial und Fragestellung 38/62 Datenmaterial 2: Virco Stichprobenumfang I n = 1066 Virus-Isolate Variablen I Sequenz-Identikation (SeqID) I Name des Virus-Isolats (IsolateName) I I Franziska Ideler Mediakmentenspezische Resistenz des Isolates (IDV.Fold) Genotypinformation in zwei Formaten I Position der Amino-Säure I Mutationsliste Datenmaterial und Fragestellung 39/62 Datenmaterial 2: Virco SeqID IsolateName IDV.Fold P10 P63 P71 P82 P90 CompMutList 3852 CA3176 14.2 I P - - M L10I, M46I, L63P, G73CS, 3865 CA3191 13.5 I P V T M L10I, R41K, K45R, M46I, V77I, L90M, I93L L63P, A71V, G73S, V77I, V82T, I85V, L90M, I93L 7430 CA9998 16.7 I P V A M L10I, I15V, K20M, E35D, M36I, I54V, R57K, I62V, L63P, A71V, G73S, V82A, L90M 7459 Hertogs-Pt1 3.0 I P T - M L10I, L19Q, E35D, G48V, L63P, H69Y, A71T, L90M, I93L 7460 Hertogs-Pt2 7.0 - - - A - K14R, I15V, V32I, M36I, 7461 Hertogs-Pt3 21.0 I P V A M L10I, K20R, M36I, N37D, M46I, V82A I54V, R57K, D60E, L63P, A71V, I72V, V82A, L90M, I93L Table : Auszug aus dem Virco-Datensatz Franziska Ideler Datenmaterial und Fragestellung 40/62 Datenmaterial 3: FAMuSS Stichprobenumfang I n = 1379 College Studenten, verschiedenen Geschlechts, Alters und Abstammung Franziska Ideler Datenmaterial und Fragestellung 41/62 Variablen: I I Identikationsnummer (fms.id) Ausprägungen der Basen von 225 SNPs (Bsp.: actn3_rs540874) I Semester (Term) I Geschlecht (Gender) I Alter (Age) I Abstammung (Race) I I Franziska Ideler prozentualer Zuwachs nicht dominanter (trainierter) Arm (NDRM.CH) prozentualer Zuwachs dominanter (nicht trainierter) Arm (DRM.CH) Datenmaterial und Fragestellung 42/62 Auswahl der SNP's Figure : Screenshot von http://www.ncbi.nlm.nih.gov/ (12.10.2012) Franziska Ideler Datenmaterial und Fragestellung 43/62 Datenmaterial 3: FAMuSS actn3_ Gender Age Race NDRM. DRM. CH CH id rs540874 Term FA-1801 GG 02-1 Female 27 Caucasian 40 40 FA-1802 GA 02-1 Male 36 Caucasian 25 0 FA-1803 GA 02-1 Female 24 Caucasian 40 0 FA-1804 GA 02-1 Female 40 Caucasian 125 0 FA-1805 GG 02-1 Female 32 Caucasian 40 20 FA-1806 GA 02-1 Female 24 Hispanic 75 0 Table : Auszug aus dem FAMuSS-Datensatz Franziska Ideler Datenmaterial und Fragestellung 44/62 Fragestellung Datensatz: FAMuSS I Franziska Ideler Kann ein Zusammenhang zwischen einem der SNPs und einem besonders groÿen Zuwachs an Muskeln festgestellt werden? Datenmaterial und Fragestellung 45/62 Statistische Auswertung Franziska Ideler Statistische Auswertung 46/62 Daten einlesen url <- "http://people.umass.edu/ foulkes/asg/data/FMS\_data.txt" fms <- read.delim(url, header=T, sep="\t") \\ attach(fms) Franziska Ideler Statistische Auswertung 47/62 Daten vorbereiten I Dierenz der Arm-Zuwachse: new <- NDRM.CH - DRM.CH I Nur SNPs und Armdierenzen: newfms <- cbind(fms[,(4:226)],new) I Entfernen der NA's bei den Dierenzen hin <- which(new != "NA") neu <- newfms[hin,] Franziska Ideler Statistische Auswertung 48/62 Funktion zur Erstellung von Kotingenztafeln Konti <- function(i){ table(I(neu$new>mean(neu$new)), neu[,i]) } I neu: 225 Spalten SNPs I new: Armzuwachs-Werte Franziska Ideler Statistische Auswertung 49/62 Kontingenztafeln prüfen ko <- numeric() for(i in 1:221){ ko <- c(ko,dim(Konti(i))[2]) fehler <- which(ko > 3 | ko < 2) } neu <- neu[,-fehler] Franziska Ideler Statistische Auswertung 50/62 Funktion OR OR <- function(x){.... return(na.omit(data.frame( x,OddsRatio,Geno1,lok1,Geno2,lok2)))} Konti(6) CC CG GG FALSE 90 124 33 TRUE 77 79 35 OR(6) x OddsRatio Geno1 lok1 Geno2 lok2 2 6 0.7446586 CC 1 CG 2 3 6 1.2396694 CC 1 GG 3 4 6 1.6647488 CG 2 GG 3 Franziska Ideler Statistische Auswertung 51/62 Fisher-Test Fisher <- data.frame(Liste[,1],fisher,Liste$Geno1, Liste$lok1,Liste$Geno2,Liste$lok2) Fisher[1:4,] x fisher Geno1 lok1 Geno2 lok2 1 0.02925794 CC 1 CT 2 1 0.05901945 CC 1 TT 3 1 0.92030576 CT 2 TT 3 2 0.79025583 AA 1 GA 2 Franziska Ideler Statistische Auswertung 52/62 Grak OR und p-Werte Figure : Plot der p-Werte des Fisher-Tests und ORs Franziska Ideler Statistische Auswertung 53/62 Graphische Dartstellungen Figure : Boxplots Franziska Ideler Statistische Auswertung 54/62 Graphische Dartstellungen Figure : Violinplots Franziska Ideler Statistische Auswertung 55/62 Graphische Dartstellungen Figure : Beanplots Franziska Ideler Statistische Auswertung 56/62 Kontingenztafeln "il6_g572c" "akt2_2304186" GG CC GC GG GT TT FALSE 182 242 133 FALSE 4 13 67 TRUE TRUE 3 112 221 65 3 62 OddsRatio Geno1 Geno2 OddsRatio Geno1 Geno2 1.4839876 GG GT 0.3076923 CC GC 0.7941729 GG TT 1.2338308 CC GG 0.5351614 GT TT 4.0099502 GC GG p-Wert Geno1 Geno2 Geno1 Geno2 0.0106095975 GG GT p-Wert 0.3184939 CC GC 0.2510705645 GG TT 1.0000000 CC GG 0.0004318704 GT TT 0.0327063 GC GG FALSE: kleiner als arith Mittel TRUE: gröÿer als arith. Mittel Franziska Ideler Statistische Auswertung 57/62 Kontingenztafeln "il6_g572c" "akt2_2304186" GG/TT CC/GG GT GC FALSE 315 247 FALSE 71 13 TRUE 177 221 TRUE 65 3 FALSE: kleiner als arith Mittel TRUE: gröÿer als arith. Mittel OR Fisher χ2 t-Test Wilcoxon akt2 1.592 2.38·10−4 2.98·10−4 2.09·10−5 3.03·10−5 il6 0.252 0.0334 0.0519 0.2316 0.1129 Table : ORs und p-Werte für die SNPs akt2_2304186 und il6_g572cc Franziska Ideler Statistische Auswertung 58/62 Zusammenfassung SNP akt2_2304186: I I I bei homozygoter Ausprägung Chance für kleine Armdierenzen 1.59 mal so hoch Umkehrschluss: heterozygote Ausprägung bedeutet höheren Muskelzuwachs Bestätigung durch signikante Testergebnisse il6_g572c: I bei homozygoter Ausprägung Chance auf kleine Armdierenzen nur 0.252 mal so hoch. I homozygote Ausprägung höherer Muskelzuwachs. I keine Bestätigung durch Tests Franziska Ideler Zusammenfassung 59/62 Ausblick I Tests mit Messungen verschiedener Muskeln I Geschlechterunterschied betrachten Franziska Ideler Zusammenfassung 60/62 Literatur I I I I I Franziska Ideler Büning, H., Trenkler, G. (1994) Nichtparametrische statistische Methoden. 2.Auage, Walter de Gruyter, Berlin. Foulkes, A.S. (2009) Applied Statistical Genetics with R: For Population-based Association Studies. Springer Science+Business Media, New York. Hartung, J., Elpelt, B. und Klösener, K.-H. (1991) Statistik. Lehr- und Handbuch der angewandten Statistik. 8.Auage, Oldenbourg Verlag, München. Murken, J., Grimm, T. und Holinski-Feder, E. (2006) Taschenlehrbuch Humangenetik. 2.Auage, Georg Thieme Verlag, Stuttgart. Sarkar D., (2008) Lattice. Multivariate Data Visualisation with R. Springer Science+Business Media, New York. Literaturverzeichnis 61/62 Literatur I I Franziska Ideler R Development Core Team (2009). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org. Wrba, F., Dolznig, H. und Mannhalter, C. (2007) Genetik verstehen. Grundlagen der molekularen Biologie. Facultas Verlags- und Buchhandels AG, Wien. Literaturverzeichnis 62/62