Föreläsning 2
Transcription
Föreläsning 2
Repetition S.V. Fördelningar Grafisk presentation Matematisk statistik för B, K, N, BME och Kemister Föreläsning 2 Johan Lindström 2 september 2015 Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation FMS086/MASB02 F1 1/18 Begrepp Oberoende Numerisk beskrivning av data Medelvärde (Kap. 2.2) x̄ = 1 (x1 + x2 + . . . + xn ) n Medelvärdet anger tyngdpunkten för observationerna. Varians s2 = (Kap. 2.2) 1 (x1 − x̄)2 + (x2 − x̄)2 ) + . . . + (xn − x̄)2 n−1 Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation FMS086/MASB02 F1 2/18 Begrepp Oberoende Grundläggande begrepp (Kap. 3.1) I Utfall – resultatet av ett slumpmässigt försök. Bet. ω1 , ω2 , . . . I Händelse – en samling av ett eller flera utfall. Bet. A, B, . . . I Utfallsrum – mängden av möjliga utfall. Bet Ω Kolmogorovs axiomsystem (Kap. 3.2) 0 ≤ P(A) ≤ 1 En sannolikhet är ett tal mellan 0 och 1 P(Ω) = 1 Sannolikheten att något skall hända är 1 P(A ∪ B) = P(A) + P(B) Om och endast om A och B är oförenliga Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F1 3/18 Repetition S.V. Fördelningar Grafisk presentation Begrepp Oberoende Oberoende händelser (Kap. 3.2.4) Händelserna A och B är oberoende av varandra ⇐⇒ P(A ∩ B) = P(A)P(B) Obs. Skilj mellan oberoende och oförenliga. Kan två oberoende händelser vara oförenliga? Läs själva 3.2.3 Bayes Sats. Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation FMS086/MASB02 F1 4/18 Slh. funktion Täthet Fördelningsfunktion Stokastisk variabel (Kap. 3.3.1) En stokastisk variabel eller slumpvariabel är ett tal vars värde styrs av slumpen. Bet X, Y, . . .. Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation FMS086/MASB02 F1 5/18 Slh. funktion Täthet Fördelningsfunktion Sannolikhetsfunktion (Kap. 3.3.2) För en diskret s.v. X definieras sannolikhetsfunktionen som pX (k) = P(X = k) Några egenskaper: I 0 ≤ pX (k) ≤ 1, eftersom det är sannolikheter I P(a ≤ X ≤ b) = I X b X pX (k) k=a pX (k) = 1. Slh att X skall anta något värde är 1. alla k Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F1 6/18 Repetition S.V. Fördelningar Grafisk presentation Slh. funktion Täthet Fördelningsfunktion Täthetsfunktion (Kap. 3.3.3) En kontinuerlig s.v X har i stället en täthetsfunktion fX (x). Z P(X ∈ A) = fX (x) dx A Några egenskaper: I fX (x) ≥ 0 I P(a ≤ X ≤ b) = fX (x) dx a Z ∞ fX (x) dx = 1. Slh att X skall anta något värde är 1. I Z b −∞ Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F1 Repetition S.V. Fördelningar Grafisk presentation 7/18 Slh. funktion Täthet Fördelningsfunktion Fördelningsfunktion (Kap. 3.4) För att räkna ut sannolikheter behöver man summera pX (k) eller integrera fX (x). Det kan därför vara användbart att ha en fördelningsfunktion (borde heta kumulativ förd.funk.) FX (x) = P(X ≤ x) Några egenskaper: I I 0 ≤ FX (x) ≤ 1, eftersom det är en sannolikhet FX (x) är växande. Diskret FX (x) = X Kontinuerlig Z x FX (x) = fX (t) dt pX (k) k≤x pX (k) = FX (k) − FX (k − 1) Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation fX (x) = −∞ d dx FX (x) FMS086/MASB02 F1 8/18 Slh. funktion Täthet Fördelningsfunktion Fördelningsfunktion Diskret b X P(a < X ≤ b) = pX (k) P(a < X ≤ b) = FX (b) − FX (a) pX(k) FX(x) k=a+1 a b a b k Z b Kontinuerligt fX (x) dx a P(a < X ≤ b) = FX (b) − FX (a) fX(x) FX(x) P(a < X ≤ b) = k a b a x Johan Lindström - johanl@maths.lth.se b x FMS086/MASB02 F1 9/18 Repetition S.V. Fördelningar Grafisk presentation Slh. funktion Täthet Fördelningsfunktion Väntevärde, E(X), μ, μX , m, . . . (Kap. 3.5) Väntevärdet anger tyngdpunkten för fördelningen och kan tolkas som det värde man får i ”medeltal i långa loppet”. (R ∞ −∞ xfX (x) dx Kont. E(X) = P Diskr. k kpX (k) Varians, V(X), σ2 , σ2X (Kap. 3.5) Variansen anger hur utspridd X är kring sitt väntevärde. h i2 V(X) = E X − E(X) = E(X 2 ) − E(X)2 Standardavvikelse:, D(X), σ, σX Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation D(X) = p V(X) FMS086/MASB02 F1 10/18 Slh. funktion Täthet Fördelningsfunktion Exempel Antag att X har täthetsfunktionen fX (x) = 12 e−x/2 , x ≥ 0. Bestäm: 1. Fördelningsfunktionen FX (x). 2. Sannolikheten P(2 ≤ X ≤ 4). 3. Väntevärdet E(X). 4. Medianen x0.5 . Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation FMS086/MASB02 F1 11/18 Rektangel Exponential Normal log-Normal Rektangel- eller likformig fördelning (Kap. 6.2.1) Beteckning: X ∈ R(a, b) eller X ∈ U(a, b) (eng. uniform) Täthetsfunktion: fX (x) = ( 1 b−a , 0 a≤x≤b f.ö. 1/(b−a) 0 a Johan Lindström - johanl@maths.lth.se b FMS086/MASB02 F1 12/18 Repetition S.V. Fördelningar Grafisk presentation Rektangel Exponential Normal log-Normal Exponentialfördelning (Kap. 6.2.2) Beteckning: X ∈ Exp(a) Täthetsfunktion: ( fX (x) = 1 −x/a , ae x≥0 x<0 0 2 a = 1/2 a=1 a=2 a=4 fX(x) 1.5 1 0.5 0 0 2 4 6 x Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation FMS086/MASB02 F1 13/18 Rektangel Exponential Normal log-Normal Normalfördelning (Kap. 3.6) Beteckning: X ∈ N(μ, σ2 ) Täthetsfunktion: fX (x) = √ 1 2πσ2 − e (x−μ) 2 2σ2 −∞ < x < ∞ , µ=4 σ=2 0.5 0.15 fX(x) fX(x) σ=1 µ=0 µ = 10 σ=2 0 −2 0 2 4 x 6 8 0 −20 10 0 20 Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation FMS086/MASB02 F1 14/18 Rektangel Exponential Normal log-Normal log-Normalfördelning (Kap. 3.6.5) Beteckning: X ∈ log N(μ, σ2 ) ln(X) ∈ N(μ, σ2 ) Täthetsfunktion: (ln(x)−μ) 2 1 − fX (x) = √ e 2σ2 , x 2πσ2 µ=0 0<x<∞ σ = 0.2 2 2 µ=0 σ = 0.2 1 1 µ=1 σ=1 0 40 x 0 2.5 5 Johan Lindström - johanl@maths.lth.se 0 0 FMS086/MASB02 F1 2.5 5 15/18 Repetition S.V. Fördelningar Grafisk presentation Fördelningsfunktion Normplot Empirisk fördelningsfunktion sannolikhet / relativ frekvens En empirisk fördelningsfunktion konstrueras genom att sortera de n mätvärdena och plotta mätvärde i mot i/n. Vid ett givet x-värde kan man då avläsa andelen mätvärden som är mindre än detta x. Denna kan jämföras med en fördelningsfunktion. Empirisk fördelningsfunktion för mjölkpaketen, Normalfördelning 1 0.8 0.6 0.4 0.2 0 0.98 0.99 1 1.01 1.02 1.03 Volym [l] Matlab: stairs(sort(x), (1:length(x))/length(x)) Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation FMS086/MASB02 F1 16/18 Fördelningsfunktion Normplot Vanligt är att man skalar om axlarna i den empiriska fördelningsfunktionen så att en given fördelnings fördelningsfunktion blir en rät linje. T.ex en normalfördelningsplot. Denna är användbar för att se om datamaterialet passar den givna fördelningen. sannolikhet / relativ frekvens Mjölkpaketen i en ett normalfördelningsdiagram 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 0.995 1 1.005 1.01 Volym [l] 1.015 1.02 Matlab: normplot(x) qqplot(exprnd(1,1000,1), expinv((1:1e3)/1e3)) Johan Lindström - johanl@maths.lth.se Repetition S.V. Fördelningar Grafisk presentation FMS086/MASB02 F1 17/18 Fördelningsfunktion Normplot Exempel normplot Normal Probability Plot Normal Probability Plot 0.997 0.99 0.98 0.95 0.90 Probability Probability 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 −2 0 Data 2 0 0.2 0.4 0.6 Data 0.8 1 Normal Probability Plot Probability 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 0 2 4 Data 6 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F1 18/18