Föreläsning 2

Transcription

Föreläsning 2
Repetition S.V. Fördelningar Grafisk presentation
Matematisk statistik för
B, K, N, BME och Kemister
Föreläsning 2
Johan Lindström
2 september 2015
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
FMS086/MASB02 F1
1/18
Begrepp Oberoende
Numerisk beskrivning av data
Medelvärde
(Kap. 2.2)
x̄ =
1
(x1 + x2 + . . . + xn )
n
Medelvärdet anger tyngdpunkten för observationerna.
Varians
s2 =
(Kap. 2.2)
1 (x1 − x̄)2 + (x2 − x̄)2 ) + . . . + (xn − x̄)2
n−1
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
FMS086/MASB02 F1
2/18
Begrepp Oberoende
Grundläggande begrepp
(Kap. 3.1)
I
Utfall – resultatet av ett slumpmässigt försök.
Bet. ω1 , ω2 , . . .
I
Händelse – en samling av ett eller flera utfall.
Bet. A, B, . . .
I
Utfallsrum – mängden av möjliga utfall.
Bet Ω
Kolmogorovs axiomsystem
(Kap. 3.2)
0 ≤ P(A) ≤ 1
En sannolikhet är ett tal mellan 0 och 1
P(Ω) = 1
Sannolikheten att något skall hända är 1
P(A ∪ B) = P(A) + P(B)
Om och endast om A och B är oförenliga
Johan Lindström - johanl@maths.lth.se
FMS086/MASB02 F1
3/18
Repetition S.V. Fördelningar Grafisk presentation
Begrepp Oberoende
Oberoende händelser
(Kap. 3.2.4)
Händelserna A och B är oberoende av varandra
⇐⇒
P(A ∩ B) = P(A)P(B)
Obs. Skilj mellan oberoende och oförenliga.
Kan två oberoende händelser vara oförenliga?
Läs själva 3.2.3 Bayes Sats.
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
FMS086/MASB02 F1
4/18
Slh. funktion Täthet Fördelningsfunktion
Stokastisk variabel
(Kap. 3.3.1)
En stokastisk variabel eller slumpvariabel är ett tal vars värde
styrs av slumpen.
Bet X, Y, . . ..
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
FMS086/MASB02 F1
5/18
Slh. funktion Täthet Fördelningsfunktion
Sannolikhetsfunktion
(Kap. 3.3.2)
För en diskret s.v. X definieras sannolikhetsfunktionen som
pX (k) = P(X = k)
Några egenskaper:
I
0 ≤ pX (k) ≤ 1, eftersom det är sannolikheter
I
P(a ≤ X ≤ b) =
I
X
b
X
pX (k)
k=a
pX (k) = 1. Slh att X skall anta något värde är 1.
alla k
Johan Lindström - johanl@maths.lth.se
FMS086/MASB02 F1
6/18
Repetition S.V. Fördelningar Grafisk presentation
Slh. funktion Täthet Fördelningsfunktion
Täthetsfunktion
(Kap. 3.3.3)
En kontinuerlig s.v X har i stället en täthetsfunktion fX (x).
Z
P(X ∈ A) =
fX (x) dx
A
Några egenskaper:
I
fX (x) ≥ 0
I
P(a ≤ X ≤ b) =
fX (x) dx
a
Z ∞
fX (x) dx = 1. Slh att X skall anta något värde är 1.
I
Z
b
−∞
Johan Lindström - johanl@maths.lth.se
FMS086/MASB02 F1
Repetition S.V. Fördelningar Grafisk presentation
7/18
Slh. funktion Täthet Fördelningsfunktion
Fördelningsfunktion
(Kap. 3.4)
För att räkna ut sannolikheter behöver man summera pX (k)
eller integrera fX (x). Det kan därför vara användbart att ha
en fördelningsfunktion (borde heta kumulativ förd.funk.)
FX (x) = P(X ≤ x)
Några egenskaper:
I
I
0 ≤ FX (x) ≤ 1, eftersom det är en sannolikhet
FX (x) är växande.
Diskret
FX (x) =
X
Kontinuerlig
Z x
FX (x) =
fX (t) dt
pX (k)
k≤x
pX (k) = FX (k) − FX (k − 1)
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
fX (x) =
−∞
d
dx FX (x)
FMS086/MASB02 F1
8/18
Slh. funktion Täthet Fördelningsfunktion
Fördelningsfunktion
Diskret
b
X
P(a < X ≤ b) =
pX (k)
P(a < X ≤ b) = FX (b) − FX (a)
pX(k)
FX(x)
k=a+1
a
b
a
b
k
Z
b
Kontinuerligt
fX (x) dx
a
P(a < X ≤ b) = FX (b) − FX (a)
fX(x)
FX(x)
P(a < X ≤ b) =
k
a
b
a
x
Johan Lindström - johanl@maths.lth.se
b
x
FMS086/MASB02 F1
9/18
Repetition S.V. Fördelningar Grafisk presentation
Slh. funktion Täthet Fördelningsfunktion
Väntevärde, E(X), μ, μX , m, . . .
(Kap. 3.5)
Väntevärdet anger tyngdpunkten för fördelningen och kan
tolkas som det värde man får i ”medeltal i långa loppet”.
(R ∞
−∞ xfX (x) dx Kont.
E(X) = P
Diskr.
k kpX (k)
Varians, V(X), σ2 , σ2X
(Kap. 3.5)
Variansen anger hur utspridd X är kring sitt väntevärde.
h
i2 V(X) = E X − E(X)
= E(X 2 ) − E(X)2
Standardavvikelse:, D(X), σ, σX
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
D(X) =
p
V(X)
FMS086/MASB02 F1
10/18
Slh. funktion Täthet Fördelningsfunktion
Exempel
Antag att X har täthetsfunktionen fX (x) = 12 e−x/2 , x ≥ 0.
Bestäm:
1. Fördelningsfunktionen FX (x).
2. Sannolikheten P(2 ≤ X ≤ 4).
3. Väntevärdet E(X).
4. Medianen x0.5 .
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
FMS086/MASB02 F1
11/18
Rektangel Exponential Normal log-Normal
Rektangel- eller likformig fördelning
(Kap. 6.2.1)
Beteckning: X ∈ R(a, b) eller X ∈ U(a, b) (eng. uniform)
Täthetsfunktion:
fX (x) =
(
1
b−a ,
0
a≤x≤b
f.ö.
1/(b−a)
0
a
Johan Lindström - johanl@maths.lth.se
b
FMS086/MASB02 F1
12/18
Repetition S.V. Fördelningar Grafisk presentation
Rektangel Exponential Normal log-Normal
Exponentialfördelning
(Kap. 6.2.2)
Beteckning: X ∈ Exp(a)
Täthetsfunktion:
(
fX (x) =
1 −x/a
,
ae
x≥0
x<0
0
2
a = 1/2
a=1
a=2
a=4
fX(x)
1.5
1
0.5
0
0
2
4
6
x
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
FMS086/MASB02 F1
13/18
Rektangel Exponential Normal log-Normal
Normalfördelning
(Kap. 3.6)
Beteckning: X ∈ N(μ, σ2 )
Täthetsfunktion:
fX (x) = √
1
2πσ2
−
e
(x−μ) 2
2σ2
−∞ < x < ∞
,
µ=4
σ=2
0.5
0.15
fX(x)
fX(x)
σ=1
µ=0
µ = 10
σ=2
0
−2
0
2
4
x
6
8
0
−20
10
0
20
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
FMS086/MASB02 F1
14/18
Rektangel Exponential Normal log-Normal
log-Normalfördelning
(Kap. 3.6.5)
Beteckning: X ∈ log N(μ, σ2 )
ln(X) ∈ N(μ, σ2 )
Täthetsfunktion:
(ln(x)−μ) 2
1
−
fX (x) = √
e 2σ2 ,
x 2πσ2
µ=0
0<x<∞
σ = 0.2
2
2
µ=0
σ = 0.2
1
1
µ=1
σ=1
0
40
x
0
2.5
5
Johan Lindström - johanl@maths.lth.se
0
0
FMS086/MASB02 F1
2.5
5
15/18
Repetition S.V. Fördelningar Grafisk presentation
Fördelningsfunktion Normplot
Empirisk fördelningsfunktion
sannolikhet / relativ frekvens
En empirisk fördelningsfunktion konstrueras genom att sortera
de n mätvärdena och plotta mätvärde i mot i/n. Vid ett
givet x-värde kan man då avläsa andelen mätvärden som är
mindre än detta x. Denna kan jämföras med en
fördelningsfunktion.
Empirisk fördelningsfunktion för mjölkpaketen, Normalfördelning
1
0.8
0.6
0.4
0.2
0
0.98
0.99
1
1.01
1.02
1.03
Volym [l]
Matlab: stairs(sort(x), (1:length(x))/length(x))
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
FMS086/MASB02 F1
16/18
Fördelningsfunktion Normplot
Vanligt är att man skalar om axlarna i den empiriska
fördelningsfunktionen så att en given fördelnings
fördelningsfunktion blir en rät linje. T.ex en
normalfördelningsplot. Denna är användbar för att se om
datamaterialet passar den givna fördelningen.
sannolikhet / relativ frekvens
Mjölkpaketen i en ett normalfördelningsdiagram
0.997
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
0.003
0.995
1
1.005
1.01
Volym [l]
1.015
1.02
Matlab: normplot(x)
qqplot(exprnd(1,1000,1), expinv((1:1e3)/1e3))
Johan Lindström - johanl@maths.lth.se
Repetition S.V. Fördelningar Grafisk presentation
FMS086/MASB02 F1
17/18
Fördelningsfunktion Normplot
Exempel normplot
Normal Probability Plot
Normal Probability Plot
0.997
0.99
0.98
0.95
0.90
Probability
Probability
0.997
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
0.003
0.75
0.50
0.25
0.10
0.05
0.02
0.01
0.003
−2
0
Data
2
0
0.2
0.4
0.6
Data
0.8
1
Normal Probability Plot
Probability
0.997
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
0.003
0
2
4
Data
6
Johan Lindström - johanl@maths.lth.se
FMS086/MASB02 F1
18/18