Übung zu Quantitative Methoden der Marktanalyse Tests zu den

Transcription

Übung zu Quantitative Methoden der Marktanalyse Tests zu den
Termin
Übungsinhalt
29.06.2009 Tests zu den Annahmen der OLS-
Schätzung
06.07.2009
13.07.2009
20.07.2009
Übung zu Quantitative
Methoden der Marktanalyse
Klausurvorbereitung
Klausurvorbereitung
(Prüfungszeitraum)
Fragen zur Klausurvorbereitung an
ahoffma@ae.uni-kiel.de
Annahmen derOLS-Schätzung
29.06.2009
2
Tests zu den Annahmen der
OLS-Schätzung
1. Annahmen zur OLS-Schätzung
1. WDH: Annahmen der OLS-Schätzung
2. Was sind die Folgen verletzter Annahmen?
(1) Linearität in den Parametern.
–
–
–
3. Überprüfung der Annahmen bei Stata
–
–
–
–
Grafische Analyse
Test auf Normalverteilung
Test auf Heteroskedastizität
Test auf Autokorrelation
Erlaubt: ln(Yi) = b0 + b1 * ln(Xi) + ui
Nicht erlaubt: Yi = b0 + b12 * Xi + ui
Nicht erlaubt: Yi = b0 + b1 * X1i + Xib2 + ui
(2) Exogene Variable X ist deterministisch.
–
X sind fest (nicht stochastisch).
(3) Varianz der exogenen Variablen ist nicht Null.
4. Was kann man tun, damit die Annahmen nicht
(mehr) verletzt werden?
–
Sonst wäre X immer genau ein Wert!
3
1. Annahmen zur OLS-Schätzung
1. Annahmen zur OLS-Schätzung
(4) Der Mittelwert der Residuen u für gegebene X
ist Null.
–
4
(7) Modell muss richtig spezifiziert sein.
–
Sonst verzerrte Schätzer.
(5) Homoskedastizität der Residuen.
–
–
Varianz der Residuen ist konstant.
Sonst ineffiziente Schätzer.
Z.B. Logarithmieren
Logarithmieren führt dazu, dass die Parameter als
Elastizitäten zu interpretieren sind!
(8) Keine (perfekte) Mulitkollinearität (X).
–
(6) Keine Korrelation der Residuen.
–
–
Evt. lineare Transformation
•
•
Z.B. keine Autokorrelation der Residuen.
Sonst ineffiziente Schätzer.
D.h. erklärende Variablen erklären sich nicht
vollständig gegenseitig.
(9) Kovarianz zwischen X und u ist Null.
–
5
Automatisch erfüllt, wenn X deterministisch ist.
6
1
1. Annahmen zur OLS-Schätzung
2. Folgen verletzter Annahmen
(10) Zahl der Beobachtungen muss größer sein,
als die Zahl der zu schätzenden Parameter.
• Technisch kann OLS nicht angewendet werden,
wenn …
– Varianz der exogenen Variable Null ist (A 4).
– Perfekte Multikollinearität vorliegt (A 8).
– Zahl der Beobachtungen keiner als Zahl der zu
schätzenden Parameter ist (A 10).
(11) Normalverteilung der Residuen.
–
–
Sonst keine Aussagen über Verteilungen der
Schätzer möglich.
D.h. Konfidenzintervalle und Signifikanztest „treffen
nicht“.
• OLS ist nicht die „richtige“ Methode, wenn …
– Linearität in den Parametern nicht vorliegt (A 1).
– Exogene Variable nicht deterministisch ist (A 2).
– Das Modell nicht richtig spezifiziert werden kann (A 7).
7
8
2. Folgen verletzter Annahmen
• Verzerrte Schätzer
3.1 Grafische Analyse (A 1 und A 4)
• Streudiagramme „endogene Variable“ (A 1)
• Ineffiziente Schätzer
– Einzeln: twoway (scatter VARLIST) (lfit VARLIST)
– Oder für alle gemeinsam: graph matrix VARLIST
– Wenn der Mittelwert der
Residuen nicht Null ist
(auch lokal) (A 4).
– Wenn Heteroskedastizität
vorliegt (A 5).
– Z.B. weil X und u noch
voneinander abhängen (A 9).
– Wenn Autokorrelation
• Keine Aussage über
Verteilung der Schätzer vorliegt (A 6).
möglich
• Residual-Versus-Fitted-Plots (z.B. A 4)
– regress VARLIST
– rvfplot
• Streudiagramme „Residuen“
– regress VARLIST
– predict u_resid, resid
– scatter u_resid VAR_exogen
– Wenn Residuen nicht
normalverteilt sind (A 11).
9
10
3.2 Test auf Normalverteilung (A11)
3.2 Test auf Normalverteilung (A 11)
Schiefe (skewness)
• regress VARLIST
• predict u_resid, resid
• sktest u_resid
– Testet anhand von Skewness, Kurtosis und
Kombination beider Größen, ob Normalverteilung vorliegt.
– H0: Normalverteilung liegt vor!
g
•
•
•
1
*  ( X i  X )3
n
3/ 2
1
( *  ( X i  X )2 )
n
Wölbung (kurtosis)
• Je größer der Wert der
Wölbung, desto spitzer die
Verteilung, bei Normalverteilung Wert = 3.
g = 0: normalverteilt.
g < 0: linksschiefe Verteilung.
g > 0: rechtsschiefe Verteilung.
– Testgröße K² = Z1² + Z2²
• Mit Z1 und Z2 als Testgröße des Skeness bzw. des Kurtosis-Tests
• Z1 und Z2 approx. standardnormalverteilt unter H0
– K² approx. Chi²-verteilt unter H0 mit 2 FG
– vgl. auch Jarque-Bera-Test auf Normalverteilung
• ohne Korrektur für SP-Umfang
11
12
Quelle: www.schulphysik.de/physik/maxwell1/maxwell1.htm
2
3.2 Test auf Normalverteilung (A 11)
3.3 Test auf Homoskedastizität (A 9)
• sktest u_resid
• regress VARLIST
• hettest
– Test nach Breusch-Pagan / Cook-Weisberg.
– H0: Homoskedastizität liegt vor!
– Prinzip: ûi² 0 +  1 * X1i + i
– Entscheidung:
– Entscheidung:
• [adj. Chi² < tabellarischer Chi²-Wert]
• (Prob > Chi²) > ( = 0.05)
– Interpretation: Normalverteilung liegt vor.
!
• [empirischer Chi² < tabellarischer Chi²-Wert]
• (Prob > Chi²) > ( = 0.05)
!
• zusätzlich Normalquantil-Plot: qnorm u-resid
– Interpretation: Homoskedastizität liegt vor.
13
3.3 Test auf Homoskedastizität (A 9)
14
Kritische Werte der Chi²-Verteilung
• regress VARLIST
• imtest, white
White‘s-General-Heteroscedasticity-Test
– H0: der Homoskedastizität für alle t bzw. i liegt vor!
– Prinzip: Hilfsregression ûi²
ûi² = f(X1i, X1i², X2i, X2i², X1i*X2i)
– Prüfgröße:
n*R²Hilfsregression ~ Chi²(k-1)
k als Zahl der exogenen Variablen inkl. Konstante
– Entscheidung: siehe Test nach Breusch-Pagan
15
3.4 Tests auf Autokorrelation (A 6)
• Autokorrelation graphisch:
Positive Autokorrelation
16
3.4 Tests auf Autokorrelation (A 6)
(a) Durbin Watson-Test
–
–
Negative Autokorrelation
testet Autokorrelation erster Ordnung
Prinzip: Hilfsregression ut = f(ut-1)
T
 (uˆ
d
t
 uˆt 1 ) 2
t 2
T
 uˆ
2
 2 * (1   uˆt ,uˆ t1 )
t
t 1
wobei für Korrelationskoeffizienten  gilt:
-1    1
→ Problem: Erklärungsgehalt der Residuen!
17
18
3
3.4 Tests auf Autokorrelation (A 6)
→ Entscheidung beim Durbin-Watson-Test
3.4 Tests auf Autokorrelation (A 6)
• Frage: Folgen die Preise für Weizen in Kanada
und in den USA einem Trend? Kann zur
Beantwortung dieser Frage eine OLSRegression durchgeführt werden oder liegt
Autokorrelation der Residuen vor?
H0: keine Autokorrelation, d.h.  = 0
• Datensatz: Weizenpreise.dta
19
–
–
–
–
t: Zeitindex
date: Datum der Preisnotierung
pc: Weizenpreis in Kanada [$/t]
pusa: Weizenpreis in den USA [$/t]
20
3.4 Tests auf Autokorrelation (A 6)
STATA: Durbin-Watson-Test
– tsset t
– regress pc t
– estat dwa
– regress pus t
– estat dwa
– Durbin-Watson d-statistic( 2, 1402) = .0244195
• Entscheidung: Vergleich dieses empirischen
Wertes mit Tabellenwert D(n, K)
– mit K als Zahl der exogenen Variablen
– hier K ohne Konstante !!!
21
3.4 Tests auf Autokorrelation (A 6)
22
3.4 Tests auf Autokorrelation (A 6)
→ Entscheidung beim Breusch-Goldfrey-Test
(b) Breusch-Goldfrey-Test
– testet Autokorrelation p-ter Ordnung
– Prinzip: Hilfsregression ut (ut-1, ut-2,..., ut-p)
– H0: keine Autokorrelation, d.h. alle Parameter der
Hilfsregression sind 0.
– Zur Wahl von p:
• wird p zu klein gewählt, kann Autokorrelation
höherer Ordnung nicht aufgedeckt werden.
• wird p zu groß gewählt, kann die Macht des Tests
verringert werden.
– Prüfgröße: (n-p)*R²Hilfsregression ~ Chi²(p)
– z.B. R² = 0,25, n = 239, p = 4
• empirische Prüfgröße: Chi²emp = 14, 6875
• Tabellenwert Chi²tab = Chi² (p)
23
24
4
4. Lösungsansätze
Kritische Werte der Chi²-Verteilung
1. Fehlender Normalverteilung
→ Grenzwertsatz der Statistik (n > 30).
2. Heteroskedastizität
→ Transformation der abhängigen Variable.
→ oder Schätzung bei der Homoskedastizität
nicht vorausgesetzt ist, bei STATA:
regress VARLIST, robust
25
26
4. Lösungsansätze
4. Lösungsansätze
3. Autokorrelation
4. Kein linearer Zusammenhang zwischen den
Variablen
→ Weitere Erklärungsvariablen einfügen.
→ Trendvariable hinzufügen.
→ Zeitverzögerte Beobachtungen hinzufügen
(lag-Variablen).
→ Transformation des Modells, einzelner Variablen
•
•
•
•
→ Weitere Hinweise zur Zeitreihenanalyse beachten!
(z.B. von Auer, 1999: 351ff)
Quadrieren
Logarithmieren
Inverse bilden
Interaktionsterme einfügen
5. Einflussreiche Beobachtungen
→ Transformation der unabhängigen Variable
→ Hinzufügen weiterer Erklärungsvariablen
→ Korrektur des Datensatzes???
27
28
1. Annahmen zur OLS-Schätzung
Ende
(1) Linearität in den Parametern
(2) Exogene Variable ist
deterministisch
(3) Varianz der exogenen Variable ist
nicht Null
(4) Der Mittelwert der Residuen für
gegebene X ist Null
(7) Modell muss richtig spezifiziert
sein
(9) Kovarianz zwischen X und u ist
Null
(10) Zahl der Beobachtungen muss
größer sein, als die Zahl der zu
schätzenden Parameter
Tests zu den Annahmen der
OLS-Schätzung
29
(5) Homoskedastizität der
Residuen
(6) Keine Korrelation der
Residuen
(8) Keine (perfekte)
Mulitkollinearität
(11) Normalverteilung der
Residuen
30
5