LS 04 Regression zwischen Zeitreihen, ARMA-Modell
Transcription
LS 04 Regression zwischen Zeitreihen, ARMA-Modell
MSc Banking & Finance Kurs 9.3: Forschungsmethoden II Zeitreihenanalyse Lernsequenz 04: Regression zwischen Zeitreihen / ARMA-Modelle November 2014 Prof. Dr. Jürg Schwarz Folie 2 Inhalt Ziele ___________________________________________________________________________________________________ 5 Regression zwischen Zeitreihen ____________________________________________________________________________ 6 Modellierung von ARMA(p,q)-Prozessen ____________________________________________________________________ 23 Beispiel zur Modellbildung________________________________________________________________________________ 39 Folie 3 Inhaltsverzeichnis Ziele ___________________________________________________________________________________________________ 5 Ziele der Lernsequenz 04 ............................................................................................................................................................................................................ 5 Regression zwischen Zeitreihen ____________________________________________________________________________ 6 Regressionsmodell für Zeitreihen ...........................................................................................................................................................................6 Beispiel Prognos / Bundesamt für Energie.................................................................................................................................................................................. 7 Beispiel Prognos / Bundesamt für Energie – Variante mit zeitverzögerten Variablen ................................................................................................................ 8 Beispiel Prognos / Bundesamt für Energie – Variante mit zeitverzögerten Variablen ................................................................................................................ 9 Autokorrelierte Residuen ......................................................................................................................................................................................10 Aufdecken von Autokorrelation.................................................................................................................................................................................................. 11 Massnahmen ............................................................................................................................................................................................................................. 11 Beispiel mit simulierten Daten ................................................................................................................................................................................................... 12 Schätzung ohne und mit Berücksichtigung der korrelierten Fehler (Cochrane-Orcutt) ............................................................................................................ 13 Tests auf Autokorrelation der Fehlerterme............................................................................................................................................................15 Durbin-Watson-Test .................................................................................................................................................................................................................. 15 Durbin-Watson-Test am Beispiel der simulierten Daten ........................................................................................................................................................... 16 Breusch-Godfrey-Test (siehe auch Tests von Box-Pierce und Ljung-Box) .............................................................................................................................. 17 Cochrane-Orcutt-Methode für autokorrelierte Fehlerterme ...................................................................................................................................18 Spezialfall AR(1)-Modell für den Fehler .................................................................................................................................................................................... 18 Hinweise zu EViews .................................................................................................................................................................................................................. 19 Breusch-Godfrey-Test und Cochrane-Orcutt-Methode am Beispiel der Verkehrsdaten........................................................................................................... 20 Folie 4 Modellierung von ARMA(p,q)-Prozessen ____________________________________________________________________ 23 Deutsches BIP zwischen 1970:Q1 und 2008:Q2 ...................................................................................................................................................................... 23 Zum Vergleich: Simulierter ARMA(2,3)-Prozess zwischen 1970:Q1 und 2008:Q2 .................................................................................................................. 24 Eigenschaften von ARMA-Prozessen ...................................................................................................................................................................25 Korrelogramm: Simulierter AR(1)-Prozess ................................................................................................................................................................................ 26 Theoretische ACF und PACF verschiedener ARMA(1,1)-Prozesse ......................................................................................................................................... 29 Theoretische und empirische ACF und PACF eines simulierten AR (2)-Prozesses................................................................................................................. 30 Stationarität eines AR(p)-Prozesses ......................................................................................................................................................................................... 31 Beispiel mit EViews mit drei simulierten AR(2)-Prozessen ....................................................................................................................................................... 32 Invertierbarkeit eines MA(q)-Prozesses .................................................................................................................................................................................... 33 Zusammenfassung: Charakterisierung des ARMA(p,q)-Prozesses.......................................................................................................................................... 34 Phasen der Modellbildung (nach Box-Jenkins 1970 / 1994) .................................................................................................................................35 Anmerkungen zur Modellidentifikation und Modellspezifikation ................................................................................................................................................ 36 Beispiel zur Modellbildung________________________________________________________________________________ 39 Datengrundlage: Deutsches BIP zwischen 1970:Q1 und 2008:Q2 .......................................................................................................................................... 39 Korrelogramm und Ordnung p und q ......................................................................................................................................................................................... 42 Bestimmung der Ordnungen p und q mit Informationskriterien................................................................................................................................................. 43 Schätzung der Modelle .............................................................................................................................................................................................................. 44 "Equation Diagnostics": Wurzeln der charakteristischen Polynome ......................................................................................................................................... 45 "Equation Diagnostics": Vergleich von theoretischem und empirischem Korrelogram ............................................................................................................. 46 Residualanalyse ........................................................................................................................................................................................................................ 47 Schlussmodell und Prognose .................................................................................................................................................................................................... 48 Folie 5 Ziele Ziele der Lernsequenz 04 Regression zwischen Zeitreihen / ARMA-Modelle (4 Lektionen mit EViews-Anwendung) ◦ Sie kennen das Problem der Autokorrelation bei der Regression zwischen Zeitreihen. ◦ Sie können autokorrelierte Fehlerterme detektieren ◦ Sie können Verfahren anwenden, um autokorrelierte Fehlerterme auszuschalten. ◦ Sie kennen die wesentlichen Eigenschafteen von ARMA(p,q)-Prozessen. ◦ Sie können Korrelogramme beurteilen. ◦ Sie können eine ARMA(p,q)-Modell mit EViews schätzen. Folie 6 Regression zwischen Zeitreihen Regressionsmodell für Zeitreihen Die Zeitreihe Yt werde durch q weitere Zeitreihen X t(1), X t(2), ... X t(q) beeinflusst Regressionsmodell Yt = β0 + β1X(t1) + β 2 X(t 2 ) + ... + βq X(t q) + E t q = ∑ β j X(t j ) + E t , mit X(t 0 ) = 1 für alle t = 1,..., T j=0 Beispiel Prognos / Bundesamt für Energie (2008 und 2010)* Einfluss der Tagestemperatur auf den Fernwärmebedarf der Stadt Bern Erster Ansatz: Fernwärmet = β0 + β1 ⋅ Mittlere Tagestemperaturt t = 1,2,...365 Tage im Jahr *Temperatur- und Strahlungsabhängigkeit des Energieverbrauchs im Wärmemarkt *www.bfe.admin.ch/themen/00526/00541/00542/02794/index.html?lang=de&dossier_id=02795 (Stand: November 2014) Folie 7 Beispiel Prognos / Bundesamt für Energie Tägliche Einspeisung ins Fernwärmenetz, in Abhängigkeit der mittleren Tagestemperatur. Indexierte Werte (1 = durchschnittliche Tages-Einspeisung) Folie 8 Beispiel Prognos / Bundesamt für Energie – Variante mit zeitverzögerten Variablen Erster Ansatz Prognos / Bundesamt für Energie Fernwärmet = β0 + β1 ⋅ Mittlere Tagestemperaturt Die mittlere Tagestemperatur wirkt sich nur simultan auf den Wärmeverbrauch aus. LS 03 Hier: Zeitverschobene Temperaturen wirken sich aus physikalischen Gründen ebenfalls aus. Zusätzlich Einfluss von Temperatur des Vortages und Vorvortages (zusätzlich: Strahlung) Vollständiges Modell: Fernwärmet = β0 + β1⋅Tt + β2⋅Tt-1 + β3⋅Tt-2 + β4 ⋅ Strahlungt + ut Folie 9 Einspeisung ins Fernwärmenetz Beispiel Prognos / Bundesamt für Energie – Variante mit zeitverzögerten Variablen : Standardisierte Parameter Achtung: x-Achse ist nicht Zeitachse sondern Nummer der Messung Tägliche Einspeisung ins Fernwärmenetz an Januartagen (2000 bis 2008): Effektive Einspeisung (blau ) und geschätzte Einspeisung (rot ) Indexierte Werte (1 = durchschnittliche Tages-Einspeisung im Januar) Folie 10 Autokorrelierte Residuen Im Gegensatz zu Modellen ohne Zeitreihencharakter haben Zeitreihenmodelle häufig autokorrelierte Residuen. Gründe Lagstruktur der Variablen nicht richtig spezifiziert (Beispiel Fernwärme: Temperatur der Vortage) Variable bei der Modellbildung nicht berücksichtigt (Beispiel Fernwärme: Strahlung) ◦ Wenn aufeinanderfolgende Werte der fehlenden Variablen korreliert sind, dann sind die Residuen im Modell, das diese Variable nicht berücksichtigt, korreliert. Auswirkungen autokorrelierter Residuen ◦ Gewöhnliche OLS-Schätzer bleiben erwartungstreu ( β = β ) Sie haben aber nicht minimale Varianz. Es gibt genauere Schätzer. ◦ Die Standardfehler (s.e.) der Koeffizienten βi werden verzerrt geschätzt. ◦ Dadurch werden t-Tests und Konfidenzintervalle ungenau. t= βˆ i s.e.(βˆ i ) Die Schätzfehler können zu Missspezifikation des Modells führen. Folie 11 Aufdecken von Autokorrelation ◦ Grafische Residualanalyse (Scatterplot) ◦ Analyse von Autokorrelationsfunktion (AC) und partieller Autokorrelationsfunktion (PAC) ◦ Durbin-Watson (Lag 1) / Breusch-Godfrey (Lag p) ◦ Box-Pierce / Ljung-Box (Lag p) – auch als Portmanteau-Tests bezeichnet Massnahmen 1. Hinzunahme zusätzlicher, erklärender Variablen Beispiel: Strahlung im Beispiel Fernwärme, Saisondummys 2. Berücksichtigung der Lagstruktur der erklärenden Variablen Beispiel: Temperatur der Vortage im Beispiel Fernwärme 3. Generalized Least Squares Estimator (GLS) => Korrektur der Standardfehler Beispiel: Prais-Winsten-Schätzer 4. Modellierung und Einbezug der korrelierten Fehler als AR(p)-Modell Beispiel: Cochrane-Orcutt-Verfahren Anwendung von GLS respektive Einbezug von korrelierten Fehlern erst dann, wenn - Alle wichtigen Variablen im Modell vorhanden sind. - Die Lagstruktur der erklärenden Variablen im Modell genügend berücksichtigt wurde. Folie 12 Beispiel mit simulierten Daten Ein Regressionsmodell für simulierte Zeitreihen wird geschätzt y t = β0 + β1x t + β2 x 2t + Et y t = β0 + 1⋅ x t + 2 ⋅ x 2t + Et x t = t / 50 t ∈ {1,100} Et sei ein AR(1)-Prozess <=> Fehlerterme sind forciert autokorreliert, im Gegensatz zu i.i.d. E t = −0.65 ⋅ E t −1 + u t Var u t = 0.1 Simulation mit EViews (100 zufällig erzeugte Zeitreihen {yt} t=1,Y,n mit n = 100) Eine der zufällig erzeugten Zeitreihen yt yt 2xt2 xt Et Folie 13 Schätzung ohne und mit Berücksichtigung der korrelierten Fehler (Cochrane-Orcutt) Beispiel: Koeffizient β1 (Modellwert ≡ 1) Standardfehler (s.e.) des Koeffizienten β1 .12 1.15 1.10 .10 1.05 .08 1.00 .06 0.95 .04 0.90 0.85 .02 Ohne Mit Ohne Mit Werte der Schätzungen von 100 zufällig erzeugten Zeitreihen Folie 14 Schätzung ohne und mit Berücksichtigung der korrelierten Fehler (Cochrane-Orcutt) Koeffizient β1 => Werte sind vergleichbar Schätzer sind erwartungstreu Standardfehler => Werte sind deutlich verschieden Die Berücksichtigung der korrelierten Fehler (Hier: Cochrane-Orcutt) liefert kleinere Standardfehler (se) (ca. Faktor ½) Tabelle: Schätzung des Koeffizienten β1 (Modellwert ≡ 1) Mittelwert aus den 100 zufällig erzeugten Zeitreihen Mean Median Maximum Minimum ohne Kleinste Quadrate Koeffizient β1 se 1.0010 0.0925 0.9988 0.0920 1.0898 0.1096 0.8941 0.0674 mit Cochrane-Orcutt Koeffizient β1 se 0.9915 0.0427 0.9953 0.0427 1.1135 0.0547 0.8683 0.0355 mit/ohne Koeffizient β1 99.1% 99.6% 102.2% 97.1% se 46.2% 46.4% 49.9% 52.6% Folie 15 Tests auf Autokorrelation der Fehlerterme Durbin-Watson-Test Modell Et = ρ ⋅ Et-1 + ut (AR(1)-Prozess der Fehlerterme <=> Autokorrelation) Nullhypothese H0: ρ = 0, Alternativhypothese HA: ρ ≠ 0 Teststatistik N ∑ (R D̂ = t − R t −1 )2 t =2 N ∑R , mit R t = y t − ŷ t Residuum zum Zeitpunkt t 2 t t =2 Approximativer Zusammenhang zwischen Durbin-Watson-Statistik und Autokorrelation ˆ ≈ 2(1 − ρˆ ) D => Werte schwanken zwischen 0 (R t = R t-1 ) und 4 (R t = -R t-1 ) Werte nahe bei 2 deuten auf Unkorreliertheit der Fehlerterme hin (siehe auch Hackl 2013) Nachteil Durbin-Watson testet nur die erste Autokorrelation (p = 1) Wenn Fehlerterme einem AR(p)-Prozess mit p > 1 folgen, versagt der Test. Folie 16 Durbin-Watson-Test am Beispiel der simulierten Daten 3.6 Ohne Korrektur: DW ≈ 3.3 => deutliches Zeichen für autokorrelierte Fehlerterme 3.2 Kritische Grenzen 2.8 Hackl (2013: Seite 490) Online (Zugriff: November 2014): www.stanford.edu/~clint/bench/dwcrit.htm n = 100, α = 0.05, k = 3 => dL = 2.29, dH = 2.37 n = 100, a = 0.05, k = 2 => 3.3 signifikant verschieden von 2 2.4 2.0 Mit Korrektur (Cochrane-Orcutt): DW ≈ 2.0 => keine autokorrelierten Fehlerterme 1.6 Ohne Mit Folie 17 Breusch-Godfrey-Test (siehe auch Tests von Box-Pierce und Ljung-Box) Modell Et = ϕ1⋅Et-1 +...+ ϕp⋅Et-p + ut (AR(p)-Prozess der Fehlerterme <=> Autokorrelation) Nullhypothese H0: ϕi = 0, i = 1,...p, Alternativhypothese HA: ϕi ≠ 0 für mindestens ein i Teststatistik: Bestimmtheitsmasse der Hilfsregression der Residuen aufeinander Eigenschaften Breusch-Godfrey-Test ist allgemeiner als Durbin-Watson-Test Der Wert von p muss vor dem Test bestimmt werden (Korrelogramm) Anwendung in EViews am Beispiel von einer der zufällig erzeugten Zeitreihen Im Output View Residual Tests Serial Correlation LM test... wählen. Hier: p = 2 Nullhypothese verwerfen ϕi ≠ 0 Modellwert ≡ -0.65 Modellwert ≡ -0.00 Folie 18 Cochrane-Orcutt-Methode für autokorrelierte Fehlerterme Spezialfall AR(1)-Modell für den Fehler Modell für die Fehler: Et = ϕ ⋅ Et-1 + ut, wobei ut weisses Rauschen Regressionsmodell einer Zeitreihe, beispielsweise: Yt = β0 + β1X t(1) + β2X t(2) + Et Bilden der Differenz Yt* = Yt − ϕYt −1 / Modell für Yt und Yt-1 einsetzen (2) (2) = β0 + β1X(1) + Et − ϕ(β0 + β1X(1) t + β2 X t t −1 + β2 X t −1 + E t −1 ) (1) (2) = β0 (1 − ϕ) + β1(X(1) − ϕX(2) t − ϕX t −1 ) + β2 (X t t −1 ) + E t − ϕE t −1 * 0 = β + β1X *(1) t + β2 X *(2) t wobei gilt E t − ϕE t −1 = ut + ut Wobei gilt β0* = β0 (1 − ϕ), (1) X*(1) = X(1) t t − ϕX t −1, X*(2) = X(2) − ϕX(2) t t t −1 Das transformierte Modell ist frei von Autokorrelation. Das transformierte Modell erfüllt die Voraussetzungen des allgemeinen Regressionsmodells. Nachteil: Um das transformierte Modell zu berechnen, muss ϕ bekannt sein. Folie 19 Hinweise zu EViews Tests auf Autokorrelation ◦ Durbin-Watson-Test wird standardmässig im Output eines Modells angezeigt ◦ Breusch-Godfrey-Test kann im Output unter View Residual Diagnostics Serial Correlation LM Test... gewählt werden HAC-Schätzer für die Varianz (heteroskedasticity and autocorrelation consistent) ◦ Schätzer nach Newey und West (1987) (korrigiert die Varianz der OLS Schätzung) kann bei der Spezifikation der Gleichung unter Options gewählt werden. Cochrane-Orcutt-Methode bei Autokorrelation der Fehlerterme ◦ Das Modell für die Fehlerterme muss bekannt sein. Beispielsweise ein AR(1)-Prozess. ◦ Bei der Spezifikation der Regression werden die Lags der Fehlerterme angegeben. Folie 20 Breusch-Godfrey-Test und Cochrane-Orcutt-Methode am Beispiel der Verkehrsdaten 260,000 240,000 40000 220,000 20000 200,000 0 180,000 Die verbleibende Zeitreihe ("Residual") enthält nur noch Saisonalität und Restterm. -20000 -40000 97 98 99 00 Residual 01 02 Actual 03 04 Fitted EViews: Method Least Squares Lineare Trendfunktion Ft = β0 + β1⋅t + ut t ∈ {1,32} Ft = 207'143.3 + 1133.867 ⋅ t DW ist ok, aber nur für Lag 1 Folie 21 Breusch-Godfrey-Test mit p = 4 Die Residuen sind autokorreliert mit Lag 2 Cochrane-Orcutt-Modell mit Lag 2 Folie 22 Cochrane-Orcutt-Methode Dummy-Variablen (gemäss LS 02) 280,000 280,000 260,000 260,000 240,000 220,000 10000 200,000 5000 180,000 240,000 10000 220,000 5000 200,000 0 180,000 0 -5000 -5000 -10000 -10000 1998 1999 2000 Residual 2001 Actual 2002 2003 Fitted 2004 1998 1999 2000 Residual 2001 Actual 2002 2003 Fitted 2004 Folie 23 Modellierung von ARMA(p,q)-Prozessen Deutsches BIP zwischen 1970:Q1 und 2008:Q2 BIP (Index: 2000 = 100) 120 100 80 60 40 1 97 0 1975 1980 1985 1990 1995 2000 2 005 Bruttoinlandsprodukt der BRD. Preisbereinigte Quartalsdaten. Quelle: www.bundesbank.de Folie 24 Zum Vergleich: Simulierter ARMA(2,3)-Prozess zwischen 1970:Q1 und 2008:Q2 Yt = 0.7 + 0.6Yt −1 + 0.4Yt −2 + ut + 0.5ut −1 − 0.3ut −2 + 0.1ut −3 70 60 50 40 30 20 10 0 1 970 (Excel-Tool "ARMA(p,q).xls") 1975 1980 1985 1990 1995 2000 2005 Folie 25 Eigenschaften von ARMA-Prozessen Aus den Eigenschaften von AR(p)- und MA(q)-Prozessen aus LS 03 folgt: Jeder stationäre AR(p)-Prozess lässt sich als MA(∞)-Prozess schreiben Jeder invertierbare MA(q)-Prozess lässt sich als AR(∞)-Prozess schreiben => Jeder stationäre Prozess lässt sich beliebig genau durch einen ARMA-Prozess annähern. ARMA(p,q) Prozesse sind in der Regel nicht eindeutig. Der gleiche Prozess kann mit verschiedenen Kombinationen von p und q dargestellt werden. Grundsätzlich gilt: ◦ Modellierung mit kleinen p und q vereinfachen die Analyse. ◦ AR-Repräsentation eignet sich besser für die Schätzung, da die OLS Annahmen erfüllt sind. ◦ MA-Darstellung eignet sich besser für die Berechnung von Varianzen und Kovarianzen. Folie 26 Korrelogramm: Simulierter AR(1)-Prozess AR(1)-Prozess Yt = 0.3 + 0.6Yt-1 mit und ohne überlagertem, deterministischem Trend 0.1⋅t Mit Trend 20 16 12 8 4 0 1975 1980 1985 1990 1 99 5 2000 2005 Ohne Trend 2.4 2.0 1.6 1.2 0.8 0.4 0.0 -0.4 -0.8 1975 1980 1985 1990 1995 2000 2005 Folie 27 EViews-Schätzung zum Prozess Yt = 0.3 + 0.6Yt-1 mit und ohne Trend Mit Trend Zeitreihe ist nicht stationär (Trend) Modell nicht OK Schätzung der Parameter fehlerbehaftet Ohne Trend Zeitreihe ist stationär Modell OK Schätzung der Parameter OK Folie 28 ACF Eigenschaften der AC- und PAC-Funktion von ARMA(p,q)-Prozessen Φ(L)Yt = ε t AR(p)-Prozess: p=q=1 ρk = ϕk p,q > 1 ρk = ∑ ϕiρk −i ρk p=q=1 φ1 = ϕ1 p,q > 1 φkk = 0 Nicht abbrechende, gedämpfte Exponentialfunktion oder Sinusfunktion. ρ1 = p i=1 PACF MA(q)-Prozess: Yt = Θ(L)ε t Modell für k > p Die Bestimmung des grössten Lags k, für den alle nachfolgenden partiellen Autokorrelationen 0 sind, ergibt die Ordnung des AR(p)-Prozesses θ 1 < 2 1+ θ 2 ∑ = q −k i=1 θi θi + k q 1 + ∑i=1 θi2 ρk = 0 für k > 1 ρk = 0 für k > q Wurzel des charakteristischen Polynoms reell => Exponentialfunktion Wurzeln des charakteristischen Polynoms komplex => Sinusfunktion Siehe auch Zusammenstellung für p + q ≤ 2 im Appendix der Practice zu LS 04. Folie 29 Theoretische ACF und PACF verschiedener ARMA(1,1)-Prozesse ϕ1 = 0.8 θ1 = 0.3 ϕ1 = 0.3 θ1 = 0.8 ϕ1 = -0.8 θ1 = 0.3 Quelle: Vorlesungsunterlagen der TU Ilmenau Quelle: (www.tu-ilmenau.de, November 2010 / Stand November 2014 => nicht mehr zugänglich) Folie 30 Theoretische und empirische ACF und PACF eines simulierten AR (2)-Prozesses Quelle: Vorlesungsunterlagen der TU Ilmenau Quelle: (www.tu-ilmenau.de, November 2010 / Stand November 2014 => nicht mehr zugänglich) Folie 31 Stationarität eines AR(p)-Prozesses AR(p)-Modell in der Schreibweise mit Lag-Operator (1 − ϕ1L − ϕ2L2 − ... − ϕpLp )Yt = α + ut Charakteristisches Polynom Φ(L ) = (1 − ϕ1L − ϕ2L2 − ... − ϕpLp ) => Φ(L)Yt = α + ut Ein AR(p)-Prozess ist genau dann stationär, wenn alle (komplexen) Nullstellen zi des charakteristischen Polynoms ausserhalb des Einheitskreises (|z| = 1) liegen. |z| > 1. Daraus folgt für die Kehrwerte (invertet roots): 1/|z| < 1 Beispiel AR(2): Yt = 0.5 ⋅Yt-1 + 0.5 ⋅Yt-2 + Et => Φ(L) = (1 – ϕ1L – ϕ2L2) = (1 – 0.5L – 0.5L2) Nullstellen von Φ(z): 1 – 0.5z – 0.5z2 = 0 => z1 = 1.0, z2 = -2.0 Da z1 nicht ausserhalb des Einheitskreises liegt, ist Yt nicht stationär. Folie 32 Beispiel mit EViews mit drei simulierten AR(2)-Prozessen Yt = 0.5 ⋅Yt-1 + 0.5 ⋅Yt-2 + Et => z1 = 1.0, z2 = -2.0 10 5 0 -5 -10 -15 -20 -25 1970 1975 1980 1985 ARMA1 1990 1995 ARMA2 2000 2005 ARMA3 Die Inverted AR Roots nahe bei 1 deuten auf den nichtstationären Charakter hin. Achtung: Die Scatterplots ARMA1 und ARMA3 lassen vermuten, dass es sich um stationäre Zeitreihen handelt. Das ist aber nicht so! Folie 33 Invertierbarkeit eines MA(q)-Prozesses Ein MA(q)-Prozess Yt = α + ut + θ1ut −1 + θ2ut −2 + ... + θqut −q ist immer stationär, unabhängig von den Parametern α und θi. Damit der MA(q)-Prozess in einen AR(∞) überführt werden kann (Invertierung), muss gelten Ein MA(q)-Prozess ist genau dann invertierbar, wenn alle (komplexen) Nullstellen zi des charakteristischen Polynoms ausserhalb des Einheitskreises (|z| = 1) liegen. |z| > 1. Daraus folgt für die Kehrwerte (invertet roots): 1/|z| < 1 Bedeutung der Invertierbarkeit: Eindeutigkeit eines MA(q)-Prozesses Verschiedene MA(q)-Prozesse können zu identischen ACF und damit auch PACF führen. Ein Rückschluss von der Autokorrelationsfunktion auf den erzeugenden Prozess ist nur dann eindeutig möglich, wenn der MA(q)-Prozesse invertierbar ist. Folie 34 Zusammenfassung: Charakterisierung des ARMA(p,q)-Prozesses Modell AR(p)-Prozess MA(q)-Prozess ARMA(p,q)-Prozess Φ(L)Yt = ε t Yt = Θ(L)ε t Φ(L )Yt = Θ(L )ε t Wurzeln zi von Φ( z ) = 0 : zi > 1 immer stationär Wurzeln zi von Φ( z ) = 0 : zi > 1 Wurzeln zi von Θ( z) = 0 : zi > 1 Wurzeln zi von Θ( z) = 0 : zi > 1 Bedingung für Stationarität Invertierbarkeit immer invertierbar Eigenschaften ACF unendlich: exponentiell endlich: ρk = 0 für k > q fallend, gedämpfter Sinus PACF endlich: φkk = 0 für k > p unendlich: exponentiell Wie MA(q) ab k > p fallend, gedämpfter Sinus Wie AR(p) ab k > q Anmerkung zur Darstellung der Modelle ohne Intercept α: Durch die Transformation Yt' = Yt - α wird der Intercept α eines ARMA-Prozesses entfernt. Folie 35 Phasen der Modellbildung (nach Box-Jenkins 1970 / 1994) Parameter schätzer nicht signifikant Signifikante Autokorrelationen Modellidentifikation und Modellspezifikation Modellschätzung (Schätzung der Parameter) Modelldiagnose Überprüfung der Zeitreihe auf Stationarität Bestimmung der Ordnungen p und q OLS-Schätzung Maximum-Likelihood Schätzung Überprüfung, ob Autokorrelation in den Residuen des geschätzten Modells vorliegt Modellanwendung (Deskription, Prognose, Diagnose, Kontrolle) Anwendung des spezifizierten Modells für verschiedene Zwecke Folie 36 Anmerkungen zur Modellidentifikation und Modellspezifikation Überprüfung der Zeitreihe auf Stationarität ◦ Inspektion der Zeitreihenplots ◦ Autokorrelationsfunktion und partielle Autokorrelationsfunktion (Korrelogramm) ◦ Unit-Root-Test (mehr in in LS 05) Bestimmung der Ordnungen p und q Wie sollen die Ordnungen p und q des anzupassenden ARMA-Modells gewählt werden? Es gibt 2 Fehlermöglichkeiten: ◦ p oder q werden zu gross gewählt => Overfitting ◦ p oder q werden zu klein gewählt => Underfitting Sowohl beim Overfitting als auch beim Underfitting ist der ML-Schätzer nicht mehr konsistent. Korrekte Bestimmung der Ordnungen p und q ist deshalb von Bedeutung. Prämisse der Box-Jenkins-Modellierung: So wenige Parameter wie möglich benutzen. Folie 37 Methoden zur Bestimmung der Ordnungen p und q Visuelle Inspektion der empirischen ACF und PACF (schwierig ...) ◦ ACF: Die Autokorrelationen sollten sich gemäss Theorie wie eine fallende Exponentialfunktion oder eine gedämpfte Sinuswelle verhalten. Falls dies nicht erfüllt ist, liegt ein komplizierteres Modell vor, wie z.B. ein ARMA-Modell. ◦ PACF: Die Bestimmung des "cut-offs" bei den partiellen Autokorrelationen, d.h. ab welchem Lag die folgenden partiellen Autokorrelationen 0 sein können, gibt eine mögliche Schätzung der Ordnung p. Die Ordnungen p und q werden in der Regel eher überschätzt. Folie 38 Bestimmung der Ordnungen p und q mit Informationskriterien Grundidee: Minimierung eines Informationskriteriums ◦ Mit steigender Ordnung von p und q wird die Anpassung des ARMA-Modells besser. Die geschätzte Varianz der Residuen σ2p,q ist eine Masszahl für die Anpassung des Modells. Mit steigender Ordnung von p und q nimmt σ2p,q ab. ◦ Als Korrektur gegen das Overfitting, wird das Anpassungsmass σ2p,q um einen Term ergänzt, der höhere Wahlen von p und q bestraft. Am meisten benutzte Informationskriterien ◦ AIC (Akaike-Informationskriterium) AIC(p, q) = log( σˆ p2,q ) + (p + q) 2 T ◦ SIC (Schwarz-Informationskriterium) SIC(p, q) = log( σˆ p2,q ) + (p + q) log( T ) T ◦ HQIC (Hannan-Quinn-Informationskriterium) HQIC(p, q) = log( σˆ p2,q ) + (p + q) 2 log[log( T )] T In der Praxis werden p und q so gewählt, dass nur eines der Informationskriterien minimal wird. Meistens wird das AIC-Kriterium gewählt, obwohl es eher zu Overfitting führt. Folie 39 Beispiel zur Modellbildung Datengrundlage: Deutsches BIP zwischen 1970:Q1 und 2008:Q2 BIP (Index: 2000 = 100 120 100 80 60 40 1 97 0 1975 1980 1985 1990 1995 2000 2 005 Bruttoinlandsprodukt der BRD. Preisbereinigte Quartalsdaten. Quelle: www.bundesbank.de Folie 40 BIP Wachstumsrate (Prozentuale Veränderung gegenüber Vorjahresquartal) .08 .06 BIP [%] .04 .02 .00 -.02 -.04 1970 1975 1980 1985 1990 1995 2000 2005 Strukturbrüche? 1973:1 <=> Ölschock 1973 1980:1 <=> Zweite Ölkrise (Revolution im Iran und Iran-Irak-Krieg) 1991:2 <=> Wiedervereinigung 1989 2000:2 <=> Dotcom-Blase ("Deutschland - deine Rezessionen", www.sueddeutsche.de, Mai 2010, Zugriff: November 2014) Folie 41 Eigenschaften und Vorbereitung für Modellierung Überprüfung der Zeitreihe auf Stationarität und Saisonalität ◦ Bruttoinlandsprodukt weist offensichtlich einen Trend auf. ◦ Bruttoinlandsprodukt weist offensichtlich ein Saisonmuster auf (Quartalsmuster). Transformation zu saisonalen Differenzen in Logarithmen EViews: gdp_log = log(gdp) - log(gdp(-4)) Yt = (1 – L4)log(BIPt) = log(BIPt) – log(BIPt-4) Yt = Wachstumsrate gegenüber dem Vorjahresquartal Entspricht ungefähr prozentualer Veränderung gegenüber Vorjahresquartal Folie 42 Korrelogramm und Ordnung p und q ACF: langsam, monoton abklingend => AR-Modell PACF: signifikante Werte bis k = 4 => AR(4)-Modell Anmerkung: Allgemein ist die Interpretation eines signifikanten PACF bei k = 4 eher nicht realistisch. Um nicht nur mit dem einfachsten Modell, das heisst AR(1), weiter zu fahren, wird davon ausgegangen, dass die PACF bei k = 4 signifikant ist. Folie 43 Bestimmung der Ordnungen p und q mit Informationskriterien AIC (Akaike-Informationskriterium) p/q p=0 p=1 p=2 p=3 p=4 p=5 q=0 -5.8273 -5.8318 -5.8115 -5.8523 -5.9000 q=1 -5.6146 -5.8157 -5.8828 -5.8922 -5.8946 -5.8876 q=2 -5.6517 -5.8121 -5.8855 -5.8878 -5.8978 -5.9218 q=3 -5.9208 -5.9522 -5.9438 -5.9242 -6.0001 -5.9650 q=4 -5.9186 -5.9436 -5.9335 -5.9236 -6.0128 -5.9981 q=3 -5.8405 -5.8514 -5.8223 -5.7818 -5.8366 -5.7802 q=4 -5.8183 -5.8226 -5.7918 -5.7608 -5.8288 -5.7928 => ARMA(4,4)- oder ARMA(4,3)-Modell SIC (Schwarz-Informationskriterium) p/q p=0 p=1 p=2 p=3 p=4 p=5 q=0 -5.7869 -5.7711 -5.7301 -5.7502 -5.7769 q=1 -5.5744 -5.7552 -5.8018 -5.7905 -5.7720 -5.7439 q=2 -5.5915 -5.7314 -5.7842 -5.7657 -5.7547 -5.7576 => ARMA(1,3)- oder ARMA(0,3)-Modell Folie 44 Schätzung der Modelle ARMA(4,0)-Modell ( AR(4)-Modell) Varianz der Residuen σ2 = (0.012754)2 = 0.000162 ARMA(1,3)-Modell Varianz der Residuen σ2 = (0.012137)2 = 0.000147 Bessere Anpassung als AR(4)-Modell Schlussmodell ARMA(0,3)-Modell (da AR(1) nicht signifikant) σ2 = (0.012370)2 = 0.000153 Folie 45 "Equation Diagnostics": Wurzeln der charakteristischen Polynome Die Kehrwerte der Nullstellen (Inverted Roots) der charakteristischen Polynome für AR(p)- und MA(q)-Prozesse sollten innerhalb des Einheitskreises liegen. Inverse Roots of AR/MA Polynomial(s) 1.5 1.0 MA roots 0.5 0.0 -0.5 -1.0 -1.5 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 Kehrwerte der Nullstellen des MA-Polynoms innerhalb des Einheitskreises => invertierbar Folie 46 "Equation Diagnostics": Vergleich von theoretischem und empirischem Korrelogram Falls das Modell richtig spezifiziert ist, sollten die beiden Kurven "nahe" sein ( "...should be 'close'.") Autocorrelation .8 .4 .0 -.4 2 4 6 8 10 Partial autocorrelation Actual 12 14 16 18 20 Theoretical Theoretisches und empirisches Korrelogram liegen nahe und die Vorzeichen der Autokorrelationen und partiellen Autokorrelationen stimmen überein. .8 => ARMA(0,3)-Struktur wird bestätigt .4 .0 -.4 2 4 6 8 Actual 10 12 14 Theoretical 16 18 20 Folie 47 Residualanalyse Keine signifikanten Autokorrelationen der Residuen bis zum Lag k = 20. Die Residuen verhalten sich wie Weisses Rauschen. Folie 48 Schlussmodell und Prognose Prognoseintervall .08 .06 .04 .02 .00 -.02 -.04 1970 Prognoseintervall 1975 1980 1985 1990 1995 Intervall für die Modellschätzung 1. Quartal 1971 bis 2. Quartal 2006 Intervall für die Prognose 2. Quartal 2006 bis 2. Quartal 2008 2000 2005