Brownsche Bewegung, Diffusionsprozesse und Ito`s Lemma
Transcription
Brownsche Bewegung, Diffusionsprozesse und Ito`s Lemma
Fakultät für Volkswirtschaftslehre Ludwig-Maximilians-Universität München Schwerpunktseminar „Bewertung von Wertpapieren“ Sommersemester 2002 Prof. Sven Rady Brownsche Bewegung, Diffusionsprozesse und Itos Lemma Betreuung: Dipl.-Volksw. Markus Reisinger Verfasser: Matthias Kredler Werner-Friedmann-Bogen 8 80993 München Matrikelnummer: 120377304471 Fachsemester: 8 Gliederung I. Einleitung 1 II. Brownsche Bewegung (oder Wiener-Prozess) 2 1. Herleitung über einen Random Walk in diskreter Zeit 2 2. Definition 5 3. Eigenschaften 6 a) Nicht-Differenzierbarkeit b) Markov-Eigenschaft c) Erwartungswert und Varianz d) Stetigkeit und Pfadlänge 4. Beispiel: Der DAX während eines Handelstages III. Diffusionsprozesse (oder Ito-Prozesse) 1.Definition 2. Wichtige Prozesse 8 9 9 10 a) Brownsche Bewegung mit Drift b) Geometrische Brownsche Bewegung c) Mean-Reverting Process (oder Ornstein-Uhlenbeck-Prozess) IV. Ito-Formel 1. Herleitung 2. Interpretation 15 3. Beispiel: der Logarithmus eines Aktienindex über längere Zeit 16 V. Möglichkeiten und Vorteile stetiger Prozesse 2 13 13 17 VI. Anhang 18 1. Grafiken 18 a) zu II.4.: Beispiel: Der DAX während eines Handelstages 18 b) zu III.1.: Brownsche Bewegung mit Drift 20 c) zu III.2.: Geometrische Brownsche Bewegung 21 d) zu III.3.: Mean-Reverting Process (oder Ornstein-Uhlenbeck-Prozess 22 e) zu IV.3.: Beispiel: Der Logarithmus des DAX über längere Zeit 24 2. Mathematischer Teil 27 a) zu II.3 d: Stetigkeit und Pfadlänge 27 b) zu IV.1.: Herleitung der Ito-Formel 27 c) zu IV.2: Interpretation der Ito-Formel: Jensens Ungleichheit 32 d) zu VI.1a: Simulation einer Brownschen Bewegung 33 e) zu VI.1b: Simulation einer Brownschen Bewegung mit Drift 33 f) zu VI.1c: Simulation einer geometrischen Brownschen Bewegung 33 g) zu VI.1d: Simulation eines Mean-Reverting Process 34 h) zu VI.1e: Konstruktion von Erwartungswerten und Konfidenzintervallen der geometrischen Brownschen Bewegung VII. Literaturverzeichnis 3 34 35 I. Einleitung In vielen Disziplinen, wie den Ingenieurwissenschaften oder der Klassischen Physik, die sich der Mathematik als Hilfsmittel bedienen, stehen deterministische Funktionen im Vordergrund. Bei deterministischen Funktionen ist jedem Argument eindeutig ein Funktionswert zugeordnet. Will beispielsweise ein Ingenieur die Flugbahn einer Rakete berechnen, bedient er sich gewisser mathematischer Werkzeuge, um die Raketenkoordinaten als eine Funktion der Zeit zu erhalten. Damit kann – im Rahmen bekannter Toleranzen – die Flugbahn perfekt vorhergesagt werden. In anderen Disziplinen, wie der Quantenphysik, der Medizin oder der Wirtschaftswissenschaft, ist es hingegen meist nicht möglich, eine solch sichere Vorhersage zu treffen. Auf den Finanzmärkten ist die Vorhersagbarkeit aufgrund der ihnen innewohnenden Eigenschaften besonders eingeschränkt. Würde nämlich der Kurs eines Wertpapiers einer deterministischen Funktion folgen, bestünde die Möglichkeit zur Arbitrage – gerade das kann nicht sein. Wenn Größen wie der Preis eines Wertpapiers mathematisch als Funktion beschrieben werden sollen, sind also Ansätze vonnöten, die eine stochastische Komponente aufweisen. Ein entsprechendes Instrumentarium bieten u.a. stochastische Prozesse. Für die Anwendung in Finanzmarktmodellen sind insbesondere die sogenannten Diffusions- oder Ito-Prozesse von Interesse, in denen sowohl deterministische als auch stochastische Anteile in die Modellierung eingehen. So könnte z.B. die langfristige Entwicklung eines Aktienindex als eine Zusammensetzung eines langfristigen exponentiellen Trends als deterministischer Komponente und kurzfristigen erratischen Abweichungen als stochastischer Komponente gesehen werden. Als Grundlage zur Modellierung einer standardisierten erratischen Komponente in stetiger Zeit dient oft die sogenannte Brownsche Bewegung. Auf der Basis dieses Konzeptes können dann durch mathematische Erweiterungen kompliziertere Prozesse beschrieben werden. Das Konzept der Brownschen Bewegung stammt ursprünglich aus der Physik. Der englische Botaniker Robert Brown hatte 1827 festgestellt, dass in Wasser schwimmende Pollenteilchen unter dem Mikroskop merkwürdig hin- und herzitternden Bahnen folgten, obwohl sie eindeutig nicht mehr lebendig waren. Physiker stellten später fest, dass diese Bewegungen durch das ständige Bombardement der Pollenteilchen durch die Wassermoleküle in ihrer unmittelbaren 1 Umgebung verursacht wurden. Später tauchte auch in anderen Bereichen der Physik, wie z.B. der Quantenmechanik, die Notwendigkeit auf, nicht-deterministische Prozesse mathematisch zu beschreiben. Die erste mathematische Theorie zur Brownschen Bewegung wurde 1905 von Albert Einstein entwickelt; für diese Leistung erhielt er später den Nobelpreis. Im Mittelpunkt dieser Arbeit soll eine eingängige, möglichst intuitive Beschreibung der Brownschen Bewegung, einiger Diffusionsprozesse und der Ito-Formel stehen. Die mathematischen Eigenschaften der vorgestellten Prozesse werden bezüglich ihrer Relevanz auf Finanzmärkten beschrieben und mit realwirtschaftlichen Datenreihen verglichen. Die Darstellung hält sich im Wesentlichen an das Kapitel 3 in „Investment under Uncertainty” von A. Dixit und R. Pindyck und den Anhang von „Asset Pricing“ von J. Cochrane. „Stochastic Differential Equations“ von B. Øksendal, ein Buch aus der mathematischen Fachliteratur, geht nur in eine Herleitung im Anhang ein. II. Brownsche Bewegung (oder Wiener-Prozess) II.1. Herleitung über einen Random Walk in diskreter Zeit Die Brownsche Bewegung (auch Wiener-Prozess genannt) ist ein erratischer Prozess in stetiger Zeit, der als Grenzwert eines Random Walks in diskreter Zeit hergeleitet werden kann.1 Mit Hilfe dieser Herleitung kann anschaulich dargestellt werden, warum es sinnvoll ist, die Brownsche Bewegung mit bestimmten Eigenschaften wie z.B. der Normalverteilung der Inkremente zu definieren. Hierzu wird ein Random Walk ohne Drift einer Variablen x über ein Zeitintervall T betrachtet. Dieses große Zeitintervall T wird in n gleich lange kleine Intervalle mit Länge ∆t aufgeteilt. In jeder dieser Perioden kann sich die Variable x um den Betrag ∆h entweder nach oben oder nach unten bewegen. Ein Sprung nach oben bzw. unten erfolgt in jedem Zeitintervall jeweils mit der Wahrscheinlichkeit ½.2 Dadurch ergibt sich ein rekombinierender Binomialbaum3, der für drei Perioden grafisch wie folgt dargestellt werden kann: 1 Die Herleitung der Brownschen Bewegung aus dem Random Walk hält sich an Dixit/Pindyck, Kapitel 3, 2.B. Die beiden Wahrscheinlichkeiten können auch unterschiedlich groß sein (wie in der Herleitung von Dixit und Pindyck). Dann ergibt sich ein Random Walk mit Drift. Die interessanten Implikationen der Herleitung können aber auch bei gleichen Wahrscheinlichkeiten erhalten werden und die Herleitung ist weniger kompliziert. 3 Die Tatsache, dass die Technik der rekombinierenden Binomialbäume in der Praxis von Investment-Bankern bei der Bewertung exotischer Wertpapierderivate angewandt wird, zeigt, dass die Brownsche Bewegung als 2 2 ... x0+3∆h x0+2∆h x0+∆h x0 1 x0-∆h x0-2∆h x0-3∆h ... 1/8 1/4 1/2 3/8 1/2 1/2 3/8 1/4 1/8 t=0 t=1 t=2 t=3 ... Schon nach zwei bis drei Perioden ist zu erkennen, dass am Ende x-Werte nahe am Ausgangswert x0 mit größerer Wahrscheinlichkeit auftreten werden als x-Werte am oberen und unteren Ende der Verteilung. Das liegt daran, dass Werte in der Mitte über mehr Pfade erreichbar sind als die Extremwerte oben und unten. So ist z.B. in t = 3 der Wert x0 + ∆h bei drei verschiedenen Entwicklungen von x erreichbar4, der Wert x0 + 3∆h hingegen nur bei einem Hergang des Prozesses – nämlich drei Aufwärtsbewegungen in Folge. Diese Wahrscheinlichkeitsverteilung mit einer großen Wahrscheinlichkeitsmasse bei mittleren Werten und kleinen Wahrscheinlichkeiten an den Enden findet man auch bei der Normalverteilung; tatsächlich ist es so, dass die den Random Walk beschreibende Binomialverteilung gegen die Normalverteilung konvergiert, wenn n unendlich groß wird. Um über die Verteilungseigenschaften von zukünftigen Werten xt Aussagen treffen zu können, ist es notwendig, zuerst die Eigenschaften der Differenzen zwischen den x-Werten an zwei aufeinander folgenden Zeitpunkten zu betrachten. Diese Differenzen, die Inkremente genannt werden, werden wie folgt bezeichnet: ∆xt = xt +1 − xt Grenzwert des Random Walk die Realitäten der Finanzmärkte – wenigstens in überschaubaren Zeitabschnitten – hinreichend gut abbildet. 4 nämlich bei den Abfolgen auf-auf-ab, auf-ab-auf und ab-auf-auf 3 ∆xt ist eine Zufallsvariable, die die Werte ∆h und –∆h annehmen kann. Für Erwartungswert und Varianz von ∆xt gilt: 1 1 E (∆xt ) = ∆h − ∆h = 0 2 2 Var (∆xt ) = 1 (∆h − 0)2 + 1 (− ∆h − 0)2 = (∆h )2 2 2 Mit Hilfe dieser Werte kann man dann die Verteilungseigenschaften für die kumulierte Veränderung von x über das Gesamtintervall T, also xt – x0, bestimmen. Diese kumulierte Veränderung ist die Summe aller einzelnen Inkremente ∆xt. Der Erwartungswert für die Summe dieser Inkremente ist gleich der Summe der Erwartungswerte aller Inkremente, also 0. Die einzelnen Inkremente sind nach der Definition eines Random Walks unabhängig; deswegen ist auch die Varianz von xt - x0 einfach die Summe der Varianzen der einzelnen ∆xt Var ( xt − x0 ) = n(∆h) 2 2 ( ∆h ) = T ∆t Innerhalb des Intervalls sollen nun die Teilintervalle ∆t immer kleiner werden und schließlich gegen die Größe 0 gehen, um den gewünschten Prozess in stetiger Zeit zu erhalten. Das Problem ist es, den Parameter ∆h so zu wählen, dass der Prozess auch im Grenzwert noch die gewünschten Eigenschaften hat und Erwartungswert sowie Varianz sinnvolle Werte annehmen. Für den Erwartungswert ist die Wahl von ∆h unerheblich, da dieser immer 0 bleibt, egal wie groß ∆h ist. Als problematisch erweist es sich, ∆h so zu wählen, dass die Varianz im Grenzwert noch sinnvoll definiert ist. Wählt man beispielsweise für ∆h eine Konstante, so geht die Varianz von xt - x0 gegen unendlich, wenn die Zeitintervalle ∆ti immer kleiner werden. Es ist also klar, dass ∆h eine Funktion der Größe der Intervalle ∆t sein muss; die Sprünge in dem Random Walk müssen immer kleiner werden, je kleiner die Zeitintervalle werden. In einem weiteren Versuch könnte man ∆h = σ ∆t wählen. Damit wäre die Varianz σ2 ∆t T und würde gegen 0 gehen, wenn ∆t unendlich klein würde. Es stellt sich heraus, dass es nur eine Möglichkeit gibt, eine endliche, positive Varianz zu erhalten. ∆h wird folgendermaßen gewählt: ∆h = σ ∆t Die Größe der Schritte im Random Walk ist also eine lineare Funktion der Wurzel der Größe des Zeitintervalls. Die Inkremente der Variablen x im Random Walk bzw. später die der Variablen zt in der Brownschen Bewegung sind also von der Größenordnung der Wurzel von ∆t – eine Eigenschaft, die in vielen Belangen von großer Bedeutung sein wird. Es ist hilfreich, sich dieses Prinzip an einem Beispiel klarzumachen: Wählt man σ = 1 und eine Zeiteinheit T von einer Sekunde, so wären die Inkremente bei einer Zerlegung in Hundertstelsekunden immer4 hin von der Größe ein Zehntel; betrachtete man eine Zerlegung in Millionstelsekunden, läge die Größe bei einem Tausendstel. Das Verhältnis von Schwankung zu Intervall wird also immer größer, je kürzer das Intervall wird. Diese Eigenschaft der Brownschen Bewegung führt zu einigen ungewöhnlichen Implikationen, die wirtschaftlich höchst relevant sind. Zusammenfassend lässt sich sagen, dass die Inkremente der Brownsche Bewegung über das Zeitintervall T folgende Eigenschaften haben müssen, wenn sie aus dem gerade beschriebenen Random Walk hergeleitet werden sollen: • Normalverteilung der Inkremente • Inkremente der Größenordnung • Voneinander unabhängige Inkremente, egal in welcher Aufteilung von T • Stationäre5 Inkremente ∆t II.2. Definition Die Brownsche Bewegung wird als Prozess einer Variablen z über die Zeit t definiert. zt bezeichnet dabei den Wert von z zum Zeitpunkt t. Die Definition des Prozesses erfolgt wie beim Random Walk über die Differenzen, die zwischen den Werten von zt zu Anfang und Ende beliebiger Zeitintervalle ∆ bestehen: ∆zt = zt+∆ – zt ~ N(0, ∆) bzw. ∆zt = ε t ∆ wobei die Zeitdistanzen ∆ von beliebiger Länge sein können und εt eine standardnormalverteilte Zufallsvariable ist. Bei einem Random Walk folgen die Inkremente einem sogenannten White-Noise-Prozess, d.h. einem stationären Prozess, bei dem die einzelnen Inkremente voneinander unabhängig sind. Genau die gleichen Eigenschaften haben die Inkremente ∆zt der Brownschen Bewegung: Der Erwartungswert jedes Inkrements ∆zt ist 0. Wenn die Intervalllänge ∆ konstant gehalten wird, ist die Varianz der Inkremente ∆zt immer gleich groß, egal welche Werte der Prozess zt oder die Zeit t annehmen. 5 Dies bedeutet, dass die Inkremente zum Zeitpunkt t die gleichen Verteilungseigenschaften haben wie zum Zeitpunkt t + s, für beliebiges s > 0. 5 Ein wichtiger Gedankenschritt beim Übergang vom Random Walk in diskreter Zeit zur Brownschen Bewegungin stetiger Zeit ist, dass die Zeitintervalle ∆ unendlich kurz werden können. Für das Inkrement der Brownschen Bewegung in einem solchen infinitesimal kurzen Intervall schreibt man dann dzt. dzt ist definiert als: dz t = lim ( z t + ∆ − z t ) ∆ →0 Bei der oben beschriebenen Definition der Brownschen Bewegung werden drei wesentliche Annahmen an die Inkremente dzt und damit für den Prozess getroffen: • Die Inkremente sind voneinander stochastisch unabhängig: Für t1 < t2 < t3 gilt: z(t2) – z(t1) unabhängig von z(t3) – z(t2) • Die Inkremente sind stationär, d.h. ihre Verteilung ist unabhängig von t. • Die Inkremente ∆zt sind normalverteilt. II.3. Eigenschaften a) Erwartungswert Der Erwartungswert eines Inkrements ∆zt der Brownschen Bewegung hat den Erwartungswert 0 für jedes Zeitintervall ∆, ganz gleich welcher Länge es ist. Deswegen ist der Erwartungswert von zt+∆ immer der gerade aktuelle Wert von zt: Et ( z t + ∆ ) = z t Die Brownsche Bewegung hat also die Markov-Eigenschaft: In die Vorhersage für zukünftige Werte von zt+s geht immer nur der aktuelle Wert zt ein; die gesamte Entwicklung von zt davor ist nicht relevant. Diese Eigenschaft macht die Brownsche Bewegung zu einem interessanten Prozess für die Modellierung von Größen auf Finanzmärkten. Dort kann man davon ausgehen, dass alle über die Zukunft erhältliche Information in Sekundenschnelle in den Preis mit einbezogen wird. Der aktuelle Preis, in den die Einschätzungen aller Marktteilnehmer über die zukünftige Entwicklung der Anlage eingehen, sollte keine systematische Über- oder Unterschätzung des Erwartungswertes des zukünftigen abdiskontierten Preises aufweisen – ansonsten wäre Arbitrage möglich. Zudem sollte es auf informationseffizienten Finanzmärkten nicht möglich sein, mit Hilfe leicht erhältilicher Information wie der historischen Entwicklung eines Wertpapierpreises 6 überdurchschnittliche Renditen zu erzielen. Könnte man nämlich aus der Historie der Anleihe verlässliche Vorhersagen über die zukünftige Wertentwicklung ableiten, würden sich bald alle Marktteilnehmer dieser Technik bedienen. Die verlässlichen Vorhersagen würden in den Preis des Wertpapiers aufgenommen werden und der Erwartungswert für zukünftige Preise hinge wieder nur vom aktuellen Preis ab – der Preisprozess hätte wieder die Markov-Eigenschaft. b) Varianz und Standardabweichung Die Varianz der Inkremente der Brownschen Bewegung wächst linear mit der Länge des Zeitintervalls: Var ( zt + ∆ − zt ) = ∆ bzw. Var (dzt ) = dt Die Auswirkung dieser Eigenschaft wird klar, wenn man eine typische Abweichung von ∆zt, nämlich dessen Standardabweichung betrachtet: σ ( z t + ∆ − z t ) = Var ( z t + ∆ − z t ) = ∆ ∆zt ist also von der Größenordnung der Quadratwurzel des Zeitintervalls ∆; eine Eigenschaft, die bei vielen der weiteren Schritte eine entscheidende Rolle spielen wird. Konkret bedeutet das, dass für längere Zeitintervalle die typische Abweichung relativ zur verstrichenen Zeit kleiner ist und die vielen erratischen Bewegung dazu tendieren, sich etwas auszugleichen. Verhundertfacht man beispielsweise das Zeitintervall, wird sich die Standardabweichung nur verzehnfachen. Umgekehrt gilt auch, dass sehr kleine Zeitintervalle relativ große Abweichungen in zt aufweisen: Teilt man ein Zeitintervall durch hundert Teile, so ist die Standardabweichung in jedem der Teilintervalle immerhin ein Zehntel der Standardabweichung des vorherigen Intervalls. Auch diese Eigenschaft erweist sich als passend bei der Beschreibung von Kapitalmärkten: So weisen z.B. Aktienindizes während eines Tages oft ganz erhebliche Schwankungen auf, über mehrere Jahrzehnte hinweg gesehen erweist sich diese kurzfristige erratische Bewegung jedoch als wenig relevant und es dominiert der exponentielle Aufwärtstrend. 7 c) Nicht-Differenzierbarkeit Die extremen Ausschläge der Brownschen Bewegung in kurzen Zeitintervallen führen außerdem zu einer weiteren wichtigen Eigenschaft: Der Pfad der Brownschen Bewegung ist an keiner Stelle differenzierbar. Dies folgt mathematisch aus der Definition der Ableitung: ε ∆ ∆z = ε t lim 1 = ±∞ lim t = lim t ∆ →0 ∆ →0 ∆ ∆ ∆ →0 ∆ Die Nicht-Differenzierbarkeit ist eine Eigenschaft, die bei einem mathematischen Prozess zur Modellierung von Zeitreihen auf Finanzmärkten erfüllt sein muss. Wäre nämlich die Kurve des Preises eines Finanztitels differenzierbar, wüsste man, in welche Richtung sich der Preis im nächsten Zeitintervall bewegte. Damit allerdings wäre Arbitrage möglich – genau das jedoch darf nicht der Fall sein. d) Stetigkeit und Pfadlänge Die Brownsche Bewegung hat weitere interessante mathematische Eigenschaften, die jedoch für ihre Verwendung zur Beschreibung von Finanzmärkten keine große Bedeutung haben. So folgt z.B. jede Realisierung einer Brownschen Bewegung einem stetigen Pfad in der Zeit. Theoretisch wäre es allerdings für wirtschaftliche Modelle nicht zwingend notwendig, keine Sprünge bei Preisen, Zinsen und anderen Variablen zuzulassen.6 Außerdem kann man zeigen, dass die Brownsche Bewegung auf jedem – also auch jedem beliebig kurzen – Zeitintervall eine unendliche Pfadlänge hat. Intuitiv lässt sich dies wiederum dadurch begreiflich machen, dass die Brownsche Bewegung relativ zur Zeit um so mehr hin- und herzittert, je kürzer die betrachteten Zeitintervalle werden.7 Jedoch ist auch diese Eigenschaft von wenig Interesse bei wirtschaftlichen Fragestellungen. II.4. Beispiel: Der DAX während eines Handelstages Ein Beispiel, auf das das Modell der Brownschen Bewegung angewendet werden könnte, ist der DAX über einen Handelstag hinweg gesehen. Während eines Tages ist der langfristige Aufwärtstrend des Index zu vernachlässigen und der Erwartungswert für den Stand am Ende 6 Es gibt sogar Prozesse, die solche Sprünge explizit erlauben und modellieren, nämlich die sogenannten Jump Processes (in Dixit und Pindyck, Kapitel 3.6, erklärt). 7 Weitere Erläuterung zur unendlichen Pfadlänge im Anhang (VI.2a) 8 des Tages dürfte ziemlich genau seinem Eröffnungsstand an diesem Tag entsprechen. Grafiken im Anhang (VI.1a) zeigen eine Gegenüberstellung des DAX 30 am 22. März 2002 und einer Simulation der Brownschen Bewegung. Man sieht, dass beide Prozesse offenbar ähnlichen Gesetzen gehorchen. Jedoch ist mit bloßem Auge natürlich nicht zu erkennen, ob die Kurve des DAX an jenem Tag wirklich die Annahmen der Brownschen Bewegung erfüllt. Doch auch bei genauerer Prüfung der Daten kommt man zu dem Schluss, dass die Brownsche Bewegung kein perfektes, aber ein durchaus passables Modell für den Kursverlauf des DAX an diesem – wohlgemerkt relativ ruhigen – Handelstag ist. 8 III. Diffusionsprozesse (oder Ito-Prozesse) III.1. Definition Um reale Wirtschaftsgrößen zu modellieren, wird selten eine reine Brownsche Bewegung geeignet sein. So ist bei vielen Variablen ein ständiger Aufwärtstrend zu beobachten, der bei der reinen Brownschen Bewegung nicht modellierbar ist. Des Weiteren könnte man z.B. einen Prozess darstellen wollen, dessen Varianz sich mit der Zeit t bzw. der Größe der Variablen selbst verändert. Diese Möglichkeiten – und viele andere mehr – können mit sogenannten Diffusionsprozessen (auch Ito-Prozesse) abgebildet werden. Die allgemeine mathematische Darstellung eines Diffusionsprozesses lautet folgendermaßen: dxt = a(t , xt )dt + b(t , xt )dz t Dabei sind a und b deterministische Funktionen von t und xt. Die Inkremente von xt setzen sich also aus zwei Teilen zusammen: aus einem deterministischen Glied, das dt enthält und z.B. einen Trend über die Zeit erfassen könnte, und aus einem stochastischen Glied, in das die Brownsche Bewegung dzt als erratische Komponente eingeht. Ein Diffusionsprozess ist also eine Kombination von deterministischen und stochastischen Prozessen. Dabei ist vor allem zu beachten, dass sowohl die Zeit t als auch der aktuelle Wert xt des Diffusionsprozesses jeweils in die Funktionen a und b eingehen können. Das heißt konkret, dass sowohl der Trend im ersten Term als auch die erratische Komponente im zweiten Term mit der Zeit variieren können. So könnten z.B. die Inkremente in xt mit der Zeit kleiner werden 8 9 Statistische Tests und Grafiken sind im Anhang (VI.1a) zu finden. und es könnte sich gleichzeitig die Varianz der stochastischen Komponente verkleinern. Des Weiteren ist es möglich, dass die Realisierungen des Prozesses xt sowohl den weiteren Trend als auch die stochastische Komponente im weiteren Verlauf beeinflussen. Zur Illustration könnte eine Variable dienen, deren Inkremente bei höheren Werten von xt tendenziell größer werden. Diese Variable würde also umso stärker wachsen, je größer der aktuelle Wert wäre. Gleichzeitig könnte der Prozess z.B. eine höhere Varianz haben, je größer die x-Werte sind. Im Folgenden werden drei Diffusionsprozesse vorgestellt, die besonders wichtig bei der Modellierung von Variablen auf Kapitalmärkten sind. III.2. Wichtige Prozesse a) Brownsche Bewegung mit Drift Die Brownsche Bewegung mit Drift9 ist das stetige Analogon zum Random Walk mit Drift und die einfachste Erweiterung der Brownschen Bewegung: dxt = αdt + σdz t Dabei bezeichnet α die Driftrate, also den erwarteten Zuwachs von xt in einer Zeiteinheit. Die wirklichen Inkremente sind jedoch um α herum gestreut, da ja auch die stochastische Komponente auf der rechten Seite des Pluszeichens in das Inkrement mit eingeht. Dabei ist σ der Varianzparameter. Je größer σ ist, desto stärker ist die erratische Komponente im Vergleich zur Driftkomponente α. Wie beim Random Walk mit Drift gilt, dass die Inkremente des Prozesses mit Standardabweichung σ um den Mittelwert α verteilt sind. Es ist nicht einfach, Anwendungen zur Brownschen Bewegung mit Drift aus der Wirtschaftswelt zu finden, da konstant wachsende wirtschaftliche Größen wie das BIP, ein Preis- oder Aktienindex fast immer in exponentieller und nicht in linearer Form zunehmen. Meistens ist für die Modellierung derartiger Zeitreihen die geometrische Brownsche Bewegung besser geeignet, die eng mit der Form mit Drift verwandt ist, wie später noch ausführlich erläutert wird. 9 Eine Simulation der Brownschen Bewegung mit Drift ist im Anhang (VI.1b) zu finden 10 b) Geometrische Brownsche Bewegung Die geometrische Brownsche Bewegung ist wie folgt definiert: dxt = αxt dt + σxt dzt bzw. dxt = αdt + σdz t xt In diesem Fall sind nicht die absolut gemessenen Inkremente, sondern die Inkremente relativ zum aktuellen Wert xt normalverteilt um die Driftrate α. Besonders in der zweiten Gleichung oben wird deutlich, dass ein enger Zusammenhang zu der Form mit Drift besteht. Allerdings sind bei der geometrischen Brownschen Bewegung die prozentualen Wachstumsraten, nicht wie vorher die absoluten Zuwächse, um die mittlere Wachstumsrate α herum mit Standardabweichung σ normal verteilt. Diese Art von Prozess könnte z.B. für eine Größe in Frage kommen, die jährlich um durchschnittlich 2% wächst, deren Wachstumsraten aber von Jahr zu Jahr um diesen Durchschnittswert schwanken. Für die Anwendung der geometrischen Brownschen Bewegung kommen also eine Fülle von wirtschaftlichen Größen in Frage: Aktienindizes, Preise einzelner Wertpapiere, aber auch Preisindizes und das BIP, wenn man die Konjunkturzyklen herausrechnen bzw. anderweitig in das Modell mit einbeziehen könnte. Auf lange Sicht ähnelt die geometrische Brownsche Bewegung einer Kurve in Form einer Exponentialfunktion – ein Muster, dem z.B. auch einem Aktienindex über mehrere Jahrzehnte hinweg betrachtet folgt. Dies kann man in den Grafiken im Anhang (VI.1c) erkennen, in denen der DAX 100 seit 1988 einer simulierten geometrischen Brownschen Bewegung gegenüber gestellt ist.10 Am Verlauf der beiden Kurven kann man auch gut eine weitere Eigenschaft der geometrischen Brownschen Bewegung erkennen: Nicht nur der Erwartungswert der Inkremente des Prozesses wird bei höheren Werten des DAX bzw. von xt immer größer, sondern auch deren Varianz. Je weiter der DAX steigt, umso höher sind auch die Schwankungen, wenn sie in absoluten DAX-Punkten gemessen werden. Mathematisch schlägt sich das in der stochastischen Komponente σ xt dzt in der ersten Gleichung oben nieder: Ihre Varianz wächst mit xt. Wenn man die Grafik des DAX über 13 Jahre mit der vorher betrachteten Kurve des DAX über einen Tag vergleicht, tritt eine grundlegende Eigenschaft von Diffusionsprozessen im Allgemeinen zu Tage: Während eines Tages dominiert die erratische Komponente den Drift so stark, dass er im Modell vernachlässigt werden kann. In der langen Frist jedoch beherrscht 10 Statistische Tests des DAX 100 auf Kompatibilität mit den Annahmen einer geometrischen Brownschen Bewegung siehe Anhang (VI.1e) 11 die deterministische Komponente das erratische Zittern und die Kurve des DAX hat näherungsweise eine exponentielle Form. c) Mean-Reverting Process (oder Ornstein-Uhlenbeck-Prozess) Ein weiterer interessanter Prozess zur Modellierung wirtschaftlicher Größen ist der MeanReverting Process: dxt = η ( xt − µ ) dt + σdz t Der Term auf der linken Seite des Pluszeichens bewirkt einen Trend hin zum Mittelwert µ. Je weiter sich der aktuelle Wert xt von diesem Mittelwert entfernt, desto stärker ist dieser Trend. Die Konstante η vor der Klammer kann als Geschwindigkeitsparameter aufgefasst werden. Je größer η ist, desto schneller wird der Prozess zu µ hingezogen. Auf der rechten Seite des Pluszeichens steht wie üblich der erratische Term. Dieser macht überhaupt erst eine Entfernung vom Mittelwert möglich. Der Mean-Reverting Process kann zur Modellierung aller Größen benutzt werden, die zwar Schocks unterliegen, aber langfristig immer wieder auf einen Gleichgewichtswert zurückdrängen. Dies könnte z.B. bei inflationsbereinigten Preisen für Güter der Fall sein, bei denen sich die Produktionskosten langfristig nicht mehr verändern, weil etwa die technologischen Möglichkeiten so gut wie ausgereizt sind. Wenn auf dem Markt für ein solches Gut perfekter Wettbewerb herrscht, Angebot und Nachfrage aber Schocks unterliegen, sollte der Preis zwar volatil sein. Langfristig aber würde er immer wieder auf das Niveau der Produktionskosten zurückdrängen. Auch bei realen Wechselkursen sollte es ähnliche Effekte geben: Das Theorem der Kaufkraftparität in seiner schwachen Form besagt, dass der reale Wechselkurs zwischen zwei Ländern langfristig konstant ist.11 Die Kurse unterliegen aber zugleich durch die Volatilität an den Devisenmärkten immer wieder Schocks, die den realen Wechselkurs von der Gleichgewichtsrate abbringen. Eine weitere Anwendungsmöglichkeit des Mean-Reverting Process wäre die Modellierung von Zinssätzen. Wenn es so etwas wie eine langfristige durchschnittliche Zinsrate 11 Wiche der Kurs von diesem Gleichgewichtswert ab, könnten Händler aus dem Land mit der unterbewerteten Währung Güter in das andere Land exportieren und so überdurchschnittliche Gewinne machen. Die Nachfrage nach der unterbewerteten Währung würde steigen und der reale Wechselkurs käme wieder ins Gleichgewicht. 12 für eine Volkswirtschaft gibt, um die die Zinsen ständig pendeln, dürfte der Mean-Reverting Process für die Modellierung von Zinssätzen geeignet sein.12 IV. Ito-Formel IV.1. Herleitung Mit den bis jetzt diskutierten Prozessen kann man vielerlei Aussagen über einzelne Größen auf den Kapitalmärkten treffen. Oft aber interessiert nicht unbedingt die Entwicklung einer Größe selbst (wie z.B. des DAX, der Zinsen etc.) sondern eine Funktion dieser Größe (z.B. der Nutzen aus dem Wert eines Wertpapiers, der Preis eines Derivats eines Wertpapiers etc.). Bei solchen Berechnungen ist oft die Ito-Formel von großem Nutzen. xt ist weiterhin ein beliebiger Diffusionsprozess, wie er schon in Absatz III.1. definiert wurde: dxt = a(t , xt )dt + b(t , xt )dz t (1) F(xt) bezeichnet eine beliebige deterministische Funktion von xt, die mindestens einmal in t und zweimal in xt differenzierbar ist.13 Bei F(xt) könnte es sich z.B. um den Logarithmus einer Datenreihe oder die Nutzenfunktion eines Individuums in Abhängigkeit vom Wert seines Portfolios handeln. Man betrachtet nun eine Taylor-Reihe14 2. Ordnung, um die Änderung dF der Funktion F(xt) zu bestimmen: dF = ∂F 1 ∂2F ∂F ∂2F ∂2F dt + dx t + 2 ( dt ) 2 + 2 dtdx t + 2 ( dx t ) 2 ∂t 2 ∂t ∂x t ∂t∂x t ∂x t (2) Ziel ist es, dF nur noch als Funktion der Glieder dt und dzt zu schreiben, deren Eigenschaften bekannt sind. Alle Terme, in denen dxt vorkommt, werden also im Folgenden umgeformt. Dabei soll auch bestimmt werden, welche Terme von der Größe her vernachlässigt werden können, wenn dt sehr klein wird. Offensichtliche Kandidaten dafür sind die Terme zweiter Voraussetzung für das Theorem ist, dass die beiden Länder miteinander Handel treiben und Transportkosten keine überragende Rolle spielen. 12 In Grafiken im Anhang (VI.1d) sind eine langfristige Zinskurve, der Wechselkurs DM/USD und die Simulation eines Mean-Reverting Process gegenübergestellt. 13 Bei F(xt) könnte es sich z.B. um den Logarithmus einer Datenreihe oder die Nutzenfunktion eines Individuums in Abhängigkeit vom Wert seines Portfolios oder 14 siehe Anhang (VI.2b) zur Erläuterung von Taylor-Reihen 13 Ordnung in der Klammer rechts in Gleichung (2). Zuerst wird die entscheidende Variable (dxt)2 im letzten Term betrachtet. Durch Einsetzen von (1) ergibt sich: (dxt ) 2 = a 2 (t , xt )(dt ) 2 + 2a(t , xt )b(t , xt )dtdz t + b 2 (t , xt )(dz t ) 2 (3) Wie schon in Absatz II.3.b beschrieben, ist dzt von der Ordnung der Quadratwurzel von dt; also ist (dzt)2 – und somit der gesamte letzte Term in (3) – von der Ordnung dt. Der gemischte Term in der Mitte ist von der Ordnung (dt)3/2. Wenn nun dt sehr klein wird, spielt nur noch der Term von Ordnung dt eine Rolle, die Terme von Ordnung (dt)2 bzw. (dt)3/2 gehen im Grenzwert gegen 0. Also kann man schreiben: ( dx ) 2 = b 2 ( t , x t )( dz t ) 2 (4) Betrachtet man nun die anderen Glieder 2. Ordnung in der großen Klammer in Gleichung (2), sieht man, dass sie von höherer Ordnung als dt und somit zu vernachlässigen sind. Das erste Glied ist offensichtlich von Ordnung (dt)2, das gemischte Glied in der Mitte von der Ordnung (dt)3/2. Der Term mit (dzt)2 ist also das einzige Glied 2. Ordnung, das weiter mitgeführt wird. Durch Einsetzen von (1) und (4) in (2) ergibt sich dann: 1 2 ∂F ∂F ∂2F [a(t , xt )dt + b(t , xt )dzt ] + b (t , xt ) 2 (dzt )2 dF = dt + 2 ∂t ∂xt ∂xt (5) Es stellt sich außerdem heraus, dass (dzt)2 nicht nur von der Ordnung dt, sondern sogar gleich dt ist.15 Aus einem stochastischen Term wird also ein deterministischer. Die Umformung (dzt)2 = dt ist keineswegs selbstverständlich. Dies wird bei einem Blick auf das stochastische Glied mit dzt klar. dzt ist zwar von der Ordnung dt , man kann es aber nicht einfach in dt umwandeln. Intuitiv lässt sich diese Identität von (dzt)2 und dt wohl am ehesten folgendermaßen verstehen: Wenn dzt quadriert wird, werden auch aus den negativen Inkremente dzt positive Werte – (dzt)2 muss also als streng positiver Beitrag in die Ito-Formel eingehen. Außerdem muss dieser positive Beitrag im Mittel die Größe dt haben, da (dzt)2 im Erwartungswert gleich dt ist.16 15 Der mathematische Beweis dafür ist im Anhang (VI.2b, Behauptung 2) zu finden. Beweis siehe Anhang (VI.2b, Behauptung 1); der Erwartungswert kann in diesem Fall allerdings nur als Veranschaulichung verstanden werden; schließlich ist dzt im Erwartungswert gleich 0, kann aber wiederum nicht einfach durch 0 ersetzt werden. 16 14 Mit Hilfe der gerade beschriebenen Gleichheit (dzt)2 = dt und nach Gruppierung der Terme in deterministische (d.h. Terme mit dt) und stochastische (d.h. Terme mit dzt) ergibt sich die ItoFormel: ∂F ∂F ∂2F 1 2 ∂F + dF = a (t , xt ) + b (t , xt ) 2 dt + b(t , xt )dzt ∂ ∂ t x 2 x ∂ ∂ x t t t (6) IV.2. Interpretation Dass die Terme ∂F ∂F und a (t , xt ) in die Ito-Formel eingehen, ist nicht wirklich ∂t ∂xt überraschend. Ersterer beschreibt den direkten Trend von F(xt) in der Zeit, letzterer die Veränderung in F(xt), die indirekt über den Zeittrend im Diffusionsprozess xt bewirkt wird. Auch die stochastische Komponente stellt sich dar, wie man das intuitiv erwarten würde: Je nachdem, wie stark die Funktion F(xt) auf Veränderungen im Diffusionsprozess xt reagiert (was sich im Term ∂F niederschlägt), wirkt sich die erratische Komponente b(t , xt )dzt aus ∂xt dem Diffusionsprozess auf die Funktion F(xt) aus. Schon eher verblüffend ist die Tatsache, dass der Term ∂2F 1 2 b (t , xt ) 2 in der Ito-Formel 2 ∂xt auftaucht – und das auch noch im deterministischen Glied17. Der Term kann als Korrekturfaktor im Sinne von Jensens Ungleichheit18 aufgefasst werden. Er korrigiert den Erwartungswert von dF in der Richtung der 2. Ableitung von F nach xt: Wenn F(xt) eine konvexe Funktion ist, ist E[F(xt)] größer als F[E(xt)] und der Term korrigiert nach oben hin. Ist F(xt) hingegen konkav, muss F[E(xt)] nach unten korrigiert werden. 17 18 Wie schon begründet ergibt sich das aus der Identität von (dzt)2 und dt. Eine Erläuterung zu Jensens Ungleichheit findet sich im Anhang (VI.2c) 15 IV.3. Beispiel: Der Logarithmus des DAX über längere Zeit Die Ito-Formel hat interessante Implikationen, wenn man sie auf den Logarithmus einer geometrischen Brownschen Bewegung anwendet (wie z.B., wie vorher erklärt, den DAX). Es zeigt sich, dass man mit dem Hilfswerkzeug des natürlichen Logarithmus viele Rückschlüsse auf die Entwicklung des eigentlich interessierenden zugrunde liegenden Prozesses ziehen kann. Man setzt also dxt = αxt dt + σxt dzt 19 und F ( x ) = ln(x) . Nach Itos Lemma gilt: 1 1 1 1 σ2 dF = 0 + αxt + − 2 σ 2 xt2 dt + σxt dz t = α − dt + σdz t 2 xt 2 xt xt Der Logarithmus der geometrischen Brownschen Bewegung folgt also einer Brownschen Bewegung mit Drift.20 Über letztere ist es in vieler Hinsicht leichter, Aussagen zu treffen. So kann man z.B. leichter den Erwartungswert und Konfidenzintervalle bestimmen.21 Setzt man die erhaltenen Werte in die Exponentialfunktion ein, erhält man die entsprechenden Größen für den zugrunde liegenden Prozess xt. Außerdem ist es jetzt sehr leicht zu sehen, dass die Werte von F normal verteilt sind. Für die Werte von xt bedeutet das, dass sie lognormal verteilt sind.22 Interessant ist außerdem, dass der Logarithmus von xt nicht mit der Rate α wächst, sondern nur mit α − σ2 2 . Hierbei macht sich der oben beschriebene Korrekturterm aus der zweiten Ableitung von F bemerkbar: Da der natürliche Logarithmus eine konkave Funktion ist, werden große Werte von xt beim Einsetzen in F in der Relation zu kleinen mehr gestaucht. Bei der Bildung des Erwartungswertes muss also im Vergleich zum ln[E(xt)] noch nach unten korrigiert werden – und zwar umso mehr, je weiter die Werte von xt streuen – also je größer die Varianz σ2 ist. 19 siehe Kapitel III.2.b siehe Grafik zum Logarithmus des DAX100 über die letzten 13 Jahre im Anhang (VI.1e) 21 Im Anhang (VI.1e) werden Erwartungswerte und Konfidenzbänder für die geometrische Brownsche Bewegung berechnet und grafisch illustriert. 22 xt = eF(xt) 20 16 V. Vorteile und Probleme stetiger Prozesse Wenn die Brownsche Bewegung und ihr verwandte Diffusionsprozesse zur Modellierung von Finanzmarktgrößen verwendet werden, kann sich eventuell die Normalverteilungsannahme der Inkremente als problematisch herausstellen. Wahrscheinlich kommen extrem starke Sprünge in den Kursen häufiger vor, als dies unter der Normalverteilungsannahme zugelassen wird.23 Ein Ausweg wäre es, die Inkremente einer Verteilung folgen zu lassen, die mehr Wahrscheinlichkeitsmasse an den Enden (Tails) der Verteilung aufweist. Eine weitere Möglichkeit ist die Verwendung von sogenannten Jump Processes24. Diese Prozesse sind ab und an unstetig und weisen Sprünge nach oben oder unten auf. Ein entscheidender Vorteil stetiger Prozesse gegenüber diskreten ist, dass bei der Verwendung von stetigen Prozessen häufig Lösungen in geschlossener Form möglich sind, selbst wenn das beim diskreten Analogon nicht möglich ist. So kann man z.B. für eine Variable, die einer geometrischen Brownschen Bewegung folgt, eine relativ einfache Dichtefunktion für die Realisierungen der Variable in der Zukunft angeben. Zieht man hingegen eine passende Form des Random Walk zur Modellierung heran, ist die Wahrscheinlichkeitsfunktion für zukünftige Werte höchst kompliziert. Des Weiteren ist die Annahme der stetigen Zeit auf den heutigen Finanzmärkten höchst realistisch: Es kann rund um die Uhr an irgendeinem Ort auf dem Globus gehandelt werden, durch moderne Informationstechnologie kann man sich ständig über die neuesten Entwicklungen der Märkte auf dem Laufenden halten und mit Hilfe von Computernetzwerken können Geschäfte in Sekundenschnelle abgewickelt werden. Die Brownsche Bewegung und ihre Erweiterungen bilden dabei ein Instrumentarium, das die Bewertung diverser Finanztitel sehr erleichtern kann. 23 Dieser Schluss liegt z.B. bei der Betrachtung des Q-Q-Diagramms der Log-Renditen des DAX über 13 Jahre nahe (Anhang, VI.1e). Im Q-Q-Diagramm werden die unter der Normalverteilungsannahme erwarteten Werte gegen die wirklichen Werte aufgetragen. Man sieht, dass es Probleme an den Enden der Verteilung gibt: Es gibt mehr Ausreißer, als dies unter der Normalverteilungsannahme zu erwarten wäre. 24 Jump Processes werden in Dixit und Pindyck, Kapitel 3.6, erläutert. 17 VI. Anhang VI.1. Grafiken a) zu II.4.: Beispiel: Der DAX während eines Handelstages Gegenüberstellung der Simulation einer Brownschen Bewegung und des DAX 30 am Freitag, 50 5420 40 5400 30 5380 DAX 30 20 5360 10 5340 0 :0 0 :0 0 19 18 :0 0 :0 0 :0 0 17 16 :0 0 Zeit Periode t Quelle: Eigene Simulation25 15 :0 0 :0 0 :0 0 14 13 12 11 00 9: 10 00 90 0 80 0 70 0 60 0 50 0 40 0 30 0 20 0 0 10 0 :0 0 5320 -10 10 Brownsche Bewegung den 22. März 2002: Datenquelle: Bloomberg Financial Services Gegenüberstellung der Inkremente pro Periode in der simulierten Brownschen Bewegung und der minütlichen Inkremente des DAX 30 am Freitag, den 22. März 2002: 6 10 8 4 2 6 4 2 0 -2 0 -2 -4 -4 -6 -8 -6 -10 Es scheint, dass es beim DAX mehr Ausreißer gibt als bei der simulierten Brownschen Bewegung und dass die Varianz beim DAX über die Zeit nicht ganz konstant ist. Ansonsten weisen die beiden Prozesse sehr große Ähnlichkeit auf. 25 Verwendete Technik zur Simulation einer Brownschen Bewegung siehe mathematischer Anhang (VI.2d) 18 Die Normalverteilungsannahme scheint für die Inkremente des DAX allerdings problematisch zu sein. Im Histogramm erscheint die Verteilung einer Normalverteilung noch sehr ähnlich (außer vielleicht, dass immerhin 5 der 600 minütlichen Inkremente im Betrag größer als 7 Punkte sind, und das bei einer Standardabweichung von nur 1,83 Punkten). Betrachtet man hingegen das Q-Q-Diagramm der Inkremente26, sieht man, dass bei der Normalverteilungsannahme zwei anscheinend systematische Probleme auftreten: Erstens – und nicht unbedingt sehr überraschend – gibt es an den Enden der Verteilung zu viele Ausreißer. Zweitens– und das verblüfft schon eher – liegen zu viele Werte direkt um den Mittelwert herum. Dieses Muster bleibt übrigens auch erhalten, wenn die Daten logarithmiert werden und dann die Differenzen gebildet werden. Q-Q-Diagramm von Normal von DHIGH 35 6 4 25 20 2 15 10 5 0 -10 -8 -6 -4 -2 0 2 4 Inkrement pro Minute 6 8 Erwarteter Wert von Normal Häufigkeit 30 0 -2 -4 -6 -10 0 10 Beobachteter Wert Interessant ist außerdem die Frage, ob die Inkremente wirklich unabhängig voneinander sind, so wie das von den Axiomen der Brownschen Bewegung gefordert wird. Bei der Autokorrelationsfunktion sieht man, dass dies wohl nicht der Fall ist, außer vielleicht für den Lag 1. Innerhalb einer Minute sind die Inkremente signifikant positiv korreliert. Das liegt wohl daran, dass ein Intervall der Länge 1 Minute selbst auf dem Stand der heutigen Technologie zu kurz ist, als dass darin schon ein neuer Informationsschub komplett in die Kurse eingepreist werden könnte. 26 Das Q-Q-Diagramm trägt die unter der Normalverteilungsannahme vorhergesagten Werte gegen die wirklich beobachteten Werte ab. 19 Autokorrelationsfunktion der Inkremente des DAX: DHIGH 1.0 .5 0.0 Konfidenzhöchstgrenz -.5 ACF en -1.0 Koeffizient 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 Lag-Nummer b) zu III.1.: Brownsche Bewegung mit Drift Simulation einer Brownschen Bewegung mit Drift: Brownsche Bewegung mit Drift 125 100 75 50 25 0 Periode t Quelle: Eigene Simulation 20 10 00 90 0 80 0 70 0 60 0 50 0 40 0 30 0 20 0 10 0 0 -25 Die Simulation hat pro Periode einen Drift von 0,1 nach oben und dauert 1000 Perioden. Ihr Erwartungswert vom Zeitpunkt t = 0 aus gesehen (dargestellt durch die rosa Gerade) für das Ende der Simulation in t = 1000 ist also der Wert 100. Bestimmt man allerdings den Erwartungswert in t = 500 wieder neu, kommt man zu einem Erwartungswert weit unter 100 (dargestellt durch die blaue Gerade). Das liegt daran, dass der Prozess in t = 500 einen niedrigeren Wert annimmt als in t = 0 erwartet. Aufgrund der Markov-Eigenschaft spielen die früheren Erwartungen in t = 500 allerdings keine Rolle mehr; jetzt interessiert nur der aktuelle Wert des Prozesses bei der Bildung des neuen (durch den bisherigen Pfad bedingten) Erwartungswertes. Die blauen Parabeln sind 66%-Konfidenzintervalle für die Werte des Prozesses ab t = 500.27 c) zu III.2.: Geometrische Brownsche Bewegung Gegenüberstellung der Simulation einer simulierten geometrischen Brownschen Bewegung 1400 4000 1200 3000 DAX 100 1000 800 600 2000 1000 400 200 Datum Periode t Quelle: Eigene Simulation Quelle: Bloomberg Financial Services Absolute Inkremente der beiden Prozesse: 60 200 150 30 100 50 0 0 -50 -30 -100 -150 -60 27 -200 Simulations-Setting und Berechnung der Intervalle siehe VI.2e 21 .0 1. 00 03 .0 1. 97 5000 03 4000 .0 1. 94 3000 03 2000 03 1000 .0 1. 88 0 .0 1. 91 0 0 03 Geometrische Brownsche Bewegung und des DAX 30 über die letzten 13 Jahre: Bei den Inkrementen ist jeweils eine Trichterform zu erkennen. Das rührt daher, dass bei der geometrischen Brownschen Bewegung die Varianz der Inkremente mit dem Wert des Prozesses selbst wächst. Man sieht jedoch, dass die Varianz beim DAX nicht kontinuierlich wächst, sondern Mitte der 90er Jahre mit dem Einsetzen des Technologie-Booms schlagartig explodiert. Dies könnte eine Verletzung der Annahmen der geometrischen Brownschen Bewegung bedeuten. Eine genauere Untersuchung der Frage, ob der DAX 100 seit 1988 einer geometrischen Brownschen Bewegung folgt, findet später in Punkt VI.1.e statt. d) zu III.3.: Mean-Reverting Process (oder Ornstein-Uhlenbeck-Prozess) Gegenüberstellung eines simulierten Mean-Reverting Process28, des Libor-Zinssatzes29 über 90 Tage seit Anfang 1984 und des Wechselkurses zwischen DM und USD seit Anfang 1971: Mean-Reverting Process 160 140 120 100 80 60 40 20 00 0 10 00 90 00 80 00 70 00 60 00 50 00 40 00 30 00 20 00 10 0 0 Periode t Quelle: Eigene Simulation (Mittelwert: 100) 28 Simulations-Setting findet sich in VI.2.g Der Libor ist der Interbanken-Zinssatz in Großbritannien. Hier im Beispiel wurde der Satz für eine Leihe über 90 Tage gewählt. 29 22 19 71 04 .0 1. 19 73 04 .0 1. 19 75 04 .0 1. 19 77 04 .0 1. 19 79 04 .0 1. 19 81 04 .0 1. 19 83 04 .0 1. 19 85 04 .0 1. 19 87 04 .0 1. 19 89 04 .0 1. 19 91 04 .0 1. 19 93 04 .0 1. 19 95 04 .0 1. 19 97 04 .0 1. 19 99 04 .0 1. 20 01 04 .0 1. Kurs DM/USD 04 .0 1. 19 87 04 .0 1. 19 88 04 .0 1. 19 89 04 .0 1. 19 90 04 .0 1. 19 91 04 .0 1. 19 92 04 .0 1. 19 93 04 .0 1. 19 94 04 .0 1. 19 95 04 .0 1. 19 96 04 .0 1. 19 97 04 .0 1. 19 98 04 .0 1. 19 99 04 .0 1. 20 00 04 .0 1. 20 01 04 .0 1. 20 02 Libor 90 Tage 18 16 14 23 12 10 8 6 4 2 0 Datum Quelle: Bloomberg Financial Services 4 3,5 3 2,5 2 1,5 1 0,5 0 Datum Quelle: Bloomberg Financial Services e) zu IV.3.: Beispiel: Der Logarithmus des DAX über längere Zeit Logarithmus des DAX 100 über die letzten 13 Jahre sowie dessen Inkremente: 0,15 Inkremente von ln(DAX) 8,5 8 ln(DAX) 7,5 7 6,5 0,05 0 -0,05 -0,1 -0,15 6 03.01.1988 0,1 03.01.1992 03.01.1996 03.01.2000 Datum Zeit Folgte der DAX einer geometrischen Brownschen Bewegung, so müsste sein Logarithmus einer Brownschen Bewegung mit Drift folgen. Bei der ersten visuellen Inspektion des Logarithmus des DAX sieht auch alles danach aus. Allerdings sieht man am Diagramm der Inkremente, dass die Varianz der Inkremente wohl nicht über die Zeit konstant ist, wie das bei einer Brownschen Bewegung mit Drift der Fall sein müsste, sondern zu manchen Zeiten größer ist als zu anderen. Weitere Probleme mit den Annahmen der Brownschen Bewegung treten wie schon beim DAX über einen Tag bei der Inspektion des Q-Q-Diagramms auf. Wieder gibt es zu viele extreme Werte an den Enden der Verteilung (vor allem zu viele extrem negative Ereignisse, also schwarze Tage). Im gesamten mittleren Bereich allerdings passt die Normalverteilung jedoch hervorragend zu den Daten. Die Unabhängigkeit der Inkremente ist jedoch gegeben. Dies macht ein Blick auf die Autokorrelationsfunktion deutlich. 24 DIFF(LNDAX100,1) Q-Q-Diagramm von Normal von DIF 1.0 .06 .04 .5 0.0 0.00 -.02 Konfidenzhöchstgrenz -.5 en -.04 ACF Erwarteter Wert von Normal .02 -.06 -.1 0.0 .1 Koeffizient -1.0 16 15 14 13 112 1 10 9 8 7 6 5 4 3 2 1 -.2 Lag-Nummer Beobachteter Wert Über den Umweg des Logarithmus einer geometrischen Brownschen Bewegung kann man leicht Erwartungswert und Konfidenzintervalle berechnen. In der folgenden Grafik ist der Logarithmus der Simulation der geometrischen Brownschen Bewegung aus VI.1.c mit Erwartungswert und zwei Konfidenzbändern dargestellt:30 Logarithmus der geometr. Brownschen Bew. 9 8 ln(x(t)) E[ln(x(t))] ln 66% oben ln 66% unten ln 95% oben ln 95% unten 7 6 5 4 3 0 1000 2000 3000 4000 Periode t 30 Errechnung der Konfidenzintervalle siehe mathematischer Anhang (VI.2h) 25 5000 Extrapoliert auf den eigentlichen Prozess, die geometrische Brownsche Bewegung, ergeben sich dadurch folgende Konfidenzbänder: Geometrische Brownsche Bewegung 1500 1250 x(t) 1000 E[x(t)] 66% oben 750 66% unten 95% oben 500 95% unten 250 Periode t 26 50 00 40 00 30 00 20 00 10 00 0 0 VI.2. Mathematische Herleitungen und Erläuterungen a) zu II.3 d: Stetigkeit und Pfadlänge Erläuterung zur Eigenschaft der unendlichen Pfadlänge der Brownschen Bewegung:31 Es ist in diesem Zusammenhang hilfreich, wieder auf die Herleitung der Brownschen Bewegung aus dem Random Walk in II.1. zurückzugreifen. Im Falle des Random Walk ist es klar, dass in einem n-mal unterteilten Intervall T n-mal die vertikale Strecke ∆h zurückgelegt wird (entweder nach oben oder nach unten). Die Summe all dieser Distanzen wird als Pfadlänge dieses Prozesses bezeichnet. Für die Pfadlänge gilt, dass n∆h = 1 T T ∆h = σ ∆t = σ T ∆t ∆t ∆t Im ersten Schritt wird n als Quotient des Gesamtintervalls T und der Teilintervalle ∆t ausgedrückt. Dann kann man für ∆h die Beziehung zu ∆t einsetzen, die für die Brownsche Bewegung gefunden wurde. Geht jetzt ∆t gegen 0, sieht man, dass die zurückgelegte Pfadlänge unendlich lang wird. b) zu IV.1.: Herleitung der Ito-Formel • Erläuterung von Taylor-Reihen Mit der Hilfe von Taylor-Reihen kann der Wert einer Funktion am Punkt x errechnet werden, wenn an einem anderen Punkt a der Funktionswert und die Werte der Ableitungen der Funktion bekannt sind: ∞ f (x ) = ∑ k =0 f ( k ) (a ) ( x − a) k k! Zieht man nur die ersten Summanden in Betracht, so erhält man Näherungen für den Funktionswert von x. Eine Näherung dritter Ordnung sähe folgendermaßen aus: f ( x ) = f ( a ) + f ′( a )( x − a ) + 27 1 1 f ′′( a )( x − a ) 2 + f ′′′( a )( x − a ) 3 6 2 Taylor-Reihen funktionieren ähnlich für Funktionen mit mehreren Variablen. Bei der Herleitung der Ito-Formel wird eine Näherung zweiter Ordnung für eine Funktion mit zwei Variablen verwendet. Die bekannten Werte für die Funktion und ihre Ableitungen liegen an der Stelle a auf der x-Achse und an der Stelle b auf der y-Achse. Dann lautet diese Näherung in allgemeiner Form folgendermaßen: ∂2 f ∂2 f 1 ∂2 f ∂f ∂f 2 ( x − a )( x − b) + 2 ( x − b) 2 f ( x, y ) = f ( a , b) + ( x − a ) + ( x − b) + 2 ( x − a ) + 2 ∂y ∂x∂y 2 ∂x ∂y ∂x Im Falle der Ito-Formel ist die Zeit t die erste Variable (hier x) und der Diffusionsprozess xt die zweite (hier y). Außerdem wird nur ein Differential errechnet (dF bzw. df hier); die Funktionswerte werden also auf beiden Seiten weggelassen. • [ Behauptung 1: ] E (dz t ) = dt 2 Beweis über die Verschiebungsregel für Varianzen: [ ] [ ] [ dt = Var (dz t ) = E (dz t ) − [E (dz t )] = E (dz t ) − 0 = E (dz t ) 2 2 2 2 ] Q:E:D: • Behauptung 2: A) Behauptung32 Zu zeigen ist, dass die zwei folgenden Prozesse V und T äquivalent sind:: t V = ∫ x ( dzτ )2 τ t 0 31 32 und t T = ∫ x dτ τ t 0 Die Erläuterung hält sich an Dixit und Pindyck , S. 70 Der folgende Beweis folgt im Wesentlichen Øksendahl (1985) 28 B) Hilfssätze Folgende drei Hilfssätze werden benötigt, um die Behauptung zu zeigen: Lemma 1: Für beliebige Zufallsvariable U und Konstante c gilt: [ ] E ( U − c )2 = 0 ⇒ E( U ) = c und außerdem P( U = c ) = 1 Ähnlich gilt für beliebige Zufallsvariablen U, V mit Var(U) < ∞, Var(V) < ∞: E (U − V )2 = 0 ⇒ U = V im quadratischen Mittel. U äquivalent V; also anschaulich gesprochen gleich bis auf pathologische Ereignisse und solche mit Wahrscheinlichkeit 0. Die Führung des Beweises folgt später im Wesentlichen Lemma 1. Lemma 2: Bei den in der Wahrscheinlichkeitsrechnung üblichen Lebesgue-Integralen darf man bei der Beweisführung Limes und Erwartungswert vertauschen: [ E lim x = lim E ( x ) i i i → ∞ i→∞ ] Lemma 3: 2 2 2 n T T T n ∑ a i c i − ∑ a i d i = a c − a d = a ( c − d ) = i =1 i =1 T n n = ( c − d )T a a ( c − d ) = ∑∑ ai a j ( ci − d i )( c j − d j ) i =1 j =1 29 C) Beweisführung Nach Lemma 1 genügt es, folgende Gleichheit zu zeigen, um die Behauptung zu verifizieren: 2 T T E ∫ x ( dz ) 2 − ∫ x dt = 0 t 0 t t 0 Integrale sind als Grenzwerte endlicher Summen definiert, also gilt: [ ] n 2− n x − E lim ∑ xti −1 z t − z t t t ∑ t i −1 i i −1 i i − 1 n → ∞ i = 1 i =1 ( ) 2 = 0 Zur Vereinfachung der Notation betrachten wir die diskreten Inkremente: ∆2 z i ( = zt − zt i ) 2 i −1 ∆t i = t i − t i −1 = und T n Da die quadratische Funktion stetig ist, kann der Limes aus der Klammer herausgezogen werden: 2 n n 2 E lim ∑ xti−1 ∆ z − ∑ xti−1 ∆t i i i =1 n → ∞ i = 1 Mit Hilfe von Lemma 2 können Limes und Erwartungswert vertauscht werden: lim E n → ∞ 2 n n 2 ∑ xti −1 ∆ zi − ∑ xti −1 ∆ti i = 1 i =1 Ab nun wird nur die endliche Summe innerhalb des Limes betrachtet. Durch Anwendung von Lemma 3 ergibt sich für diese: n n Sn = ∑ ∑ E i =1 j =1 x x ( ∆2 z − ∆t ) ( ∆2 z − ∆t ) ti t j i i j j Nun werden die Erwartungswerte der Summanden einzeln betrachtet. Bezeichne die Summanden mit bij: bij = E 30 [x ti xt ( ∆2 zi − ∆ti ) ( ∆2 z j − ∆t j ) j ] Die Summanden bji und bij sind gleich, daher gilt: n n n S n = ∑ ∑ bij = ∑ bii + 2∑ bij i =1 j =1 i =1 i< j Betrachte zuerst die Summanden vom Typ bii: [ bii = E xt xt i j ] [ 2 ( ∆2 z i − ∆ti ) ( ∆2 z i − ∆ti ) = E xti ( ∆2 z i − ∆ti ) 2 ] Die beiden quadrierten Zufallsvariablen in den Klammern sind voneinander unabhängig: Die Inkremente der Brownschen Bewegung erfolgen im Zeitintervall direkt nach der Realisierung von xti; laut den Axiomen der Brownschen Bewegung müssen sie also von den Werten unabhängig sein. Der Erwartungswert des Produkts zweier unabhängiger Zufallsvariablen ist das Produkt der Erwartungswerte der beiden Variablen, also: b = E xt 2 E ( ∆2 z − ∆t ) 2 ii i i i Schreibe ab jetzt: e = E xt 2 i ii Außerdem gilt, dass: E [ ∆2 z ] = ∆ t i i ...und folglich: E[ ∆4 z ] = ∆2 t i i Damit kann man schreiben: b = e (3∆2t − 2 ∆2t + ∆2t ) = 2e ∆2t ii ii i i i ii i Wie in der Herleitung zur Ito-Formel beschrieben, sind Terme dieser Größenordnung zu vernachlässigen. Betrachte nun die Summanden vom Typ bij: b =E ij [ ] x x (∆2 z − ∆t )(∆2 z − ∆t ) = E x x E (∆2 z − ∆t )(∆2 z − ∆t ) ti tj ti t j i i j j i i j j Wieder darf die Trennung der Erwartungswerte nur deswegen so vorgenommen werden, weil die Zufallsvariablen in den zwei Erwartungswerten auf der rechten Seite des Gleichheitszeichens voneinander unabhängig sind. Dies ist deswegen der Fall, weil i < j ist und deswegen 31 die Inkremente zeitlich hinter den beobachteten Realisierungen von xt stehen. Wegen der Unabhängigkeit der Inkremente folgt des Weiteren: E ( ∆2 z − ∆t )( ∆2 z − ∆t ) = E ( ∆2 z − ∆t ) E ( ∆2 z − ∆t ) = 0 i i j j i i j j Damit bleiben in der ursprünglich betrachteten Summe Sn nur noch die Summanden bii übrig: Sn = n ∑ bii ≤ 2n max{eii }∆2ti = 2 max{eii } i =1 ...und somit: 1 T2 n = 2 max {eii }T 2 2 n n lim [S n ] = 0 n→∞ Damit ist also gezeigt, dass: [ ] n 2− n x − E lim ∑ xti−1 z t − z t t t ∑ t i −1 i i −1 i i − 1 n → ∞ i = 1 i =1 ( ) 2 = 0 Mit Lemma 2 folgt also im Sinne der Abweichung im quadratischen Mittel: T T 2 ∫ xt ( dz t ) = ∫ xt dt 0 0 Q.E.D. c) zu IV.2: Interpretation der Ito-Formel: Jensens Ungleichheit: Wenn X eine Zufallsvariable und F eine konvexe Funktion von X ist, dann gilt: E [F ( X )] > F [E ( X )] Ist dagegen F konkav, gilt das Gegenteil: E [F ( X )] < F [E ( X )] Man kann sich das Prinzip von Jensens Ungleichheit an einer Zufallsvariable X verdeutlichen, die nur zwei Werte annehmen kann. Wendet man auf X eine konvexe Funktion an, wird das arithmetische Mittel zwischen den beiden Funktionswerten größer sein als der Funktionswert des arithmetischen Mittels der zwei Werte selbst. 32 d) zu VI.1a: Simulation einer Brownschen Bewegung Die Brownsche Bewegung wurde folgendermaßen simuliert: xt = xt −1 + ε t ε t ~ N (0;1) wobei und x0 = 0 Die Inkremente wurden vom Zufallsgenerator eines Computerprogramms erzeugt. e) zu VI.1b: Simulation einer Brownschen Bewegung mit Drift Die Brownsche Bewegung mit Drift wurde folgendermaßen simuliert: xt = xt −1 + 0,1 + ε t ε t ~ N (0;1) wobei und x0 = 0. Die Geraden der Erwartungswerte haben folgende Gleichungen: E 0 ( xt ) = 0,1t E500 ( xt ) = x500 + 0,1(t − 500) Das Konfidenzintervall ab t = 500 ergibt sich folgendermaßen (σ2 = σ = 1): KI 66% ( xt ) = E500 ( xt ) ± t − 500 f) zu VI.1c: Simulation einer geometrischen Brownschen Bewegung Die geometrische Brownsche Bewegung wurde folgendermaßen simuliert: xt = xt −1 (1 + 0,0005 + 0,02ε t ) wobei ε t ~ N (0;1) und x0 = 100 Durch folgende Umformung ist leicht zu sehen, dass obige Formel in der Struktur identisch mit der Definition der geometrischen Brownschen Bewegung ist: ∆xt −1 = xt − xt −1 = 0,0005 xt −1 + 0,02 xt −1ε t 33 g) zu VI.1d: Simulation eines Mean-Reverting Process Der Mean-Reverting Process wurde folgendermaßen simuliert: xt = −0,001( xt −1 − 100) + ε t wobei ε t ~ N (0;1) und x0 = 100 h) zu VI.1e: Konstruktion von Erwartungswerten und Konfidenzintervallen der geometrischen Brownschen Bewegung Der Erwartungswert für die logarithmierte geometrische Brownsche Bewegung (ab jetzt als Ft bezeichnet) wurde bestimmt durch: σ2 0,02 2 t = 4,605 + 0,03t t = ln (100 ) + 0,0005 − E 0 [Ft ] = F0 + α − 2 2 Die Konfidenzintervalle wurden folgendermaßen errechnet: KI 66% = E [Ft ] ± σ t = E [Ft ] ± 0,02 t KI 95% = E [Ft ] ± 1,96σ t = E [Ft ] ± 0,0392 t Die entsprechenden Erwartungswerte und Konfidenzintervalle für die geometrische Brownsche Bewegung wurde durch Einsetzen der oben errechneten Werte in die Exponentialfunktion gewonnen. 34 VII. Literaturverzeichnis: Cochrane, John (Princeton University Press, 2001): „Asset Pricing“, Princeton, New Jersey Dixit, Avinash K. und Pindyck, Robert S. (Princeton University Press, 1994): „Investment under Uncertainty“, Princeton, New Jersey Øksendal, Bernt (Springer-Verlag, 1985): „Stochastic Differential Equations“, Oslo 35