Brownsche Bewegung, Diffusionsprozesse und Ito`s Lemma

Transcription

Brownsche Bewegung, Diffusionsprozesse und Ito`s Lemma
Fakultät für Volkswirtschaftslehre
Ludwig-Maximilians-Universität München
Schwerpunktseminar
„Bewertung von Wertpapieren“
Sommersemester 2002
Prof. Sven Rady
Brownsche Bewegung,
Diffusionsprozesse
und Itos Lemma
Betreuung:
Dipl.-Volksw. Markus Reisinger
Verfasser:
Matthias Kredler
Werner-Friedmann-Bogen 8
80993 München
Matrikelnummer: 120377304471
Fachsemester: 8
Gliederung
I. Einleitung
1
II. Brownsche Bewegung (oder Wiener-Prozess)
2
1. Herleitung über einen Random Walk in diskreter Zeit
2
2. Definition
5
3. Eigenschaften
6
a) Nicht-Differenzierbarkeit
b) Markov-Eigenschaft
c) Erwartungswert und Varianz
d) Stetigkeit und Pfadlänge
4. Beispiel: Der DAX während eines Handelstages
III. Diffusionsprozesse (oder Ito-Prozesse)
1.Definition
2. Wichtige Prozesse
8
9
9
10
a) Brownsche Bewegung mit Drift
b) Geometrische Brownsche Bewegung
c) Mean-Reverting Process (oder Ornstein-Uhlenbeck-Prozess)
IV. Ito-Formel
1. Herleitung
2. Interpretation
15
3. Beispiel: der Logarithmus eines Aktienindex über längere Zeit
16
V. Möglichkeiten und Vorteile stetiger Prozesse
2
13
13
17
VI. Anhang
18
1. Grafiken
18
a) zu II.4.: Beispiel: Der DAX während eines Handelstages
18
b) zu III.1.: Brownsche Bewegung mit Drift
20
c) zu III.2.: Geometrische Brownsche Bewegung
21
d) zu III.3.: Mean-Reverting Process (oder Ornstein-Uhlenbeck-Prozess
22
e) zu IV.3.: Beispiel: Der Logarithmus des DAX über längere Zeit
24
2. Mathematischer Teil
27
a) zu II.3 d: Stetigkeit und Pfadlänge
27
b) zu IV.1.: Herleitung der Ito-Formel
27
c) zu IV.2: Interpretation der Ito-Formel: Jensens Ungleichheit
32
d) zu VI.1a: Simulation einer Brownschen Bewegung
33
e) zu VI.1b: Simulation einer Brownschen Bewegung mit Drift
33
f) zu VI.1c: Simulation einer geometrischen Brownschen Bewegung
33
g) zu VI.1d: Simulation eines Mean-Reverting Process
34
h) zu VI.1e: Konstruktion von Erwartungswerten und
Konfidenzintervallen der geometrischen Brownschen Bewegung
VII. Literaturverzeichnis
3
34
35
I. Einleitung
In vielen Disziplinen, wie den Ingenieurwissenschaften oder der Klassischen Physik, die sich
der Mathematik als Hilfsmittel bedienen, stehen deterministische Funktionen im Vordergrund.
Bei deterministischen Funktionen ist jedem Argument eindeutig ein Funktionswert zugeordnet. Will beispielsweise ein Ingenieur die Flugbahn einer Rakete berechnen, bedient er sich
gewisser mathematischer Werkzeuge, um die Raketenkoordinaten als eine Funktion der Zeit
zu erhalten. Damit kann – im Rahmen bekannter Toleranzen – die Flugbahn perfekt vorhergesagt werden.
In anderen Disziplinen, wie der Quantenphysik, der Medizin oder der Wirtschaftswissenschaft, ist es hingegen meist nicht möglich, eine solch sichere Vorhersage zu treffen. Auf den
Finanzmärkten ist die Vorhersagbarkeit aufgrund der ihnen innewohnenden Eigenschaften
besonders eingeschränkt. Würde nämlich der Kurs eines Wertpapiers einer deterministischen
Funktion folgen, bestünde die Möglichkeit zur Arbitrage – gerade das kann nicht sein. Wenn
Größen wie der Preis eines Wertpapiers mathematisch als Funktion beschrieben werden sollen, sind also Ansätze vonnöten, die eine stochastische Komponente aufweisen.
Ein entsprechendes Instrumentarium bieten u.a. stochastische Prozesse. Für die Anwendung
in Finanzmarktmodellen sind insbesondere die sogenannten Diffusions- oder Ito-Prozesse von
Interesse, in denen sowohl deterministische als auch stochastische Anteile in die Modellierung eingehen. So könnte z.B. die langfristige Entwicklung eines Aktienindex als eine Zusammensetzung eines langfristigen exponentiellen Trends als deterministischer Komponente
und kurzfristigen erratischen Abweichungen als stochastischer Komponente gesehen werden.
Als Grundlage zur Modellierung einer standardisierten erratischen Komponente in stetiger
Zeit dient oft die sogenannte Brownsche Bewegung. Auf der Basis dieses Konzeptes können
dann durch mathematische Erweiterungen kompliziertere Prozesse beschrieben werden. Das
Konzept der Brownschen Bewegung stammt ursprünglich aus der Physik. Der englische Botaniker Robert Brown hatte 1827 festgestellt, dass in Wasser schwimmende Pollenteilchen
unter dem Mikroskop merkwürdig hin- und herzitternden Bahnen folgten, obwohl sie eindeutig nicht mehr lebendig waren. Physiker stellten später fest, dass diese Bewegungen durch das
ständige Bombardement der Pollenteilchen durch die Wassermoleküle in ihrer unmittelbaren
1
Umgebung verursacht wurden. Später tauchte auch in anderen Bereichen der Physik, wie z.B.
der Quantenmechanik, die Notwendigkeit auf, nicht-deterministische Prozesse mathematisch
zu beschreiben. Die erste mathematische Theorie zur Brownschen Bewegung wurde 1905 von
Albert Einstein entwickelt; für diese Leistung erhielt er später den Nobelpreis.
Im Mittelpunkt dieser Arbeit soll eine eingängige, möglichst intuitive Beschreibung der
Brownschen Bewegung, einiger Diffusionsprozesse und der Ito-Formel stehen. Die mathematischen Eigenschaften der vorgestellten Prozesse werden bezüglich ihrer Relevanz auf Finanzmärkten beschrieben und mit realwirtschaftlichen Datenreihen verglichen. Die Darstellung hält sich im Wesentlichen an das Kapitel 3 in „Investment under Uncertainty” von A.
Dixit und R. Pindyck und den Anhang von „Asset Pricing“ von J. Cochrane. „Stochastic Differential Equations“ von B. Øksendal, ein Buch aus der mathematischen Fachliteratur, geht
nur in eine Herleitung im Anhang ein.
II. Brownsche Bewegung (oder Wiener-Prozess)
II.1. Herleitung über einen Random Walk in diskreter Zeit
Die Brownsche Bewegung (auch Wiener-Prozess genannt) ist ein erratischer Prozess in stetiger Zeit, der als Grenzwert eines Random Walks in diskreter Zeit hergeleitet werden kann.1
Mit Hilfe dieser Herleitung kann anschaulich dargestellt werden, warum es sinnvoll ist, die
Brownsche Bewegung mit bestimmten Eigenschaften wie z.B. der Normalverteilung der Inkremente zu definieren.
Hierzu wird ein Random Walk ohne Drift einer Variablen x über ein Zeitintervall T betrachtet.
Dieses große Zeitintervall T wird in n gleich lange kleine Intervalle mit Länge ∆t aufgeteilt. In
jeder dieser Perioden kann sich die Variable x um den Betrag ∆h entweder nach oben oder
nach unten bewegen. Ein Sprung nach oben bzw. unten erfolgt in jedem Zeitintervall jeweils
mit der Wahrscheinlichkeit ½.2 Dadurch ergibt sich ein rekombinierender Binomialbaum3, der
für drei Perioden grafisch wie folgt dargestellt werden kann:
1
Die Herleitung der Brownschen Bewegung aus dem Random Walk hält sich an Dixit/Pindyck, Kapitel 3, 2.B.
Die beiden Wahrscheinlichkeiten können auch unterschiedlich groß sein (wie in der Herleitung von Dixit und
Pindyck). Dann ergibt sich ein Random Walk mit Drift. Die interessanten Implikationen der Herleitung können
aber auch bei gleichen Wahrscheinlichkeiten erhalten werden und die Herleitung ist weniger kompliziert.
3
Die Tatsache, dass die Technik der rekombinierenden Binomialbäume in der Praxis von Investment-Bankern
bei der Bewertung exotischer Wertpapierderivate angewandt wird, zeigt, dass die Brownsche Bewegung als
2
2
...
x0+3∆h
x0+2∆h
x0+∆h
x0
1
x0-∆h
x0-2∆h
x0-3∆h
...
1/8
1/4
1/2
3/8
1/2
1/2
3/8
1/4
1/8
t=0
t=1
t=2
t=3
...
Schon nach zwei bis drei Perioden ist zu erkennen, dass am Ende x-Werte nahe am Ausgangswert x0 mit größerer Wahrscheinlichkeit auftreten werden als x-Werte am oberen und
unteren Ende der Verteilung. Das liegt daran, dass Werte in der Mitte über mehr Pfade erreichbar sind als die Extremwerte oben und unten. So ist z.B. in t = 3 der Wert x0 + ∆h bei
drei verschiedenen Entwicklungen von x erreichbar4, der Wert x0 + 3∆h hingegen nur bei einem Hergang des Prozesses – nämlich drei Aufwärtsbewegungen in Folge. Diese Wahrscheinlichkeitsverteilung mit einer großen Wahrscheinlichkeitsmasse bei mittleren Werten
und kleinen Wahrscheinlichkeiten an den Enden findet man auch bei der Normalverteilung;
tatsächlich ist es so, dass die den Random Walk beschreibende Binomialverteilung gegen die
Normalverteilung konvergiert, wenn n unendlich groß wird.
Um über die Verteilungseigenschaften von zukünftigen Werten xt Aussagen treffen zu können, ist es notwendig, zuerst die Eigenschaften der Differenzen zwischen den x-Werten an
zwei aufeinander folgenden Zeitpunkten zu betrachten. Diese Differenzen, die Inkremente
genannt werden, werden wie folgt bezeichnet:
∆xt = xt +1 − xt
Grenzwert des Random Walk die Realitäten der Finanzmärkte – wenigstens in überschaubaren Zeitabschnitten –
hinreichend gut abbildet.
4
nämlich bei den Abfolgen auf-auf-ab, auf-ab-auf und ab-auf-auf
3
∆xt ist eine Zufallsvariable, die die Werte ∆h und –∆h annehmen kann. Für Erwartungswert
und Varianz von ∆xt gilt:
1
1
E (∆xt ) = ∆h − ∆h = 0
2
2
Var (∆xt ) =
1
(∆h − 0)2 + 1 (− ∆h − 0)2 = (∆h )2
2
2
Mit Hilfe dieser Werte kann man dann die Verteilungseigenschaften für die kumulierte Veränderung von x über das Gesamtintervall T, also xt – x0, bestimmen. Diese kumulierte Veränderung ist die Summe aller einzelnen Inkremente ∆xt. Der Erwartungswert für die Summe
dieser Inkremente ist gleich der Summe der Erwartungswerte aller Inkremente, also 0. Die
einzelnen Inkremente sind nach der Definition eines Random Walks unabhängig; deswegen
ist auch die Varianz von xt - x0 einfach die Summe der Varianzen der einzelnen ∆xt
Var ( xt − x0 ) = n(∆h)
2
2
(
∆h )
=
T
∆t
Innerhalb des Intervalls sollen nun die Teilintervalle ∆t immer kleiner werden und schließlich
gegen die Größe 0 gehen, um den gewünschten Prozess in stetiger Zeit zu erhalten. Das Problem ist es, den Parameter ∆h so zu wählen, dass der Prozess auch im Grenzwert noch die gewünschten Eigenschaften hat und Erwartungswert sowie Varianz sinnvolle Werte annehmen.
Für den Erwartungswert ist die Wahl von ∆h unerheblich, da dieser immer 0 bleibt, egal wie
groß ∆h ist. Als problematisch erweist es sich, ∆h so zu wählen, dass die Varianz im Grenzwert noch sinnvoll definiert ist. Wählt man beispielsweise für ∆h eine Konstante, so geht die
Varianz von xt - x0 gegen unendlich, wenn die Zeitintervalle ∆ti immer kleiner werden. Es ist
also klar, dass ∆h eine Funktion der Größe der Intervalle ∆t sein muss; die Sprünge in dem
Random Walk müssen immer kleiner werden, je kleiner die Zeitintervalle werden. In einem
weiteren Versuch könnte man ∆h = σ ∆t wählen. Damit wäre die Varianz σ2 ∆t T und würde
gegen 0 gehen, wenn ∆t unendlich klein würde. Es stellt sich heraus, dass es nur eine Möglichkeit gibt, eine endliche, positive Varianz zu erhalten. ∆h wird folgendermaßen gewählt:
∆h = σ ∆t
Die Größe der Schritte im Random Walk ist also eine lineare Funktion der Wurzel der Größe
des Zeitintervalls. Die Inkremente der Variablen x im Random Walk bzw. später die der Variablen zt in der Brownschen Bewegung sind also von der Größenordnung der Wurzel von ∆t –
eine Eigenschaft, die in vielen Belangen von großer Bedeutung sein wird. Es ist hilfreich, sich
dieses Prinzip an einem Beispiel klarzumachen: Wählt man σ = 1 und eine Zeiteinheit T von
einer Sekunde, so wären die Inkremente bei einer Zerlegung in Hundertstelsekunden immer4
hin von der Größe ein Zehntel; betrachtete man eine Zerlegung in Millionstelsekunden, läge
die Größe bei einem Tausendstel. Das Verhältnis von Schwankung zu Intervall wird also immer größer, je kürzer das Intervall wird. Diese Eigenschaft der Brownschen Bewegung führt
zu einigen ungewöhnlichen Implikationen, die wirtschaftlich höchst relevant sind.
Zusammenfassend lässt sich sagen, dass die Inkremente der Brownsche Bewegung über das
Zeitintervall T folgende Eigenschaften haben müssen, wenn sie aus dem gerade beschriebenen
Random Walk hergeleitet werden sollen:
•
Normalverteilung der Inkremente
•
Inkremente der Größenordnung
•
Voneinander unabhängige Inkremente, egal in welcher Aufteilung von T
•
Stationäre5 Inkremente
∆t
II.2. Definition
Die Brownsche Bewegung wird als Prozess einer Variablen z über die Zeit t definiert. zt bezeichnet dabei den Wert von z zum Zeitpunkt t. Die Definition des Prozesses erfolgt wie beim
Random Walk über die Differenzen, die zwischen den Werten von zt zu Anfang und Ende
beliebiger Zeitintervalle ∆ bestehen:
∆zt = zt+∆ – zt ~ N(0, ∆)
bzw.
∆zt = ε t ∆
wobei die Zeitdistanzen ∆ von beliebiger Länge sein können und εt eine standardnormalverteilte Zufallsvariable ist.
Bei einem Random Walk folgen die Inkremente einem sogenannten White-Noise-Prozess,
d.h. einem stationären Prozess, bei dem die einzelnen Inkremente voneinander unabhängig
sind. Genau die gleichen Eigenschaften haben die Inkremente ∆zt der Brownschen Bewegung:
Der Erwartungswert jedes Inkrements ∆zt ist 0. Wenn die Intervalllänge ∆ konstant gehalten
wird, ist die Varianz der Inkremente ∆zt immer gleich groß, egal welche Werte der Prozess zt
oder die Zeit t annehmen.
5
Dies bedeutet, dass die Inkremente zum Zeitpunkt t die gleichen Verteilungseigenschaften haben wie zum
Zeitpunkt t + s, für beliebiges s > 0.
5
Ein wichtiger Gedankenschritt beim Übergang vom Random Walk in diskreter Zeit zur
Brownschen Bewegungin stetiger Zeit ist, dass die Zeitintervalle ∆ unendlich kurz werden
können. Für das Inkrement der Brownschen Bewegung in einem solchen infinitesimal kurzen
Intervall schreibt man dann dzt. dzt ist definiert als:
dz t = lim ( z t + ∆ − z t )
∆ →0
Bei der oben beschriebenen Definition der Brownschen Bewegung werden drei wesentliche
Annahmen an die Inkremente dzt und damit für den Prozess getroffen:
•
Die Inkremente sind voneinander stochastisch unabhängig:
Für t1 < t2 < t3 gilt: z(t2) – z(t1) unabhängig von z(t3) – z(t2)
•
Die Inkremente sind stationär, d.h. ihre Verteilung ist unabhängig von t.
•
Die Inkremente ∆zt sind normalverteilt.
II.3. Eigenschaften
a) Erwartungswert
Der Erwartungswert eines Inkrements ∆zt der Brownschen Bewegung hat den Erwartungswert
0 für jedes Zeitintervall ∆, ganz gleich welcher Länge es ist. Deswegen ist der Erwartungswert von zt+∆ immer der gerade aktuelle Wert von zt:
Et ( z t + ∆ ) = z t
Die Brownsche Bewegung hat also die Markov-Eigenschaft: In die Vorhersage für zukünftige
Werte von zt+s geht immer nur der aktuelle Wert zt ein; die gesamte Entwicklung von zt davor
ist nicht relevant. Diese Eigenschaft macht die Brownsche Bewegung zu einem interessanten
Prozess für die Modellierung von Größen auf Finanzmärkten. Dort kann man davon
ausgehen, dass alle über die Zukunft erhältliche Information in Sekundenschnelle in den Preis
mit einbezogen wird. Der aktuelle Preis, in den die Einschätzungen aller Marktteilnehmer
über die zukünftige Entwicklung der Anlage eingehen, sollte keine systematische Über- oder
Unterschätzung des Erwartungswertes des zukünftigen abdiskontierten Preises aufweisen –
ansonsten wäre Arbitrage möglich.
Zudem sollte es auf informationseffizienten Finanzmärkten nicht möglich sein, mit Hilfe
leicht erhältilicher Information wie der historischen Entwicklung eines Wertpapierpreises
6
überdurchschnittliche Renditen zu erzielen. Könnte man nämlich aus der Historie der Anleihe
verlässliche Vorhersagen über die zukünftige Wertentwicklung ableiten, würden sich bald alle
Marktteilnehmer dieser Technik bedienen. Die verlässlichen Vorhersagen würden in den Preis
des Wertpapiers aufgenommen werden und der Erwartungswert für zukünftige Preise hinge
wieder nur vom aktuellen Preis ab – der Preisprozess hätte wieder die Markov-Eigenschaft.
b) Varianz und Standardabweichung
Die Varianz der Inkremente der Brownschen Bewegung wächst linear mit der Länge des Zeitintervalls:
Var ( zt + ∆ − zt ) = ∆
bzw.
Var (dzt ) = dt
Die Auswirkung dieser Eigenschaft wird klar, wenn man eine typische Abweichung von ∆zt,
nämlich dessen Standardabweichung betrachtet:
σ ( z t + ∆ − z t ) = Var ( z t + ∆ − z t ) = ∆
∆zt ist also von der Größenordnung der Quadratwurzel des Zeitintervalls ∆; eine Eigenschaft,
die bei vielen der weiteren Schritte eine entscheidende Rolle spielen wird. Konkret bedeutet
das, dass für längere Zeitintervalle die typische Abweichung relativ zur verstrichenen Zeit
kleiner ist und die vielen erratischen Bewegung dazu tendieren, sich etwas auszugleichen.
Verhundertfacht man beispielsweise das Zeitintervall, wird sich die Standardabweichung nur
verzehnfachen. Umgekehrt gilt auch, dass sehr kleine Zeitintervalle relativ große
Abweichungen in zt aufweisen: Teilt man ein Zeitintervall durch hundert Teile, so ist die
Standardabweichung
in
jedem
der
Teilintervalle
immerhin
ein
Zehntel
der
Standardabweichung des vorherigen Intervalls. Auch diese Eigenschaft erweist sich als
passend bei der Beschreibung von Kapitalmärkten: So weisen z.B. Aktienindizes während
eines Tages oft ganz erhebliche Schwankungen auf, über mehrere Jahrzehnte hinweg gesehen
erweist sich diese kurzfristige erratische Bewegung jedoch als wenig relevant und es
dominiert der exponentielle Aufwärtstrend.
7
c) Nicht-Differenzierbarkeit
Die extremen Ausschläge der Brownschen Bewegung in kurzen Zeitintervallen führen
außerdem zu einer weiteren wichtigen Eigenschaft: Der Pfad der Brownschen Bewegung ist
an keiner Stelle differenzierbar. Dies folgt mathematisch aus der Definition der Ableitung:
ε ∆ 
 ∆z 
 = ε t lim 1 = ±∞
lim t  = lim t
∆ →0
∆ →0
∆
 ∆  ∆ →0 ∆ 
Die Nicht-Differenzierbarkeit ist eine Eigenschaft, die bei einem mathematischen Prozess zur
Modellierung von Zeitreihen auf Finanzmärkten erfüllt sein muss. Wäre nämlich die Kurve
des Preises eines Finanztitels differenzierbar, wüsste man, in welche Richtung sich der Preis
im nächsten Zeitintervall bewegte. Damit allerdings wäre Arbitrage möglich – genau das jedoch darf nicht der Fall sein.
d) Stetigkeit und Pfadlänge
Die Brownsche Bewegung hat weitere interessante mathematische Eigenschaften, die jedoch
für ihre Verwendung zur Beschreibung von Finanzmärkten keine große Bedeutung haben. So
folgt z.B. jede Realisierung einer Brownschen Bewegung einem stetigen Pfad in der Zeit.
Theoretisch wäre es allerdings für wirtschaftliche Modelle nicht zwingend notwendig, keine
Sprünge bei Preisen, Zinsen und anderen Variablen zuzulassen.6
Außerdem kann man zeigen, dass die Brownsche Bewegung auf jedem – also auch jedem
beliebig kurzen – Zeitintervall eine unendliche Pfadlänge hat. Intuitiv lässt sich dies wiederum dadurch begreiflich machen, dass die Brownsche Bewegung relativ zur Zeit um so mehr
hin- und herzittert, je kürzer die betrachteten Zeitintervalle werden.7 Jedoch ist auch diese
Eigenschaft von wenig Interesse bei wirtschaftlichen Fragestellungen.
II.4. Beispiel: Der DAX während eines Handelstages
Ein Beispiel, auf das das Modell der Brownschen Bewegung angewendet werden könnte, ist
der DAX über einen Handelstag hinweg gesehen. Während eines Tages ist der langfristige
Aufwärtstrend des Index zu vernachlässigen und der Erwartungswert für den Stand am Ende
6
Es gibt sogar Prozesse, die solche Sprünge explizit erlauben und modellieren, nämlich die sogenannten Jump
Processes (in Dixit und Pindyck, Kapitel 3.6, erklärt).
7
Weitere Erläuterung zur unendlichen Pfadlänge im Anhang (VI.2a)
8
des Tages dürfte ziemlich genau seinem Eröffnungsstand an diesem Tag entsprechen. Grafiken im Anhang (VI.1a) zeigen eine Gegenüberstellung des DAX 30 am 22. März 2002 und
einer Simulation der Brownschen Bewegung. Man sieht, dass beide Prozesse offenbar ähnlichen Gesetzen gehorchen. Jedoch ist mit bloßem Auge natürlich nicht zu erkennen, ob die
Kurve des DAX an jenem Tag wirklich die Annahmen der Brownschen Bewegung erfüllt.
Doch auch bei genauerer Prüfung der Daten kommt man zu dem Schluss, dass die Brownsche
Bewegung kein perfektes, aber ein durchaus passables Modell für den Kursverlauf des DAX
an diesem – wohlgemerkt relativ ruhigen – Handelstag ist. 8
III. Diffusionsprozesse (oder Ito-Prozesse)
III.1. Definition
Um reale Wirtschaftsgrößen zu modellieren, wird selten eine reine Brownsche Bewegung
geeignet sein. So ist bei vielen Variablen ein ständiger Aufwärtstrend zu beobachten, der bei
der reinen Brownschen Bewegung nicht modellierbar ist. Des Weiteren könnte man z.B. einen
Prozess darstellen wollen, dessen Varianz sich mit der Zeit t bzw. der Größe der Variablen
selbst verändert. Diese Möglichkeiten – und viele andere mehr – können mit sogenannten
Diffusionsprozessen (auch Ito-Prozesse) abgebildet werden. Die allgemeine mathematische
Darstellung eines Diffusionsprozesses lautet folgendermaßen:
dxt = a(t , xt )dt + b(t , xt )dz t
Dabei sind a und b deterministische Funktionen von t und xt. Die Inkremente von xt setzen
sich also aus zwei Teilen zusammen: aus einem deterministischen Glied, das dt enthält und
z.B. einen Trend über die Zeit erfassen könnte, und aus einem stochastischen Glied, in das die
Brownsche Bewegung dzt als erratische Komponente eingeht. Ein Diffusionsprozess ist also
eine Kombination von deterministischen und stochastischen Prozessen.
Dabei ist vor allem zu beachten, dass sowohl die Zeit t als auch der aktuelle Wert xt des Diffusionsprozesses jeweils in die Funktionen a und b eingehen können. Das heißt konkret, dass
sowohl der Trend im ersten Term als auch die erratische Komponente im zweiten Term mit
der Zeit variieren können. So könnten z.B. die Inkremente in xt mit der Zeit kleiner werden
8
9
Statistische Tests und Grafiken sind im Anhang (VI.1a) zu finden.
und es könnte sich gleichzeitig die Varianz der stochastischen Komponente verkleinern. Des
Weiteren ist es möglich, dass die Realisierungen des Prozesses xt sowohl den weiteren Trend
als auch die stochastische Komponente im weiteren Verlauf beeinflussen. Zur Illustration
könnte eine Variable dienen, deren Inkremente bei höheren Werten von xt tendenziell größer
werden. Diese Variable würde also umso stärker wachsen, je größer der aktuelle Wert wäre.
Gleichzeitig könnte der Prozess z.B. eine höhere Varianz haben, je größer die x-Werte sind.
Im Folgenden werden drei Diffusionsprozesse vorgestellt, die besonders wichtig bei der Modellierung von Variablen auf Kapitalmärkten sind.
III.2. Wichtige Prozesse
a) Brownsche Bewegung mit Drift
Die Brownsche Bewegung mit Drift9 ist das stetige Analogon zum Random Walk mit Drift
und die einfachste Erweiterung der Brownschen Bewegung:
dxt = αdt + σdz t
Dabei bezeichnet α die Driftrate, also den erwarteten Zuwachs von xt in einer Zeiteinheit. Die
wirklichen Inkremente sind jedoch um α herum gestreut, da ja auch die stochastische Komponente auf der rechten Seite des Pluszeichens in das Inkrement mit eingeht. Dabei ist σ der
Varianzparameter. Je größer σ ist, desto stärker ist die erratische Komponente im Vergleich
zur Driftkomponente α. Wie beim Random Walk mit Drift gilt, dass die Inkremente des Prozesses mit Standardabweichung σ um den Mittelwert α verteilt sind.
Es ist nicht einfach, Anwendungen zur Brownschen Bewegung mit Drift aus der Wirtschaftswelt zu finden, da konstant wachsende wirtschaftliche Größen wie das BIP, ein Preis- oder
Aktienindex fast immer in exponentieller und nicht in linearer Form zunehmen. Meistens ist
für die Modellierung derartiger Zeitreihen die geometrische Brownsche Bewegung besser geeignet, die eng mit der Form mit Drift verwandt ist, wie später noch ausführlich erläutert wird.
9
Eine Simulation der Brownschen Bewegung mit Drift ist im Anhang (VI.1b) zu finden
10
b) Geometrische Brownsche Bewegung
Die geometrische Brownsche Bewegung ist wie folgt definiert:
dxt = αxt dt + σxt dzt
bzw.
dxt
= αdt + σdz t
xt
In diesem Fall sind nicht die absolut gemessenen Inkremente, sondern die Inkremente relativ
zum aktuellen Wert xt normalverteilt um die Driftrate α. Besonders in der zweiten Gleichung
oben wird deutlich, dass ein enger Zusammenhang zu der Form mit Drift besteht. Allerdings
sind bei der geometrischen Brownschen Bewegung die prozentualen Wachstumsraten, nicht
wie vorher die absoluten Zuwächse, um die mittlere Wachstumsrate α herum mit Standardabweichung σ normal verteilt. Diese Art von Prozess könnte z.B. für eine Größe in Frage
kommen, die jährlich um durchschnittlich 2% wächst, deren Wachstumsraten aber von Jahr
zu Jahr um diesen Durchschnittswert schwanken. Für die Anwendung der geometrischen
Brownschen Bewegung kommen also eine Fülle von wirtschaftlichen Größen in Frage: Aktienindizes, Preise einzelner Wertpapiere, aber auch Preisindizes und das BIP, wenn man die
Konjunkturzyklen herausrechnen bzw. anderweitig in das Modell mit einbeziehen könnte.
Auf lange Sicht ähnelt die geometrische Brownsche Bewegung einer Kurve in Form einer
Exponentialfunktion – ein Muster, dem z.B. auch einem Aktienindex über mehrere Jahrzehnte
hinweg betrachtet folgt. Dies kann man in den Grafiken im Anhang (VI.1c) erkennen, in denen der DAX 100 seit 1988 einer simulierten geometrischen Brownschen Bewegung gegenüber gestellt ist.10 Am Verlauf der beiden Kurven kann man auch gut eine weitere Eigenschaft
der geometrischen Brownschen Bewegung erkennen: Nicht nur der Erwartungswert der Inkremente des Prozesses wird bei höheren Werten des DAX bzw. von xt immer größer, sondern auch deren Varianz. Je weiter der DAX steigt, umso höher sind auch die Schwankungen,
wenn sie in absoluten DAX-Punkten gemessen werden. Mathematisch schlägt sich das in der
stochastischen Komponente σ xt dzt in der ersten Gleichung oben nieder: Ihre Varianz wächst
mit xt.
Wenn man die Grafik des DAX über 13 Jahre mit der vorher betrachteten Kurve des DAX
über einen Tag vergleicht, tritt eine grundlegende Eigenschaft von Diffusionsprozessen im
Allgemeinen zu Tage: Während eines Tages dominiert die erratische Komponente den Drift
so stark, dass er im Modell vernachlässigt werden kann. In der langen Frist jedoch beherrscht
10
Statistische Tests des DAX 100 auf Kompatibilität mit den Annahmen einer geometrischen Brownschen Bewegung siehe Anhang (VI.1e)
11
die deterministische Komponente das erratische Zittern und die Kurve des DAX hat näherungsweise eine exponentielle Form.
c) Mean-Reverting Process (oder Ornstein-Uhlenbeck-Prozess)
Ein weiterer interessanter Prozess zur Modellierung wirtschaftlicher Größen ist der MeanReverting Process:
dxt = η ( xt − µ ) dt + σdz t
Der Term auf der linken Seite des Pluszeichens bewirkt einen Trend hin zum Mittelwert µ. Je
weiter sich der aktuelle Wert xt von diesem Mittelwert entfernt, desto stärker ist dieser Trend.
Die Konstante η vor der Klammer kann als Geschwindigkeitsparameter aufgefasst werden. Je
größer η ist, desto schneller wird der Prozess zu µ hingezogen. Auf der rechten Seite des
Pluszeichens steht wie üblich der erratische Term. Dieser macht überhaupt erst eine Entfernung vom Mittelwert möglich.
Der Mean-Reverting Process kann zur Modellierung aller Größen benutzt werden, die zwar
Schocks unterliegen, aber langfristig immer wieder auf einen Gleichgewichtswert zurückdrängen. Dies könnte z.B. bei inflationsbereinigten Preisen für Güter der Fall sein, bei denen
sich die Produktionskosten langfristig nicht mehr verändern, weil etwa die technologischen
Möglichkeiten so gut wie ausgereizt sind. Wenn auf dem Markt für ein solches Gut perfekter
Wettbewerb herrscht, Angebot und Nachfrage aber Schocks unterliegen, sollte der Preis zwar
volatil sein. Langfristig aber würde er immer wieder auf das Niveau der Produktionskosten
zurückdrängen.
Auch bei realen Wechselkursen sollte es ähnliche Effekte geben: Das Theorem der Kaufkraftparität in seiner schwachen Form besagt, dass der reale Wechselkurs zwischen zwei Ländern
langfristig konstant ist.11 Die Kurse unterliegen aber zugleich durch die Volatilität an den Devisenmärkten immer wieder Schocks, die den realen Wechselkurs von der Gleichgewichtsrate
abbringen. Eine weitere Anwendungsmöglichkeit des Mean-Reverting Process wäre die Modellierung von Zinssätzen. Wenn es so etwas wie eine langfristige durchschnittliche Zinsrate
11
Wiche der Kurs von diesem Gleichgewichtswert ab, könnten Händler aus dem Land mit der unterbewerteten
Währung Güter in das andere Land exportieren und so überdurchschnittliche Gewinne machen. Die Nachfrage
nach der unterbewerteten Währung würde steigen und der reale Wechselkurs käme wieder ins Gleichgewicht.
12
für eine Volkswirtschaft gibt, um die die Zinsen ständig pendeln, dürfte der Mean-Reverting
Process für die Modellierung von Zinssätzen geeignet sein.12
IV. Ito-Formel
IV.1. Herleitung
Mit den bis jetzt diskutierten Prozessen kann man vielerlei Aussagen über einzelne Größen
auf den Kapitalmärkten treffen. Oft aber interessiert nicht unbedingt die Entwicklung einer
Größe selbst (wie z.B. des DAX, der Zinsen etc.) sondern eine Funktion dieser Größe (z.B.
der Nutzen aus dem Wert eines Wertpapiers, der Preis eines Derivats eines Wertpapiers etc.).
Bei solchen Berechnungen ist oft die Ito-Formel von großem Nutzen.
xt ist weiterhin ein beliebiger Diffusionsprozess, wie er schon in Absatz III.1. definiert wurde:
dxt = a(t , xt )dt + b(t , xt )dz t
(1)
F(xt) bezeichnet eine beliebige deterministische Funktion von xt, die mindestens einmal in t
und zweimal in xt differenzierbar ist.13 Bei F(xt) könnte es sich z.B. um den Logarithmus einer
Datenreihe oder die Nutzenfunktion eines Individuums in Abhängigkeit vom Wert seines
Portfolios handeln. Man betrachtet nun eine Taylor-Reihe14 2. Ordnung, um die Änderung dF
der Funktion F(xt) zu bestimmen:
dF =

∂F
1 ∂2F
∂F
∂2F
∂2F
dt +
dx t +  2 ( dt ) 2 + 2
dtdx t + 2 ( dx t ) 2 
∂t
2  ∂t
∂x t
∂t∂x t
∂x t

(2)
Ziel ist es, dF nur noch als Funktion der Glieder dt und dzt zu schreiben, deren Eigenschaften
bekannt sind. Alle Terme, in denen dxt vorkommt, werden also im Folgenden umgeformt.
Dabei soll auch bestimmt werden, welche Terme von der Größe her vernachlässigt werden
können, wenn dt sehr klein wird. Offensichtliche Kandidaten dafür sind die Terme zweiter
Voraussetzung für das Theorem ist, dass die beiden Länder miteinander Handel treiben und Transportkosten
keine überragende Rolle spielen.
12
In Grafiken im Anhang (VI.1d) sind eine langfristige Zinskurve, der Wechselkurs DM/USD und die Simulation eines Mean-Reverting Process gegenübergestellt.
13
Bei F(xt) könnte es sich z.B. um den Logarithmus einer Datenreihe oder die Nutzenfunktion eines Individuums
in Abhängigkeit vom Wert seines Portfolios oder
14
siehe Anhang (VI.2b) zur Erläuterung von Taylor-Reihen
13
Ordnung in der Klammer rechts in Gleichung (2). Zuerst wird die entscheidende Variable
(dxt)2 im letzten Term betrachtet. Durch Einsetzen von (1) ergibt sich:
(dxt ) 2 = a 2 (t , xt )(dt ) 2 + 2a(t , xt )b(t , xt )dtdz t + b 2 (t , xt )(dz t ) 2
(3)
Wie schon in Absatz II.3.b beschrieben, ist dzt von der Ordnung der Quadratwurzel von dt;
also ist (dzt)2 – und somit der gesamte letzte Term in (3) – von der Ordnung dt. Der gemischte
Term in der Mitte ist von der Ordnung (dt)3/2. Wenn nun dt sehr klein wird, spielt nur noch
der Term von Ordnung dt eine Rolle, die Terme von Ordnung (dt)2 bzw. (dt)3/2 gehen im
Grenzwert gegen 0. Also kann man schreiben:
( dx ) 2 = b 2 ( t , x t )( dz t ) 2
(4)
Betrachtet man nun die anderen Glieder 2. Ordnung in der großen Klammer in Gleichung (2),
sieht man, dass sie von höherer Ordnung als dt und somit zu vernachlässigen sind. Das erste
Glied ist offensichtlich von Ordnung (dt)2, das gemischte Glied in der Mitte von der Ordnung
(dt)3/2. Der Term mit (dzt)2 ist also das einzige Glied 2. Ordnung, das weiter mitgeführt wird.
Durch Einsetzen von (1) und (4) in (2) ergibt sich dann:
1 2
∂F
∂F
∂2F
[a(t , xt )dt + b(t , xt )dzt ] + b (t , xt ) 2 (dzt )2
dF =
dt +
2
∂t
∂xt
∂xt
(5)
Es stellt sich außerdem heraus, dass (dzt)2 nicht nur von der Ordnung dt, sondern sogar gleich
dt ist.15 Aus einem stochastischen Term wird also ein deterministischer. Die Umformung
(dzt)2 = dt ist keineswegs selbstverständlich. Dies wird bei einem Blick auf das stochastische
Glied mit dzt klar. dzt ist zwar von der Ordnung
dt , man kann es aber nicht einfach in
dt
umwandeln. Intuitiv lässt sich diese Identität von (dzt)2 und dt wohl am ehesten
folgendermaßen verstehen: Wenn dzt quadriert wird, werden auch aus den negativen
Inkremente dzt positive Werte – (dzt)2 muss also als streng positiver Beitrag in die Ito-Formel
eingehen. Außerdem muss dieser positive Beitrag im Mittel die Größe dt haben, da (dzt)2 im
Erwartungswert gleich dt ist.16
15
Der mathematische Beweis dafür ist im Anhang (VI.2b, Behauptung 2) zu finden.
Beweis siehe Anhang (VI.2b, Behauptung 1); der Erwartungswert kann in diesem Fall allerdings nur als Veranschaulichung verstanden werden; schließlich ist dzt im Erwartungswert gleich 0, kann aber wiederum nicht
einfach durch 0 ersetzt werden.
16
14
Mit Hilfe der gerade beschriebenen Gleichheit (dzt)2 = dt und nach Gruppierung der Terme in
deterministische (d.h. Terme mit dt) und stochastische (d.h. Terme mit dzt) ergibt sich die ItoFormel:
 ∂F ∂F
∂2F 
1 2
∂F
+
dF = 
a (t , xt ) + b (t , xt ) 2  dt +
b(t , xt )dzt
∂
∂
t
x
2
x
∂
∂
x
t
t

t 
(6)
IV.2. Interpretation
Dass die Terme
∂F
∂F
und
a (t , xt ) in die Ito-Formel eingehen, ist nicht wirklich
∂t
∂xt
überraschend. Ersterer beschreibt den direkten Trend von F(xt) in der Zeit, letzterer die
Veränderung in F(xt), die indirekt über den Zeittrend im Diffusionsprozess xt bewirkt wird.
Auch die stochastische Komponente stellt sich dar, wie man das intuitiv erwarten würde: Je
nachdem, wie stark die Funktion F(xt) auf Veränderungen im Diffusionsprozess xt reagiert
(was sich im Term
∂F
niederschlägt), wirkt sich die erratische Komponente b(t , xt )dzt aus
∂xt
dem Diffusionsprozess auf die Funktion F(xt) aus.
Schon eher verblüffend ist die Tatsache, dass der Term
∂2F
1 2
b (t , xt ) 2 in der Ito-Formel
2
∂xt
auftaucht – und das auch noch im deterministischen Glied17. Der Term kann als
Korrekturfaktor im Sinne von Jensens Ungleichheit18 aufgefasst werden. Er korrigiert den
Erwartungswert von dF in der Richtung der 2. Ableitung von F nach xt: Wenn F(xt) eine
konvexe Funktion ist, ist E[F(xt)] größer als F[E(xt)] und der Term korrigiert nach oben hin.
Ist F(xt) hingegen konkav, muss F[E(xt)] nach unten korrigiert werden.
17
18
Wie schon begründet ergibt sich das aus der Identität von (dzt)2 und dt.
Eine Erläuterung zu Jensens Ungleichheit findet sich im Anhang (VI.2c)
15
IV.3. Beispiel: Der Logarithmus des DAX über längere Zeit
Die Ito-Formel hat interessante Implikationen, wenn man sie auf den Logarithmus einer geometrischen Brownschen Bewegung anwendet (wie z.B., wie vorher erklärt, den DAX). Es
zeigt sich, dass man mit dem Hilfswerkzeug des natürlichen Logarithmus viele Rückschlüsse
auf die Entwicklung des eigentlich interessierenden zugrunde liegenden Prozesses ziehen
kann. Man setzt also
dxt = αxt dt + σxt dzt 19
und
F ( x ) = ln(x) .
Nach Itos Lemma gilt:



1
1 1 
1
σ2
dF = 0 + αxt +  − 2 σ 2 xt2  dt + σxt dz t = α −
 dt + σdz t
2  xt 
2 
xt
xt



Der Logarithmus der geometrischen Brownschen Bewegung folgt also einer Brownschen
Bewegung mit Drift.20 Über letztere ist es in vieler Hinsicht leichter, Aussagen zu treffen. So
kann man z.B. leichter den Erwartungswert und Konfidenzintervalle bestimmen.21 Setzt man
die erhaltenen Werte in die Exponentialfunktion ein, erhält man die entsprechenden Größen
für den zugrunde liegenden Prozess xt. Außerdem ist es jetzt sehr leicht zu sehen, dass die
Werte von F normal verteilt sind. Für die Werte von xt bedeutet das, dass sie lognormal verteilt sind.22
Interessant ist außerdem, dass der Logarithmus von xt nicht mit der Rate α wächst, sondern
nur mit α −
σ2
2
. Hierbei macht sich der oben beschriebene Korrekturterm aus der zweiten
Ableitung von F bemerkbar: Da der natürliche Logarithmus eine konkave Funktion ist,
werden große Werte von xt beim Einsetzen in F in der Relation zu kleinen mehr gestaucht.
Bei der Bildung des Erwartungswertes muss also im Vergleich zum ln[E(xt)] noch nach unten
korrigiert werden – und zwar umso mehr, je weiter die Werte von xt streuen – also je größer
die Varianz σ2 ist.
19
siehe Kapitel III.2.b
siehe Grafik zum Logarithmus des DAX100 über die letzten 13 Jahre im Anhang (VI.1e)
21
Im Anhang (VI.1e) werden Erwartungswerte und Konfidenzbänder für die geometrische Brownsche
Bewegung berechnet und grafisch illustriert.
22
xt = eF(xt)
20
16
V. Vorteile und Probleme stetiger Prozesse
Wenn die Brownsche Bewegung und ihr verwandte Diffusionsprozesse zur Modellierung von
Finanzmarktgrößen verwendet werden, kann sich eventuell die Normalverteilungsannahme
der Inkremente als problematisch herausstellen. Wahrscheinlich kommen extrem starke
Sprünge in den Kursen häufiger vor, als dies unter der Normalverteilungsannahme zugelassen
wird.23 Ein Ausweg wäre es, die Inkremente einer Verteilung folgen zu lassen, die mehr
Wahrscheinlichkeitsmasse an den Enden (Tails) der Verteilung aufweist. Eine weitere Möglichkeit ist die Verwendung von sogenannten Jump Processes24. Diese Prozesse sind ab und
an unstetig und weisen Sprünge nach oben oder unten auf.
Ein entscheidender Vorteil stetiger Prozesse gegenüber diskreten ist, dass bei der Verwendung von stetigen Prozessen häufig Lösungen in geschlossener Form möglich sind, selbst
wenn das beim diskreten Analogon nicht möglich ist. So kann man z.B. für eine Variable, die
einer geometrischen Brownschen Bewegung folgt, eine relativ einfache Dichtefunktion für die
Realisierungen der Variable in der Zukunft angeben. Zieht man hingegen eine passende Form
des Random Walk zur Modellierung heran, ist die Wahrscheinlichkeitsfunktion für zukünftige
Werte höchst kompliziert.
Des Weiteren ist die Annahme der stetigen Zeit auf den heutigen Finanzmärkten höchst realistisch: Es kann rund um die Uhr an irgendeinem Ort auf dem Globus gehandelt werden, durch
moderne Informationstechnologie kann man sich ständig über die neuesten Entwicklungen
der Märkte auf dem Laufenden halten und mit Hilfe von Computernetzwerken können Geschäfte in Sekundenschnelle abgewickelt werden. Die Brownsche Bewegung und ihre Erweiterungen bilden dabei ein Instrumentarium, das die Bewertung diverser Finanztitel sehr erleichtern kann.
23
Dieser Schluss liegt z.B. bei der Betrachtung des Q-Q-Diagramms der Log-Renditen des DAX über 13 Jahre
nahe (Anhang, VI.1e). Im Q-Q-Diagramm werden die unter der Normalverteilungsannahme erwarteten Werte
gegen die wirklichen Werte aufgetragen. Man sieht, dass es Probleme an den Enden der Verteilung gibt: Es gibt
mehr Ausreißer, als dies unter der Normalverteilungsannahme zu erwarten wäre.
24
Jump Processes werden in Dixit und Pindyck, Kapitel 3.6, erläutert.
17
VI. Anhang
VI.1. Grafiken
a) zu II.4.: Beispiel: Der DAX während eines Handelstages
Gegenüberstellung der Simulation einer Brownschen Bewegung und des DAX 30 am Freitag,
50
5420
40
5400
30
5380
DAX 30
20
5360
10
5340
0
:0
0
:0
0
19
18
:0
0
:0
0
:0
0
17
16
:0
0
Zeit
Periode t
Quelle: Eigene Simulation25
15
:0
0
:0
0
:0
0
14
13
12
11
00
9:
10
00
90
0
80
0
70
0
60
0
50
0
40
0
30
0
20
0
0
10
0
:0
0
5320
-10
10
Brownsche Bewegung
den 22. März 2002:
Datenquelle: Bloomberg Financial Services
Gegenüberstellung der Inkremente pro Periode in der simulierten Brownschen Bewegung und
der minütlichen Inkremente des DAX 30 am Freitag, den 22. März 2002:
6
10
8
4
2
6
4
2
0
-2
0
-2
-4
-4
-6
-8
-6
-10
Es scheint, dass es beim DAX mehr Ausreißer gibt als bei der simulierten Brownschen Bewegung und dass die Varianz beim DAX über die Zeit nicht ganz konstant ist. Ansonsten weisen
die beiden Prozesse sehr große Ähnlichkeit auf.
25
Verwendete Technik zur Simulation einer Brownschen Bewegung siehe mathematischer Anhang (VI.2d)
18
Die Normalverteilungsannahme scheint für die Inkremente des DAX allerdings problematisch
zu sein. Im Histogramm erscheint die Verteilung einer Normalverteilung noch sehr ähnlich
(außer vielleicht, dass immerhin 5 der 600 minütlichen Inkremente im Betrag größer als 7
Punkte sind, und das bei einer Standardabweichung von nur 1,83 Punkten). Betrachtet man
hingegen das Q-Q-Diagramm der Inkremente26, sieht man, dass bei der Normalverteilungsannahme zwei anscheinend systematische Probleme auftreten: Erstens – und nicht unbedingt
sehr überraschend – gibt es an den Enden der Verteilung zu viele Ausreißer. Zweitens– und
das verblüfft schon eher – liegen zu viele Werte direkt um den Mittelwert herum. Dieses Muster bleibt übrigens auch erhalten, wenn die Daten logarithmiert werden und dann die Differenzen gebildet werden.
Q-Q-Diagramm von Normal von DHIGH
35
6
4
25
20
2
15
10
5
0
-10
-8
-6
-4
-2
0
2
4
Inkrement pro Minute
6
8
Erwarteter Wert von Normal
Häufigkeit
30
0
-2
-4
-6
-10
0
10
Beobachteter Wert
Interessant ist außerdem die Frage, ob die Inkremente wirklich unabhängig voneinander sind,
so wie das von den Axiomen der Brownschen Bewegung gefordert wird. Bei der Autokorrelationsfunktion sieht man, dass dies wohl nicht der Fall ist, außer vielleicht für den Lag 1. Innerhalb einer Minute sind die Inkremente signifikant positiv korreliert. Das liegt wohl daran,
dass ein Intervall der Länge 1 Minute selbst auf dem Stand der heutigen Technologie zu kurz
ist, als dass darin schon ein neuer Informationsschub komplett in die Kurse eingepreist werden könnte.
26
Das Q-Q-Diagramm trägt die unter der Normalverteilungsannahme vorhergesagten Werte gegen die wirklich
beobachteten Werte ab.
19
Autokorrelationsfunktion der Inkremente des DAX:
DHIGH
1.0
.5
0.0
Konfidenzhöchstgrenz
-.5
ACF
en
-1.0
Koeffizient
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Lag-Nummer
b) zu III.1.: Brownsche Bewegung mit Drift
Simulation einer Brownschen Bewegung mit Drift:
Brownsche Bewegung mit Drift
125
100
75
50
25
0
Periode t
Quelle: Eigene Simulation
20
10
00
90
0
80
0
70
0
60
0
50
0
40
0
30
0
20
0
10
0
0
-25
Die Simulation hat pro Periode einen Drift von 0,1 nach oben und dauert 1000 Perioden. Ihr
Erwartungswert vom Zeitpunkt t = 0 aus gesehen (dargestellt durch die rosa Gerade) für das
Ende der Simulation in t = 1000 ist also der Wert 100. Bestimmt man allerdings den
Erwartungswert in t = 500 wieder neu, kommt man zu einem Erwartungswert weit unter 100
(dargestellt durch die blaue Gerade). Das liegt daran, dass der Prozess in t = 500 einen
niedrigeren Wert annimmt als in t = 0 erwartet. Aufgrund der Markov-Eigenschaft spielen die
früheren Erwartungen in t = 500 allerdings keine Rolle mehr; jetzt interessiert nur der aktuelle
Wert des Prozesses bei der Bildung des neuen (durch den bisherigen Pfad bedingten)
Erwartungswertes. Die blauen Parabeln sind 66%-Konfidenzintervalle für die Werte des
Prozesses ab t = 500.27
c) zu III.2.: Geometrische Brownsche Bewegung
Gegenüberstellung der Simulation einer simulierten geometrischen Brownschen Bewegung
1400
4000
1200
3000
DAX 100
1000
800
600
2000
1000
400
200
Datum
Periode t
Quelle: Eigene Simulation
Quelle: Bloomberg Financial Services
Absolute Inkremente der beiden Prozesse:
60
200
150
30
100
50
0
0
-50
-30
-100
-150
-60
27
-200
Simulations-Setting und Berechnung der Intervalle siehe VI.2e
21
.0
1.
00
03
.0
1.
97
5000
03
4000
.0
1.
94
3000
03
2000
03
1000
.0
1.
88
0
.0
1.
91
0
0
03
Geometrische Brownsche
Bewegung
und des DAX 30 über die letzten 13 Jahre:
Bei den Inkrementen ist jeweils eine Trichterform zu erkennen. Das rührt daher, dass bei der
geometrischen Brownschen Bewegung die Varianz der Inkremente mit dem Wert des Prozesses selbst wächst. Man sieht jedoch, dass die Varianz beim DAX nicht kontinuierlich wächst,
sondern Mitte der 90er Jahre mit dem Einsetzen des Technologie-Booms schlagartig explodiert. Dies könnte eine Verletzung der Annahmen der geometrischen Brownschen Bewegung
bedeuten. Eine genauere Untersuchung der Frage, ob der DAX 100 seit 1988 einer geometrischen Brownschen Bewegung folgt, findet später in Punkt VI.1.e statt.
d) zu III.3.: Mean-Reverting Process (oder Ornstein-Uhlenbeck-Prozess)
Gegenüberstellung eines simulierten Mean-Reverting Process28, des Libor-Zinssatzes29 über
90 Tage seit Anfang 1984 und des Wechselkurses zwischen DM und USD seit Anfang 1971:
Mean-Reverting Process
160
140
120
100
80
60
40
20
00
0
10
00
90
00
80
00
70
00
60
00
50
00
40
00
30
00
20
00
10
0
0
Periode t
Quelle: Eigene Simulation (Mittelwert: 100)
28
Simulations-Setting findet sich in VI.2.g
Der Libor ist der Interbanken-Zinssatz in Großbritannien. Hier im Beispiel wurde der Satz für eine Leihe über
90 Tage gewählt.
29
22
19
71
04
.0
1.
19
73
04
.0
1.
19
75
04
.0
1.
19
77
04
.0
1.
19
79
04
.0
1.
19
81
04
.0
1.
19
83
04
.0
1.
19
85
04
.0
1.
19
87
04
.0
1.
19
89
04
.0
1.
19
91
04
.0
1.
19
93
04
.0
1.
19
95
04
.0
1.
19
97
04
.0
1.
19
99
04
.0
1.
20
01
04
.0
1.
Kurs DM/USD
04
.0
1.
19
87
04
.0
1.
19
88
04
.0
1.
19
89
04
.0
1.
19
90
04
.0
1.
19
91
04
.0
1.
19
92
04
.0
1.
19
93
04
.0
1.
19
94
04
.0
1.
19
95
04
.0
1.
19
96
04
.0
1.
19
97
04
.0
1.
19
98
04
.0
1.
19
99
04
.0
1.
20
00
04
.0
1.
20
01
04
.0
1.
20
02
Libor 90 Tage
18
16
14
23
12
10
8
6
4
2
0
Datum
Quelle: Bloomberg Financial Services
4
3,5
3
2,5
2
1,5
1
0,5
0
Datum
Quelle: Bloomberg Financial Services
e) zu IV.3.: Beispiel: Der Logarithmus des DAX über längere Zeit
Logarithmus des DAX 100 über die letzten 13 Jahre sowie dessen Inkremente:
0,15
Inkremente von ln(DAX)
8,5
8
ln(DAX)
7,5
7
6,5
0,05
0
-0,05
-0,1
-0,15
6
03.01.1988
0,1
03.01.1992
03.01.1996
03.01.2000
Datum
Zeit
Folgte der DAX einer geometrischen Brownschen Bewegung, so müsste sein Logarithmus
einer Brownschen Bewegung mit Drift folgen. Bei der ersten visuellen Inspektion des Logarithmus des DAX sieht auch alles danach aus. Allerdings sieht man am Diagramm der Inkremente, dass die Varianz der Inkremente wohl nicht über die Zeit konstant ist, wie das bei einer Brownschen Bewegung mit Drift der Fall sein müsste, sondern zu manchen Zeiten größer
ist als zu anderen.
Weitere Probleme mit den Annahmen der Brownschen Bewegung treten wie schon beim
DAX über einen Tag bei der Inspektion des Q-Q-Diagramms auf. Wieder gibt es zu viele extreme Werte an den Enden der Verteilung (vor allem zu viele extrem negative Ereignisse, also
schwarze Tage). Im gesamten mittleren Bereich allerdings passt die Normalverteilung jedoch
hervorragend zu den Daten. Die Unabhängigkeit der Inkremente ist jedoch gegeben. Dies
macht ein Blick auf die Autokorrelationsfunktion deutlich.
24
DIFF(LNDAX100,1)
Q-Q-Diagramm von Normal von DIF
1.0
.06
.04
.5
0.0
0.00
-.02
Konfidenzhöchstgrenz
-.5
en
-.04
ACF
Erwarteter Wert von Normal
.02
-.06
-.1
0.0
.1
Koeffizient
-1.0
16
15
14
13
112
1
10
9
8
7
6
5
4
3
2
1
-.2
Lag-Nummer
Beobachteter Wert
Über den Umweg des Logarithmus einer geometrischen Brownschen Bewegung kann man
leicht Erwartungswert und Konfidenzintervalle berechnen. In der folgenden Grafik ist der
Logarithmus der Simulation der geometrischen Brownschen Bewegung aus VI.1.c mit Erwartungswert und zwei Konfidenzbändern dargestellt:30
Logarithmus der geometr. Brownschen
Bew.
9
8
ln(x(t))
E[ln(x(t))]
ln 66% oben
ln 66% unten
ln 95% oben
ln 95% unten
7
6
5
4
3
0
1000
2000
3000
4000
Periode t
30
Errechnung der Konfidenzintervalle siehe mathematischer Anhang (VI.2h)
25
5000
Extrapoliert auf den eigentlichen Prozess, die geometrische Brownsche Bewegung, ergeben
sich dadurch folgende Konfidenzbänder:
Geometrische Brownsche Bewegung
1500
1250
x(t)
1000
E[x(t)]
66% oben
750
66% unten
95% oben
500
95% unten
250
Periode t
26
50
00
40
00
30
00
20
00
10
00
0
0
VI.2. Mathematische Herleitungen und Erläuterungen
a) zu II.3 d: Stetigkeit und Pfadlänge
Erläuterung zur Eigenschaft der unendlichen Pfadlänge der Brownschen Bewegung:31
Es ist in diesem Zusammenhang hilfreich, wieder auf die Herleitung der Brownschen Bewegung aus dem Random Walk in II.1. zurückzugreifen. Im Falle des Random Walk ist es klar,
dass in einem n-mal unterteilten Intervall T n-mal die vertikale Strecke ∆h zurückgelegt wird
(entweder nach oben oder nach unten). Die Summe all dieser Distanzen wird als Pfadlänge
dieses Prozesses bezeichnet. Für die Pfadlänge gilt, dass
n∆h =
1
T
T
∆h = σ ∆t = σ T
∆t
∆t
∆t
Im ersten Schritt wird n als Quotient des Gesamtintervalls T und der Teilintervalle ∆t ausgedrückt. Dann kann man für ∆h die Beziehung zu ∆t einsetzen, die für die Brownsche Bewegung gefunden wurde. Geht jetzt ∆t gegen 0, sieht man, dass die zurückgelegte Pfadlänge
unendlich lang wird.
b) zu IV.1.: Herleitung der Ito-Formel
•
Erläuterung von Taylor-Reihen
Mit der Hilfe von Taylor-Reihen kann der Wert einer Funktion am Punkt x errechnet werden,
wenn an einem anderen Punkt a der Funktionswert und die Werte der Ableitungen der Funktion bekannt sind:
∞
f (x ) = ∑
k =0
f ( k ) (a )
( x − a) k
k!
Zieht man nur die ersten Summanden in Betracht, so erhält man Näherungen für den Funktionswert von x. Eine Näherung dritter Ordnung sähe folgendermaßen aus:
f ( x ) = f ( a ) + f ′( a )( x − a ) +
27
1
1
f ′′( a )( x − a ) 2 + f ′′′( a )( x − a ) 3
6
2
Taylor-Reihen funktionieren ähnlich für Funktionen mit mehreren Variablen. Bei der Herleitung der Ito-Formel wird eine Näherung zweiter Ordnung für eine Funktion mit zwei Variablen verwendet. Die bekannten Werte für die Funktion und ihre Ableitungen liegen an der Stelle a auf der x-Achse und an der Stelle b auf der y-Achse. Dann lautet diese Näherung in allgemeiner Form folgendermaßen:

∂2 f
∂2 f
1 ∂2 f
∂f
∂f
2
( x − a )( x − b) + 2 ( x − b) 2 
f ( x, y ) = f ( a , b) + ( x − a ) + ( x − b) +  2 ( x − a ) + 2
∂y
∂x∂y
2  ∂x
∂y
∂x

Im Falle der Ito-Formel ist die Zeit t die erste Variable (hier x) und der Diffusionsprozess xt
die zweite (hier y). Außerdem wird nur ein Differential errechnet (dF bzw. df hier); die Funktionswerte werden also auf beiden Seiten weggelassen.
•
[
Behauptung 1:
]
E (dz t ) = dt
2
Beweis über die Verschiebungsregel für Varianzen:
[
]
[
]
[
dt = Var (dz t ) = E (dz t ) − [E (dz t )] = E (dz t ) − 0 = E (dz t )
2
2
2
2
]
Q:E:D:
•
Behauptung 2:
A) Behauptung32
Zu zeigen ist, dass die zwei folgenden Prozesse V und T äquivalent sind::
t
V = ∫ x ( dzτ )2
τ
t
0
31
32
und
t
T = ∫ x dτ
τ
t
0
Die Erläuterung hält sich an Dixit und Pindyck , S. 70
Der folgende Beweis folgt im Wesentlichen Øksendahl (1985)
28
B) Hilfssätze
Folgende drei Hilfssätze werden benötigt, um die Behauptung zu zeigen:
Lemma 1:
Für beliebige Zufallsvariable U und Konstante c gilt:
[
]
E ( U − c )2 = 0 ⇒ E( U ) = c
und außerdem
P( U = c ) = 1
Ähnlich gilt für beliebige Zufallsvariablen U, V mit Var(U) < ∞, Var(V) < ∞:
E (U − V )2  = 0 ⇒ U = V im quadratischen Mittel.


U äquivalent V; also anschaulich gesprochen gleich bis auf pathologische Ereignisse und solche mit Wahrscheinlichkeit 0. Die Führung des Beweises folgt später im Wesentlichen Lemma 1.
Lemma 2:
Bei den in der Wahrscheinlichkeitsrechnung üblichen Lebesgue-Integralen darf man bei der
Beweisführung Limes und Erwartungswert vertauschen:
[


E  lim x  = lim E ( x )
i
i
i → ∞
 i→∞
]
Lemma 3:
2
2
2
n
T
T
T
 n





 ∑ a i c i − ∑ a i d i  = a c − a d  = a ( c − d ) =
i =1
 i =1

T
n
n
= ( c − d )T a a ( c − d ) = ∑∑ ai a j ( ci − d i )( c j − d j )
i =1 j =1
29
C) Beweisführung
Nach Lemma 1 genügt es, folgende Gleichheit zu zeigen, um die Behauptung zu verifizieren:
2
T
T

E  ∫ x ( dz ) 2 − ∫ x dt  = 0
t
 0 t t

0
Integrale sind als Grenzwerte endlicher Summen definiert, also gilt:
[
]

 n

2− n x
−
E  lim  ∑ xti −1 z t − z t
t
t
∑
t
i −1
i
i −1
i i − 1 
 n → ∞ i = 1
i =1

(
)



2
= 0
Zur Vereinfachung der Notation betrachten wir die diskreten Inkremente:
∆2 z
i
(
= zt − zt
i
)
2
i −1
∆t i = t i − t i −1 =
und
T
n
Da die quadratische Funktion stetig ist, kann der Limes aus der Klammer herausgezogen werden:
2

n
 n
 
2

E lim  ∑ xti−1 ∆ z − ∑ xti−1 ∆t 
i
i 

i =1
 
 n → ∞ i = 1
Mit Hilfe von Lemma 2 können Limes und Erwartungswert vertauscht werden:

lim  E
n → ∞

2
n
 n
 
2
 ∑ xti −1 ∆ zi − ∑ xti −1 ∆ti  
i = 1
 
i =1

Ab nun wird nur die endliche Summe innerhalb des Limes betrachtet. Durch Anwendung von
Lemma 3 ergibt sich für diese:
n n
Sn = ∑ ∑ E
i =1 j =1
 x x ( ∆2 z − ∆t ) ( ∆2 z − ∆t ) 
 ti t j
i
i
j
j 
Nun werden die Erwartungswerte der Summanden einzeln betrachtet. Bezeichne die Summanden mit bij:
bij = E
30
[x
ti
xt ( ∆2 zi − ∆ti ) ( ∆2 z j − ∆t j )
j
]
Die Summanden bji und bij sind gleich, daher gilt:
n
n
n
S n = ∑ ∑ bij = ∑ bii + 2∑ bij
i =1 j =1
i =1
i< j
Betrachte zuerst die Summanden vom Typ bii:
[
bii = E xt xt
i
j
] [
2
( ∆2 z i − ∆ti ) ( ∆2 z i − ∆ti ) = E xti ( ∆2 z i − ∆ti ) 2
]
Die beiden quadrierten Zufallsvariablen in den Klammern sind voneinander unabhängig: Die
Inkremente der Brownschen Bewegung erfolgen im Zeitintervall direkt nach der Realisierung
von xti; laut den Axiomen der Brownschen Bewegung müssen sie also von den Werten unabhängig sein. Der Erwartungswert des Produkts zweier unabhängiger Zufallsvariablen ist das
Produkt der Erwartungswerte der beiden Variablen, also:
b = E  xt 2  E ( ∆2 z − ∆t ) 2 
ii
i
i 
 i  
Schreibe ab jetzt:
e = E  xt 2 
 i 
ii
Außerdem gilt, dass:
E [ ∆2 z ] = ∆ t
i
i
...und folglich:
E[ ∆4 z ] = ∆2 t
i
i
Damit kann man schreiben:
b = e (3∆2t − 2 ∆2t + ∆2t ) = 2e ∆2t
ii
ii
i
i
i
ii
i
Wie in der Herleitung zur Ito-Formel beschrieben, sind Terme dieser Größenordnung zu vernachlässigen.
Betrachte nun die Summanden vom Typ bij:
b =E
ij
[
]
 x x (∆2 z − ∆t )(∆2 z − ∆t ) = E x x E (∆2 z − ∆t )(∆2 z − ∆t )
ti
tj
 ti t j

i
i
j
j 
i
i
j
j 
Wieder darf die Trennung der Erwartungswerte nur deswegen so vorgenommen werden, weil
die Zufallsvariablen in den zwei Erwartungswerten auf der rechten Seite des Gleichheitszeichens voneinander unabhängig sind. Dies ist deswegen der Fall, weil i < j ist und deswegen
31
die Inkremente zeitlich hinter den beobachteten Realisierungen von xt stehen. Wegen der
Unabhängigkeit der Inkremente folgt des Weiteren:
E  ( ∆2 z − ∆t )( ∆2 z − ∆t )  = E ( ∆2 z − ∆t )  E ( ∆2 z − ∆t )  = 0


i
i
j
j 
i
i  
j
j 
Damit bleiben in der ursprünglich betrachteten Summe Sn nur noch die Summanden bii übrig:
Sn =
n
∑ bii ≤ 2n max{eii }∆2ti = 2 max{eii }
i =1
...und somit:
1
T2
n = 2 max {eii }T 2
2
n
n
lim [S n ] = 0
n→∞
Damit ist also gezeigt, dass:
[
]

 n

2− n x
−
E  lim  ∑ xti−1 z t − z t
t
t

∑
t i −1
i
i −1
i i − 1  
 n → ∞ i = 1
i =1

(
)
2
= 0
Mit Lemma 2 folgt also im Sinne der Abweichung im quadratischen Mittel:
T
T
2
∫ xt ( dz t ) = ∫ xt dt
0
0
Q.E.D.
c) zu IV.2: Interpretation der Ito-Formel: Jensens Ungleichheit:
Wenn X eine Zufallsvariable und F eine konvexe Funktion von X ist, dann gilt:
E [F ( X )] > F [E ( X )]
Ist dagegen F konkav, gilt das Gegenteil:
E [F ( X )] < F [E ( X )]
Man kann sich das Prinzip von Jensens Ungleichheit an einer Zufallsvariable X verdeutlichen,
die nur zwei Werte annehmen kann. Wendet man auf X eine konvexe Funktion an, wird das
arithmetische Mittel zwischen den beiden Funktionswerten größer sein als der Funktionswert
des arithmetischen Mittels der zwei Werte selbst.
32
d) zu VI.1a: Simulation einer Brownschen Bewegung
Die Brownsche Bewegung wurde folgendermaßen simuliert:
xt = xt −1 + ε t
ε t ~ N (0;1)
wobei
und
x0 = 0
Die Inkremente wurden vom Zufallsgenerator eines Computerprogramms erzeugt.
e) zu VI.1b: Simulation einer Brownschen Bewegung mit Drift
Die Brownsche Bewegung mit Drift wurde folgendermaßen simuliert:
xt = xt −1 + 0,1 + ε t
ε t ~ N (0;1)
wobei
und
x0 = 0.
Die Geraden der Erwartungswerte haben folgende Gleichungen:
E 0 ( xt ) = 0,1t
E500 ( xt ) = x500 + 0,1(t − 500)
Das Konfidenzintervall ab t = 500 ergibt sich folgendermaßen (σ2 = σ = 1):
KI 66% ( xt ) = E500 ( xt ) ± t − 500
f) zu VI.1c: Simulation einer geometrischen Brownschen Bewegung
Die geometrische Brownsche Bewegung wurde folgendermaßen simuliert:
xt = xt −1 (1 + 0,0005 + 0,02ε t )
wobei
ε t ~ N (0;1)
und
x0 = 100
Durch folgende Umformung ist leicht zu sehen, dass obige Formel in der Struktur identisch
mit der Definition der geometrischen Brownschen Bewegung ist:
∆xt −1 = xt − xt −1 = 0,0005 xt −1 + 0,02 xt −1ε t
33
g) zu VI.1d: Simulation eines Mean-Reverting Process
Der Mean-Reverting Process wurde folgendermaßen simuliert:
xt = −0,001( xt −1 − 100) + ε t
wobei
ε t ~ N (0;1)
und
x0 = 100
h) zu VI.1e: Konstruktion von Erwartungswerten und Konfidenzintervallen der geometrischen
Brownschen Bewegung
Der Erwartungswert für die logarithmierte geometrische Brownsche Bewegung (ab jetzt als Ft
bezeichnet) wurde bestimmt durch:


σ2
0,02 2 
t = 4,605 + 0,03t
t = ln (100 ) +  0,0005 −
E 0 [Ft ] = F0 + α −
2 
2 


Die Konfidenzintervalle wurden folgendermaßen errechnet:
KI 66% = E [Ft ] ± σ t = E [Ft ] ± 0,02 t
KI 95% = E [Ft ] ± 1,96σ t = E [Ft ] ± 0,0392 t
Die entsprechenden Erwartungswerte und Konfidenzintervalle für die geometrische Brownsche Bewegung wurde durch Einsetzen der oben errechneten Werte in die Exponentialfunktion gewonnen.
34
VII. Literaturverzeichnis:
Cochrane, John (Princeton University Press, 2001): „Asset Pricing“, Princeton, New Jersey
Dixit, Avinash K. und Pindyck, Robert S. (Princeton University Press, 1994): „Investment
under Uncertainty“, Princeton, New Jersey
Øksendal, Bernt (Springer-Verlag, 1985): „Stochastic Differential Equations“, Oslo
35