Gewichteter Verzweigungsprozess
Transcription
Gewichteter Verzweigungsprozess
1 Verzweigende Stochastische Prozesse Die Grundidee ist ein genealogischer Baum von Individuen mit einem Urahnen. Jedes Individuum erhält einen Namen und Eigenschaften, die von der Mutter mit einem zusätzlichen Zufallseffekt vererbt wurden usw. Der Zufallseffekt ist unabhängig von Familie zu Familie, ist innerhalb der Familie in der Regel jedoch korreliert. Wir erhalten einen Stammbaum von Individuen mit individuellen Kenngrößen wie Lebensdauer, DNS, Intelligenz, Reichtum, Größe des Individuums. Die mathematische Untersuchung solcher Modelle führt zu Wahrscheinlichkeitstheorie auf Bäumen mit einer Dynamik, die wie bei Markoffketten oder dynamischen Systemen fortschreitend von der Wurzel des Baumes aufsteigend von Knoten zu Knoten führt. Wir führen den gewichteten Verzweigungsprozess (=GVP) ein. Grob gesprochen bestehen diese aus dem Baum V aller endlichen Folgen natürlicher Zahlen, einem Zustandsraum S und Transformationen T auf dem Zustandsraum in sich auf allen Kanten des Baums. Der Zustand eines Individuums ergibt sich aus dem Zustand der Urmutter und den Transformationen. Eventuell ist der Zustand selbst nicht direkt beobachtbar, sondern nur eine Funktion U davon mit Werten in einem Realraum R. 1.0.1 Alphabete und Worte: n Sei A eine nichtleere Menge und A∗ = ∞ n=0 A die Menge aller endlichen 0 Tupel über der Menge A. Das Symbol A bezeichnet per Definition die Menge der leeren Menge {∅}. Die Menge A heißt Alphabet, ein Element davon Buchstabe und eine endliche Folge von Buchstaben Wort. Wir stellen die Wortmenge A∗ dar als einen genealogischen Baum, siehe Bild. Das Bild zeigt den binären Baum für die Grundmenge A = {1, 2}.) Der Name eines Knotens (vertex=Knoten) v = (v1 , v2 , . . . , vn ) ∈ A∗ wird gegeben durch den Pfad von der Wurzel ∅ startend bis zum Knoten selbst. Wir unterdrücken nach Möglichkeit die leere Menge ∅ im Pfadnamen und Knotennamen. S 1 ³ ³³ ³³ )³ 1 u³ ¡@ @ ¡ Ru12 @ ª u 11 ¡ ¢A ¢A ¢ A ¢ A u u ¢® Uu A ¢® AUu u∅ ³³ PPP PP PP PP qu2 ¡@ @ ¡ Ru22 @ ª 21 u¡ ¢A ¢A ¢ A ¢ A u ¢® AUu212 u AUu ¢® Zur schnelleren Schreibweise notieren wir einen Knoten v = (v1 , v2 , . . . , vn ) ∈ A (außer der Wurzel ∅) als v = v1 v2 . . . vn . (Dies ist formal ein kleiner Notationsmißbrauch.) Der Namen eines Knoten v korrespondiert eineindeutig mit dem direkten Pfad von der Wurzel ∅ bis zum Knoten v. Dieser Pfad startet in der Wurzel, besucht dann v1 , von dort v1 v2 , dann v1 v2 v3 usw. Die Länge |v| des Pfadnamens bzw. die Generation eines Knotens v = v1 v2 . . . vn ist die Länge n des Pfades von der Wurzel bis zum Knoten. Hierbei hat der Pfadname ∅ die Länge 0. Das Bild zeigt alle Knoten bis einschließlich der dritten Generation. Für m ≤ |v| benutzen wir die Einschränkung v|m = v1 . . . vm . Sei w = w1 . . . wm ∈ V ein weiterer Knoten, so benutzen wir ∗ vw = v1 . . . vn w1 . . . wm . Die Verzweigungsstruktur führt auf die genealogische Ordnung ¹g auf A∗ , definiert durch v ¹g w ⇔ |v| ≤ |w| and w||v| = v. (1) Dies ist eine partielle Ordnung. Wir schreiben v ≺g w genau dann wenn v ¹g w und v ungleich w gilt. Wir sprechen auch von v ist ein Vorfahre oder Ahne von w im Fall v ¹g w und von einem von einem echten Vorfahren oder Ahnen. Ganz allgemein nutzen wir den genealogischen Sprachgebrauch, da er sehr intuitiv und treffend ist. Einen Knoten, abhängig vom Kontext, nennen wir Individuum, Teilchen oder Mutter. vi ist ein Kind oder Nachkommen von v und v ist die Mutter von vi. vw ist ein Nachkomme von v and v ist ein Vorfahre von vw. Die gegebene Ordnung v ¹ w entspricht der natürlichen Abstammung der Biologie. Sei jetzt A mit einer Totalordnung (partielle Ordnung und für alle a, b ∈ A gilt a ¹ b oder b ¹ a. Die Totalordnung auf dem Alphabet impliziert die 2 lexikografische Ordnung auf dem Folgenraum A∗ . Hierbei gilt v kleiner gleich w in lexikografischer Ordnung, v ¹l w, falls v ein Anfangsstück von w ist oder vi < wi gilt für das kleinste i, für welche vi und wi sich unterscheiden. v ¹l w ⇔ v ¹l w oder vτ < wτ für τ = inf{i ≤ |v|, |w| | vi 6= wi }. 1.0.2 (2) Bäume als Graphen Ein Teil der Notation gewichteter Verzweigungsprozesse ist der Graphentheorie entnommen, da Bäume Spezialfälle sind. Daher ein kurzer Ausflug in die Graphentheorienotation. Ein Graph (V, E) besteht aus einer nicht leeren Menge V und einer Teilmenge E von V × V. V heißt Knotenmenge und ein Element v darin Knoten (=vertex). Ein Element e = (a, b) aus E heißt Kante (edge) mit Anfangsknoten a und Endknoten b. Ein Pfad in einem Graph ist eine Folge e1 , . . . , en von Kanten, wobei der Endknoten der Kante ei stets der Anfangsknoten der folgenden Kante ei+1 ist. Der Anfangsknoten eines Pfades ist der Anfangsknoten von e1 und der Endknoten der von en . Wir sprechen auch von einem Pfad von v nach w Ein Pfad heißt Schleife oder Zykel, falls Anfangsknoten und Endknoten übereinstimmen. Der Knoten w heißt erreichbar von v, falls es einen Pfad von v nach w gibt. Eine Wurzel eines Graphen ist ein Knoten v, von dem aus alle andere Knoten erreichbar sind. Ein Baum in der Graphentheorie ist ein Graph ohne Schleifen. Ein Baum mit Wurzel heißt auch Wurzelbaum oder gewurzelter Baum. Die Wurzel ist eindeutig. Ein gewichteter Graph ist ein Graph mit einer Abbildung K ∈ e 7→ ge ∈ G von den Kanten in eine Halbgruppe (G, ∗). (Beachte, das Gewicht liegt auf den Kanten, nicht den Ecken.) Der Wert ge heißt Kantengewicht. Jedem Pfad p = (e1 , . . . , en ) ordnen wir das Pfadgewicht gp = ge1 ∗ ge2 ∗ . . . ∗ gen zu. In einem gewichtenen Baum mit Wurzel w gibt es eine Bijektion zwischen Pfaden und Knoten ohne die Wurzel. Dies liefert eine Belegung V \{w} 3 v → gv ∈ G der Knoten, wobei gv das Pfadgewicht des Pfades von der Wurzel bis v ist. Die Belegung läßt sich stets auf den ganzen Baum erweitern, indem der Halbgruppe ein neutrales Element x (∀g ∈ G x ∗ g = g = g ∗ x) zugefügt und 3 gw,w = x gesetzt wird. Ist der Baum in einem Graph eingebettet, so läßt sich die Baumkantengewichtung zu einer Graphkantengewichtung fortsetzen. Der Halbguppe fügen wir ein Grab 4 (∀g ∈ G g ∗ 4 = 4 = 4 ∗ g) und belegen alle noch unbesetzten Kanten e des Graphen werden mit ge = 4. Nun zur verwendeten Ausprägung. Unsere Wortmenge A∗ versehen mit den Kanten (a, ai), a ∈ A∗ , i ∈ A ist ein Graph und ein Wurzelbaum mit der Wurzel ∅. In Anbetracht der Graphentheorienotation benutzen wir das Symbol V für die Knotenmenge (Vertexmenge). Der Knotenname v = (v1 , v2 . . . , vn ) entspricht dem Pfad von der Wurzel ∅ über die Knoten (∅, v1 ), (∅, v1 , v2 ) usw. bis hin zum Knoten v. (Aus schreibtechnischen Gründen unterdrücken wir die Wurzel wenn möglich.) Die Länge n = |v| des Knotennamens entspricht der Anzahl der besuchten Knoten des zugehörigen Pfades (ohne die Wurzel). Die n-te Generation Vn eines Baumes besteht aus allen Knoten der Länge (=Namenslänge, Pfadlänge) n. Sinngemäß bezeichnet V≤n die Knoten bis zur n-ten Generation und vV den Teilbaum zur Wurzel v. 1.0.3 Das Grab Durch Einführung eines Grabes ersparen wir uns Fallunterscheidungen verschiedener Bäume und erreichen eine effizientere Notation. Wir betrachten (fast ausschließlich) Bäume mit unendlich vielen VerzweiS n gungen und arbeiten stets auf dem Baum V = ∞ n=0 IN aller endlichen Tupel zum Alphabet der natürlichen Zahlen IN = {1, 2, 3, . . .}. Binäre Bäume (das Alphabet ist zweielementig) oder m-verzweigende Bäume (das Alphabet hat m Elemente) mit endlich viele Ästen usw. sind alles Teilbäume von V mit Wurzel ∅. Ein Teilbaum bzw. Baum mit Wurzel ∅ wird charakterisiert als eine Teilmenge B ⊂ V , sodaß jeder Vorfahre eines Individuums in B wieder in B liegt. (Äquivalent ist B ⊂ V versehen mit den Kanten (B × B) ∩ E ist ein Wurzelbaum mit Wurzel ∅.) Formal können wir Teilmengen B der Knotenmenge eindeutig durch eine Funktion ϕ : V 7→ {0, 1} via ϕ−1 (1) = B beschreiben. Die Antitonie in genealogischer Ordnung (v ¹g w ⇒ ϕ(v) ¹g ϕ(w)) der Abbildung ϕ ist äquivalent zur Baumeigenschaft von B mit Wurzel ∅. Wir sprechen dann von einem beobachtbaren (=lebenden) Individuum v im Falle ϕ(v) = 1 und von einem nicht beobachtbaren (=toten) im Falle ϕ(v) = 0. Die beobachtbaren Individuen bilden den Teilbaum B, analog zum genealogischen Stammbaum. Allgemein, wenn immer wir eine Funktion f von einem Teilbaum B von V 4 in irgendeine Menge S haben, erweitern wir diese Menge S um ein weiteres Element 4, genannt das Grab, und die Funktion f zur Abbildung von V nach S ∪ {4}, indem wir jedem Element aus V \B das Grab zuordnen. Im obigen Fall besteht S aus der 1 und das Grab ist die 0. Ab jetzt betrachten wir nur den Baum V = IN ∗ der endlichen Folgen natürlicher Zahlen mit der Pfadindizierung startend in der Wurzel ∅. 1.1 Gewichteter Verzweigungsprozess Wir führen den gewichteten Verzweigungsprozess (GVP) ein und geben einige Beispiele. Generell sei (Ω, A, P ) ein nicht näher bezeichneter Wahrscheinlichkeitsraum. Wir setzen stets voraus, daß dieser reichhaltig genug ist für alle Konstruktionen und Zufallsgrößen. Wir unterdrücken, wenn möglich, in allen Zgn die Realisierung ω. Ein gewichteter Verzweigungsprozess (GVP) besteht aus einem Tupel (V, W, (G, ∗)). Hierbei ist V der Baum der endlichen Folgen natürlicher Zahlen einschlies̈lich der leeren Folge ∅. Der Gewichtsraum (G, ∗) ist ein mes̈bare Halbgruppe mit σ-Algebra σ(G) und einem neutralen Element sowie einem Grab. Zu jeder Kanten (v, vi), v ∈ V, i ∈ IN des Baumes sind Zgn Wv,i : Ω → G, genannt Kantengewichte, mit Werten in der Halbgruppe G vorgegeben. Die Zgn ((Wv,vi )i∈IN ), v ∈ V sind unabhängig und identisch verteilt. Bem: Beachte die verkürzende Schreibweise Wv,i zur Kante (v, vi). Die Zgn (Wv,i )i , v ∈ V sind unabhängig, aber für festes v sind die Kantengewichte Wv,i , i ∈ IN beliebig abhängig voneinander. Als Merkregel, verschiedene Familien sind unabhängig, aber innerhalb einer Familie können beliebige Abhängigkeiten bestehen. Not: Wir verwenden g ∗ h oder sogar gh für ∗(g, h). Das Grab heißt stets 4. Pfadgewichte Definiere rekursiv die Pfadgewichte Wv,w für die Pfade (v, vw) von v nach vw durch Wv,vwi = Wv,w ∗ Wvw,i . (3) Not: Wir verwenden Ww (v) =: W (v, w) und Ww = Ww (∅). Aus schreibtechnischen Gründen verwenden wir standardmäßig Wv,v als das neutrale Element in der Halbgruppe. 5 Die Gleichung (3) schreibt sich allgemeiner als Wv,wx = Wv,w ∗ Wvw,x Wwx (v) = Ww (v) ∗ Wx (vw) Wwx = Ww ∗ Wx (w) und expliziter v = v1 . . . vn Wv = Wv1 Wv2 (v1 )Wv3 (v1 v2 ) . . . Wvn−1 (v|n−1 )Wvn (v) (4) Die Pfadgewichte Ww (v) lassen sich interpretieren als Pfadgewicht für den Baum vV zum relativen Pfad w. Das Pfadgewicht Ww (v) ergibt sich durch Hintereinanderschaltung von den Kantengewichten entlang dem Pfad vom Knoten v zum Knoten vw. Ein gewichteter Verzweigungsprozeß mit Nutzenfunktion (=Kostenfunktion) U , der Buchstabe U steht für utility, ist ein GVP (V, W, (G, ∗)) mit einer zusätzlichen Belegung Uv der Knoten durch eine Zg mit Werten in R. Hierbei operiert (G, ∗) transitiv auf R ∗ : G × R → R. Die Zgn ((Wi (v))i , Uv ), v ∈ V sind unabhängig, identisch verteilt. Halbgruppen werden gerne via der Komposition von Funktionen dargestellt und analog für transitive Operationen. Mit dieser Interpretation werden die realen Werte Uv (Wv )) auf den Knoten v beobachtet. Wir führen dies formal aus. Bisher haben wir GVP eher algebraisch betrachtet. Jetzt zur mehr analytischen Sichtweise über Funktionen. Jede Halbgruppe läßt sich darstellen als ein Funktionenraum F mit der Komposition als Verknüpfung. Die Kantengewichte Wi (v) entsprechen funktionswertigen Zgn Ti (v) : Ω → S S auf einer Menge S. Die Menge S heißt Zustandsraum (state space). Die Halbgruppenoperation ∗ entspricht der Komposition von Funktionen Wi (v) ∗ Wj (vi) = Tj (vi) ◦ Ti (v). Beachte die Umkehrung der Verknüpfungsordnung. Analog benutzen wir Tw (v) für Ww (v). Die Nutzenfunktion C als Abbildung C : S S → R erfüllt W ∗ U = C(W ). Bei der Schreibweise mit Funktionen ergeben sich Schwierigkeiten mit der Indizierung W (v) für das Pfadgewicht. Um diesen vorzubeugen, verwenden wir teilweise Lv , der Buchstabe L für layer, um noch eine eventuelle Auswertung der Funktion an der Stelle s ∈ S gut betrachten zu können. Oder wir benutzen die Kantennotation geeignet. 6 Mit der Notation T (v) = (Ti (v))i∈IN lautet die Unabhängigkeitsbedingung (T (v), Uv ), v ∈ V sind uiv Zgn. Die wesentlichen interessanten Beispiele für gewichtete Verzwigungsprozesse mit zufälligen Gewichten werden wir gleich vorstellen. Es gibt aber durchaus interessante und nichttriviale Beispiele mit deterministischen Gewichten. Als Beispiel wählen wir die Cantormenge mit dem Cantormaß. (Stellvertretend für eine ganze Klasse von Beispielen mit dieser Struktur, Kochkurve, Schneeflocke, usw..) Bsp: Cantormenge: Aus dem abgeschlossenen Einheitsintervall entferne das offene mittlere Drittel. Im nächsten Schritt entferne aus jedem verbleibenden Intervall das offene mittlere Drittel und fahre rekursiv fort. Die übriggebliebenen Punkte ist die Cantormenge. Cantormenge: 0r r1/3 p p p p p p pppp pppp p p p p p p pppp pppp r2/3 p p p p p p pppp pppp Cantorset Cantorset Can r1 p p p p p p pppp pppp Cantorset Cantorset Can Die formale Definition der Cantormenge C lautet: 3n −1 2 Cn := [ 2m 2m + 1 [ m=0 C := \ n Cn = {x = 3n , 3n ∞ X xi i=1 3i ]. | xi ∈ {0, 2}}. Die Cantormenge hat interessante Eigenschaften: • Die Cantor Menge ist überabzählbar, abgeschlossen, kompakt, nirgends dicht (=das Innere vom Abschluß ist leer) und perfekt (=jeder Punkt ist Häufungspunkt). (Übung) • Die Cantor Menge ist Borel meßbar und das Lebesgue Maß der Cantor Menge ist 0. (Übung) 7 • Die Cantormenge ist die größte kompakte invariante Menge bzgl. der Funktion f : IR 7→ IR, f (x) = 11x≤1/2 3x + 11x>1/2 (1 − 3x). (Eine Menge A heißt invariant unter f, falls f −1 (A) = A gilt.) (Übung: Benutze die Trialdarstellung einer reellen Zahl.) Jetzt zur Beschreibung als gewichtetem Wurzelbaum. Die verzweigende Struktur wird durch das Aufspalten eines Intervalls in zwei Teile gegeben. Die Knotennamensgebung startet mit der Wurzel ∅ für das Einheitsintervall. Nach Entnahme des mittleren Drittels erhält das linke verbleibende Intervall [0, 1/3] den Namen 1 und das rechte verbleibende Intervall [2/3, 1] den Namen 2. Fahre so fort, indem bei Aufspaltung eines Intervalls mit Namen v das linke den Namen v1 erhält und das rechte den Namen v2. Wir erhalten den binären Baum A∗ zum Alphabet A = /1, 2/. Sind wir nur an der Länge der jeweiligen Intervalle interessiert, bietet sich eine Modellierung an als ein GVP mit W1 = 1/3 = W2 , W3 = 0 = W4 = . . . auf den positiven reellen Zahlen G mit der Multiplikation. Das Grab P entspricht dem Wert 0 und das neutrale Element der 1. Sei Zn = |v|=n Wv die Gesamtlängen der Intervalle in n-ter Generation, bzw. das Lebesguemaß n von Cn . Eine leichte Überlegung liefert 32 Zn = Zn−1 und damit Zn = 32n →n 0. Damit erhalten wir Zn →n 0 und das Lebesguemaß λ(C) der Cantormenge ist ebenfalls 0, λ(C) = n→∞ lim λ(Cn ) = lim Zn = 0. n Jetzt eine etwas ausfürlichere dynamischere Modellierung als Prozess auf Intervallen. Sei S die Menge der abgeschlossenen Intervalle in den positiven reellen Zahlen einschlies̈lich des leeren Intervalls {∅}. Die Kantengewichte beschreiben wir durch Transformationen der Intervalle auf sich wia T [a, b] 7→1 [a, a + b−a ] 3 T [a, b] 7→2 [b − b−a , b] 3 und T3 = {∅} = T4 = . . . . Die Cantormenge ist der Grenzwert der fallenden Folge der Mengen ∪|v|=n Lv ([0, 1]). Auf den Knoten sei die deterministische Kostenfunktion gegeben, die jedem Intervall I seine Länge |I| zuordnet. Wir erhalten als Gesamtmasse P in n-ter Generation Zn = |v|=n |Lv (I)| bei Start in dem Intervall I. Eine n leichte Rechnung ergibt Zn = 32n λ(I) mit λ(I) die Länge des Startintervalls. Benutzen wir die Nutzenfunktion, welches jedem Intervall I die Länge des Intervalls zur Potenz α zuordnet. Sei α0 derjenige (eindeutige) Wert mit 8 ( 23 )α0 = 1. Dann konvergiert Zn(α) := |v|=n |Lv (I)|α mit n → ∞ gegen 0 für α < α0 , ist konstant für α = α0 und konvergiert gegen unendlich für α > α0 . (In 4.1 zeigen wir α0 ist die Hausdorffdimension der Cantormenge.) Ein weiteres interessantes Objekt ist das Cantormaß bzw. Hausdorffmaß. Definiere die reellwertige Funktion F für dei Kostenfunktion J 7→ λ(J)α0 P F (x) := n→∞ lim X Cv (Lv ). |v|=n, Lv <x Hierbei benutzen wir J < x in der Bedeutung, jeder Punkt des Intervalls J ist strikt kleiner als x. Dann ist F eine stetige Verteilungsfunktion und differenzierbar auf dem Komplement der Cantormenge mit Ableitung 0. (Aber nirgendwo auf der Cantormenge. Auf der Cantormenge selbst wäre die Ableitung ∞.) Das Cantormaß ist das Maß gehörend zur Verteilungsfunktion F. 1.2 Beispiele Wir kommen jetzt zu einer Reihe von Beispielen mit stochastischer Komponente. Die extremen Beispiele sind diejenigen, wo eine der beiden Hauptstrukturen, die Gewichtung oder die Baumstruktur, ausarten. Falls die Gewichtung nur einen Wert annehmen kann, neben dem Grab, so behalten wir nur die Baumstruktur. Dies sind die Galton-Watson Prozesse (eventuell mit abzählbar vielen Nachkommen.) Falls die Baumstruktur degeneriert zu einer Linie, die dann isomorph zu den natürlichen Zahlen ist, erhalten wir im zufällige iterierte Funktionensysteme, im reellen Produkte von uiv Zgn. Diese Beispiele sind eher als einfach oder grundlegend anzusehen, da nur eine Struktur vorhanden ist. Das Vorliegen beider Strukturen verkompliziert die Lage, da beide Strukturen einen gegenteiligen Effekt auslösen können (und in der Regel tun) und es substanzieller Argumente und Abschätzungen bedarf, welcher Effekt sich durchsetzt. Bsp: Galton-Watson Prozesse: Der Galton-Watson Prozess [2] [3] wird beschrieben durch eine Folge von uiv Zgn Xn,m , m, n ∈ IN mit Werten in den natürlichen Zahlen einschließlich der 0. Betrachtet wird der Prozess (Zn )n∈IN0 mit Werten in den natürlichen Zahlen einschließlich der Null, Z0 = 1, Zn+1 := Zn X m=1 9 Xn,m . Dabei hat Xn,m die Interpretation als die Anzahl der Nachkommen des mten Individuums in der n-ten Generation. Zn gibt die Anzahl der (lebenden) Individuen in n-ter Generation an. Der Galton-Watson Prozess entspricht einem gewichteten Verzweigungsprozess zu der multiplikativen Gruppe {1} erweitert um das Grab 4 = 0. Die Halbgruppe ist G = {0, 1} mit der Multiplikation als Operation ∗. Die Kantengewichte und Pfadgewichte nehmen nur die Werte 0 oder 1 an. Das Pfadgewicht 1 eines Pfades in der Wurzel startend mit Endknoten v interpretieren wir als einen lebenden (beobachtbaren) Knoten v und das Pfadgewicht 0 als nicht beobachtbar (nicht existent, nicht wahrnehmbar, tot, nicht lebend, nicht realisiert usw. ). Wir erhalten als typische Realisierungen genealogische Bäume wie etwa folgendes Bild: ³ ³³ ³³ u³ ) 1³ ´Q Q ´ Q ´ Q su13 Q u´ u12 ? 11 +́ ¢A ¢A ¢ A ¢ A u u ?A ? ?AUu ¢ ® u Uu ¢u ® u u∅ ³³ PPP PP PP PP qu3 ¡@ ¡ @ u ª Ru32 @ 31 ¡ ¢A ¢A ¢ A ¢ A ¢u ® AUu312 u AUu ¢® u2 ? Hierbei wurden nur die beobachtbaren Individuen eingezeichnet. P Die Anzahl der Nachkommen eines Individuums v ist X(v) = i Wi (v) und die Anzahl aller lebenden Individuen in n-ter Generation ist Zn = X Wv . |v|=n Die Verteilung von X ist die gleiche wie von Xn,m des GWP und die Zn sind identisch. Nur die Benennung der Individuen ist veschieden, in unserer Baumstruktur durch den Namen v induziert durch dne Pfad, im GaltonWatson Prozess als m-tes lebendes Individuum in der n-ten Generation. Üblicherweise hat ein Galton-Watson Prozess per Definition nur endlich viele Nachkommen. Eine typische Fragestellungen für den Galton-Watson Prozess, dies ist auch historisch der entscheidende Anlaß zur Betrachtung von Galton-Watson Prozessen gewesen, war die Aussterbewahrscheinlichkeit 10 q = limn→∞ P (Zn = 0) eines (adligen) Namens. In dem Modell von GaltonWatson hierzu spielte die Namensgebung der Individuen keine Rolle. P Mit geeigneter Normierung 0 < m := E i Wi < ∞ konvergiert Zn →n M mn als positives Martingal fast sicher gegen einen Grenzwert genannt M . Die Verteilung der Grenzverteilung von M erfüllt eine stochastische Fixpunktgleichung D M= X Wi i m Mi . (5) Hierbei sind (W1 , W2 , . . .), Mi , i ∈ IN unabhängig und Mi hat dieselbe Verteilung wie M. Hierdurch läßt sich die Verteilung von M charakterisieren. Wir werden in den folgenden Sektionen dies genauer untersuchen. Bsp: Iteriertes Funktionensystem: Ein zufälliges iteriertes Funktionensystem ist die Komposition Yn := Xn ◦ Xn−1 ◦ . . . X1 n ∈ IN von uiv Zgn Xi , i ∈ IN. Hierbei haben die X-Zgn Werte in einer Menge von Funktionen von einer Menge S auf sich selbst. Zufällige iterierte Funktionensysteme sind extreme Spezialfälle gewichteter Verzweigungsprozesse mit dem Baum der lebenden Individuen ausgeartet zu einer Linie isomorph zu IN0 . Es bietet sich die Beschreibung eines GVP via Funktionen an. Die Funktionen mit der Komposition bilden die Halbgruppe. Das neutrale Element ist die Identität und das Grab ist die Funktion identisch 4, wobei, ebenfalls Grab genannt, 4 dem Zustandsraum zugefügt wird (und entsprechend der Definitionsbereich aller Funktionen erweitert wird). Die Kantengewichte sind W1 (v) = X|v| falls v nur aus lauter Einsen besteht und ansonsten setze Wi (v) die Grabfunktion. Die lebenden Individuen bei Start in s ∈ S entsprechen denjeningen Knoten, deren Wert Lv (s) nicht das Grab ist. Dies können nur Knoten sein mit einem Namen nur aus Einsen bestehend. Ein eher einfaches Beispiel dieser Struktur wäre S die positiven reellen Zahlen und die Funktionen fy , y ∈ IR+ als Multiplikation x 7→ fy (x) = xy. 11 Mit der Identifizierung fy ↔ y von Funktionen mit reellen Zahlen entspricht die Halbgruppe (G, ∗) den positiven reellen Zahlen mit der Multiplikation. P Das Gesamtgewicht Zn = |v|=n Lv (s) der n-ten Generation für den Anfangswert s ist Yn (s) = Xn Xn−1 . . . X1 s, wobei wir Xi als Zg mit Werten in den positiven reellen Zahlen genommen haben. Der Logarithmus des Produkts Yn ist eine Summe von uiv Zgn und darüber ist viel bekannt. Hier ein etwas anspruchvolleres Beipiel im IR2 . Die Multiplikation wird nun durch Matrizen ersetzt und ist im allgemeinen nicht mehr vertauschbar. Bsp: Iterierte affin lineare Abbildungen: Sei H ein separabler Hilbertraum, endlich dimensional oder nicht [6]. Die Werte der zufälligen Funktion Xn seien affin lineare Abbildungen auf dem Hilbertraum H, H 3 x 7→ Xn (x) = An x + bn . Hierbei sind (An , bn ) uiv Zgn mit An ist eine (zufällige) lineare Abbildung und bn ein (zufälliges) Element des Hilbertraumes. Damit erhalten wir Yn als Yn = bn + An bn−1 + An An−1 bn−2 + . . . An An−1 . . . A1 b0 + An An−1 . . . A1 A0 = An Yn−1 + bn . Betrachte den gewichteten Verzweigungsprozess (in der algebraischen Beschreibung) mit der Halbgruppe der linearen Abbildungen, beschrieben durch Matrizen, auf dem Hilbertraum H bereichert um das Grab 4. Die Kantengewichte sind gegeben durch W1 (v) = A|v| falls v nur aus Einsen besteht und Wi (v) ist ansonsten die konstante Abbildung auf 4. Die Nutzenfunktion Uv : Ω → R, mit R die Menge der Funktionen von Matrizen in Hilbertraumwerte, identifizieren wir mit einer Abbildung Ũv : Ω → H durch M 7→ Uv (M ) = M Ũv durch Auswertung der Matrix M and der Stelle Uv . Setze Ũv = b|v| für v nur aus Einsen bestehend und ansonsten das Grab. Dann hat Rn Rn := X Uv (Lv ) |v|<n dieselbe Verteilung wie Yn bei Start in Y0 ≡ 0. Dies ersieht man aus der Rückwärtsgleichung D Rn = ARn−1 (1) + b mit Rm (i) der Rm -Term für den Baum mit der Wurzel i. Hierbei sind (A, b), R· unabhängig und (A, b) verteilt wie oben. 12 Konvergiert Rn in Verteilung gegen ein R [6], so erfüllt die Grenzverteilung R die stochastische Fixpunktgleichung D R = AR + b. Beispiele hierzu sind die Cantormenge, die Schneeflocke, das Sierpinski Dreieck, der Farn, . . . . Bsp: Cantormenge In einer Dimension d = 1 wähle A als eine Konstante in (0, 1/2] und für die Kosten C nehmen den Wert 0 oder 1 − A mit Wahrsch. 1/2 an. Der stochastische Fixpunkt R hat das Cantormaß als Verteilung im Fall A = 1/3 und das Lebesguemaß im Fall A = 1/2. Diese Konstruktion läs̈t sich offensichtlich auch zufällig machen. Cantor Menge Bsp: Sierpinski Dreieck In Dimension d = 2 sei A := à 1/2 0 0 1/2 ! und Ũ nimmt die Werte (0, 0), (1/4, 1/2), (1/2, 0) jeweils mit Wahrsch. 1/3 an. 13 Sierpinski Dreieck Bsp: Kochkurve Wie entsteht die Kochkurve? Folgendes Bild erläutert dies: Kochkurve Bsp: Farn Die wesentlichen Daten für den Farn sind: In zwei Dimensionen d = 2 wähle (A, b) als Ãà Ãà .02 0 −.139 .246 0 .27 ! à .263 .224 14 , 150 0 ! à , !! 171 −10.8 , !! , Ãà .16 .222 Ãà .781 −.032 −.215 .176 ! à , 122.4 26.79 !! , .034 .739 ! à 32.25 81 !! , , jeweils mit Wahrsch. 0, 01; 0, 15; 0, 13; 0, 71. Definiere die Folge Xn von Zgn auf IRd rekursiv zu dem Anfangswert X0 durch Xn+1 = An Xn + bn mit (An , bn ), n ∈ IN0 unabhängige Zgn verteilt nach (A, b). Diese Folge für eine feste Realisierung ω aufgezeichnet, zeigt, bis auf die Anfangspunkte, fast sicher einen Farn. Die Zg Xn nähert sich nach einer Einschwingphase dem Farn und springt dort hin und her. Der Träger der Verteilung des stochastischen Fixpunktes der stochastischen Fipunktgleichung D R = AR + b ist der gezeichnete Farn. Farn 1.3 GVP mit beiden Strukturen Bsp: Verzweigende Irrfahrt: Das vielleicht einfachste Beispiel eines nicht ausgearteten GVP ist die verzweigende Irrfahrt (Branching Random Walk) [5]. Ein Individuum startet in 0 und erzeugt pro Zeiteinheit endlich viele Nachkommen. Diese 15 werden zufällig verschoben vom Aufenthaltsort der Mutter nach einer festen Verteilung platziert. Danach verhalten sich sich alle Individuen unabhängig voneinander und folgen demselben Teilungs- und Verschiebungsschema. Die Halbgruppe sind die reellen Zahlen mit der Addition erweitert um das Grab −∞. Die Verschiebung des i-ten Kindes der Mutter v entsprecht dem Kantengewicht Wi (v). Die Position des Individuums v ist die Summe der Einzelverschiebungen des Pfades von der Wurzel ∅ bis nach v. Von Interesse sind z.B. die exponentiell gewichteten Gesamtverschiebungen X Zn := eWv v∈Vn in nter Generation oder das größte Gewicht in n-ter Generation sup Wv . v∈Vn Die Größe Zn mn P Wi mit 0 < m = E i e < ∞ ist ein positives Martingal und konvergiert fast sicher gegen einen Grenzwert. Dieser erfüllt wie oben die Fixpunktgleichung 5. Die additive Grupps der reellen Zahlen ist isomorph zur multiplikativen Gruppe der strikt positiven Zahlen. Der Isomorphismus ist die Exponentialfunktion. Der Isomorphismus dehnt sich auf die Gräber aus, das additive Grab −∞ wird auf das multiplikative Grab 0 abgebildet. Daher sind die additive und die multiplikative Darstellung äquivalent. Beide Beschreibungen desselben Modells haben ihre Vor- und Nachteile. Für stochastische Fixpunktgleichungen auf den reellen Zahlen ist die multiplikative Version vorzuziehen. BSP: Gewichteter Verzweigungsprozess auf den reellen Zahlen: Betrachte die multiplikative Gruppe der reellen Zahlen ohne die Null. Die Gruppe ist isomorph zu der multiplikativen Gruppe IR> × {+1, −1} mit zwei Zusammenhangskomponenten, den strikt positiven und den strikt negativen Zahlen. Als Grab fügen wir die 0 hinzu. Die Halbgruppe G sind die reellen Zahlen mit der Multiplikation. Von Interesse sind auch hier z.B. das Gesamtgewicht Zn := X v∈Vn 16 Wv oder das größte Gewicht sup Wv v∈Vn in n-ter Generation. Weitere Anwendungen ergeben sich durch Verwendung der Nutzenfunktion und von Knotengewichten Uv . Wir verwenden Uv Ω → G und lassen Uv auf G agieren via g 7→ g ∗ Uv . (Das Halbguppenelement wird mit einer Funktion identifiziert.) Von Interesse sind z.B. die Zgn Rn := X v∈V<n Wv ∗ Uv , die die Pfadgewichte multipliziert mit den Kosten aller Individuen bis zur nten Generation aufsummiert. Unter geeigneten Voraussetzungen konvergiert Rn (eventuell nach Normierung) gegen eine Zg Q, die die stochastische Fixpunktgleichung D Q= X Wi Qi + U i∈IN erfüllt. Hierbei sind die Zgn (U, W1 , W2 , . . .), Qi , i ∈ IN unabhängig, Qi verteilt wie Q und (U, W1 , W2 , . . .) verteilt wie (U∅ , (Wi )i ) des GVP. (Die obige Fixpunktgleichung gilt auch fast sicher, falls Rn gegen Q fast sicher konvergiert und Rn (i), analog Rn für den Baum iV, gegen Qi fast sicher konvergiert. Dabei ist U = U∅ .) Die Zgn Q hat Anwendungen in der Analyse von Algorithmen, [24][25], und allgemein für stochastische Fixpunktgleichungen. Ein prominentes Beispiel hierzu ist die Quicksortverteilung [23] als einzige Lösung mit endlichem Erwartungswert folgender stochastischen Fixpunktgleichung: D Q = XQ + (1 − X)Q + f (X). Hierbei sind X, Q, Q unabhängige Zgn mit X hat eine gleichmäßige Verteilung auf (0, 1) und Q dieselbe Verteilung wie Q. Die Funktion f : (0, 1) → IR ist gegeben durch f (x) = 2x ln x + 2(1 − x) ln(1 − x) + 1. In der Notation gewichteter Verzweigungsprozesse wäre W1 = X, W2 = 1 − X, W3 = 0 = W4 = . . . , U = g(X). 17 In den bisherigen Beispielen haben wir als Halbgruppe eine mulltiplikative Gruppe in den reellen Zahlen erweitert um das Grab genommen. Die kleinste mögliche multiplikative Gruppe {1} fḧrte auf den Galton-Watson Prozess, die multiplikative Gruppe IR> = (0, ∞) and die verzweigende Irrfahrt und die multiplikative Produktgruppe (−∞, 0) ∪ (0, ∞) auf Anwendungen zur Laufzeitanalyse von Algorithmen. Hier noch eine Algorithmenbeispiel mit Prozesswertigen Zgn. Bsp: Find oder Quickselect: Wir beschreiben zuerst den Findprozess [8], wie er als Grenzwert des Findsuchalgorithmus, (Algorithm 65, FIND oder QUICKSELECT und Algorithm 63, PARTITION, [11],) Anzahl der Vergleiche um die l-kleinste Zahl unter n (verschiedenen) vorgegebenen zu finden, auftaucht. Die Halbgruppe besteht aus halboffenen Intervallen [a, b) aus dem Einheitsintervall mit der Verknüpfung [a, b) ∗ [c, d) = [a + c(b − a), a + d(b − a)). Das Grab wird gespielt von dem leeren Intervall und das neutrale Element durch das halboffene Einheitsintervall I = [0, 1). Seien Xv , v ∈ V unabhängige Zgn gleichverteilt auf dem Einheitsintervall. Das Kantengewicht Wi (v) hat den Wert [0, Xv ), das Kantengewicht W2 (v) = [Xv , 1) ist das Komplement von W1 (v) bzgl. dem halboffenen Intervall I und alle anderen Kantengewichte Wi (v) sind das Grab. 18 6 r tr r r rr r r Betrachte für t ∈ [0, 1) die Zgn Zn (t) = X |v|≤n |Wv |11t∈Wv , |J| die Länge eines Intervalls J, mit Werten in den Funktionen auf dem halboffenen Einheitsintervall. (Per Definition wird W∅ identisch das neutrale Element gesetzt.) Die Zgn Zn sind punktweise steigend für jedes t ∈ I. Der Grenzwert Z = limn Zn ist der Findprozess. Er hat Werte im Raum D der rechtsstetigen Funktionen mit linksseitigem Grenzwert auf dem halboffenen Einheitsintervall I. Der stochastische Prozess Z ist ein Fixpunkt der Gleichung (Z(t))t∈I = (11t<X XZ( t t−X ) + 11t≥X (1 − X)Z( ) + 1)t∈I . X 1−X (6) Hierbei sind ist X, Z, Z unabhängig, X ist rechteckverteilt auf dem Einheitsintervall I und Z hat dieselbe Verteilung in D wie Z. Dies charakterisiert Z eindeutig, [8]. 19 Aus der Fixpunktgleichung ersieht man die allgemeinere Struktur via eines gewichteten Verzweigungsprozesses. Eine Zg Y : Ω × I, mit I jetzt das abgeschlossenen Einheitsintervall, wird abgebildet auf X (Y (t))t 7→ ( Ai (t)Yi (Bi (t)) + C(t))t . i Hierbei sind Ai , C : Ω×I → IR, Bi : Ω×I ×I Zgn, mes̈bar bzgl. der Produkt σ-Algebra. Die Zgn ((Ai , Bi )i , C), Yj , j ∈ N sind unabhängig und die Yj -Zgn sind verteilt wie Y. Wenn wir obige Abbildung mehrfach iterieren, erhalten wir, mit offensichtlicher Notation, X i Ai Yi ◦ Bi + C = = X j i XX i = X Ai ( j Ai Aij ◦ Bi Yij ◦ Bij ◦ Bi + XXX i + j k XX i Aij ◦ Bi Yij ◦ Bij ◦ Bi + Ci ◦ Bi ) + C j X i Ci ◦ Bi + C Ai Aij ◦ Bi Aijk ◦ Bij ◦ Bi Yijk ◦ Bijk ◦ Bij ◦ Bi Ai Aij ◦ Bi Cij ◦ Bij ◦ Bi + X i Ci ◦ Bi + C I Die Halbgruppe G bestehe aus den Funktionen R+ × I I mit der Verknüpfung ∗ (A, B) ∗ (A0 , B 0 ) = (A + A0 ◦ B, B 0 ◦ B). Die Halbgruppe G operiert auf R = D durch (A, B) ∗ C = A C ◦ B. Die Kantengewichte und die Nutzenfunktion ((Wi (v))i , Uv ) sind verteilt wie ((Ai , Bi )i , C). P Die Zg Rn := |v|≤n Wv ∗ Uv erfüllt die Rekursion Rn+1 = X i Wi ∗ Rn (i) mit Rn (i) entsprechend für den Baum mit Wurzel i. Konvergiert jetzt Rn geeignet [17], z.B. fast sicher gegen eine Zg R, so gilt die Fixpunktgleichung R= X i Wi ∗ R(i). 20 Für den Findprozess gilt Zn = Rn und Z = R. Bsp: Verzweigende Markoff Prozesse: Wir können verzweigende Markoff Prozesse analog zu Markoffprozessen definieren. Sei (S, σ(S)) ein meßbarer Raum und K : S × σ(S IN ) → IR ein Übergangskern. Mit Hilfe des Übergangskernes K definieren wir die Verteilung des Übergang von Lv (s) nach (Lvi (s))i∈IN , s ein Startwert, unabhängig von allem anderen. Wir erhalten eine Belegung aller Knoten durch die Pfade analog wie für Markoffketten. Einfacher ist die folgende Sichtweise: Unter ganz schwachen Voraussetzungen kann man zu jedem Überganskern K eine mes̈bare(!) Funktion X : Ω → S ( S IN ) finden mit Ω 3 ω 7→ X(ω)(s) hat Verteilung K(s, ·) für alle s ∈ S. Nehme uiv Kopien X(v) v ∈ V und bilde den GVP mit den Kantengewichten (Wi (v))i = X(v). Dieser tut’s. Umgekehrt, jedes iterierte Funktionensystem, wie obiges Beispiel Find, ist auch eine Markoffkette. Die Übergänge sind S 3 f 7→ A · f ◦ B + C für Funktionen f auf dem Einheitsintervall in sich. 2 Der vorwärtige und rückwärtige Blick Zusätzlich habe S eine Struktur, in der Summe (oder Supremum, Infimum . . . ) einen Sinn machen. Der Einfachheit halber betrachten wir das Gesamtgewicht Zn der n-ten Generation und +, ∗ erfüllen die Distributivgesetze. Die Rekursion für Z lautet ausführlich geschrieben, Zn+1 = X v∈Vn+1 W (∅, v1 ) ∗ W (v1 , v2 ) ∗ . . . ∗ W (v|n−1 , v|n ) ∗ W (v|n , v). Der Vorwärtsblick betrifft den Übergang von Zn nach Zn+1 , indem wir von der n-ten Generation übergehen in die n + 1-Generation, Zn+1 = X X ( |v|=n i∈IN L(v) ∗ W (v, vi). (7) Der Rückwärtsblick betrifft ebenfalls den Übergang von Zn nach Zn+1 , nur benutzen wir jetzt den Übergang von der 0-ten Generation zu der ersten, Zn+1 = X i∈IN W (∅, i) ∗ Zn (i). 21 (8) Hierbei bezeichnet Zn (i) das Gesamtgewicht n-ter Generation für den Baum mit Wurzel i. Die Bedeutung der Begriffe vorwärts und rückwärts ergibt sich aus der Anschauung. Für die Vorwärtsgleichung fügen wir jedem Individuum der nten Generation die nächste weitere Generation zu. Für die Rückwärtsgleichung steht der Prozess mit n-Generationen startend von einem Individuum erster Generation im Vordergrund. Danach werden diese Prozesse gewichtet mit Wi (∅) und zusammengefaßt. Die Vorwärtsgleichung wird uns Resultate für Zgn als Funktion liefern, wie z.B. Konvergenzsätze via Martingalen. Die Methoden sind wahrscheinlichkeitstheoretischer Natur. Die Rückwärtsgleichung wird uns Verteilungsaussagen für Zgn liefern, wie die Konvergenz gegen eine Grenzverteilung, die eine stochastische Fixpunktgleichung erfüllt. Die Methoden sind eher maßtheoretischer Natur, z.B. Kontraktionsmethoden für Maßräume. Der Beweis für zufällige Iteration affin linearer Funktionen zeigt das Zusammen- und Wechselspiel beider Anschauungen, mit dem gute Resultate erzielt werden. Gleiches gilt für Resultate erzielt durch die Martingalstruktur (Vorwärtsstruktur) und mit Hilfe der Kontraktionsmethode (Rückwärtsstruktur). 22 3 GVP auf den positiven reellen Zahlen. Wir betrachten gewichtete Verzweigungsprozesse auf der multiplikativen Halbgruppe der positiven reellen Zahlen einschlies̈lich ∞. Das Grab ist die 0 und P konventionell gilt 0 ∗ ∞ = 0. GVP mit keinen Nachkommen i 11Wi =0 = 0 P und GVP mit genau einem Nachkommen i 11Wi =0 ≡ 1 der nur einen Wert P annimmt ( i Wi identisch eine Konstante) sind prinzipiell ausgeschlossen. Die Galton-Watson Prozesse gehören zur Halbgruppe und Kantengewichtsraum {0, 1}. Wir lassen, abweichend von GWP, unendlich viele Kantengewichte ausgehend von einem Knoten zu. GVP zum Kantengwichtsraum {0, c}, c > 0 können nach Division durch c der Kantengewichte auf die Halbgruppe {0, 1} zurückgeführt werden. Damit sind wir im Bereich der GWP. Die nächst einfache Halbgruppe rIN ∪{0} werden erzeugt von einer strikt positiven reellen Zahl r ungleich 1 erweitert um das Grab 0. Diese multiplikative Halbgruppe ist isomorph zu der additiven Halbgruppe IN0 . Die weiteren sind rZZ ∪ {0} usw. Das Hauptinteresse dieses Abschnittes liegt auf dem Gesamtgewicht Zn = X Wv i∈IN in n-ter Generation. Eine wesentliche Rolle werden die Vorwärts- und Rückwärtsgleichung spielen. 3.0.1 Die Vorwärts- und Rückwärtsgleichung Der Z Prozess erfüllt die Vorwärtsgleichung Zn+1 = X X |v|=n i∈IN Wv ∗ Wi (v) (9) und die Rückwärtsgleichung Zn+1 = X X i∈IN v∈V Wi ∗ Wv (i) = X i∈IN Wi ∗ Zn (i). (10) Hierbei bezeichnet Zn (i) das Gesamtknotengewicht n-ter Generation für den Baum iV zur Wurzel i. Die Bedeutungen der Begriffe vorwärts und rückwärts ergeben sich direkt aus der Anschauung. Für die Vorwärtsgleichung fügen wir jedem Pfad bis zur 23 n-ten Generation alle weiteren Kanten zu. Dies entspricht einer iterativen Vorgehensweise. Für die Rückwärtsgleichung stehen die Abkömmlinge der Gründerindividuen i im Vordergrund, von denen dann die Pfade jetzt der Länge n starten. Der Vorteil dieser Betrachtsweise besteht im Zusammenfassen aller Pfade in i startend. Dies ist eine rekursive Betrachtung. Verweilen wir bei den Vorteilen der rückwärtigen Betrachtung. Die Rueckwaertsgleichung liefert uns eine Vorschrift, aus der Verteilung von Zn diejenige von Zn+1 zu erhalten. Sei K diese Abbildung. Dann hat Zn als Verteilung die n-fache Iteration K n (δ1 ) bei Start im Punktmaß δ1 auf 1. Ein eventueller Grenzwert in Verteilung entspricht der Konvergenz der Iterierten K n (δ1 ) gegen einen Fixpunkt von K. Bezeichne ϕY , ϕY (t) := Ee−tY , t ≥ 0 die Laplace Transformierte einer Zg Y und sei ϕn = ϕZn die Laplace Transformierte von Zn . Proposition 1 Die Rückwärtsgleichung (8) schreibt sich in der äquivalenten Form Y ϕn+1 (t) = E ϕn (tWi ). (11) i Beweis: P ϕn+1 (t) = Ee−tZn+1 = E(E(e−t i Wi Zn (i) | (Wi )i ))) Y Y = E( E(e−tWi Zn (i) | (Wi )i )) = E( ϕn (tWi )) i i q.e.d. Konvergiert Zn schwach gegen Z, so konvergieren die Laplacetransformierten ϕn punktweise und monoton in n und die Laplacetransformierte ϕZ von Z erfüllt die Fixpunktgleichung, verwende mootone Konvergenz in der Rückwärtsgleichung Y ϕ(t) = E( ϕ(tWi )) (12) i Hier eröffnet sisch ein potentieller Weg zur Bestimmung und Charakterisierung der Grenzverteilung von Z. Jetzt zu den Vorteilen der vorwärtigen Betrachtung. Sei m endlich. Die Zn Zgn m n bildet ein Martingal bzgl. der Filtration An , die kleinste σ-Algebra aufgespannt von allen Kantengewichten bis zur n-ten Generation E(Zn+1 | An ) = X |v|=n X Wv ∗ E( i 24 Wi (v) | An ) = X |v|=n m = Zn m. Jedes positive Martingal konvergiert fast sicher. Damit haben wir einen fast sicheren Grenzwert der Zn gefunden. Zusammenfassend: Der vorwärtige Blick betrifft Zgn und liefert Konvergenz von Zgn. mit eher wahrscheinlichkeitstheoretischen Hilfsmitteln. Der rückwärtige Blick betrifft Verteilungen und liefert Konvergenz von Verteilungen mit eher mas̈theoretischen Hilfsmitteln. 4 Die Aussterbewahrscheinlichkeiten Sir Francis Galton, ein Cousin des Naturforschers Charles Darwins, angeregt durch dessen grundlegendes Buch von 1859, ber die Entstehung der Arten durch natrliche Zuchtwahl oder Die Erhaltung der begnstigten Rassen im Kampfe ums Dasein (Original: On the Origin of Species by Means of Natural Selection, or the Preservation of Favoured Races in the Struggle for Life), versuchte auf der Vererbungsgrundlage in seinem Buch Heriditary Genius (Deutsch: Genie und Vererbung) den Niedergang adliger Familien zu erklären. Später schrieb er: Es gibt viele Beispiel dafür, dass Nachnamen, die einst verbreitet waren, seltener wurden oder ganz verschwanden. Die Tendenz ist überall zu beobachten und zu ihrer Erklärung wurde vorschnell der Schluss gezogen, dass eine Zunahme an physischem Komfort und intellektueller Fähigkeit notwendigerweise mit einer Minderung der Fruchtbarkeit einhergeht. Galton bot eine andere, gesellschaftliche Erklärung an: Männer, deren Status sich kürzlich erhöht hat, versuchen ihre Position abzusichern, indem sie Erbinnen heiraten - per Definition Frauen aus Familien ohne Söhne. Solche Frauen würden auch selbst mit geringerer Wahrscheinlichkeit Söhne gebären. Nach dem Einwand des Schweizer Botanikers Alphonse de Candolle auf ein rein zufälliges Phänomen, stellt er diese wahrscheinlichkeitstheoretische Frage 1873 im Journal Educational Times. Der Reverend, Schullehrer und Mathematiker Reverend Henry William Watson gab eine Antwort, die gemeinsam 1874 erschien, On the probability of extinction of families. Dies ist die Grundlage des Galton-Watson Pozesses. (Dies Konzept, wie erst viel später herausgefunden wurde, war (unabhängig) früher von I. J. Bienaym diskutiert worden [13] [10]. Die übliche Definition eines Galton-Watson Prozesses ist: Seien Xn,i , n, i ∈ IN0 uiv Zgn mit Werten in IN0 . Der Galton-Watson Prozess (Zn )n ist rekursiv 25 definiert durch Zn+1 = Zn X Xn,i (13) i=1 mit der Anfangsbedingung Z0 = 1. Die Verteilung von X heißt die Nachkommenschaftsverteilung Wir schliessen per Definition den uninteressanten Fall X identisch 1 oder identisch 0 aus. Galton-Watson Prozesse sind spezielle gewichtete Verzweigungsprozesse auf der multiplikativen Halbgruppe G = {0, 1}. Beobachtet werden die lebenden Nachkommen, alle Knoten v mit Wv = 1. Die Verteilung der Nachkommen P Xv = i Wi (v) des Individuums v ist die Nachkommenverteilung. Während der gewichtete Verzweigunsprozess eine namensgebung nach der Abstammung vergibt, nummeriert der Galton-Watson Prozess die Individuum n-ter Generation willkürlich. Wir wollen eine unendliche Nachkommenanzahl zulassen. Der GWP betrachtet nur endlich viele Nachkommen, was biologisch sinnvoll erscheint. Für abstraktere Anwendungen des GVP benötigen wir unendlich viele Nachkommen. Sei qn = P (Zn = 0) die Wahrscheinlichkeit, dass der Prozess in nter Generation bereits ausgestorben ist. Aus Monotoniegründen konvergiert qn aufsteigend gegen die Aussterbewahrscheinlichkeit q = P (∃nZn = 0) = limn qn . Sehr viele Aussagen von Galton-Watson Prozessen, wie auch die Analyse über Aussterbewahrscheinlichkeiten, basieren auf dem Studium erzeugender Funktionen. Erzeugende Funktionen Die erzeugende Funktion fY einer Zg Y mit Werten in den natürlichen Zahlen einschlies̈lich der 0 und ∞ ist die Funktion [0, 1] 3 s 7→ fY (s) := EsY . Beachte, das Y eventuell Masse auf ∞ hat und nur das halboffene Intervall (0, 1) für die erzeugende Funktion betrachten. Die erzeugende Funktion ist wohl definiert. Aus der erzeugenden Funktion erhalten wir die Verteilung von Y durch die Koeffizienten, die sich durch Ableitungen ermittlen lassen, eindeutig zurück. Die Masse P (Y = ∞) ergibt sich aus 1−lims%1 f (s). Dies ergibt eine Bijektion zwischen Wahrscheinlichkeitsverteilungen auf IN0 und erzeugenden Funktionen. Die erzeugende Funktion hat viele schöne Eigenschaften, aufsteigend, konvex, steitig in [0, 1), stetig differenzierbar in (0, 1) usw. Ein Unstetigkeitspunkt ist eventuell 1 da 1 − lims%1 f (s) der Masse P (Y = ∞) entspricht. Lemma 2 Seien Yi , i ∈ IN uiv Zgn mit Werten in N 0 und sei τ eine davon unabhängige Zg ebenfalls mit Werten in N 0 . Sei f die erzeugende Funktion 26 der Y -Zgn und g die erzeugende Funktion von τ. Dann hat die Zg die erzeugende Funktion g ◦ f. Bew: Die Zg Pτ i=0 Es Pτ i=0 Yi Yi ist wohldefiniert. P i≤τ Yi = E ∞ X 11τ =j s j=0 Pj i=1 X 11τ =j E( X 11τ =j E( X 11τ =j = E( j Y j Y j i=1 X j = E( sYi | τ = j)) sYi )) i=1 j = E( j Y i=1 j = E( Yi E( j Y sYi )) i=1 11τ =j f (s)) = Ef τ (s) = g(f (s)). j q.e.d. Wir verwenden f für die erzeugende Funktion der Nachkommenschaftsverteilung P Xv = i Wi (v) in der GVP-Notation. Sei m = f 0 (1−) und fn die n-fache Komposition von f. P Sei Zn = |v|=n Wv die Anzahl der lebenden Individuen eines GWP in der GVP-Notation. Beachte die Vorwärtsdarstellung und die Rückwärtsdarstellung Zn+1 = X X Wv Wi (v) = |v|=n i∈IN X X Wi Wv (i). i∈IN |v|=n Proposition 3 Die erzeugende Funktion von Zn aus (13) ist fn . Bew: Wir zeigen die Behauptung durch Induktion nach n. Die erzeugende Funktion von Z1 ist f nach Definiton von Z1 = X. Nun der Induktionsschritt von n auf n+1. Beachte hierbei die Unabhängigkeit von Zn und der Xv , |v| ∈ V EsZn+1 = Es P i∈IN sup|v|=n Wi Wv (i) (sWi s Y = EE( i Y = EE( i sWi E(s P v Wv P v Wv ) | Wi , i ∈ IN ) | Wi , i ∈ IN ) = f (fn (s)) = fn+1 . q.e.d. 27 Satz 4 Die Aussterbewahrscheinlichkeit q eines GWP mit eventuell unendlich vielen Nachkommen ist der kleinste Fixpunkt der erzeugenden Funktion f. Es gilt q < 1 genau dann wenn entweder f (1−) < 1 oder f (1−) = 1 und m > 1 gilt. Bew: Die W-keiten qn = P (Zn = 0) = fn (0) erfüllen f (qn ) = f (fn (0)) = fn+1 (0) = qn+1 . Sei f (1−) = 1. Damit gilt, beachte f ist eine stetige, monoton steigende Funktion auf dem gesamten abgeschlossenen Einheitsintervall f (q) = f (lim qn ) = lim f (qn ) = lim qn+1 = q. n n n Für die Eindeutigkeit sei r ein weiterer Fixpunkt von f . Es gilt 0 ≤ r und die Monotonie von f bzw. fn impliziert fn (0) ≤ fn (r) = r. Im Grenzwert folgt q ≤ r. Da [0, 1] 3 s 7→ f (s) − s eine strikt konvexe Funktion ist, (wir hatten X ≡ 0 ausgeschlossen), hat f maximal zwei Fixpunkte. Der Wert 1 ist stets ein Fixpunkt. f hat einen zweiten Fixpunkt genau dann, wenn f 0 (1)−1 strikt positiv ist. Dies ist äquivalent zu f 0 (1) = m > 1. Im Fall f (1−) < 1 hat f mindestens einen Fixpunkt s0 < 1, da f stetig ist auf [0, 1) und [0, 1) 3 s 7→ f (s) − s das Vorzeichen wechselt. Zeige per Induktion qn ≤ s0 und verwende dann die Stetigkeit wie eben um q als kleinsten Fixpunkt zu erhalten. q.e.d. Ohne Beweis sei angefügt, f hat stets höchstens einen Fixpunkt in [0, 1) und keinen genau dann wenn f (1−) = 1 und m ≤ 1 gilt. Diesen Satz wenden wir auf einen GVP an. Sei 4 das Grab und Zn = P 1Wv 6=4 die Anzahl der Knoten n-ter Generation, denen nicht durch die |v|=n 1 Pfade der Wert 4 zugeordnet wird. Die Anzahl der lebenden Nachkommen P des Individuums v ist Xv = i 11Wi (v)6=4 . Hiermit ergeben sich, sei Zn die Anzahl der lebenden Nachkommen in n-ter Generation, die Aussterbewahrscheinlichkeiten qn = P (Zn = 0) und q = P (∃n Zn = 0) = limn qn eines GWP. Das Anwendung von Satz 4 auf GVP lautet: Korollar 5 Die Aussterbewahrscheinlichkeit q eines GVP ist der kleinste Fixpunkt der erzeugenden Funktion f. Es gilt f (qn ) = qn+1 ↑n q. Die Aussterbewahrscheinlichkeit q ist 1 genau dann wenn f (1−) = 1 und m ≤ 1 gilt. 28 Watson, der diese Charakterisierung der Aussterbewahrscheinlichkeit gezeigt hatte, machte kurz vor dem Ziel einen Schnitzer. Er setzte als Beispiel die 5 erzeugende Funktion als f (s) = (3+s) an, was durchaus akzeptabel ist, 210 übersah aber die Lösung f (0, 55) = 0, 55. Stattdessen erhielt er als Aussterbewahrscheinlichkeit den Wert 1 und schrieb: Alle Nachnamen haben daher die Tendenz auszusterben. Dieses Resultat war eigentlich vorhersehbar, denn ein Nachname, wenn er erst verloren ist, kann niemals wiederhergestellt werden, und mit jeder nachfolgenden Generation erhöht sich die Chance des Verlustes. Damit war die Chance vertan. 4.1 Das Gesamtknotengewicht Zn Wie groß ist in der Regel das Gesamtknotengewicht Zn = X Wv |v|=n Zn der n-ten Generation? Den Schlüssel liefert das Martingal Mn = m n. Mit An bezeichnen wir die kleinste σ-Algebra erzeugt von allen Kantengewichten Wi (v), |v| < n, i ∈ IN für Kanten (v, vi) bis zur n-ten Generation. Sei P Xv = i Wi (v) und m = EX. Satz 6 Sei der durchschnittliche Zuwachs m strikt positiv und endlich. Dann ist M = (Mn )n∈IN ein positives Martingal bzgl. der Filtration (An )n∈IN und konvergiert fast sicher gegen einen Grenzwert, genannt M∞ , mit Erwartungswert 0 ≤ EM∞ ≤ 1. v ( Xmv − Beweis: Die Differenz Dn = Mn −Mn−1 hat die Darstellung |v|=n−1 mWn−1 1). (Dies folgt aus der Vorwärtsgleichung.) Die Martingaleigenschaft ist äquivalent zu E(Dn | An−1) = 0 für alle n, P Wv Xv ( − 1) | An−1 ) mn−1 m |v|=n−1 E(Dn | An−1 ) = E( = X Wv Xv E( − 1) | An ) = 0. n−1 m m |v|=n−1 X Jedes positive Martingal konvergiert fast sicher gegen einen Grenzwert. Das Lemma von Fatou liefert 1 = limninf EMn ≥ E limninf Mn = EM∞ ≥ 0. 29 q.e.d. Das Gesamtknotengewicht n-ter Generation ist pfadweise von der Größenordnung Zn ∼ M ∞ m n . Bsp: Die Hausdorffdimension zufälliger Cantormengen.: Anstelle des mittleren Drittels wie bei der (deterministischen) Cantormenge 1.1 schneiden wir zufällig ein Intervall heraus. Formal: Seien (Av , Bv ), v ∈ V uiv Zgn mit 0 ≤ Av , Bv ≤ 1, Av + Bv < 1. Sei S die Menge der abgeschlossenen Intervalle in den positiven reellen Zahlen einschlies̈lich des leeren Intervalls {∅}. Die Kantengewichte sind Transformationen von S nach S Tv,1 Tv,2 [a, b] 7→ [a, a + Av (b − a)] [a, b] 7→ [b − Bv (b − a), b] und Tv,3 = {∅} = Tv,4 = . . . . Die zufälligen Cantormengen sind die Grenzwerte C = C(ω) der fallenden Folgen Cn := ∪|v|=n Lv ([0, 1]) von abgeschlossenen Mengen bei vorgegenem ω ∈ Ω. Die Hausdorffdimension H(C) einer Menge C aus den reellen Zahlen wird definiert als das Infimum aller α < 0 mit lim²→0 Hα,² (C) < ∞. Hierbei ist P Hα,² (C) das Infimum aller Summen n∈IN |Un |α , wobei jedes Un ein Intervall höchstens der Länge ² ist und ∪i∈IN Ui eine Überdeckung der Menge C ist. Wir behaupten, die Hausdorffdimension einer zufälligen Cantormenge ist fast sicher kleiner gleich α0 , wobei α0 > 0 durch EAα1 0 + EB1α0 = 1 gegeben wird. Wir betrachten die Folge Uv = Lv ([0, 1]), |v| = n von Überdeckungen. Das Supremum sup|v|=n |Uv | der n-ten Überdeckung ist absteigend. Es konvergiert gegen 0, da der Erwartungswert E( sup |Uv |)2α0 ≤ E |v|=n X |v|=n |Uv )|2α0 = mn →n 0 2α0 0 = EA2α + EB12α0 i |Ti ([0, 1))|Uv | 1 P ist Hα0 ,² (C) ≤ |v|=n |Uv |α0 =: Mn für m = E < 1 gegen 0 konvergiert. hinreichend gros̈es n. Das Folglich Martingal Mn konvergiert fast sicher gegen einen endlichen Wert. Dies zeigt lim²→0 H²,α0 (C) ≤ limn Mn < ∞ fast sicher und damit die Behauptung. Der Wert α0 ist tatsächlich die Hausdorffdimension [22]. Dies Ergebnis umfasst auch die deterministische Cantormenge mit Av und Bv identisch 1/3. P 4.1.1 Momente von Zn Wie groß ist das Gesamtknotengewicht Zn in n-ter Generation? In diesem Abschnitt berechnen wir die ersten beiden Momente. 30 Da diese Aufgabenstellung die Verteilung betrifft, liegt es nahe, die Rückwärtsgleichung zu benutzen. Wir erhalten gute Rekursionen, die sich explizit lösen lassen. Die Rechnungen für natürliche Momente werden kürzer (und etwas einfacher) Zn durch konsequente Ausnutzung der Martingalstruktur von Mn = m n bzgl der σ-Algebren An erzeugt von allen Kantengewichte bie zur n-ten Generation. Wir nutzen die Martingaldifferenzdarstellung des Martingals Mn als Teleskopsumme Mn − 1 = n X Di i=1 mittels der Martingaldifferenzen Di = M − i − Mi−1 . P P (2) Sei Zn(2) := |v|=n Wv2 , m(2) := EZ1 = E i Wi2 und σ 2 = Var X . m Proposition 7 Die Nachkommenschaft Xv = i Wi (v) habe endliches erstes Moment m = EX < ∞ und endliche Varianz σ 2 = VarX. Es gilt P E E Zn = 1 mn Zn(2) = 1 m2 (n) Zn Var( n ) = σ 2 m2n m mn (2) m2n m(2) 1− 2 m falls m(2) 6= m2 n falls m(2) = m2 1− Beweis: Wir benutzen die Darstellung des Martingals Mn − 1 = ni=1 Di über P v die Martingaldifferenzen Di = M − i − Mi−1 = |v|=i−1 mWi−1 ( Xmv − 1). Der Erwartungswert der Martingaldifferenzen P E(Di ) = EE(Di | Ai−1 ) = E Wv Xv E( − 1 | Ai−1 ) = 0 mn m |v|=i−1 X ist natürlich 0. Die zweite Behauptung folgt aus der ersten für den GVP mit Kantengewichten (2) Wi2 (v). (Dann ist mZnn(2) ein Martingal.) Die Varianz von Mn berechnet sich zu n X E(Mn − 1)2 = E( i=1 Di ) = E n X Di2 + E i=1 31 X 1≤i6=j6=n Di Dj = E n X i=1 Di2 . Beachte, die gemischten Terme EDi Dj sind 0 für i 6= j. Zum Beispiel für i < j benutze die bedingte Erwartungen EDi Dj = EE(Di Dj | Aj−1 ) = E(Di E(Dj | Aj−1 )) = 0. Wv Xv ( − 1))2 i−1 m m |v|=i−1 EDi2 = E( X Wv2 Xv ( − 1))2 + 0 2(i−1) m m |v|=i−1 = E( = X X |v|=i−1 = σ2 E( Wv2 Xv )E(( − 1))2 ) m2(i−1) m mi−1 (2) . m2(i−1) W w Xw W v Xv Alle gemischten Terme E( m n ( m − 1)) mn ( m − 1)) sind 0, da wir auf Ai−1 bedingen können, Unabhängigkeit ausnutzen und E( Xmv − 1) = 0 gilt. Wir erhalten n−1 X mi (2) Zn . Var n = σ 2 2i m i=0 m Dies ist eine geometrische Reihe mit dem Faktor m(2) . Die Fallunterscheidung m2 nach dem Faktor gleich oder ungleich 1 liefert das Resultat. q.e.d. Auch höhere Momente ließen sich berechnen, falls notwendig. Die Ausdrücke werden mit steigender Potenz schwieriger. Aber es ist machbar und man erhält (durchaus handhabbare) Formeln. Eine typische Anwendung ist: Korollar 8 Sei m(2) < m2 und EX 2 < ∞. Dann ist M gleichgradig integrierbar und gleichgradig 2-integrierbar. Damit konvergiert das Martingal M fast sicher und in L2 . Beweis: Der Satz folgt direkt aus dem Theorem 45 des Anhangs. q.e.d. Beispiel: Für einen superkritischen (1 < m < ∞) Galton-Watson Prozess Zn mit endlicher Varianz der Nachkommenschaft ist Mn = m n ein gleichgradig 2-integrierbares Martingal. Die Varianz von Z∞ berechnet sich als Grenzwert der Varianzen der Zn . 32 4.1.2 Andere Momente Aus der Martingaldifferenzdarstellung erhalten wir Abschätzungen für pMomente 1 < p < 2 von Z. Lemma 9 Sei m endlich und es existiere ein 1 < p ≤ 2 mit endlichem P m(p) = E i Wip und EX p . Es gilt ¯p n ¯ ¯ ¯ X EMnp ≤ 1 + E ¯¯ − 1¯¯ 1−( m(p) )n mp m 1− m(p) = mp falls sonst m(p) mp Im Fall m(p) < mp ist das Martingal M gleichgradig p-integrierbar und konvergiert fast sicher und in Lp . Beweis: Wir wollen die ARTV-Ungleichung (??) aus dem Anhang anwenden. − 1|p . Sei zur Abkürzung a = E| X m Sei zuerst n fest und ϕ : Vn−1 → IN eine Abzählung (=bijektive Abbildung) von Vn−1 . Dann ist Yj := X ϕ(v)≤j Wv mn−1 à ! X(v) −1 m ein Martingal mit den Martingaldifferenzen Yj − Yj−1 Wv = 11ϕ(v)=j n−1 m |v|=n−1 X à ! X(v) −1 . m Eine Anwendung der ARTV-Ungleichung auf das positive Martingal (Mn−1 + Yj )j liefert p E(Mn−1 + Yj ) − p EMn−1 ≤ X X |v|=n ϕ(v)≤j ≤ a X ϕ(v)≤j à ¯ ¯ ¯ W v ¯p ¯ E ¯ n−1 ¯¯ m(p) ≤ a mp 33 ¯ à !¯p ¯ W ¯ X(v) v ¯ E ¯¯ n−1 − 1 ¯¯¯ m m m !n−1 < ∞. (14) (15) (16) Daher ist (Mn−1 + Yj )j ein positives Lp -Martingal und konvergiert in Lp und f.s. gegen den Grenzwert Mn . Wir erhalten à m(p) E|Mn |p − E|Mn−1 |p ≤ a mp !n−1 . Eine erneute Anwendung der ARTV-Ungleichung mit der Funktion x 7→ x liefert p p E|Mn | − 1 ≤ 2 n X j=1 p p (E|Mj | − E|Mj−1 | ) ≤ a n X i=1 à m(p) mp !n−1 Im Fall m(p) < m ist E|Mn |p gleichmäßig beschränkt durch 1 + a damit das Martingal gleichgradig p-integrabel. . 1 1− m(p) mp und q.e.d. Korollar 10 Sei m endlich und es existiere ein 1 < p ≤ 2 mit m(p) < mp und EX p < ∞. Dann ist M gleichgradig integrierbar und gleichgradig pintegrierbar. Damit konvergiert das Martingal M fast sicher und in Lp . Beweis: Der Satz folgt direkt aus dem Theorem 45. q.e.d. Beispiel: Für einen superkritischen (1 < m ≤ 2) Galton-Watson Prozess mit endlichem p-ten Moment der Nachkommenschaft für ein 1 < p ≤ 2 ist Zn Mn = m n ein gleichgradig p-integrierbares Martingal für 1 < p ≤ 2. 4.1.3 Die stochastische Fixpunktgleichung von M Ziel der nächsten Sektionen ist es die Menge M = 0 genauer zu betrachten. Die Aussage Zn (ω) ist von der Größenordnung M (ω)mn macht erst besonders Sinn, falls M (ω) > 0 gilt. Eine Verteilung µ erfüllt die Fixpunktgleichung D X= X Ai Xi + C (17) i bzgl. dem Wertebereich B falls alle Zgn Werte in B haben und die Verteilung P der rechten Seite als Grenzwert der Verteilungen i≤n Ai Xi +C wohldefiniert ist. Die Zgn (C, A1 , A2 , . . .), Xi , i ∈ IN sind unabhängig und alle X-Zgn haben D dieselbe Verteilung µ. Das Symbol = steht für Gleichheit der Verteilung. Aber 34 Vorsicht, die Regelregeln mit Gleichheit und Gleichheit in Verteilung sind verschieden. (Zum Beispiel kann man im letzteren keine Zgn auf beiden Seiten addieren.) Sprachlich benutzt man auch, eine Zg erfüllt eine stochastische Fixpunktgleichung, wenn dies für die Verteilung der Zg gilt. Die Unabhängigkeit ist Bestandteil der Definition und wird nicht jedesmal neu gefordert. Wenn wir die Angabe des Wertebereiches weglassen, ist das default setting die reellen Zahlen. Implizit wird damit auch die Wohldefiniertheit der rechten Seite gegeben. Durch Annahmen in Sätzen wird diese dann gewährleistet. Da wir nur positive Zgn betrachten und den Wert ∞ zulassen, haben wir in diesem Abschnitt keine Probleme mit der Wohldefiniertheit. Falls notwendig, werden wir dies spezifizieren. Beachte, wenn wir eine Lösung X der Lösung der Fixpunktgleichung (??) P haben, so gibt es Versionen von X, Xi und ((Ai )i , C) mit X = i Ai Xi + C fast sicher. Definiere einfach X durch vorgegebenen Zgn auf der rechten Seite als Zgn durch die rechte Seite. Äquivalent zur Fixpunktgleichung ist die Gleichung ϕ(t) = EetC Y ϕ(tAj ) (18) j für Laplace- oder Fouriertransformierte ϕ und der Parameter t geeignet reell oder imaginär. Aus der stochastischen Fixpunktgleichung ?? folgt für die Transformierte ϕ(t) = EetX mit bedingten Erwartungen ϕ(t) = EE(etC Y j etAj Xj | A, C) = E(etC Y j E(etAj Xj | A, C)) = EetC Y ϕ(tAj ). j Umgekehrt aus einer Lösung von Gleichung (18) durch eine Transformierte ϕ ergibt sich aus der Eindeutigkeit eine Lösung der stochastischen Fixpunktgleichung ??. q.e.d. Lemma 11 Gegeben sei ein GVP auf den positiven reellen Zahlen mit m < ∞. Dann erfüllt M die Gleichung M= X Wi m i M (i) (19) mit M (i) der entsprechende Grenzwert auf dem Baum iV. Insbesonders erfüllt M die Fixpunktgleichung ?? D X= X Wi i 35 m Xi (20) Es gilt EM ≤ 1. Beweis: Definiere das Gesamtknotengewicht Zn (i) = |v|=n Wv (i) der n-ten Generation des Baumes iV mit Wurzel i und betrachte die Rückwärtsdarstellung P Mn+1 = X Wi Zn (i) Zn+1 = . n+1 n m i m m Die linke Seite konvergiert f.s. als positives Martingal gegen M. Das Lemma von Fatou liefert EM = E limn Mn ≤ limn EMn = 1. Falls wir auch auf der rechten Seite zum Grenzwert übergehen dürften, würde Gleichung (19) und damit Gleichheit in Verteilung. Der Grenzübergang ist nicht offensichtlich und benötigt ein Argument. P P i Zn (i) i Für endliches N konvergiert i≤N W gegen i≤N W M (i). Dieser m mn m Wert ist punktweise dominiert bei M und konvergiert mit N → ∞ gegen P Wi i m M (i) ≤ M∞ . Nehmen wir auf beiden Seiten den Erwartungswert, so erhalten wir fast sichere Gleichheit. q.e.d. Die Fixpunktgleichung ?? hat eventuell mehrere Lösungen. Vielfache einer Lösung sind ebenfalls ein Lösung. X ≡ 0 ist stets eine Lösung, wenn auch eine triviale. Es gibt Fälle in denen M ≡ 0 gilt. (Siehe den Satz von KestenStegum oder die Sektionen über Maßtransformierte.) Ist das Martingal M jedoch gleichgradig integrierbar, so konvergiert Mn in L1 und die Zg M hat Erwartungswert 1. Insbesonders ist M∞ nicht ausgeartet und wir haben einen nicht trivialen Fixpunkt. Natürlich ließe sich obiges Resultat auch mit Transformierten erreichen. Betrachte die Laplace Transformierten ϕn , ϕn (t) = Ee−tMn , t ≥ 0 von Mn . Diese sind punktweise aufsteigend in n, verwende Jensens Ungleichung und P die vorwärtige (=iterative) Blickweise, Yv = i Wi (v), −t ϕn+1 (t) = Ee = EE( Wv Yv |v|=n mn m P Y Wv Yv m e−t mn |v|=n = E( Wv Yv m Y E(e−t mn Y e−t mn E m |An ) ) |v|=n ≥ E( | An ) |v|=n Wv Yv = E(e−tMn ) = ϕn (t). 36 | An )) ϕn konvergiert punktweise gegen einen Grenzwert, und dies muß die Laplace Transformierte ϕ von M sein (eventuell ausgeartet). Aus der Rückwärtsgleichung 1 erhalten wir ϕn+1 (t) = ϕn+1 (t) = E Y ϕn (tWi ) = E i Y ϕn (tWi ) i und damit für den punktweisen Grenzwert ϕ(t) = E Y ϕ(tWi ). i Dies entspricht der stochastischen Fixpunktgleichung 20 wegen der Eindeutigkeit der Laplace Transformierten. Beachte auch, alles ist wohldefiniert in IR+ . q.e.d. 4.1.4 Die W-keit P (M∞ = 0). Wann ist M∞ identisch 0. Als Folgerung aus der stochastischen Fixpunktgleichung (20) berechnen wir die Wahrscheinlichkeit P (M∞ = 0). P Sei X̂ = i 11Wi 6=0 die Anzahl der Nachkommen und f die erzeugende Funktion [0, 1] 3 s 7→ f (s) = EsX̂ von X̂. (Im Punkt 0 benutzen wir die stetige Fortsetzung durch die Konvention 00 = 1.) Wir lassen unendlich viele Nachkommen zu (X̂ kann den Wert unendlich annehmen). Lemma 12 Sei Y eine Lösung der Fixpunktgleichung D Y = X Wi Yi (21) i auf dem Wertebereich B = [0, ∞). Dann ist P (Y = 0) ein Fixpunkt von f. Beweis: P (Y = 0) = N X lim P ( N →∞ X = lim N = lim N Wi Yi = 0) i=1 J⊂{1,2,...,N } X J P (J = {i ≤ N | Wi > 0}, ∀j ∈ J : Yj = 0) P (J = {i ≤ N | Wi > 0})P (∀j ∈ J : Yj = 0) 37 = lim N = lim N = X J N X l=0 X P (J = {i ≤ N | Wi > 0})P |J| (Y = 0) N X P( 11Wi >0 = l)P l (Y = 0) i=1 P (X̂ = l)P l (Y = 0) 0≤l<∞ = f (P (Y = 0)). Damit ist P (Y = 0) ein Fixpunkt von f. Der Rest folgt aus Lemma ??. q.e.d. Korollar 13 Entweder ist M∞ identisch 0 oder M∞ ist strikt positiv auf der Überlebensmenge. Bew: Die Zgn identisch 0 ist immer eine Lösung der obigen Fixpunktgleichung. Wenn die Zg M∞ ein strikt positives Moment besitzt, so kann sie nicht degeneriert sein. Die Menge M∞ > 0 ist enthalten in der Überlebensmenge P U des GWP mit Nachkommenschaftverteilung wie X̂ = i 11Wi 6=0 . Da beide dieselbe W-keit besitzen, sowohl P (M∞ = 0) als auch 1−P (U ) sind Fixpunkte ungleich 1 von f und oEdA hat f höchstens zwei Fixpunkte, gilt fast sichere Gleichheit. Folglich konvergiert Mn auf der Überlebensmenge gegen den strikt positiven Grenzwert M∞ und nur dort. q.e.d. Wie sieht die Verteilung von M∞ aus auf der Überlebensmenge? Der strikt positive Teil einer nichttrivialen Fixpunktlösung löst noch eine andere Fixpunktgleichung. Damit lassen sich lästige Fallunterscheidungen manchmal vermeiden. Proposition 14 Sei X eine positive Lösung einer stochastischen Fixpunktgleichung D X= X Ai Xi i mit positiven Koeffizienten und 0 < P (X = 0) < 1. Sei Y die Verteilung von X gegeben X ist strikt positiv. Dann erfüllt Y die stochastische Fixpunktgleichung D Y = X A0i Yi . (22) i Hierbei ist die Verteilung von (A0i )i diejenige von (Ai Bi )i bedingt auf i Ai Bi > 0 wobei Bi , i ∈ IN Zgn mit Bernoulli Verteilung zum Parameter P (X > 0) sind und unabhängig von den (Ai )i . P 38 Beweis: Beachte die Darstellung von X in der Form BY mit Y, B unabhängig, B eine Zg mit Bernoulli Verteilung zum Parameter P (X > 0) und die Verteilung von Y wie oben beschrieben. Die Fixpunktgleichung für X liefert D BY = X Ai Bi Yi . i Die Einschränkung auf strikt positive Werte lifert D 11B=1 Y = 11P A B >0 i i i X Ai Bi Yi . i Es folgt P (B = 1) = P ( i Ai Bi > 0) und stochastische Gleichheit (22) bei Bedingung auf strikt positive Werte. q.e.d. : Ex. GWP: Welcher Transformation entspricht dies beim GWP? Sei i m > 1 und die Ai entsprechen den W mit den Werten 0 oder m1 . Sei p = m P (B = 1), f die erzeugende Funktion des GWP und j ∈ IN. P X P( A0i = mj) = P ( X i i = = = = g(s) := X j A − jBj > 0) P ( i Ai Bi = mj) P P ( j Aj Bj > 0) 1 X E 11J={j|Aj >0} 11P Bi =j i∈J p J⊂IN P à ! |J| j |J|−j 1 X pq 11J={j|Aj >0} E j p J⊂IN à ! 1 X k j k−j E pk pq p k≥j j X sj P ( j∈IN = Ai Bi = mj | 1X p k X i à ! X k j k−j 1X pq ) sj pk ( A0i = mj) = j p k 1≤j≤k pk ((sp + q)k − q k ) = f (sp + q) − q . p Aus der erzeugenden Funktion läßt sich die Nachkommenschaftsverteilung berechnen. Die beiden Erwartungswerte m = f 0 (1−) und g 0 (1−) der Nachkommenschaft sind gleich. Die Laplacetransformierte ϕ des Fixpunktes X erfüllt ϕ(t) = 39 f (ϕ( mt )) und der Fixpunkt Y mit Laplacetransformierter ψ erfüllt ψ(t) = g(ψ( mt )). Für den GWP bedingt aufs Aussterben siehe den Abschnitt Maßtransformierte Prozesse. Prozess als bedingt auf Nichtaussterben. ......................Name....................... 40 5 Maßtransformierte Prozesse Zn Wir kommen langfristig jetzt zur L1 -Konvergenz des Martingals m n . Ein starkes Hilfsmittel von eigenständiger Bedeutung sind maßtransformierte Prozesse bzw. ein Maßwechsel. Die Idee eines Maßwechsels ist es eine stochastische Aussage bzgl. eines Maßes auf eine andere stochastische Aussage unter einem anderen Maß zu erhalten. Hintergrund: Sei (An )n eine Filtration und Pn das auf An eingeschränkte Maß. Sei (Mn )n ein adaptiertes Martingal. Die Familie Qn := Mn Pn von Wmaßen habe einen projektiven Grenzwert, genannt Q. Die Idee ist, eventuelle Aussagen für den W-raum (Ω, A, Q) beweisen zu können und damit Aussagen für den Originalwahrscheinlichkeitsraum (Ω, A, P ) zu erhalten. Zur Orientierung sehen wir uns zeitlich homogene Markoffketten und Doobsche h-Transformierte an. Sei (Xn )n eine zeitlich homogene Markoffkette zur Übergangsmatrix P = (pi,j )i,j∈S auf dem abzählbaren Zustandsraum S an. Sei h eine harmonische (in der Wahrscheinlichkeitstheorie P h = h ≥ 0), überall auf dem Zustandsraum strikt positive Funktion. Die Doob hTransformierte ist die Markoffkette mit den Übergangswahrscheinlichkeiten q(i, j) = 1 p(i, j)h(j). h(i) n) P entsteht durch Beachte (h(Xn ))n ist ein Martingal und das Maß Qn = h(X h(X0 ) n obigen Maßwechsel. Zur Interpretaion, betrachte ein terminales Ereignis A (meßbar bzgl. σ(∪n≥m An ) für alle m) und benutze die harmonische Funktion h(x) = Px (A). Es gilt Q = P (. | A). Das Martingal h(Xn ) konvergiert gegen 11A und Q ist das W-maß bedingt auf das termninale Ereignis Q = P (. | A). Der h-transformierte Prozess ist der Originalprozess bedingt auf das terminale Ereignis A. Ein Beispiel für einen superkritischen GWP als Markoffkette gesehen, ist die Harris-Sevastyanov [9] Transformierte zur harmonischen Funktion n 7→ q n mit q die Aussterbewahrscheinlichkeit. Dies ist wieder ein GWP. Er hat die erzeugende Funktion s 7→ f (sq) . Anschaulich gesprochen ist dies der Original q GWP bedingt darauf, auszusterben. (Siehe nachfolgende Erklärungen.) Ein Maßtheoretiker würde auf demselben meßbaren Raum einen Wechsel des Maßes vornehmen und die Zgn unverändert lassen. Ein Wahrscheinlichkeitstheoretiker würde den W-raum unverändert lassen und die Zgn ändern. 41 Beide Sichtweisen haben Ihre Bedeutung und Vorteile. Wir werden in folgenden Abschnitten [21] beide Sichtweisen verwenden. Der nächste Teilabschnitt entwickelt etwas Theorie und Notation, um solche Transformierten auch für GVP nutzen zu können. 5.0.5 Maßtransformation zu einer Filtration Seien P, Q zwei W-maße auf demselben meßbaren Raum (Ω, A) und (An )n eine Filtration. Seien die Einschränkungen Pn , Qn der Maße auf die n-te σAlgebra An absolut stetig, etwa sei Qn << Pn . Die Radon-Nikodym Ableitung bildet ein positives Martingal mit Erwartungswert 1. Umgekehrt ein positives Martingal Mit Erwartungswert 1 liefert auch eine Folge von konsistenten Wmaßen Qn und damit als projektiven Grenzwert ein W-maß Q. Wir geben zuerst einige allgemeine Sachverhalte zu Maßtransformationen mit Martingalen an. Ein Maß ν heißt absolut stetig bzgl. einem Maß µ, geschrieben ν << µ, falls alle µ-Nullmengen auch ν-Nullmengen sind, (µ(A) = 0 ⇒ ν(A) = 0). Ein Maß µ heißt singulär oder orthogonal bzgl. einem Maß ν, geschrieben µ⊥ν, falls es eine Menge A gibt mit µ(A) = 0 und ν(Ac ) = 0. Jedes Maß ν hat bzgl. µ eine eindeutige Zerlegung ν = νc + ν⊥ in den absolut stetigen Teil νc und den singulären Teil νs jeweils bzgl. µ. Der Satz von Radon-Nikodym besagt für W-maße (σ-endliche Maße), ν << µ dann und nur dann, wenn es eine positive meßbare Funktion f gibt R R mit dν = f dµ. (Ausführlicher gdν = f gdµ für alle positiven, meßbaren Funktionen g.) Die Radon-Nikodym Ableitung f ist µ fast sicher eindeutig. dν = f (oder seltener dν = f dµ). Wir werden auch schreiben ν = f µ oder dµ Beachte, die Relation singulär ist symmetrisch, die Relation absolut stetig im allgemeinen nicht. (Beispiel: P, Q seien die Bernoulliverteilung zum Parameter 1/2 bzw. 1.) Symmetrie für absolute Stetigkeit liegt vor, falls die RadonNikodym Ableitung P -fast sicher strikt positiv ist. Sei (An )n eine Filtration (=aufsteigende Folge von σ-Algebren) bzw. die kanonische Filtration zu einem Prozess Xn )n . (An ist die kleinste von Xi , i ≤ n aufgespannte σ-Algebra.) Eine Folge Xn von Zgn heißt adaptiert zur Filtration (An )n falls Xn meßbar ist bezüglich An für jede natürliche Zahl n. Seien P und Q W-maße auf dem meßbarem Raum (Ω, A). Wir benutzen Pn = P|An für die Einschränkung von P auf die σ-Algebra An und analog Qn . 42 Proposition 15 Sei (Mn )n ein positives Martingal mit Erwartungswert 1 bzgl. der Filtration (An )n . Dann ist Qn definiert surch Qn := Mn Pn eine projektive Familie im Sinne Qn eingeschränkt auf Am ist Qm für m < n. Umgekehrt, sei Qn absolut stetig bzgl. Pn für alle n ∈ IN und sei Mn = dQn die Radon-Nikodym Ableitung von Qn bzgl. Pn . Dann ist (Mn )n ein dPn positives Martingal bzgl. P zu der Filtration (An )n mit Erwartungswert 1. Beweis: Das Objekt Qn ist ein wohldefinertes W-maß. Die Projektivität wird nachgerechnet. Sei A aus An−1 . Qn (A) = = Z ZA A Mn dPn = Z A Mn dP = Z E(11A Mn | An−1 )dP Mn−1 dP = Qn−1 (A). Die Radon-Nikodym Ableitung ist Pn -f.s. und damit P -f.s. eindeutig. Die Martingaleigenschaft wird nachgerechnet. Für alle A ∈ An−1 gilt Z A E(Mn | An−1 )dP = Z A Mn dP = Qn (A) = Qn−1 (A) = Z A Mn−1 dP. Die Eindeutigkeit der bedingten Erwartung liefert die Teilaussage. q.e.d. Bemerkung: Die Existenz eines projektiven Grenzwertes der projektiven Familie (Qn )n muss separat gezeigt werden und erfordert weitere Voraussetzungen wie polnische Räume oder die endliche Durchschnittseigenschaft. In den meisten Fällen gibt es den projektiven Grenzwert. Lemma 16 Sei A erzeugt von der Filtration (An )n . Seien Q, P zwei Wmaße auf (Ω, A) und die Einschränkung Qn von Q auf An absolut stetig bzgl. der Einschränkung Pn von P auf An . Sei (Mn )n die Radon-Nikodym Ableitung von Qn nach Pn und M der P -fast sichere Grenzwert. Es gilt L1 (P ) Mn →n M ⇔ Q << P M ≡ 0 P-f.s. ⇔ Q⊥P Im Falle Q << P gilt Q = M P. Bew: Betrachte die Menge M der A-meßbaren Mengen A, für die es eine Folge von An -meßbaren Mengen An gibt, sodaß bzgl. dem Maß P + Q die symmetrischen Differenz An 4A von An und A gegen 0 konvergiert. 43 M ist nicht leer und abgeschlossen bzgl. der Komplementbildung und endlicher Vereinigung und Durchschnitt. Dies ist einfach. • M ist abgeschlossen bzgl. abzählbarer Vereinigung. Für An ∈ M, n ∈ IN haben wir B = ∪n An ∈ M zu zeigen. Sei BN := ∪n≤N An und CN,n ∈ An mit (P + Q)(BN 4CN,n ) →n 0. Wähle Nn →n ∞ geeignet und argumentiere (P + Q)(B4CNn ,n ) ≤ (P + Q)(BNn 4CNn ,n ) + (P + Q)(B\BNn ) →n 0. •M=A M ist eine σ-Algebra enthalten in A und enthält einen Erzeuger von A. L1 (P ) • Mn →n M ⇒ Q << P. Sei P (A) = 0. Dann gibt es eine Folge An -meßbarer Mengen An mit (P + Q)(An 4A) →n 0. Dies impliziert P (An ) → P (A) = 0 und Q(An ) →n Q(A). Aus Q(A) ←n Q(An ) = Qn (An ) = Z An Mn dPn = Z An Mn dP = Z An M dP →n 0 folgt die Teilaussage. L1 (P ) • Q << P ⇒ Mn →n M und Q = M P. Die L1 -Konvergenz ist äquivalent zur schwachen Konvergenz und der Konvergenz des ersten Momentes. (Und äquivalent zur gleichgradigen Integrierbarkeit der Folge, siehe Anhang.) Sei M∞ die Radon-Nikodym Ableitung von Q bzgl. P. Es gilt E(M∞ | An ) = Mn fast sicher wegen der Eindeutigkeit der bedingten Erwartung. Die linke Seite konvergiert in n gegen M∞ und die rechte gegen M P-fast sicher. Daher gilt M = M∞ P -f.s. Aus EMn = 1 = EM∞ folgt die Teilbehauptung. • M ≡ 0 P-f.s. ⇒ Q⊥P Sei (Mn )n eine feste Version und B das Ereignis lim inf n Mn = 0. Es gilt P (B) = 1 nach Voraussetzung und Q(B) = 0 wegen Q(B) ≤ = Z Z 1lim inf n Mn <² dQ limninf 11Mn <² dQ ≤ limninf 44 Z 11Mn <² dQ = limninf ≤ limninf Z Z 11Mn <² dQn 11Mn <² ² dPn ≤ ² →²→0 0. • Q⊥P ⇒ M ≡ 0 P-f.s. Es gibt eine meßbare Menge B mit Q(B) = 0 und P (B) = 1. Da B auch in M liegt, existiert eine An -meßbare Folge An mit der symmetrischen Differenz zu B konvergiert dem Maße P + Q nach gegen 0. Damit liefert Z Z M dP ←n An M dP = Z lim Mm dP ≤ limminf An m Z An Mm dP = limminf Qm (An ) = Q(An ) →n Q(B) = 0 die Teilbehauptung. q.e.d. Korollar 17 Seien Q, P zwei W-maße auf demselben meßbaren Raum (Ω, A). Sei für jedes n ∈ IN das W-maß Qn absolut stetig bzgl. Pn und Mn die RadonNikodym Ableitung. Dann gilt auf An ( Der Prozess 1 Mn 1 )Qn = Pn (· ∩ 0 < Mn < ∞)). Mn ist ein Q-Supermartingal. Es gilt Mn → ∞ Q-f.s. ⇔ Mn →n 0 P-f.s.. Sei M der fast sichere Grenzwert des Martingals (Mn )n unter P. Es gilt lim sup Mn < ∞Q − f.s. ⇔ Mn → M in L1 (P ). n Es gilt Q = M P falls lim supn Mn < ∞Q−f.s. gilt und Q⊥P im Fall lim supn Mn = ∞Q−f.s. Beweis: Für jedes A ∈ An gilt Z A Z Z Z 1 1 1 1 dQn = dQn + dQn + dQn Mn A∩{0<Mn <∞} Mn A∩{0=Mn } Mn A∩{Mn =∞} Mn = Z A∩{0<Mn <∞} dPn + 0 + 0 = Pn (A ∩ {0 < Mn < ∞}) 45 Für die Supermartingaleigenschaft argumentiere Z 1 1 EQ ( ( | An )dQ = dQn+1 Mn+1 A A Mn+1 Z = Pn+1 (A, 0 < Mn+1 < ∞) ≤ Pn (A, 0 < Mn < ∞) = Z A ( • Mn → ∞ Q-f.s. ⇒ Mn →n 0 P-f.s.. Für reelle Zahlen 0 < c < d betrachte Z Z 1 1 1 dQn = dQn + dQn P (c < Mn ) = c<Mn <d Mn d≤Mn Mn c<Mn Mn 1 1 1 ≤ + Q(c < Mn < d) →n→∞ →d→∞ 0. d c d Z Da Mn fast sicher gegen M konvergiert, erhalten wir P (c < M ) ≤ lim inf n P (c < 2Mn ) = 0 für jedes c > 0 und damit M = 0 P -fast sicher. • Mn → 0 P-f.s. ⇒ Mn →n ∞ Q-f.s.. Q(Mn < d) = Z Mn <c Mn dPn + Z cMn <d Mn dPn ≤ c + P (c < Mn < d)d →n→∞ c →c→0 0. Aus der Submartingaleigenschaft ergibt sich Mn konvergiert Q-f.s. und der Grenzwert kann nach obigem nur ∞ sein. • lim supn Mn < ∞ Q-f.s. ⇒ Mn →n M in L1 (P ). Wir zeigen die äquivalente Eigenschaft gleichgradige Integrierbarkeit der (Mn )n . sup n Z Mn >c Mn dP = sup Qn (Mn > c) = sup Q(Mn > c) ≤ Q(sup Mn > c) →c→∞ 0. n n n • Mn →n M in L1 (P ) ⇒ lim supn Mn < ∞ Q-f.s. und Q = M P. Aus Lemma (16) wissen wir Q = M P. Mit gleichgradiger Integrierbarkeit folgt Z sup Q(Mn > c) = sup M dP →c→∞ = 0 n n Mn >c und wegen der Submartingaleigenschaft lim supn Mn < ∞ Q-f.s. Der Rest folgt aus Lemma (16). 46 q.e.d. 1 dQ Mn 5.0.6 Maßtransformation für den GWP Hier einige Beispiele eines Maßwechsels für den GWP gesehen als Markoffkette. Der GWP bedingt aufs Aussterben: Sei A = {∃n Zn = 0} das Aussterbeereignis und die Aussterbewahrscheinlichkeit q = P (A) in dem offenen Einheitsintervall. Die Funktion x 7→ h(x) = Px (A) = q x ist eine harmonische, strikt positive Funktion und h(Zn ) eine Martingal. Der maßtransformierte n) P ist eine zeithomogene Markoffkette Prozess zu den Übergansw-keiten Qn = h(Z h(Z0 ) n mit den Übergangswahrscheinlichkeiten qy q(x, y) = x p(x, y) q y und der Halbgruppe q n (x, y) = qqx pn (x, y), n ∈ IN0 . Die erzeugende Funktion P ∗ n y fn,x (s) = ∞ y=0 q (x, y)s berechnet sich zu gn,x (s) = à fn (sq) q !x . Aus dieser Darstellung heraus identifiziert sich der Q-Prozess als ein GWP zu der erzeugenden Funktion s 7→ g(s) = f (sq) . q Der transformierte Prozess entspricht dem Originalprozess bedingt aufs Aussterben. Mit Markoffkettennotation gilt Px (Zn = y | A) = Px (Zn = y, A) 1 = x Px (Zn = y)Px (A | Zn = y) = q n (x, y). Px (A) q Bevor wir ein weiteres Beispiel einer Maßtransformierten betrachten, führen wir GWP mit Immigration bzw. GWP mit ewigem Partikel ein. GWP mit Immigration: Ein Galton-Watson Prozess mit Immigration (GWPI) ist ein Prozess (Zn )n rekursiv definiert durch Zn+1 = Zn X Xn,i + Cn . i=1 47 Die Zgn Xn,i , Cn , i, n ∈ IN0 sind unabhängig mit Werten in den positiven ganzen Zahlen IN0 . Die X-Zgn haben alle dieselbe Verteilung und die C-Zgn haben alle dieselbe Verteilung. Der Anfangswert Z0 ist zusätzlich unabhängig von allem anderen gegeben, standardmäßig als eie Konstante, etwa 1. Der Immigrationsprozess (Zn )n ist eine Markoffkette auf den positiven ganzen Zahlen. Die erzeugende Funktion gn,x (s) = Ex sZn von Zn bei Start in Z0 = x erfüllt die Rekursion gn+1,x = cgn,x ◦ f mit c(s) = EsC1 und dem Anfangswert g0,x (s) = sx . (Dies folgt direkt aus der Rekursionsgleichung und die bedingte Erwartung genommen bzgl. Zn .) Durch Iteration erhalten wir gn,x = c(c ◦ f )(c ◦ f2 ) . . . (c ◦ fn−1 )fnx . (23) GWP mit ewigem Partikel: Die Immigration läßt sich interpretieren als Nachkommenschaft eines ewig lebenden Partikels, das ewige Partikel nicht mitgezählt. Wenn wir es mitzählen, ändert sich nicht viel am Prozess. Wir erhalten für Ẑn = Zn + 1 die rekursive Beziehung Ẑn+1 = ẐX n −1 Xn,i + Cn + 1. i=1 Die erzeugende Funktion von Ẑn bei Start in Ẑ0 = x ergibt sich als ĝn,x (s) = Ex sẐn = sEx−1 sZn = sgn,x−1 (s) wie oben berechnet. Die Rekursion (nachrechnen) lautet ĝn+1,x (s) = c(s)s gn,x (f (s)). f (s) GWP mit Königswahl: Eine andere Interpretation wäre, anstelle des mitgezählten ewigen Partikels jetzt von Generation zu Generation ein Partikel, genannt den König, pro Generation auszuwählen, welches sich mit einer anderen Nachkommenschaftsverteilung reproduziert. Die auswahl kann mit Gleichverteilung über alle Individuen der n-ten Generation erfolgen, oder stets aus der Königsfamilie wird ein Nachkomme ausgewählt oder..... Die 48 Gesamtgröße der n-ten Generation ist stets die gleiche (in Verteilung) unabhängig von der speziellen Auswahl des Königs. Wir kommen hierauf zurück. Zn mn Zn Die Transformierte zu m n : Sei Q die Maßtransformation zum Martingal und dem GWP Prozess (Zn )n . Es ergibt sich q n (x, y) = Die erzeugende Funktion gn,x (s) = gn,x (s) = ∞ X y n p (x, y). xmn P∞ y=0 q n (x, y)sy von q n (x, .) ergibt sich als 1 s y n p (x, y)sy = sDs fnx (s) = n fnx−1 (s)fn0 (s). n n xm m y=0 xm Sie erfüllt die rekursive Gleichung gn+1,x (s) = sf 0 (s) gn,x (f (s)). mf (s) Dies ist dieselbe Rekursion wie für einen GWPE, wenn wir eine Verteilung von C finden mit sc(s) sf 0 (s) = . mf (s) f (s) Der maßtransformierte Prozess ist ein GWP mit Immigration zu derselben Nachkommenschaftsverteilung (pk )k und der Immigrationsverteilung kpmk . Zu der Immigrationsverteilung berechnen wir c(s) = 1 X 1 kpk sk = sf 0 (s). m k m (24) Bemerkung: Der konstruierte maßtransformierte Prozess ist ein Doob htransformierter Prozess. Ein direkter Übertragungsversuch scheitert sofort Zn an der formalen Schwierigkeit, daß das Martingal m n sich nicht als eine harmonische Funktion angewandt auf Zn darstellen läßt. Wir benötigen den Umweg über Raum-Zeit Prozesse. Sei (Xn )n eine Markoffkette mit den Übergangswahrscheinlichkeiten m,n (p (i, j))i,j∈S , m ≤ n ∈ IN0 . Der Raum-Zeit Prozess ist eine Markoffkette mit dem Zustandsraum S̃ = S × ZZ und den Übergangsmatrizen p̃m,n ((i, s), (j, t)) = 11t−s=n−m pm,n (i, j) 49 m ≤ n ∈ IN0 . Eine harmonische Funktion für diese Markoffkette ist eine P positive Funktion h auf dem Raum-Zeitzustandsraum S̃ mit h(i, m) = j,t p̃m,n ((i, m), (j, t))h(j, t für alle n ≥ m. Mit der Notation hn = h(., n) schreibt sich die Harmonizität für den Raum-Zeit Prozess als hm = P m,n hn . Der Doob h-transformierte Raum-Zeitprozess hat die Übergangsw-keiten q̃ m,n ((i, s), (j, t)) = h(j, t) m,n p̃ ((i, s), (j, t)). h(i, s) Falls h faktorisiert (h(i, m) = f (i)g(m)) mit g ein Charakter, g(x + y) = g(x)g(y), und die Markoffkette zeitlich homogen ist, (pm,n = pm−n ), folgt q̃ m,n ((i, s), (j, t)) = f (j) pn−m (i, j). f (i)g(m − n) Die linke Seite ist die Übergangsmatrix einer zeitlich homogenen MK. Der GWP Zn ist eine zeitlich homogene MK, die Funktion h(x, n) = mxn ist eine faktorisierende harmonische Funktion mit dem Charakter g(n) = m1n . 5.1 Maßtransformation für den GVP Wir konstruieren eine spezielle Prozessversion der Maßtransformierten zum Zn Martingal m n . Dies ist der Königsprozess oder Rückgratprozess (im Englischen Spine). Der Königsprozess hat entlang dem Rückgrat (in der Königslinie) eine andere Nachkommenschaftsverteilung als die anderen Individuen. Königsprozess: Mathematisch ist der Königsprozess ein GVP mit Immigration analog zum GWP mit Immigration. Wir benutzen einen GVP mit einem zufällig ausgewählten Pfad, wobei die Kantengewichtsvektoren für Knoten auf dem Pfad durch uiv Zgn. geändert werden. Die Kantengewichtung auf dem ausgewählten Pfad entscheidet die L1 -Konvergenz des Z-Martingals. Definiere ein neues Maß µ̂ auf IRIN durch Z gdµ̂ = EP (g(W ) X ) m (25) mit W = (W1 , W2 , . . .), X = i Wi für alle positiven, meßbaren Funktionen g : IRIN → IRIN . (Vergleiche mit (24).) Die rechte Seite ist eine lineare, P 50 positive und σ-stetige Abbildung auf Funktionen, die die 1 auf die 1 abbildet. Daher existiert das Wahrscheinlichkeitsmaß µ̂. Sei Ŵ stets eine Zg mit Werten in IR+ IN und Verteilung µ̂ bezüglich dem Wahrscheinlichkeitsmaß P, EP (g(Ŵ )) = Z gdµ̂ = EP g(W ) X . m Beachte weiterhin X̂ := i Ŵi ist P -fast sicher strikt positiv. (P (X̂ = 0)) = E11{0} (X̂) = E X 11 (X) = 0.) m {0} Sei (Ŵ , A), A steht für Auswahl des Königs, eine Zg mit Werten in IR+ IN × IN. Hierbei ist Ŵ wie oben und die Verteilung der Zg  ist gegeben durch P P (A = i | Ŵ ) = Ŵi . X̂ Damit ist die Verteilung von (Ŵ , A) wohlbestimmt und es gibt Zgn mit dieser Verteilung. Zum Beispiel bei gegebenem Ŵ wähle eine gleichverteilte Zg U und definiere A als dasjenige i welches genau i−1 X Ŵj j=1 X̂ ≤U < i X Ŵj j=1 X̂ erfüllt. Dies tut es. Wir haben an dieser Stelle X̂ > 0 P f.s. benutzt. Die gemeinsame Verteilung von (Ŵ , Â) berechnet sich hieraus zu E(11A=i g(Ŵ )) = E(g(Ŵ )E(11A=i | Ŵ ) = E(g(W ) Wi ). m (26) Seien W (v), v ∈ V, (Ŵ n , An ), n ∈ IN0 unabhängige Zgn. Die Zgn W (v), v ∈ V geben die uiv Kantenvektoren für einen GVP und die Zgn (Ŵ n , An ) haben die Verteilung von (Ŵ , A). Die unendliche Folge (A0 , A1 , A2 , . . .) der Auserwählten heißt Königspfad oder Rückgrat (oder Spine in Denglisch). Anschaulich, im Knoten v des Pfades wird das Kind A|v| auserwählt. Definiere die Kantengewichtsvektoren W̃ durch W̃ (v) := ( Ŵ |v| W (v) falls 51 v = A|v|−1 . sonst Dieser Prozess heißt Königsprozess oder Rückgratprozess. (Für Dengländer auch Spineprozess.) Zn Die Maßtransformierte des GVP Sei Qn = m n Pn die Maßtransformation Zn auf der Filtration An = σ(W (v), |v| < n) zu dem P -Martingal m n. Lemma 18 Die Verteilung der Kantengewichtsvektoren (W (v))v∈V<n unter Qn ist genau die Verteilung des Königsprozesses (W̃ (v))v∈V<n unter P für alle n ∈ IN. Beweis: Sei ϕn , ϕ̃n : Ω → (IRIN )V<n , ϕn = (W (v))v∈V<n die Projektion des original GVP bzw. des Königsprozesses bis zur n-ten Generation (aussschließlich). Für die Verteilungsgleichheit Pn (ϕ̃n ∈ B) = Qn (ϕn ∈ B) (27) für alle borelmeßbaren Mengen B aus (RIN )V<n reicht es für alle w ∈ Vn zu zeigen Ww (28) E11A|n =w 11ϕ̃n ∈B = E n 11ϕn ∈B m mit A|n = (A0 , A1 , . . . , An−1 ). Denn eine einfache Rechnung zeigt Pn (ϕ̃n ∈ B) = X w∈Vn Qn (ϕn ∈ B) = E11A|n =w 11ϕ̃n ∈B X w∈Vn E Ww 11ϕ ∈B . mn n Für die Aussage (28) reicht es Zylindermengen B = v∈V|n Bv mit Bv borelmeßbar aus RIN ) zu nehmen. Sei gv = 11Bv . Beachte die Produktformen Qn−1 Qn−1 11A|n =w = j=0 11Aj =wj+1 und vom Pfadgewicht Ww = j=0 11Wwj+1 (w|j ). Q Linke Seite = E = E n−1 Y = j=0 Y V<n 3v¹w n−1 Y j=0 gv (W̃ (v)) Y V<n−1 3v6¹w j (gw|j (Ŵ )11Aj =wj+1 ) E(gw|j (Ŵ j )11Aj =wj+1 ) 52 gv (W̃ (v)) Y V<n−1 3v6¹w Y V<n−1 3v6¹w gv (W (v)) Egv (W (v)) Rechte Seite Y Y Ww gv (W̃ (v)) = E n gv (W̃ (v)) m V<n 3v¹w V<n−1 3v6¹w n−1 Y Wwj+1 (w|j ) Y = E (gw|j (W (w|j )) ) gv (W (v)) m j=0 V<n−1 3v6¹w n−1 Y ! à Y Wwj+1 (w|j ) Egv (W (v)) E gw|j (W (w|j )) = m j=0 V<n−1 3v6¹w Ein Vergleich mit Hilfe von 26 zeigt die Gleichheit Egw|j (Ŵ j )11Aj =wj+1 = Egw|j (W (w|j )) Wwj+1 (w|j ) m für alle j. q.e.d. Lemma 19 Die Folge (Qn ) von W-maßen ist eine projektive Familie mit einem projektiven Grenzwert, genannt Q, auf der von An erzeugten kleinsten σ-Algebra. Die Verteilung der Kantengewichtsvektoren (W (v))v∈V unter Q ist genau die Verteilung des Königsprozesses (W̃ (v))v∈V unter P. Beweis: Die beiden σ-Algebren An und die Borelsche Bn auf (IRIN )V<n sind isomorph, siehe Anhang. Die Isomorphie ist ϕ−1 : Bn → An . Wir können daher Qn auf (Ω, An ) mit einem Maß µn auf (IRIN )V<n , Bn ) identifizieren. Die (Qn )n bilden eine projektive Familie und ebenso die (µn )n bzgl. der üblichen Projektion. Da µn auf Borelräumen lebt, liefert der Satz von Kolmogoroff ??, einen projektiven Grenzwert µ der µn . Das W-maß Q, Q(·) = µ(ϕ∞ (·)), ist der projektive Grenzwert der Folge (Qn ). Der projektive Grenzwert lebt auf der kleinsten von An erzeugten σ-Algebra. Da die W-maße P und Q auf einem Erzeuger übereinstimmen, sind sie gleich. q.e.d. 5.2 Regularitäet des Martingals Mn . Zn Wann ist das Martingal Mn = m n ein reguläres Martingal, d.h. L1 konvergent gegen M ? Verbunden damit ist die Frage, wann der obige projektive Grenzwert sich als transformeirte Q = M P schreiben läßt. Die Konvergenzfragestellung ist äquivalent zur gleichgradigen Integrierbarkeit 50 der Familie (Mn )n von Zgn. 53 Für den GWP ist die L1 -Konvergenz äquivalent zur sogenanten L-log-LBedingung nach einem Satz von Kesten und Stigum [15]. Satz 20 (Kesten-Stigum) Für eine superkritischen GWP sind äquivalent • EZ1 ln Z1 < ∞ • P (M > 0) > 0 • EM = 1 • Mn →n M in L1 . • E supn Mn < ∞. Als Folgerung bekommen wir die Dichotomie entweder EM = 1 oder EM = 0. Der Beweis von Kesten-Stigum oder andere zum Satz, [3], lassen sich nicht auf den GVP übertragen, da an irgendeiner Stelle entscheidend ein Zählargument eingeht, das Pfadgewicht Wv ist 1 oder 0. (Diese Bedingung ließe sich für den GVP kopieren unter der Bedingung Wv ist 0 oder gleichmäßig von 0 weg beschränkt.) Wir präsentieren hier den konzeptionellen Beweis von Lyons, [20] bzw. Lyons, Pemantle, Peres [21] mit Hilfe einer geschickten Maßtransformation. Die beiden Fälle EM = 1 bzw. M ≡ 0 P-fast sicher entsprechen nach der Proposition 16 den Fällen Mn konvergiert fast sicher unter dem transformierten Qn = Pn ). Auf Maß Q gegen eine endliche Zg oder gegen unendlich (betrachte M n dem Originalwahrscheinlichkeitsraum entsprechen diese Fälle genau (M̃n )n konvergiert fast sicher unter dem Maß P gegen eine endliche Zg oder gegen unendlich. Dies werden wir zeigen. Wir benutzen die Notation wie eben. Zur Abkürzung verwenden wir a = P i P i E ln ŴmA = E i W ln W und b = E ln X̂ = E( X ln X ) mit X = i Wi . Der m m m m m Erwartungswert a sei wohldefiniert im Lebesguesinne, wobei wir die Werte ∞ oder −∞ zulassen. Satz 21 Der Erwartungswert des Martingalgrenzwertes M unter dem Maß P ist entweder 1 oder 0. • Sei a = ∞ oder b = ∞ und a > −∞. Dann gilt M = 0 P-fast sicher. • Sei jetzt b < ∞. 54 (i) Sei ln m ≤ a < ∞. Dann gilt M = 0 P-fast sicher. (ii) Sei a < ln m. Dann gilt EM = 1. Beweis: Sei M der fast sichere Grenzwert des positiven Martingals Mn = Der Rückgratprozess Z̃n erfüllt eine rekursive Beziehung X Z̃n = Zn . mn Ŵi0 Zn−1 (i) + ŴA0 0 Z̃n−1 (A0 ). i6=A0 Hierbei benutzen wir Zm (i) für das Gesamtknotengewicht der m-ten Generation im Baum iV. Diese Beziehung iterieren wir. Sei U i = Y k := k−1 Y Ŵ i i A m und Y k das Produkt U i. i=0 Leichter ist die rekursive Definition Y 0 = 1 und Y k := Y k−1 Ui . Sei M̃n = Z̃n = ŴA0 0 Z̃n−1 (A0 ) + X Z̃n . mn Ŵi0 Zn−1 (i) i6=A0 M̃n = U0 M̃n−1 (A0 ) + X Ŵ 0 (i) i6=A0 m = U0 U1 M̃n−2 (A0 A1 ) + U0 Mn−1 (i) X Ŵi1 i6=A1 n = Y +Y n−1 X i6=An−1 + Y2 X Ŵi2 i6=A2 ≥ Y n−1 m m Mn−2 (A0 i) + X Ŵi0 i6=A0 m Mn−1 (i) Ŵin−1 + ... m Mn−3 (A0 A1 i) + Y 1 X Ŵi1 i6=A1 m Mn−2 (A0 i) + X Ŵi0 i6=A0 m Mn−1 (i) X̂ n−1 m Der Summand mit Y k anfangend bezeichnet den Beitrag aller Knoten, deren Vorfahren bis zur k-ten Generation einschließlich Könige waren und anschließend Bürgerliche. 55 Die Zgn Y n−1 sind ein Produkt von n uiv Faktoren mit Verteilung U = ŴA . Der Erwartungswert von ln U berechnet sich zu m E ln U = E X Ŵi i X̂ ln Ŵi X X Wi Wi = E( ln = a. m m i X m Das starke Gesetz der Großen Zahl 7 impliziert die fast sichere Konvergenz ln Y n →n→∞ a gegen den Erwartungswert a, wobei wir die Werte +∞ und −∞ zulassen. • a = ∞ impliziert lim supn M̃n = ∞ P -f.s. Verwende aus obiger Abschätzung ln M̃n ≥ ln Y n−1 + ln X̂ n−1 . m (29) Das starke Gesetz der großen Zahl liefert die Aussage. • b = ∞ und a > −∞ impliziert lim supn M̃n = ∞ P -f.s. In der Abschätzung (29) n−1 ln X̂m 1 1 ln M̃n ≥ ln Y n−1 + n n n (30) ist der erste Term auf der rechten Seite fast sicher nach unten beschränkt n−1 ln X̂ m und konvergiert nach dem starken GGZ gegen a. Die Ereignisse ≥c n treten nach Borel-Cantelli unendlich oft ein für jedes c > 0. (Die Ereignisse P n−1 sind unabhängig und n P (ln X̂m ≥ nc) = ∞, da der Erwartungswert b von ln X̂ unendlich ist.) m • b < ∞ und 0 < a < ∞ impliziert lim supn M̃n = ∞ P -f.s. In der Abschätzung (30) konvergiert der erste Term auf der rechten Seite ln X̂ n−1 nach dem starken GGZ gegen a > 0. Es reicht also lim supn nm ≥ a2 zu zeigen. Dies folgt z.B. aus Borel-Cantelli. • b < ∞, a = 0 und WA keine Konstante impliziert lim supn M̃n = ∞ P -f.s. Nach einem Satz von Spitzer Kesten-Spitzer [14] gilt für jede Irrfahrt Sn , d.h. n-te Partialsummen von uiv zentrierten nicht ausgearteten Zgn, 56 lim supn Sn = ∞ P -f.s. Im Fall a = 0 ist ln Y n−1 eine Irrfahrt und der Limes superior P -f.s. ∞. Sei ni → ∞ eine (meßbare) Folge mit limi ln Y ni = ∞. Die Folge X̂ ni ist unendlich oft größer als ein vorgegebenes c mit P (X̂ > c) > 0. (Verwende wieder Borel-Cantelli wie oben.) Aus beiden Aussagen folgt die Teilbehauptung. • b < ∞, a = 0 und ŴA eine Konstante, aber X nicht, impliziert M ≡= 0 P -f.s. Sei W identisch die Konstante c. Aus der Maßtransformation Eg ŴA = P i A gWi für alle positiven meßbaren g erkennt man Wi = c oder 0. Der E iW m Prozess mit den Kantengewichten Wc i ist ein GWP. Aus 0=a=E X Wi i m ln Wi X c c = E ln = ln m m m m folgt c = m und E i Wc i = 1. Ein GWP mit durchschnittlicher Nachkommenschaft m = 1 stirbt fast sicher aus, es sei denn, die Nachkommenschaft ist identisch 1. (Dieser Fall war prinzipiell ausgeschlossen und entspräche hier X ist ebenfalls eine Konstante.) • lim supn M̃n = ∞ P -f.s. impliziert M ≡= 0 P -f.s. Die Verteilung von Z̃n unter P entspricht der Verteilung von Zn unter Qn . Daher gilt lim supn Mn = ∞ unter Q. Das Korollar 17 liefert das gewünschte. • b < ∞ und a < 0 impliziert Mn konvergiert in L1 (P ). Sei Y die σ-Algebra erzeugt von allen Zgn (Ŵ i , Ai ). Durch Iteration, wie oben ausgeführt, erhalten wir P E(M̃n | Y ) = n−1 X i=0 Yi X̂ i +Yn m E M̃n = E(E(M̃n | Y)) = = n−1 X n−1 X i=0 E(Y i )E( X̂ i ) + E(Y n ) m ci d + cn i=0 i mit c = E(U ) und d = E X̂m . Wegen EU ≤ ea < 1 (Jensen Ungleichung) ist dies eine geometrische konvergente Reihe. Es folgt limn E M̃n < ∞. Dies impliziert EQ Mn < ∞ unter dem Mass Q.Da Mn bzw M1n fast sicher unter Q konvergieren, erhalten wir lim supn Mn < ∞ Q-f.s. Das Korollar (17) liefert die Teilbehauptung. 57 q.e.d. Der Satz von Kesten-Stigum ist ein Korollar unseres Satzes 21. 5.2.1 Der Spineprozess als GVP Die obige Maßtransformation bildet einen GVP mit Zustandsraum IR+ auf einen GVP ab mit einem anderen Zustandsraum. Mathematisch gesehen verbleibt man in derselben Klasse unter der Masstransformation. (Dieser Abschnitt ist nicht wichtig für alles folgende, beim ersten Lesen überschlagen.) .................................................. Wenn der Spineprozess ein GVP ist, brauchen wir zumindest zwei verschieden Typen von Individuen, Prinz oder nicht Prinz. Weiterhin müssen wir das Problem beseitigen, dass die Nachkommenschaft des n-ten Prinzen durch eine Zgn beschrieben wird, die von der jeweiligen Generation abhängt, aber nicht von der Familie. (Prinzen verschiedener Familien in derselben n-ten Generation haben dieseben Nachkommen (Ŵ n , An ). Zuerst einige andere Betrachtungen. GVP mit Immigration. Wir betrachten den Prozess ohne die Königsfamilien. Die Nichtprinzen der Königsfamilie werden dem Prozess als Immigranten zugefügt und vermehren sich anschließend wie normale Individuen. Die Verteilung der Folge der Gesamtgewichte in den Generationen ist dieselbe wie für den Spineprozess. GVP mit ewig lebendem Individuum. Im obigen Modell sehen wir den jeweiligen Prinzen als dasselbe, ewig lebende Individuum versehen mit Generationenweise wechselndem Gewicht. Dieses wird an die Kinder entsprechend weitergegeben. Die Gewichte sind dieselben wie im Immigrationsprozess, nur die Interpretation ist verschieden. Umnummerierung. Wir ändern die Namensgebung etwas. Die Prinzen erhalten als Namen im Baum stets Folgen bestehend nur aus Einsen. Es verbleibt einen Prozess zu definieren, der zwei verschieden Typen von Individuen hat und ein GVP ist. Dies wird in Allgemeinheit im nächsten Beispiel beschrieben. Die Verteilung der Folge der Gesamtgewichte in den Generationen für diesen Prozess ist dieselbe wie für den Spineprozess. GVP mit Matrixen. Wir verwenden als S den Raum der 2×2 Matrixen mit der üblichen Matrizenmultiplikation als Verknüpfung. Seien W (v), Ŵ (v), A(v)), v ∈ V unabhängig identisch verteilte Zgn. Hierbei seien W (v) wie eben und (Ŵ (v), A(v)) habe die masstransformierte Verteilung. 58 Definiere die Kantengewichte durch W i (v) = à Wi (v) 0 11A(v)6=i Ŵi (v) 11A(v)=i Wi (v) ! . Sei Z n das Gesamtkontengewicht |v|=n L(v) in n-ter Generation. Ei x0 der Vektor (1, 0) und x1 der Vektor (0, 1). Dann hat (Z n x0 )n die Verteilung wie der Original W -GVP und (Z n x1 )n wie der Spineprozess. Der allgemeine Weg. Wir konstruieren einen GVP (V, (S, σ(S), ◦), W , L) einschließlich einer Abbildung ◦S,R in die reale Welt, so dass die Beobachtung von (Z n ) sich als (Zn )n ergibt. Der Zustandsraum S bestehe aus den Funktionen von S1 × S2 in sich selbst. Hierbei sind S1 = {0, 1} und S2 = [0, ∞). (Die Markierung als Prinz erfolgt durch 1 aus S1 und das eigentliche Gewicht wird durch eine reelle Zahl aus S2 gegeben.) Die betrachteten Zustände sind die Funktionen f werden mit einem Tupel (z, x, y) S1 × S2 × S2 identifiziert, durch P f (s1 , s2 ) = (zs1 , 11s1 =0 xs2 + 11s1 =0 ys2 ). Die Komposition von zwei Funktionen f ↔ (z, x, y) ergibt sich durch f ◦ f ↔ (zz, xx, 11z=0 xy + 11z=0 yy). Die reale Welt ist R = S1 × S2 (Typ des Partikels und Gewicht) mit der Verknüpfung ◦S,R als f ◦S,R (s1 , s2 ) = f (s1 , s2 ). Seien W (v), Ŵ (v), A(v)), v ∈ V unabhängig identisch verteilte Zgn. Hierbei seien W (v) wie eben und (Ŵ (v), A(v)) habe die masstransformierte Verteilung. Definiere die Kantengewichte durch W i (v) ↔ (11A(v) = i, Wi (v), Ŵi (v)). Dann hat die Familie der Knotengewichte L(v) ◦S,R (1, 1))v dieselbe Verteilung wie Q (L(v))v . (Der Beweis via den massbestimmenden Produkten v gv und einer Induktion ist länglich ohne Besonderheiten und wir überschlagen ihn.) Der Königspfadprozess Dies ist ein spezieller GVP. Die Kantengewichte P Wi sind positiv und erfüllen i Wi = 1. In n-ter Generation sind alle Gewichte 0 bis auf genau ein v mit Gewicht L(v) = 1. Alle diese Knoten mit Gewichte 1 liegen auf einem Pfad nach unendlich. Definiere den unendlichen Pfad S ∈ IN IN durch L(S|n = 1. (Oder rekursiv S0 = ∅, S1 = i mit demjenigen I welches W (∅, i) = 1 erfüllt. S2 = W (S1 , s1 i) = 1 usw. Die Rekursionsformel lautet, Sn+1 = i) mit W (S|n , S|n i) = 1 mit S = (S1 , S2 , . . .). Die leere Menge wird in der Indizierung weggelassen.) 59 Rückgratprozess als GVP Definiere ein neues Maß µ̂ auf IRIN durch Z gdµ̂ = EP (g(W ) X ) m mit X = i Wi für alle positiven, meßbaren Funktionen g : IRIN → IRIN . Die rechte Seite ist eine lineare, positive und σ-stetige Abbildung auf Funktionen, die die 1 auf die 1 abbildet. Daher existiert das Wahrscheinlichkeitsmaß µ̂. Sei Ŵ stets eine Zg mit Verteilung µ̂ bezüglich dem Wahrscheinlichkeitsmaß R P P, EP (g(Ŵ )) = gdµ. Beachte weiterhin X̂ := i Ŵi > 0 fast sicher. (Die Menge X̂ = 0 hat µ̂-Maß 0.) Sei (W 2 , W 3 ) mit Index 2, 3 eine Zgn mit Werten in IR+ IN × IN. Die Verteilungsfunktion der W 2 Kantengewichte ist durch µ̂ wie oben gegeben P und die Verteilung von W 3 wird gegeben durch, 0 ≤ Wi3 , i Wi3 = 1 und den bedingten W-keiten P P (Wi3 = 1 | W 2 ) = Wi2 X̂ mit X̂ = i Wi2 . Es bedarf eines Arguments, daß wir eine Verteilung (W 2 , W 3 ) mit dieser Eigenschaft wählen können. Zum Beispiel sei U eine von W unabhängige Zg mit einer gleichmäßigen Verteilung auf [0, 1). Dann definiere Wi3 = 1 für dasjenige i welches genau P i−1 X j=1 Wj2 ≤ U X j∈IN Wj2 < i X Wj2 j=1 erfüllt. Dies tut es. Wir haben an dieser Stelle j Wj2 > 0 P -f.s. benutzt. Die gemeinsame Verteilung berechnet sich hieraus zu P E(Wi3 g(W 2 )) = E(g(W 2 )Wi3 ). (31) Seien W 1 (v), (W 2 (v), W 3 (v)), v ∈ V, unabhängige Zgn. Die Zgn W (v) sind die original Kantengewichte eines GVP, die (W 2 , W 3 ) Zgn wie oben definiert. Hier ist eine algorithmische und verbale Beschreibung des Spineprozesses. Am Anfangspunkt ∅ wähle das Kantengewichte W 2 (∅) und setze S1 als dasjenige Kind i fest mit W 3 (∅) = i. In erster Generation starte von jedem 60 Individuum v ungleich S1 einen ordinären GVP mit den Kantengewichten W 1 (v) wie bisher. Für das Individuum S1 , dem Prinzen in der ersten Generation, wähle als neue Kantengewichte (von der ersten zur zweiten Generation) die Zgn W 2 (S1 ). Der Prinz (S1 , S2 ) in zweiter Generation wird der Knoten v ∈ V2 mit L3 (v) = 1. Alle anderen Knoten in zweiter Generation bekommen Nachkommen wie der gewöhnliche GVP, der Prinz (S1 , S2 ) hat Nachkommen gegeben durch W 2 mit der maßtransformierten Verteilung und wählt W 3 einen neuen Prinzen in der nächsten Generation usw. Für die formale Beschriebung als GVP seien fa,b,c : IR2 → IR2 , a, b, c ∈ IR die Funktionen fa,b,c (x, y) = (11cy6=1 ax + 11cy=1 by, cy). Betrachte den GVP mit den Kantengewichten W̃ (v) = fW 1 (v),W 2 (v),W 3 (v) . Die Knotenlängenfunktion sei L̃(v) = (L̃1 (v), L̃2 (v)). Jedem Knoten v ordnen wir als Knotengewicht die Projektion C(v) = C des IR2 auf die erste Koordinate zu. Der Prozess V 3 v 7→ C L̃(v)(1, 1) von Knotengewichten heißt Rückgratprozess oder Spineprozess. Die Menge der Knoten v mit einer zweiten Koordinate 1 von L(v)(1, 1) liegen alle auf einem Pfad, dem Königspfad. (Betrachte den GVP mit Kantengewichten W 3 (v) und dessen Knotenlängen. Diese geben den Königspfad.) Das Rückgrat oder Spine des Prozesses ist dieser Pfad S = (S1 , S2 , S3 , . . .) der Auserwählten. 61 6 Maximum In diesem Abschnitt betrachten wir einen nicht ausgearteten gewichteten Verzweigungsprozess mit positiven Kantengewichten. Unser Hauptinteresse P gilt dem Tailverhalten des zufälligen Maßes νn = |v|=n δWv und dessen Funktionen ξn (t) := νn ([t, ∞)) = Fn (t) := Eξn (t) X |v|=n 11Wv ≥t (32) (33) für t > 0. Die Funktion Fn erweist sich als n−fache Faltung von F1 . Die Theorie großer Abweichungen liefert dann das asymptotische Verhalten ln Ln →n a0 n für den maximalen Wert Ln := sup Wv |v|=n in n-ter Generation, Korollar 27. Der Wert a0 ist die Nullstelle I(a0 ) = 0 der P Fenchel-Legendre Transformation I zu α 7→ m(α) = E i Wiα . 6.1 Faltungseigenschaft Wir benutzen F = F1 . Als monoton fallende Funktion korrespondiert F zu einem Maß dF auf den strikt positiven reellen Zahlen IR> = (0, ∞). Wir R benutzen f dF = F (f ) für Funktionen f, fallls wohldefiniert. Sei F n∗ die nfache Faltung von F (bzw. dF ) bezüglich der multiplikativen Gruppe (IR> , ·) Z n∗ f (x)dF (dx) = Z ... Z f (x1 x2 . . . xn )dF (x1 ) . . . dF (xn ) für alle positiven meßbaren Funktionen f. Proposition 22 Fn = F n∗ 62 (34) Bew: Wir zeigen die Behauptung durch Induktion nach n. Für den Induktionsschritt n → n + 1 benutzen wir die Vorwärtsdarstellung. (Die Rückwärtsdarstellung wäre analog möglich.) Sei f eine positive meßbare Funktion. Fn+1 (f ) = E X X |v|=n i∈IN = X E |v|=n Z X f (Wvi ) = E(E( |v|=n f (Wv x)dF (x) = X i∈IN Z Z f (Wv Wi (v)) | Wv )) f (xy)dF (x)dFn (dy) = (Fn ∗ F )(f ) = F (n+1)∗ (f ). q.e.d. 6.2 Das Tailverhalten von Fn . Wir benutzen im folgenden m(α) := E ∞ X Wiα m0 (α) := E i=1 X m00 (α) := E Wiα ln Wi Wi >0 X Wiα ln2 Wi Wi >0 für α > 0, falls die Terme wohldefiniert sind als absolut konvergierende Reihen. Falls m differenzierbar ist, sind dies die entsprechenden Ableitungen von m. Sei m0 (α) J(a) := ln m(α) − aα J = J(a(α)). a(α) := m(α) Satz 23 Sei α eine strikt positive reelle Zahl mit 0 < m(α) < ∞. Dann gilt für jede reelle Zahl a und jede positive reelle Zahl b Fn (bean ) ≤ b−α enJ(a) (35) an ln Fn (be ) lim sup ≤ J(a). (36) n n→∞ Ist m0 (α) eine wohldefinierte reelle Zahl, so gilt für alle a < a(α) ∈ IR und b>0 ln Fn (bena(α) ) = J n Sei 0 < m00 (α) < ∞. Dann gilt für jedes b > 0 lim n→∞ lim n→∞ √ ln Fn (bena(α) ) n − J) = 0 n à ! 63 (37) (38) Bew: Mit dem Erwartungswert auf beiden Seiten der Markoff Abschätzung ξn (t) = X |v|=n 11Wv ≥t ≤ X Wvα |v|=n tα = Zn(α) tα (39) und t = bean eingesetzt ergibt ξn (t) ≤ Zn(α) nJ(a) −α e b mn (α) (40) und die Aussage (35). Die Aussage (36) ist eine direkte Folgerung aus (35). a(α)n ) ≥ J zu Wegen (36) reicht es die untere Abschätzung lim inf n ln Fn (ben zeigen. Definiere das W-mas̈ µ̂ zu dem W-mas̈ µ mit Verteilungsfunktion F durch Z Z xα f (x)µ̂(dx) = f (x) dµ(x) m(α) für alle positiven mes̈baren Funktionen f. Dieses existiert. P Seien Yn , n ∈ IN uiv Zgn mit Verteilung µ̂ und Sn = ni=1 ln Yi die n−te Partialsumme der logarithmierten Zgn.. Beachte E ln Y = E 1 Z α m0 (α) = a(α) x ln x ν(dx) = m(α) m(α) und die Verteilung von eSn = µ̂n∗ mit Qn i=1 µ̂n∗ (dx) := Yi ist die n-fache multiplikative Faltung xα µn∗ (dx). n m (α) Damit erhalten wir, t = bean Fn (t) = Z 11t≤x µn∗ (dx) n = m (α) Z 11t≤x x−α µ̂n∗ (dx) = mn (α)E11t≤eSn e−αSn ≥ mn (α)e−αn(a(α)+²) E11 ln b +a≤ Sn ≤a(α)+² . n n Der Erwartungswert konvergiert für n → ∞ gegen 1 wegen der fast sicheren Konvergenz Snn → a(α). Mit ln und lim inf auf beiden Seiten und dann ² → 0 folgt die untere Abschätzung für (37). 64 Für die Aussage 38 zeige zuerst die Wohldefiniertheit von m0 (α) ∈ IR. (Übung). Die Ungleichung (36) liefert den oberen Grenzwert 0. Nun zum unteren Grenzwert. Sei Sn wie oben. Die Zgn Sn∗ = Sn√−na(α) , mit nσ 2 00 (α) − a2 die Varianz von ln Y, konvergiert nach dem ZGS gegen eine σ 2 = mm(α) standard Gaußverteilung. Wir erhalten mit einer noch wählenden Konstanten c>0 Fn (bena(α) ) = mn (α)e−αna(α) E11 √ln b ≥ enJ e−α √ nσ 2 nσ 2 c E11 √ln b nσ 2 −α ∗e ≤Sn √ ∗ nσ 2 Sn ∗ ≤c ≤Sn Der Erwartungswert =: en in obiger Gleichung wird für gros̈e n nach dem zentralen Grenzwertsatz dicht bei 0 < Φ(c)−Φ(0) < 1, Φ die Verteilungsfunktion der Normalverteilung, liegen. Wir erhalten limninf √ n( ln en ln Fn (bena(α) ) − J) ≥ −αcσ + limninf √ →n −αcσ. n n Mit c > 0 klein genug erhalten wir die Teilbehauptung. q.e.d. Bemerkung 24 Einige Ergebnisse lassen sich auch erzielen falls m0 (α) nicht wohldefiniert ist oder den Wert ∞ annimmt. [12] 6.3 Das Tailverhalten des zufälligen Maßes νn Wir betrachten das asymptotische Verhalten von ξn (t) = v∈Vn 11Wv ≥t . Dies ist nur auf der Überlebensmenge U interessant, wenn nicht alle Pfadgewichte einer Generation Null sind. Die Markoff Ungleichung (39) liefert auch punktweise eine obere Abschätzung. Zusammen mit Martingalkonvergenz ergibt sich eine obere asymptotische Schranke M (α) ξn (t) ≤ ∞ (41) lim sup n m (α) tα n P (α) (α) mit M∞ der Grenzwert des Martingals mZnn(α) . Für Galton-Watson Prozesse ergeben sich untere asymptotische Schranken leicht, da jedes Individuum das Gewicht 0 oder 1 trägt und Zn(α) = Zn gilt. 65 Der nächste Satz liefert untere asymptotische Schranken für den GVP. Wir verwenden a(α), J wie eben. Wir sprechen vom Galton-Watson Fall, falls es eine Konstante c gibt, sodass alle Kantengwichte entweder 0 oder c sind. Satz 25 Der Galton-Watson Fall sei ausgeschlossen. Sei α > 0 und 0 < m(α) < ∞. Für J(a) < 0 gilt für jedes b > 0 bis auf endlich viele n ξn (bena ) = 0. (42) (α) −α lim sup ξn (bena ) ≤ M∞ b . (43) Für J(a) = 0 gilt n Für J(a) > 0, m0 (α) eine wohldefinierte reelle Zahl gilt für jedes a, b > 0 lim sup n ln ξn (bena ) ≤ J(a). n (44) Auf der Überlebensmenge U gilt lim n ln ξn (bena(α) ) = J. n (45) Bew: Gelte J(a) < 0. In der Gleichung (40) konvergiert das positive Martingal (α) Zn (α) fast sicher gegen einen endlichen Grenzwert genannt M∞ . Daher konvergiert n m (α) an an ξn (be ) fast sicher mit n → ∞ gegen 0. Da ξn (be ) nur ganzzahlige Werte annehmen kann erhalten wir die erste Aussage. Der Fall J(a) = 0 folgt wie oben aus der Martingalkonvergenz. Sei jetzt J(a) > 0. Gleichung (40) und die Martingalkonvergenz liefern (44). Für a < a(α) zeigen wir zuerst lim inf n n1 ln ξn (bena ) ≥ d für jedes 0 < P d < J unter der zusätzlichen Voraussetzung i Wiα ist gleichmäßig nach oben beschränkt durch c < ∞. Für den Beweis zählen wir ausgewählte Individuen nur entlang der Generationen mit einem Vielfachen von k als Index. Zu vorgegebenem 0 < d < J wähle ein k ∈ IN und a < a1 < a(α) mit Fk (eka1 ) ≥ ekd > 1. Dies ist möglich nach Satz 23. Zu diesem k konstruieren wir einen GWP, Notation mit überstrichenen 66 Symbolen, auf dem Baum B = ∪n≥0 Vnk mit den Kanten (v, vw), v ∈ B, |w| = k und den Pfadgewichten W w (v) = 11Ww (v)≥ea1 k . Der Baum B ist isomorph (als Graph) zu V. Die Knotengewichte W v , v ∈ B, sind 0 oder 1. P Der Prozeß Z n := |v|=nk W v in n ist ein Galton-Watson Prozess. Beachte, nach Konstruktion gilt für v ∈ B Wv ≥ ea1 |v| W v ξk (ea1 k ) = Z 1 ξnk (ea1 nk ) ≥ Z n . • Der GWP (Z n )n ist superkritisch. Die durchschnittliche Nachkommenschaft ist m := EZ 1 = Fk (ea1 k ) ≥ ekd > 1. • Der GWP (Z n )n ist quadratintegrierbar. Die Nachkommenschaft Z 1 ≤ c ist beschränkt. Zn • Das Martingal m n konvergiert in L2 gegen eine Zg genannt M ∞ . Das Martingal ist gleichgradig 2-integrierbar 36 da das Supremum der Varianzen des Martingals beschränkt ist. • Die Menge M ∞ > 0 hat strikt positives Maß. Folgt aus Positivität und der L2 −Konvergenz. (ea1 kn ) > d auf der Menge M ∞ > 0. • lim inf n ln ξknnk Mit Monotonieüberlegungen folgt limninf ln ξkn (eka1 n ) ln Z n ≥ limninf nk nk Zn 1 ln m ln n + = lim inf n nk m k ln ekd ≥ 0+ =d k (46) (47) (48) auf der Menge M ∞ > 0. an ) ≥ d auf M ∞ > 0 für jedes b > 0. • lim inf n ln ξn (be n Jedes n hat eine eindeutige Zerlegung n = mk + r mit 0 ≤ r < k. Wähle zu für jedes r ein vr = vr (ω) ∈ V1 mit Wvr > 0 und argumentiere mit der 67 Rückwärtsgleichung X ξn (t) = ξmk,v ( |v|=r t t ). ≥ ξmk,vr ( Wv W vr Hierbei ist ξi,j analog zu ξi für den Baum jV. Für t setze bean ein und argumentiere für hinreichend große n Wbv ean ≤ ea1 mk für alle r. Der Rest r folgt aus dem oberen. an ) Sei A die Menge lim inf n ln ξn (be ≥ d für jedes b > 0. Sei A(i) das n Äquivalent von A auf dem Teilbaum iV gestartet mit dem Gewicht 1 auf i. • Ai ∩ {Wi > 0} ⊂ A für jedes i ∈ IN. Die rückwärtige Betrachtung des Prozesses liefert, t = bean , X ξn (t) = ξn−1,j j:Wj >0 à t Wj ! ≥ 11Wi >0 ξn−1,i µ t . Wi ¶ Die Summe wird nur genommen über j mit Wj > 0 (oder alternativ benutze die Konvention 0b = ∞ für b > 0). Der Rest folgt. • P (Ac ) ≤ f (P (Ac )) für die erzeugende Funktion f (s) = EsX , X = P 1Wi >0 , s ∈ [0, 1]. i1 P (Ac ) ≤ P (∩j (Acj ∪ {Wj = 0})) = lim P (∩j≤N (Acj ∪ {Wj = 0})) N →∞ = lim N = lim N = lim N = lim N P (J = {i ≤ N | Wi > 0}, ∩j∈J (Acj ∪ {Wj = 0}) X P (J = {i ≤ N | Wi > 0}, ∩j∈J Acj ) J⊂{1,2,...,N } = lim N X J⊂{1,2,...,N } X J X J N X P (J = {i ≤ N | Wi > 0})P (∩j∈J Acj ) | P (J = {i ≤ N | Wi > 0})P |J (Ac ) N X P( l=0 = f (P (Ac )) 11Wi >0 = l)P l (Ac ) = i=1 ∞ X P (X = l)P l (Ac ) l=0 • P (Ac ) ≤ q mit q der kleinste Fixpunkt von f in [0, 1]. 68 Die Funktion f : [0, 1] → [0, 1] ist monoton steigend, strikt konvex und stetig. Die Werte s mit s ≤ f (s) sind genau die Werte 0 ≤ s ≤ q oder s = 1. Dies impliziert P (Ac ) ≤ q oder P (Ac ) = 1. Da A die Menge M ∞ enthält, hat sie strikt positives Maß hat und die Aussage folgt. • P (Ac ) = q und A = U fast sischer. Da A eine Untermenge der Überlebensmenge U sein muss, folgt P (A) ≤ P (U ). Die Überlebensmenge U hat W-keit 1−q, Satz 4. Jetzt ergibt P (Ac ) ≤ q = P (U c ) = 1 − P (U ) ≤ P (Ac ) die Teilbehauptung. na ) Damit haben wir lim inf n ln ξn (be ≥ J auf der Überlebensmenge U gezeigt n unter zusätzlichen Beschränktheitsbedingungen. Von diesen werden wir uns jetzt lösen durch eine Abschneidetechnik 7.1. Definiere einen neuen GVP mit den Kantengewichten W̃i (v) := Wi (v)11P j≤i Wjα (v)≤c . Der neue GVP ist eine Minorante, es gilt stets W̃v ≤ Wv . Der neue GVP erfüllt die benötigte zusätzliche Eigenschaft und unser Resultat liefert ln ξ˜n (bena ) ≥ J˜ (49) limninf n für alle b > 0 und a < ã(α) auf der Überlebensmenge Ũ . Wegen Monotonie, W̃v ≤ Wv , gilt (49) auch für ξ˜n ersetzt durch ξn . Wir machen jetzt den Übergang c → ∞. Der Wert m̃(α) konvergiert ˜ (monoton) gegen m(α), m̃(α) konvergiert gegen m̃0 (α), und folglich ã(α), J(a) gegen a(α), J(a). Die Überlebensmenge Ũ ist aufsteigend in c und eine Teilmenge von U. 1 − P (Ũ ) ist der kleinste Eigenwert q̃ der erzeugenden Funktion P P f˜(s) = n sn P ( i 11W̃i >0 = n). Da f˜ monoton gegen f aufsteigt (und schöne Eigenschaften hat), erhalten wir q̃ →c q mit etwas Epsilontik. Damit folgt P (Ũ ) =%c P (U ) und Ũ %c U. na) ) Damit haben wir lim inf n ln ξn (be ≥ J für alle a < a(α) bewiesen (ohne n Zusatzbedingungen). Wir kommen jetzt zu (45). Der Trick ist eine Abschneidetechnik, die eine Minorante mit ã(α) > a(α) liefert. Diesmal müssen wir kleine Kantengewichte wegschneiden, etwa W̃i (v) = Wi (v)11Wi (v)≥c , und machen dann den Grenzübergang 0 < c → 0. Wir überlassen dem Leser die Einzelheiten. (Eventuelle muß randomisiert werden und/oder c konvergiert absteigend gegen einen endlichen Grenzwert.) q.e.d. 69 Zum Abschluss formulieren wir noch ein Korollar. Die Fenchel-Legendre Transformierte, siehe Anhang, I(a) := inf (ln m(α) − aα) α≥0 ist strikt antiton, sofern I endlich ist. Sofern I in einer Umgebeung von a endlich ist, ordnen wir jedem a dasjenige α = α(a) = arginfI(a) zu, an dem 0 (α) I(a) das Infimum annimmt. Dies geschieht bei a = m . Der Galton-Watson m(α) Fall sei wieder ausgeschlossen. Korollar 26 Sei I(a) > 0 und es gebe ein α > 0 mit a = Funktion m ist endlich in einer Umgebung von α. Dann gilt m0 (α) m(α) und die 1 ln ξn (bena ) →n I(a) n fast sicher auf der Überlebensmenge. Obiges Korollar fogt aus Satz 25. Da α ein Stetigkeitspunkt von m ist, kann m (unendlich oft) differenziert werden. 6.4 Maximaler Wert Der Galton-Watson Fall sei wieder ausgeschlossen und die Funktion m endlich in mindestens einem Wert. Wir betrachten jetzt den maximalen Wert Ln = sup Wv |v|=n in n-ter Generation. Der Zusammenhang mit ξn ergibt sich aus Ln ≥ t ⇔ ξn (t) > 0. Anders formuliert Ln = inf{t | ξn (t) = 0} = sup{t | ξn (t) > 0}. Die Fenchel-Legendre Transformierte, siehe Anhang, I(a) := inf (ln m(α) − aα) α≥0 70 ist strikt antiton, sofern I endlich ist. Sofern I in einer Umgebeung von a endlich ist, ordnen wir jedem a dasjenige α = α(a) = arginfI(a) zu, an dem 0 (α) I(a) das Infimum annimmt. Dies geschieht bei a = m . m(α) Sei a0 := inf{a | I(a) < 0}. Ist a0 ein Stetigkeitspunkt von I so gilt I(a0 ) = 0. Anderenfalls ist a0 ein Randpunkt von I −1 (IR) und es gilt I(a0 ) = −∞. Korollar 27 Sei a0 ∈ (0, ∞) ein Stetigkeitspunkt von I. Sei α mit a0 = und α ein innerer Punkt von m−1 (IR). Dann gilt m0 (α) m(α) ln Ln →n a0 n auf der Überlebensmenge. Bew: Sei a > a0 dicht bei a0 und I(a) < 0. Es gibt ein α1 mit I(a) = ln m(α1 ) − aα1 < 0. Der Satz 25 liefert lim sup 11ln Ln ≥an = lim sup 11ξn (ean )>0 = 0. n n Dies impliziert lim supn lnnLn ≤ a0 . Sei a < a0 dicht bei a0 . Die strikte Monotonie von I impliziert I(a) > 0. Wir können daher den Satz 25 anwenden (mit a und α(a)). Auf der Überlebensmenge U gilt limninf 11ln Ln ≥an = limninf 11ξn (ean )>0 ≥ limninf 11 ln ξn (ean ) >0 ≥ 11I(a)>0 = 1. n Wir erhalten auf der Überlebensmenge a ≤ limninf ln Ln ln Ln ≤ lim sup ≤ a0 . n n n q.e.d. Das Korollar 26 ermöglicht Abschätzungen der Anzahl der Individuen. Korollar 28 Seien a1 < a2 < a0 und α(a1 ), α(a2 ) innere Punkte vom Definitionsbereich der Funktion m. Dann gilt 1 ln |{v ∈ Vn | ea1 n ≤ Wv < ea2 n }| →n I(a1 ). n 71 Bew: Sei Xn := ξn (ea1 n ) > Yn := ξn (ea2 n ). 1 1 ln |{v ∈ Vn | ea1 n ≤ Wv < ea2 n }| = ln(Xn − Yn ))) n n ¶ µ 1 1 Yn = ln(Xn ) + ln 1 − n n Xn Der erste Term konvergiert gegen I(a1 ), Korollar 26. Der zweite Term konvergiert gegen 0, da 1 ≥ XYnn →n 0 fast sicher konvergiert. Dies folgt punktweise für n hinreichend gros̈ aus I(a2 )−I(a1 ) ln Yn −ln Xn Yn n 2 ≤ en →n 0. = en Xn (Wir haben die strikte Monotonie von I benutzt.) q.e.d. Die Resultate zum Maximum folgen im wesentlichen der Arbeit Biggins, Chernoff’s Theorem in the branching random walk, J. Appl. Prob. 14, 630636 (1977). 72 6.5 Logkonvexität der characteristischen Kantenfunktion Durchgehend ist der Zustandsraum enthalten in den positiven reellen Zahlen. Das Hauptresultat dieses Abschnittes ist die Logkonvexität der (erweiterten) Funktion m X m (0, ∞) 3 α 7→= E Wiα . i Die erweiterte Funktion m ist immer wohldefiniert, kann jedoch den Wert ∞ annehmen. m heißt die charakteristische Kantenfunktion. Sei D = m−1 (IR) die Menge der strikt positiven α mit endlichem Kantenfunktionswert m(α). Dies ist stets ein Intervall, mit oder ohne die Randpunkte αl , αr ∈ [0, ∞]. Der Definitionsbereich D von m hae stets ein nicht leeres Inneres. Eine Funktion f : I → IR mit Definitionsbereich I ⊂ IR heißt konvex, falls f (tx+(1−t)y) ≤ tf (y)+(1−t)f (y) für alle reellen Zahlen x, y, tx+(1−t)y aus dem Definitionsbereich und t aus dem Einheitsintervall gilt. Wir sprechen von strikter Konvexität, falls in der Ungleichung stets strikt kleiner steht, sofern t aus dem offenen Einheitsintervall (0, 1) stammt und x 6= y gilt. Die charakteristische Funktion m ist antiton (monoton fallend), wenn alle Kantengewichte aus dem Einheitsinterval sind und isoton (monoton steigend), falls alle Kantengewichte größer oder gleich 1 sind. Die Kantenfuntion m|D eingeschränkt auf D ist konvex. (Sie ist Summe positiver konvexer Funktionen und damit konvex.) Sie ist sehr stark konvex, genauer gesagt logarithmisch konvex. Eine Funktion f : I → IR> heißt (strikt) logarithmisch konvex oder logkonvex, falls der Logarithmus der Funktion (strikt) konvex ist. Die logarithmische Konvexität einer Funktion f ist äquivalent zu f (tx + (1 − t)y) ≤ f t (x)f 1−t (y) für alle t aus dem Einheitsintervall und reelle Zahlen x, y, tx + (1 − t)y aus dem Definitionsbereich. Proposition 29 Eine logarithmisch konvexe Funktion ist konvex, eine strikt logarithmisch konvexe ist strikt konvex. Eine logarithmisch konvexe Funktion, die nicht konstant ist auf einem offenen Intervall, ist strikt konvex. Bew: Sei ϕ(x) = eψ(x) mit ψ konvex und zweimal stetig differenzierbar. Dann gilt ϕ00 = eψ (ψ 00 + (ψ 0 )2 ). Konvexität ist äquivalent zur Positivität 73 der zweiten Ableitung und strikte Konvexität zur strikten Positivität bis auf eine abgeschlossene Menge mit leerem Inneren. Ohne Differenzierbarkeit sind die Aussagen (schreibtechnisch aufwändiger) ebenfalls herleitbar. q.e.d. Lemma 30 Ein Integral über logkonvexe Funktionen bzgl. einem Mas̈ ist logkonvex. Das Integral ist strikt logkonvex, falls für alle x 6= y und t ∈ (0, 1) es keine Konstante c gibt mit µ({f | f (x) 6= cf (y)}) = 0. R Bew: Sei h = f µ(df ) ein Integral über logkonvexe Funktionen f und sei 1 t ∈ (0, 1). Wir benutzen die dualen Zahlen p = 1/t, q = 1−t mit p1 + 1q = 1. h(tx + (1 − t)y) = Z f (tx + (1 − t)y)µ(df ) ≤ Z f t (x)f 1−t (y)µ(df ) = kf t (x)f 1−t (y)k1 ≤ kf t (x)kp kf 1−t (y)kq = ht (x)h1−t (y) Die erste Ungleichung beruht auf Logkonvexität und ist strikt für strikt logkonvexe Funktionen. Die zweite Ungleichung ist die Hölder Ungleichung. Gleichheit gilt genau dann, wenn für festes x, y stets f (x) dasselbe Vielfache von f (y) µ fast sicher ist. q.e.d. Bemerkung: Das Lemma schließt Summen ein als ein Integral bzgl. dem Zählmaß. Satz 31 Die Funktion m|D eingeschränkt auf D ist logkonvex. Sie ist strikt logkonvex, falls m keine Konstante ist. Bew: Die Funktionen α → xα für x ≥ 0 sind logkonvex. Die Funktion m(α) = P E i Wiα ist als Integral über logkonvexe Funktionen logkonvex nach Lemma 30. Für die strikte Kogkonvexität müssen wir konstante Kantenfunktionen ausschließen. q.e.d. Eine Funktion f auf de reellen Zahlen heißt oberhalb (unterhalb) stetig, falls für alle y ∈ IR die Menge {x ∈ E | f (x) > y} ({x ∈ E | f (x) < y}) offen ist. Äquivalent ist die Aussage, für jede konvergente Folgen xn → x gilt lim inf n f (xn ) ≥ f (x) (lim supn f (xn ) ≤ f (x)). Lemma 32 Sei m|D keine Konstante und sei D nicht leer oder einelementig. Die Funktion m ist strikt konvex und unterhalbstetig. Die Funktion ist unendlich 74 oft differenzierbar im Inneren von D und die Ableitungen haben stetige Erweiterungen auf die Randpunkte von D. Es gilt lim α→∞ ln m(α) = ln esssupi Wi α Die Funktion m ist strikt logkonvex. Beweis: Wir benutzen die Zerlegung m(α) = E X Wiα + E Wi <1 X Wiα + E Wi =1 X Wiα . i:Wi >1 Der linke Term ist fallend in α, der mittlere unabhängig von α und der rechte aufsteigend. Wir erhalten strikte Logkonvexität und strikte Konvexität. Für die Unterhalbstetigkeit reicht es die Stetigkeit in den Randpunkten von D nachzuweisen. Dies folgt aus monotoner Konvergenz. • Unendlich oft differenzierbar. P Die formale Ableitung ist m(k) (α) = E i Wiα lnk Wi . In der Zerlegung wie oben ist jede der drei Summen und auch deren Ableitungen monoton in α (monotonen Konvergenz). • lim inf ln m(α) ≥ ln s wobei s = esssupWi ist. α Sei r < s dicht bei s. Aus ∞ > m(α) ≥ E X wi >r Wiα ≥ rα E X Wi >r ≥ ln r. Der Term E folgt die untere Abschätzung lim inf α→∞ ln m(α) α ist positiv und endlich. ≤ ln s • lim sup ln m(α) α Sei α ≥ α0 und m(α0 ) < ∞. Sei s < ∞. Es gilt m(α) = sα E X µ W i ¶α i s P wi >c1 ≤ sα−α0 m(α0 ) und hieraus die Teilbehauptung. q.e.d. Die charakteristische Kantenfunktion m eingeschränkt auf D ist stetig im Inneren von D und hat eventuelle Sprünge nach ∞ auf den Endpunkten von D. Eine Sprungstelle tritt genau dann auf, wenn m an dem Randpunkt endlich ist. 75 6.6 Die Fenchel-Legendre Transformierte Sei m endlich in mindestens einem Punkt α0 > 0 und der Galton-Watson Fall liegt nicht vor. Definiere das Aktionsfunktional I : (−∞, ∞) → IR I(a) := inf (ln m(α) − aα). α>0 I ist wohldefiniert. I kann nicht den Wert ∞ annehmen, denn es gilt stets I(a) ≤ ln m(α0 ) − aα0 < ∞. Sei c das essentielle Supremum esssupi Wi aller Kantengewichte. Proposition 33 Die erweiterte Funktion I ist monoton fallend, konkav und oberhalb stetig. Beweis: • Monotonie. Für jedes α ≥ 0 ist die Funktion a 7→ ln m(α) − aα fallend. Das Infimum fallender Funktionen ist fallend. • Konkavität. Mit entsprechender Notation haben wir I(ta+(1−t)b) ≥ tI(a)+(1−t)I(b) zu zeigen. Zu vorgegebenem ² wähle 0 ≤ α mit I(ta + (1 − t)b) ≥ ln m(α) − (ta + (1 − t)b)α − ². Dann gilt I(ta+(1−t)b) ≥ t(ln m(α)−aα)+(1−t)(ln m(α)−bα)−² ≥ tI(a)+(1−t)I(b)−². Da ² beliebig war folgt die Teilbehauptung. • Oberhalbstetigkeit. Für jedes α ist die Funktion a 7→ ln m(α) − aα oberhalb stetig. Das Infimum oberhalb stetiger Funktionen ist oberhalb stetig. (Nachrechnen.) q.e.d. Bei fallenden Monotonie ist Oberhalbstetigkeit äquivalent zur Linksstetigkeit. Das Infimum I(a) wird angenommen entweder durch ein α = α(a) aus 0 (α ) l dem Rand von D oder im Inneren von D. αl tut es für a ≤ m und ar tut m(αl ) 0 (αl ) es für a ≥ m . In allen anderen Fällen liegt α im Inneren von D und ist m(αl ) eindeutig bestimmt durch m0 (α) . a= m(α) Viele weitere Eigenschaften liessen sich aufzeigen: Ist m(αl ), m(αr ) < ∞ so ist I eine Funktion. Und damit auch stetig. Sei c das essentielle Supremum 76 aller Kantengewichte. Ist c < 1, so ist I(a) = −∞ für a > 0. Ist 1 < c < ∞ und αr = ∞, so gilt I(a) = −∞ für a > ln c. Im Fall c = ∞ und αr = ∞ ist I eine Funktion. 6.7 Gleichgradige Integrierbarkeit Eine Familie F von Zgn heißt gleichgradig integrierbar, falls gilt g(c) := sup X∈F Z {|X|>c} |X|dP −→c→∞ 0. Eine Familie F von Zgn heißt gleichgradig f -integrierbar, falls die Familie f (X), X ∈ F gleichgradig integrierbar ist. Im Falle f (x) = xp , p > 0 sprechen wir von gleichgradiger p-Integrierbarkeit. Bemerkung: Gleichgradige Integrierbarkeit ist eine Eigenschaft der Verteilungen der Zgn und hängt nicht von der Realisation der Zgn ab. Eine Familie gleichgradig integrierbaren Zgn erfüllt stets supX E|X| ≤ c + g(c) < ∞. Für eine Zg X definiere H = HX : [0, 1] 7→ IR Z HX (t) := sup{ A |X|dP | P (A) ≤ t}. Für eine Familie F von Zgn benutzen wir HF (t) := sup HX (t). X∈F Falls der W-raum reichhaltig genug ist und eine gleichförmig verteilte Zg besitzt, so gilt Z HX (t) = 1 1−t F −1 (u)du, mit F die Verteilungsfunktion zu |X|. Übung. Satz 34 Für eine Familie F von Zgn sind die folgenden beiden Aussagen äquivalent: i) F ist gleichgradig integrierbar. ii) Für alle ² > 0 gibt es eine integrierbare Zg Y so, daß für alle Zgn R X ∈ F aus der Familie gilt |X|>Y |X|dP < ². iii) HF : [0, 1] → IR ist stetig in 0. iv) Es gibt eine aufsteigende Funktion ϕ : IR+ → IR+ mit limx→∞ ϕ(x) = x ∞ und F ist gleichgradig ϕ-integrierbar. 77 Beweis: i)⇒ ii) Wähle Y als eine Konstante. ii) ⇒ iii) In der Zerlegung Z A Z |X|dP = A∩{|X|>Y } |X|dP + Z A∩{|X|≤Y } |X|dP ≤ Z |X|>Y |X|dP + Z A |Y |dP ist der erste Term klein durch Wahl des Y. Der zweite Term ist klein in P (A) klein. iii) ⇒ i) Zu vorgegebenem ² > 0 wähle ein p > 0 mit HF (p) < ². Wähle eine Überdeckung (Ai )i von Ω in N = p1 + 1 Mengen vom Maß ≤ p. Dann gilt gleichmäßig in X ∈ F Z |X|dP ≤ Z ∪i A i |X|dP ≤ XZ i Ai |X|dP ≤ ²N. Damit gilt ²N |X|dP ≤ →c→∞ 0 c c X X R und supX |X|>c |X| < ² for c sufficiently large. iv) ⇒ i) sup P (|X| > c) ≤ sup Z |X|>c |X| = Z |X|>c R |x| |X| ϕ(|X|) ≤ sup Eϕ(|X|). ϕ(|X|) x≥c ϕ(|x|) Der erste Faktor konvergiert mit c → ∞ gegen 0 und der hintere ist endlich gleichmäßig für X ∈ F. P i) ⇒ iv) Wähle positive Zahlen R0 < bn mit n bn < ∞ und eine aufsteigende Folge 0 < en →n ∞ mit supX∈F |X|≥en |X| ≤ bn . Definiere die Funktion ϕ P = ∞ wegen Monotonie durch ϕ(x) = n (x − en )+ . Dann gilt limx→∞ ϕ(x) x und gleichmäßig in X ∈ F Z ϕ(|X|) = XZ n (|X| − en )+ ≤ X n bn < ∞. q.e.d. Bemerkung Die hier konstruierte Funktion ϕ ist eine Orlicz Funktion (ϕ ist positiv, konvex und ϕ(0) = 0). Zusätzlich ließe sich ϕ glatt wählen, eventuell unendlich oft differenzierbar und ϕ(x) > 0 für x > 0. Der wesentliche Einsatz gleichgradiger Integrierbarkeit besteht in folgendem Lemma. 78 Lemma 35 Sei Xn , n ∈ IN eine gegen X in Verteilung konvergierende Folge von Zgn. Ist die Familie (Xn )n gleichgradig integrierbar, so vertauschen für jede stetige Funktion f mit lim sup |x|→∞ |f (x)| <∞ |x| (50) das Integral und der Limes, lim Ef (Xn ) = Ef (X). n Bew: • Die Familie Xn , n ∈ IN ist gleichgradig f -integrierbar. (x)| < ∞. Es gilt Sei b = supx |f|x| Z |f (Xn )|≥c |f (Xn )| ≤ b Z |Xn )|≥ cb |x| →c 0. • limn Ef (Xn ) = Ef (X). Wir benutzen eine Abschneidetechnik. Zu vorgegebenem c > 0 sei fc die bei c und −c gekappte stetige Funktion, fc (x) = (f (x) ∧ c) ∨ −c. Es gilt |Ef (Xn )−Ef (X)| ≤ E|f (Xn )−fc (Xn )|+E|fc (Xn )−fc (X)|+E|fc (X)−f (X)|. Der erste und dritte Term sind beliebig klein gleichmäßig in n für c hinreichend groß wegen der gleichgradigen f -Integrierbarkeit. Der zweite Term ist beliebig klein für festes c bei hinreichend großem n. q.e.d. Korollar 36 Sei Xn , n ∈ IN eine Folge von integrierbaren Zgn, die in Verteilung gegen X konvergiert. Die Familie Xn , n ∈ IN ist gleichgradig integrierbar genau dann wenn gilt lim E|Xn | = E|X| < ∞. n 79 Bew: Die Hinrichtung folgt aus obigem Lemma mit f die Betragsfunktion . Für die Rückrichtung sei fc die gekappte Betragsfunktion wie oben. Z |Xn |>c |Xn | = ≤ Z Z |Xn | − Z |Xn |≤c |Xn | (|Xn | − |X|) + Z |Xn |≤c (−fc (Xn ) + fc (X)) + Z |X|>c fc (X) Der dritte Term auf der rechten Seite ist beliebig klein für c hinreichend groß wegen der Markoff Ungleichung. Der erste und zweite Term sind beliebig klein bei festem c für n hinreichend groß. q.e.d. Korollar 37 Seien Xn , n ∈ IN , p-integrierbare Zgn, 1 ≤ p < ∞. Xn konvergiert in Lp genau dann, wenn Xn stochastisch konvergiert und die Familie (Xn )n gleichgradig p-integrierbar ist. Im Konvergenzfalle sind der stochastische und der Lp -Limes gleich. Bew: Lp -Konvergenz impliziert stochastische Konvergenz E|Xn − X|p →n→∞ 0 ²p und diese impliziert Konvergenz in Verteilung. Die gleichgradige p-Integrierbarkeit folgt aus obigem Lemma. Für die Rückrichtung argumentiere P (|Xn − X| ≥ ²) ≤ Z p |Xn − X| dP = Z |Xn −X|>c ... + Z ²<|Xn −X|≤c ... + Z |Xn −X|≤² .... Der dritte Term ist beliebig klein für ² hinreichend klein. Der erste Term ist beliebig klein gleichmäßig in n, ² für c hinreichend groß wegen p-gleichgradiger Integrierbarkeit (Lemma ?? und beachte |x + y|p ≤ 2p (|x| + |y|).) Der zweite Term wird abgeschätzt durch ≤ cP (|Xn − X| > ²) und ist klein für n hinreichend groß bei festem c und ². q.e.d. Korollar 38 Sei Xn stochastisch konvergent gegen X und sei 1 ≤ p < ∞. Dann sind äquivalent: i) E|Xn |p →n→∞ E|X|p . ii) (Xn )n∈IN gleichgradig p-integrierbar. Bew: Der Beweis folgt direkt aus obigem Korollar. Beachte, stochastische Konvergenz und Konvergenz der p-tem Momente impliziert Lp -Konvergenz. q.e.d. 80 6.8 Orlicz Räume Dieser Abschnitt behandelt das ARTV-Resultat. Eine Orlicz Funktion [18][19] ist eine konvexe Funktion ϕ : IR+ → IR+ mit ϕ(0) = 0. Jede Orlicz Funktion ist aufsteigend, stetig bis auf eventuell einen Sprung auf ∞ und hat fast sicher eine rechte und linke Ableitung. Die triviale Orlicz Funktion überall unendlich bis auf den Nullpunkt wird üblicherweise ausgeschlosen. Zu gegebener Orliczfunktion ϕ definiere die Abbildung dϕ auf Zgn dϕ (X, Y ) := inf{c > 0 | Eϕ ³ |X − Y | ´ c und Lϕ := {X : Ω → IR | ∃c > 0 Eϕ Ohen Beweis geben wir an. ³ |X| ´ c < 1} < ∞}. Proposition 39 Sei ϕ eine Orlicz Funktion. Der Raum (Lϕ , k · kϕ , kXkϕ = dϕ (X, 0) ist eine separabler Banachraum. Notation: Lϕ heißt Orlicz Raum und k · k die Orlicz Norm. 7 Die ARTV-Ungleichung Sei G die Klasse der symmetrischen konvexen Functionen ϕ mit ϕ(0) = 0 und sei G0 die Teilmenge φ ∈ G mit einer konkaven Ableitung auf (0, ∞). Funktionen aus G0 , die Funktion identisch 0 ausgenommen, sind stetig, strikt aufsteigend und eine Bijektion von IR+ . . Beispiele sind die Funktionen x 7→ |x|p für p ∈ [1, 2] und x 7→ (|x| + p a) logr (x + a) − ap logr a für p ∈ [1, 2), r > 0 und a > 0 hinreichend groß. Für ein Martingal M = (Mn , An )n∈IN0 benutzen wir die Martingaldifferenzen Dk := Mk − Mk−1 , k ∈ IN. Dann gilt Theorem 40 Sei ϕ aus G0 und M ein Martingal mit Martingaldifferenzen Dk . Dann gilt Eϕ(Mn ) − Eϕ(M0 ) ≤ 2 81 n X k=1 Eϕ(Dk ). (51) Die Konstante 2 ist scharf. Ist M ein positives Martingal oder sind die Verteilungen der bedingten Differenzen stets symmetrisch, so ist 1 die scharfe Konstante. [1]. Das Resultat ist dort für ϕ-integrierbare Martingale bewiesen, gilt jedoch allgemein. Ein strukturell ähnliche Ungleichung kann aus der Burkholder-DavisGundy Ungleichung [7][2. Thm. 1] für das Maximum Mn∗ = supi≤n |Mi | geschlossen werden. Sei a > 0 and G(a) die Klasse aller φ ∈ G mit φ(2x) ≤ aφ(x) für alle x. Satz 41 (Burkholer-Davis-Gundy) Zu vorgegebenem a > 0 gibt es eine Konstante Ca ∈ (0, ∞), so das für alle ϕ ∈ G(a) und Martingale M mit M0 = 0 gilt Eϕ(Mn∗ ) !1/2 à n X 2 . Dk ≤ Ca Eϕ k=1 Diese Ungleichung können wir auf G0 anwenden, siehe die folgende Proposition. Die Funktion ψ, definiert durch ψ(t) := ϕ(t1/2 ) für vorgegebenes ϕ ∈ G0 , ist P P konkav und subadditive (ψ( nk=1 xk ) ≤ nk=1 ψ(xk ) für alle 0 ≤ x1 , . . . , xn und n ∈ IN ). Korollar 42 Für jedes ϕ ∈ G0 und jedes Martingal M mit M0 = 0 gilt Eϕ(Mn∗ ) ≤ C4 n X Eϕ(Dk ). k=1 Proposition 43 Es gilt G0 ⊂ G(4) und ψ ist konkav und subadditiv. Bew: Sei ϕ ∈ G0 . Die Konkavität von ϕ0 und die Positivität von ϕ0 (0) liefert ϕ0 (2x) ≤ 2φ0 (x) wegen 1 ϕ0 (2x) ϕ0 (x) ≥ (ϕ0 (2x) + ϕ0 (0)) ≥ . 2 2 Damit gilt ϕ(2x) = Z 0 2x ϕ0 (t) dt = Z 0 x 2ϕ0 (2t) dt ≤ 82 Z 0 x 4ϕ0 (t) dt = 4ϕ(x) für alle x ≥ 0. Nun zur Konkavität. Die Ableitung von ψ ist √ 1 ϕ0 (0) 1 Z x 00 ψ 0 (t) = ϕ( x) √ = √ + √ ϕ (t)dt. 2 x x x 0 Da ϕ00 fallend in t ist, ist ψ 0 fallend. Genau genommen haben wir hier xϕ00 (x)− ϕ0 (x) ≤ 0 für alle x ≥ 0 gezeigt. Jede positive konkave Funktion ist subadditiv. q.e.d. Wir erhalten die folgenden Folgerungen aus der standard Martingaltheorie. Corollary 44 Sei ϕ aus G0 und nicht identisch 0. Sei M ein Martingal. Unter der Bedingung ∞ X k=1 Eϕ(Dk ) < ∞ ist M ein gleichgradig integrierbares Martingal und das Supremum des Martingals ist ϕ-integrierbar. Weiterhin konvergiert das Martingal fast sicher und im L1 -Sinne. Bew: Sei M ein Martingal mit M0 = 0. Das Korollar 42 liefert uns die endliche ∞ P Schranke c = Eϕ(Dk ) für Eϕ(Mn∗ ) für jedes n. Insbesonders konvergiert k=1 das Martingal fast sicher. Für das Maximum M ∗ = supn Mn gilt Eϕ(M ∗ ) = E lim ϕ(Mn∗ ) = lim E$(Mn∗ ) ≤ c < ∞. n n Das Martingal ist gleichgradig integrierbar. Im Fall M0 6= 0 verwende sinnvoll die Abschätzungen ϕ(x + y) ≤ ϕ(2x) + ϕ(2y) ≤ 2ϕ(x) + 2ϕ(y) zum Beweis der Aussagen. (52) q.e.d. Theorem 45 Sei ϕ ∈ G0 und erfülle limx→∞ ϕ(x) = ∞. Sei M = (Mn , An )n )n∈IN x ein Martingal mit supn Eϕ(Mn ) < ∞. Dann ist M ein gleichgradig integrierbares und gleichgradig ϕ-integrierbares Martingal. Das Supremum des Martingals ist integrierbar und ϕ-integrierbar. Weiterhin konvergiert das Martingal M und das Submartingal ϕ(M ) und der Prozeß ϕ(Mn − M∞ ) fast sicher und im L1 -Sinne. 83 Bew: sup n Z |Mn |>c |Mn |dP ≤ sup n Z |Mn |>c |Mn | ϕ(Mn )dP ϕ(Mn ) Z |y| sup ≤ sup ϕ(Mn )dP |Mn |>c |y|≥c ϕ(y) n |y| sup Eϕ(Mn ) →c→∞ 0. ≤ sup |y|≥c ϕ(y) n Die f.s. Konvergenz folgt aus dem Satz von Doob, die L1 -Konvergenz aus der gleichgradigen Integrierbarkeit. Die f.s. Konvergenz von ϕ(Mn ) folgt aus Stetigkeit von ϕ. Wir kommen jetzt zur L1 -Konvergenz des Submartingals ϕ(M ) gegen ϕ(M∞ ). Seien ϕy die Funktionen IR+ 3 x 7→ (x − y)+ . Jede Orlicz Funktion ϕ auf IR+ hat eine (Choquet-)Darstellung ϕ= Z 0 ∞ ϕy µ(dy) mit einem Maß µ. (Die Funktionen ϕy , y ∈ IR+ sind die extremalen Funktionen und das Mas̈ ist eindeutig. Die Umkehrung, sofern alles wohldefiniertist, gilt auch.) Diese Darstellung läßt sich einfacher sehen falls ϕ zweimal stetig differenzierbar ist. ϕ= Z 0 x 0 ϕ (z)dz = x Z 0 Z ( z 0 00 0 ϕ (y)dy + ϕ (0))dz = Z ∞ 0 (x − y)+ ϕ00 (y)dy. Das Darstellungsmaß ist µ(dy) = φ00 (y)dy. Im folgenden benutzen wir das Submartingal ϕy (Mn ) = (|Mn | − y)+ , y ∈ IR+ . Der Erwartungswert E(ϕy (Mn ) ist aufsteigend in n und der Satz von der monotonen Konvergenz liefert lim Eϕ(Mn ) = lim E n n = lim = Z Z n 0 ∞ 0 Z ∞ 0 ∞ ϕy (Mn )µ(dy) Eϕy (Mn )µ(dy) = Z 0 ∞ lim Eϕy (Mn )µ(dy) n Eϕy (M∞ )µ(dy) = Eϕ(M∞ ). Damit ist das Martingal gleichgradig integrierbar. 84 Die f.s. Konvergenz von ϕ(Mn ) folgt aus dem Satz von Doob und die L1 -Konvergenz aus der gleichgradigen Integrierbarkeit. Die letzte Aussage folgt mit A = {|Mn − M∞ | < b} und der Ungleichung 52 Eϕ(Mn − M∞ ) = ≤ Z ZA A ϕ(Mn − M∞ ) + ϕ(Mn − M∞ ) + Z ZA c Ac ϕ(Mn − M∞ ) 2ϕ(Mn ) + Z Ac 2ϕ(M∞ ) Der zweite und dritte Term sind beliebig klein wegen gleichgradiger Integrierbarkeit für b hinreichend groß gleichmäßig in n. Der erste Term ist beliebig klein bei festem c für n hinreichend groß. q.e.d. Starke Gesetz der Großen Zahl ....................................... Projektiver Grenzwert. ...........Kolmogorov......... CHOW, Y.S. and TEICHER, H. (1997). Probability Theory: Independence, Interchangeability, Martingales (3rd Edition). Springer, New York. TOPCHII, V.A. and VATUTIN, V.A. (1997). Maximum of the critical Galton-Watson processes and left continuous random walks. Theory Probab. Appl. 42, 17-27. G. Alsmeyer, U. Rösler: The Best Constant in the Topchii-Vatutin-Inequality for Martingales 7.1 Abschneidetechnik Durch Abschneidetechniken werden punktweise Minoranten eines GVP erzeugt. Die Vorteile sind bessere analytische Eigenschaften der Minoranten. Der unten gestutzte GVP Für c > 0 definiere den unten gestutzten GVP, Notation mit hochgestelltem Index c, durch die Kantengewichte W c (v, vi) = W (v, vi)11W (v,vi)≥c . Der unten gestutzte GVP ist eine punktweise Minorante Lc (v) ≤ L(v) für alle Knoten v. Diese Ordnung überträgt sich auf Zählfunktionale νnc ≤ νn Eνnc ≤ Eνn 85 Die gesamte Familie GVPc , c ≥ 0, wobei wir c = 0 für den Originalprozess benutzen, ist eine monotone Familie. Die Funktionale W c (v), Lc (v), νnc , Eνnc , mc , (mc )00 sind antiton in c. Ebenfalls isoton ist die Funktion c 7→ (mc )0 . mc (α) Verwende dazu die Proposition 46 mit µc = I11[c,∞) eν mit deer Identitäet I. R (mc )0 Dann ist c → ln xµc (dx) = m c (α) monoton steigend. Der unten randomisiert gestutzte GVP Randomisierung wird eingesetzt um Stetigkeit (oder Konvexität) im Parameterraum zu erreichen. Für (c, p) ∈ (IR≥ , [0, 1]) definiere GVPc,p durch die Kantengewichte W c,p (v, vi) = W (v, vi)(11W (v,vi)>c + 11W (v,vi)=c 11U (v,vi)≥p . Hierbei sind die U (v, vi), v ∈ Vi ∈ IN weitere unabhängige Zgn mit einer Rechteckverteilung auf dem Einheitsintervall. Der Parameterraum (IR≥ , [0, 1]) bekommt die partielle Ordnung (c1 , p1 ) ≤ (c2 , p2 ) ⇔ c1 < c2 oder (c1 = c2 und p1 ≤ p2 . Mit dieser Ordnung ist die Familie GVP( c, p) antiton (isoton) geordnet wie vorher auch. Der Vorteil der randomisierten Version ist die punktweise Stetigkeit von (c, p) 7→ W c,p (., .) und deren Abkömmlingen wie mc , (mc )0 , (mc )00 . Der oben gestutzte GVP Für c > 0 definiere den oben gestutzten GVP, Notation mit hochgestelltem Index c, durch die Kantengewichte W c (v, vi) = W (v, vi)11W (v,vi)≤c . Der unten gestutzte GVP ist eine punktweise Minorante Lc (v) ≤ L(v) für alle Knoten v. Diese Ordnung überträgt sich auf Zählfunktionale νnc ≤ νn Eνnc ≤ Eνn 86 Analoge Aussagen gelten für die gesamte Familie GVPc , c ≥ 0, wobei wir c = 0 für den Originalprozess benutzen, als monotone Familie. Die Funktion c 7→ (mc )0 mc (α) wird jetzt antiton. Der oben randomisiert gestutzte GVP Die Vorteile der Randomisierung und die Konstruktion ist wie vorher. Wir überschlagen die angepasste Konstruktion. Weitere Abschneidetechniken Je nach Problemstellung können weitere Zgn vorteilhaft abgeschnitten werden, wie z.B. die Summe der Kantengewichte ausgehend von einem Knoten. 7.2 Stochastische Monotonie Proposition 46 Sei µ ein Maß auf den reellen Zahlen mit µ[a, ∞) < ∞ für alle reellen Zahlen a. Seien µa die W-mas̈e definiert durch Z f dµa = R f dµ µ[a, ∞) [a,∞) für positive, mes̈bare Funktionen f und µ[a, ∞) > 0. Dann ist die Familie (µa )a von W-maßen stochastisch monoton in a. Beweis: Sei a1 < a2 und 0 < µ[a2 , ∞). Es gilt l.S. = µ[x, ∞) µ[x, ∞) ≤ = r.S. µ[a1 , ∞] µ[a2 , ∞] q.e.d. 87 Literatur [1] ........ [2] .............. [3] ............. [4] ........ [5] ............... [6] ................ [7] [8] ........ [9] ......... [10] ........... [11] ...... [12] ........... [13] ............. [14] ................ [15] .......... [16] ............. [17] ........... [18] [19] [20] [21] ,,,,,,,,,,, 88 [22] ......... [23] ................. [24] ..... [25] ............... 89