Von den Zufallszahlen und ihrem Gebrauch

Transcription

Von den Zufallszahlen und ihrem Gebrauch
Von den Zufallszahlen und ihrem Gebrauch
J. Baumeister∗ und Tania Garfias Macedo†
Im Mai 2011
Zusammenfassung
Zufallszahlen sind aus vielen Anwendungsgebieten heute nicht mehr wegzudenken:
Computerspiele wären schnell langweilig, wenn nicht durch eingebauten Zufall der
Ablauf innerhalb des Spiels bzw. von Spiel zu Spiel variiert würde. Das Binomialmodell zur Ermittlung von fairen Optionspreisen bedient sich des Zufalls in der
Simulation des Auf und Ab von Aktienkursen. Um die Sicherheit bei der Übertragung
von Daten im Internet zu gewährleisten, werden kryptografische Programme verwendet, die sichere Zufallszahlen verwenden.
Viele Einträge im Internet zum Thema Zufallszahlen“ sind aufgelistet unter dem
”
Stichwort echte Zufallszahlen. Doch kann es echte Zufallszahlen geben? Oder anders
gefragt, wie soll man solche Zahlen in ihrer Echtheit/Verwendbarkeit bewerten,
und wie kann man brauchbare Zufallszahlen erzeugen? Bereits vom Pionier der
Computertechnik, John von Neumann, gab es ein erstes Verfahren zur Konstruktion
von Zufallszahlen auf einem Rechner. Aber er schreibt auch: Any one who considers
arithmetical methods of producing random digits is of course in a state of sin.
Die ersten Überlegungen sollten einer ganz einfachen Fragestellung gelten: was
ist ein Zufallsexperiment? Dies sind Experimente, die unterschiedliche Ergebnisse
haben können, deren Ausgang vor der Ausführung aber nicht vorausgesagt werden
kann. Als Beispiele für Zufallsexperimente sehr unterschiedlicher Natur können zur
Veranschaulichung etwa herangezogen: Münzwurf, Würfeln, Ziehen einer Kugel aus
einer Urne, Zeitpunkt des Zerfalls eines radioaktiven Materials, 2. Stelle nach dem
Komma der Laufzeit eines Programms auf dem Rechner. Man kann sich unschwer
vorstellen, dass jedes dieser angeführten Experimente zu einem Zufallsgenerator
umdefiniert werden kann. Einen komplizierteren Zufallsmechanismus erhält man,
wenn man ein Zufallsexperiment mehrmals unabhängig voneinander wiederholt. Nun
steht die Frage im Raum, was unabhängig“ heißen soll. Alle diese Umstände und
”
Fragen werden wir im Folgenden vertiefen.
Dies sind Aufzeichnungen zur Vorbereitung auf den Kurs J.1 der Juniorakademie
Meisenheim vom 30. Juni -16. Juli 2011. Eine Juniorakademie ist eine Fördermaßnahme auf Bundesländerebene für begabte Schülerinnen und Schüler der 8. und 9.
Klassen.
Im Kurs werden Erzeugungsmethoden für Zufallszahlen untersucht und Beispiele
für die Verwendung kennengelernt. Wir werden sehen, dass neben den zentralen Fragen viele interessante Themen berührt werden: schlechte Würfel, Benford-Zahlen,
euklidischer Algorithmus, statistische Tests. Zum Verständnis all dieser Fragen sind
∗
Prof. Dr. Baumeister, Fachbereich Informatik und Mathematik, Goethe-Universität, Robert Mayer–
Str. 6–10, 60054 Frankfurt am Main, Germany, baumeist@math.uni-frankfurt.de.
†
Mathematisches Institut, Georg-August-Universität Göttingen, Bunsenstr. 3-5 37073 Göttingen
1
elementare Kenntnisse über die Behandlung des Zufalls und das modulare Rechnen
erforderlich.
Zentral für das Verständnis der Erzeugung von (Pseudo-)Zufallszahlen ist die
Arithmetik in den ganzen Zahlen. Die Tatsache, dass Division in den ganzen Zahlen
nicht uneingeschränkt möglich ist, kann erfolgreich dabei verwendet werden. Die
Hilfsmittel für die algebraischen Überlegungen, die bereitgestellt werden müssen,
sind Teilbarkeit, Division mit Rest und euklidischer Algorithmus. Als Grundlagen
für die Zufälligkeitstest benötigen wir den Wahrscheinlichkeitsbegriff für endliche
Ereignisräume und Verteilungsstests. Die Möglichkeiten der Erzeugung von Zufallszahlen berühren insbesondere das Thema Benfordzahlen“, das einige besonders
”
reizvolle Facetten bereithält.
Diese Aufzeichnungen sind im ganzen keine Vorlage für die Dokumentation,
die die Kursteilnehmer anzufertigen haben, lediglich Teile werden zur Vorbereitung zur Verfügung stehen. In den Abschnitten 6,7 werden Vorbereitungsaufgaben
formuliert und eine mögliche Liste von Vorträgen ausgearbeitet. Mit dem Literaturverzeichnis liefern wir einen ziemlich umfassenden Überblick über Monographien,
Übersichtsartikel und Originalarbeiten zur Thematik.
1
Vor der Computerzeit
Gott würfelt nicht !
Zufall ist nur der Ausdruck
unserer Unfähigkeit, den Dingen
auf den Grund zu kommen
Albert Einstein
1.1
In der Bibel
Und da sie ihn gekreuziget hatten, teileten sie seine Kleider, und warfen das
Los drum, welcher was überkäme.
(Markus-Evangelium 15,24; siehe Abbildung 11 )
Was heißt das Los werfen“, um eine Zufallsentscheidung herbeizuführen? In einer alttes”
tamentarischen Losentscheidung werden die zur Wahl stehenden verschiedenen Kleidungsstücke, Namen, Zeitpunkte . . . auf ein Stück Holz, eine Tonscherbe oder etwas ähnliches
geschrieben. Diese Lose“ werden dann in einem Gefäß oder einem Kleidungsstück zusam”
men durchgeschüttelt, bis eines herausfällt.
Jesus hatte zwölf engste“ Jünger. Ei”
ner davon (Judas Ischariot) hatte Jesus
verraten und sich dann erhängt. Die anderen elf Jünger wollten ein altes Wort aus
den Psalmen erfüllen und ihre Zahl wieder
auf zwölf erhöhen. Dazu machten sie nach
Christi Himmelfahrt eine Versammlung.
Zwei Anhänger wurden als Kandidaten
ausgeguckt - Barsabbas und Matthias und das Gottes-Los über sie geworfen. So
wurde Matthias zwölfter Jünger.
Abbildung 1: Würfeln um die Kleider
Aus dem Alten Testament gibt es folgende Aufzeichnung einer Zufallsentscheidung:
Mose hatte den Rat der ältesten aus 70 Mitgliedern zu bestimmen: Aus jedem der 12
Stämme wurden zunächst 6 Kandidaten ausgewählt. Aus der Schar dieser 72 Kandidaten
waren nun zwei zu eliminieren. Dazu wurden 72 Kugeln vorbereitet; 70 davon wurden
markiert, zwei blieben unmarkiert. Die Kugeln wurden in eine Urne gelegt und gemischt.
Jeder Kandidat hatte ein Kugel zu ziehen; jene beiden, die die unmarkierten zogen, wurden eliminiert.
1.2
Zufall und Wahrscheinlichkeit
Hier skizzieren wir die Begriffe, die wir aus dem Bereich der Wahrscheinlichkeitstheorie für
die Diskussion unserer Ergebnisse benötigen. Beispiele für die Begriffe führen wir hier im
Allgemeinen nicht an, sie folgen in ausreichender Auswahl in den nächsten Abschnitten.
Literatur zum Thema: [1, 2, 5].
1
Bild von U. Leive
1
Zufall
Wie reden wir über den Zufall? Wir wollen uns nicht lange dabei aufhalten. Mögliche
Definitionsschnipsel“ sind:
”
• Wenn im Bereich der Geschehnisse, die im strengen Sinn wegen etwas eintreten und
deren Ursache außer ihnen liegt, etwas geschieht, das mit dem Ergebnis nicht in eine
Deswegen-Beziehung zu bringen ist, dann nennen wir das zufällig (Aristoteles) 2
• Zufall ist das Eintreten unvorhergesehener und unbeabsichtigter Ereignisse.
• Das, wobei unsere Rechnungen versagen, nennen wir Zufall (Albert Einstein).
• Jemandem fällt etwas (unverdientermaßen) zu.
Die Spannung bei der Verwendung des Zufalls resultiert wesentlich aus der naturwissenschaftlichen Sicht vom Eintreten von Ereignissen: das Kausalitätsprinzip lässt Nicht–
”
Determiniertes“ nicht zu. Ein Ausweg ist, dass wir unterstellen, die Umstände (Anfangsbedingungen) des Greifens von naturwissenschaftlichen Gesetzen nicht vollständig kennen
zu können. Beispiele für das Wirken von Zufall“ sind etwa:
”
• Ergebnis beim Münzwurf
• Eintreten von Augenzahlen beim Würfeln
• Radioaktiver Zerfall
• Gesund trifft auf krank in der U-Bahn
• Ein Blatt fällt von einem Baum zu Boden, landet es auf der Voderseite oder Rückseite?
• Männlicher oder weiblicher Nachwuchs
Ergebnis und Ereignismenge
In der Wahrscheinlichkeitsrechnung betrachtet man so genannte Zufallsexperimente
(Lottoziehung, Würfeln, Ergebnis einer Befragung). Bei all diesen Experimenten gibt es
eine Menge möglicher Ereignisse, üblicherweise mit dem griechischen Großbuchstaben
Omega bezeichnet:
Ω = {ω1 , ω2 , . . . , ωn } .
Ω ist die Ereignismenge, jedes ωi heißt ein Elementarereignis. Eine Teilmenge von Ω
heißt ein zusammengesetztes Ereignis.
Wahrscheinlichkeit
Nun gehen wir daran, das Nichtwissenkönnen des Ausgangs eines Zufallsexperiments zu
quantifizieren. Jedem Ereignis soll eine Zahl aus [0, 1] zugeordnet werden, die uns gestattet, die Unsicherheit über den Ausgang anzugeben: 1 sollte für absolute Sicherheit, 0 für
vollständige Unsicherheit stehen.
Als Maßzahl für die Chance für das Eintreten eines Elementarereignisses ωi sehen wir
eine nichtnegative (reelle) Zahl pi an. Diese Maßzahl pi nennen wir die Wahrscheinlichkeit für das Eintreten des Elementarereignisses ωi . Als Normierung betrachtet man
die Bedingung, dass sich diese Elementarwahrscheinlichkeiten zu Eins aufsummieren. Dies
ist in Übereinstimmung mit der Sichtweise, dass ein sicheres Eintreten eines Ereignisses
mit der Chance Eins bewertet wird.
2
Von Aristoteles ist auch überliefert (Quelle: [4], S. 183): . . . . . . Alle Gebilde, bei deren Entstehen
”
sich alle gerade so ergeben habe, wie es auch ein zweckbestimmtes Werden hervorgebracht haben würde,
hätten sich nun am Leben erhalten können, da sie dank dem blinden Zufall einen lebensdienlichen Aufbau
besessen hätten. Das Übrige aber sei zugrunde gegangen und gehe stets zugrunde.“
2
Laplace-Versuch
Manchmal sind alle Ergebnisse gleichwahrscheinlich, d.h. als Ausgang des Experiments
kann jedes Elementarereigniss mit der gleichen Chance eintreten. Dann ist die Wahrscheinlichkeit pi für jedes Ereignis natürlich der n-te Teil der Gesamtwahrscheinlichkeit Eins,
also
pi = 1/n für alle i = 1, . . . , n .
Man spricht dann von einem Laplace-Experiment.
Mehrstufige Zufallsexperimente und Baumdiagramme
Etwas komplexer wird eine Experimentsituation, wenn man sich mehrstufige Zufallsexperimente anschaut, wie etwa die N -malige Wiederholung eines Experiments. Die Wahrscheinlichkeiten für das mehrstufige Experiment soll ermittelt werden aus den Wahrscheinlichkeiten, die auf jeder Stufe bekannt seien. Eine Möglichkeit, eine solche Situation zu
veranschaulichen, besteht darin, ein Baumdiagramm zu zeichnen. Ein Baumdiagramm
ist ein verzweigtes Diagramm, bei dem jeder Stufe des Zufallsexperimentes eine Ebene“
”
entspricht. Man zeichnet Blasen, die mit den jeweiligen Stufen–Ereignissen gekennzeichnet sind und schreibt die Wahrscheinlichkeiten für ihr Eintreten an die Verbindungslinien
(siehe Abbildung 2 und siehe dazu Beispiel 1.1). Dieses Diagramm wird von links nach
rechts gelesen.
Zwei Regeln werden zur Berechnung der
Wahrscheinlichkeit des mehrstufigen Experiments
herangezogen.
1. Pfadregel: Multiplikationsregel
Die Wahrscheinlichkeit eines Ereignisses bei einem
mehrstufigen Zufallsexperiment, die sich aus einem
Pfad des Diagramms ergibt, ist gleich dem Produkt der Wahrscheinlichkeiten längs des Pfades,
der zu diesem Ergebnis führt! Begründung: Diese
Regel ist einsichtig, etwa wenn man an die
Häufigkeitsinterpretation denkt.
2. Pfadregel: Additionsregel
Setzt sich ein mehrstufiges Ereignis aus verschiedenen Pfaden eines Baumdiagramms zusammen, so
erhält man seine Wahrscheinlichkeit durch Addition der einzelnen Pfadwahrscheinlichkeiten.
2
4/6
4/6
2/6
2
2/6
4/6
6
p= 16/36
6
p=8/36
2
p=8/36
6
p=4/36
2/6
1. Stufe
2. Stufe
(1. Wurf)
(2. Wurf)
Abbildung 2: Würfelexperiment
Example 1.1 Wir würfeln mit einem Würfel, der auf 4 Seiten die Zahl 2 und auf den
übrigen 2 Seiten die Zahl 6 zeigt. Er wird 2-mal geworfen. Wir machen dazu eine Pfaddiagramm; siehe Abbildung 2. An den Pfadenden können wir Wahrscheinlichkeiten ablesen.
Die Wahrscheinlichkeit, dass zweimal eine Sechs gewürfelt wird, ergibt sich nach der ersten Pfadregel zu 4/36, die Wahrscheinlichkeit, dass nach zwei Würfen die Augensumme
8 vorliegt, ergibt sich nach der zweiten Pfadregel zu 8/36 + 8/36 = 16/36.
Häufigkeitsinterpretation der Wahrscheinlichkeit
Jetzt haben wir schon viel von Wahrscheinlichkeit gesprochen, aber was soll man sich
darunter vorstellen? Eine Möglichkeit bietet die Häufigkeitsinterpretation. Sie fasst
Wahrscheinlichkeit etwa so:
3
Wenn man ein Zufallsexperiment N -mal wiederholt, möge man das Ergebnis ωi etwa mi mal erhalten. Ist nun pi die (theoretische) Wahrscheinlichkeit für das Eintreten von ωi ,
so sollte die Häufigkeit mi etwa gleich N · pi sein; je größer die Zahl der Wiederholungen
N ist, desto genauer sollte das Ergebnis mi an die erwartete Anzahl N · pi herankommen
(Gesetz der großen Zahl).
Hilfsmittel zur Realisierung von Laplace-Experimenten
Ein Mechanismus, der eine Zufallswahl bewerkstelligt, die zwei Ergebnisse mit der Wahrscheinlichkeit 21 als Ausgang hat, ist der Münzwurf. Wir unterstellen also, dass wir es mit
einer fairen“ Münze zu tun haben, bei der jede der beiden Seiten – wir bezeichnen sie mit
”
Kopf und Zahl – die gleiche Chance hat, oben zu liegen. Wenn wir Kopf die Zahl Eins (1)
und Zahl die Zahl Null (0) zuordnen, erzeugen wir also bei mehrmaliger Wiederholung
des Münzwurfes eine Folge von Nullen und Einsen. Man nennt eine solche Folge auch
ein Wort über dem (einfachen) Alphabet {0, 1} . Für eine solches Wort haben wir die
Interpretation als Dualzahlen.
Betrachten wir etwa den Ausgang 00101011. Dieses Wort entspricht dann der Dualzahl,
die die Zahl 43 im Dezimalsystem darstellt. Jede dieser achtstelligen Dualzahlen hat als
Wahrscheinlichkeit, geworfen zu werden, den Wert ( 12 )8 = 1/256, wie man sich über ein
Baumdiagramm mit 8 Stufen mittels der 1. Pfadregel überzeugt.3
Der Wurf eines Reißnagels kommt dem Münzwurf zwar als Experiment mit zwei
Ausgängen sehr nahe, er ist aber ein Beispiel eines Zufallsgenerators mit ungleicher Zufallsverteilung: die Ausgänge sind: Lage auf der Kappe, Spitze nach oben; Lage auf der
Spitze und der Kante der Kappe.
Unter Würfeln“ verstehen wir die zufällige Auswahl einer Zahl aus 1,2,. . . ,6. Natürlich
”
stellt diese Darstellung die historische Wahrheit auf den Kopf: ein Würfel mit seinen
gleichen sechs Seiten stellt die einfache Realisierung der zufälligen Auswahl von Zahlen
dar, die Gleichverteilung der Auswahl der Zahlen ist eine Konsequenz der unterstellten
geometrischen Gestalt des Würfels.4
Beim Würfelexperiment (mit einem fairen Würfel), betrachtet als Laplace–Experiment,
haben wir als Ereignismenge
Ω = {1, . . . , 6}
und jedes Elementarereignis hat die Wahrscheinlichkeit
pi =
1
, i = 1, 2, . . . , 6
6
Für das zusammengesetzte“ Ereignis, eine Eins, Zwei oder Drei zu würfeln, errechnen wir
”
eine Wahrscheinlichkeit 21 mit der zweiten Pfadregel; anschaulich ist das Ergebnis natürlich
klar, denn die erste Hälfte“ der Augen ist gleichwahrscheinlich mit der zweiten Hälfte“
”
”
der Augen. Beim Würfeln mit zwei (fairen) Würfeln, betrachtet als Laplace–Experiment,
haben wir:
Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6} ; p(i,j) =
1
, 1 ≤ i, j ≤ 6 .
36
Bemerkung 1.2 Wir haben das Würfeln mit einem fairen Würfel, guten Würfel beschrieben. Wir benötigen diesen Würfel, um aus sechs Zahlen eine zu wählen, ohne die
3
Diese kleine Zahl entspricht der Wahrscheinlichkeit, dass der Kracke Paul für acht Spiele der Weltmeisterschaft den Ausgang richtig voraussagt, wenn man eine Irrtumswahrscheinlichkeit von 21 unterstellt.
4
Siehe http://de.wikipedia.org/wiki/Spielwürfel
4
anderen zu benachteiligen“. Der schlechte Würfel ist ein geometrischer“ Körper, der
”
”
zwar von sechs Seiten berandet ist, aber keineswegs in einer regelmäßigen Art. Wir verweisen auf den Aufsatz [6] von Riemer und Stoyan, in dem der Versuch einer Berechnung
der Wahrscheinlichkeiten der Augen mittels einer speziellen Verteilung gemacht wird. In
[3] betrachtet Ineichen den Spezialfall prismatischer Würfel und diskutiert eine physikalische Modellierung zur Berechnung der Wahrscheinlichkeiten der Augen.
Bei der Beschriftung eines Würfels mit den Augenzahlen“ 1,2,3,4,5,6 gibt es viele
”
Möglichkeiten. Unter diesen Möglichkeiten werden aber in der Praxis nur die so genannten
7er-Beschriftung realisiert. Sie sind dadurch ausgezeichnet, dass die Beschriftung zweier
gegenüberliegender Seiten so gewählt wird, dass die Augensumme 7 ergibt. Darunter
haben sich genau 2 Möglichkeiten durchgesetzt. Sie sind dargestellt durch folgende Würfel”
netze“:




3
4
6 5 1 2 
6 5 1 2 
4
3
Wie kann man mit Hilfe eines Münzwurfes einen Würfel simulieren? Hier kommen uns
die Dualzahlen zu Hilfe, denn mit einem dreifachen Münzwurf können wir die Dualzahlen
000, 001, 010, 100, 011, 110, 101, 111 (0 entspricht Kopf, 1 entspricht Zahl) auswürfeln“.
”
Aus diesen 8 Möglichkeiten müssen wir nun 6 machen, also 2 streichen“; wir sollten 000
”
(entspricht 0) und 111 (entspricht 7) streichen Dies kann so geschehen:
S1 Werfe dreimal die Münze.
S2 Ist das Ergebnis 000 oder 111, gehe zu S1, sonst
S3 notiere das Ergebnis als Würfelwurfergebnis.
Ein beliebtes Bild von einem Laplace–Mechanismus ist das Urnenmodell. Eine Urne
ist ein Gefäß, in dem Gegenstände versteckt“ werden, die man dann wieder – nach ausrei”
chendem Mischen – herausholen kann.
Beispiel 1.3 In einer Urne liegen drei schwarze Kugeln und eine weiße Kugel. Auf gut
Glück werden zwei Kugeln der Urne entnommen. Welche Wahrscheinlichkeit ist größer,
zwei schwarze Kugeln oder eine weiße und eine schwarze Kugel herauszunehmen? Man
ist auf Grund der Tatsache, dass dreimal soviele schwarze wie weiße Kugeln in der Urne
liegen zu vermuten, dass die erste Möglichkeit wahrscheinlicher ist. Dem ist aber nicht
so, denn es gibt drei Möglichkeiten, zwei schwarze Kugeln herauszunehmen und drei
Möglichkeiten eine schwarze und eine weiße Kugel herauszunehmen. Es lässt sich dies
auch rechnerisch begründen:
Wahrscheinlichkeit für das Ziehen zweier schwarzer Kugeln
Wahrscheinlichkeit für das Ziehen einer weißen und einer schwarzer Kugel
Man fertige dazu ein Baumdiagramm!
3
4
1
4
· 32 = 12
· 1 + 34 · 13 = 12 .
Zufallsvariable, Erwartungswert und Verteilung
Man bezeichnet eine Funktion, die den Ergebnissen eines Zufallsexperiments numerische
Werte (so genannte Realisationen) zuordnet, nennt man eine Zufallsvariable. Die Bedeutung der Zufallsvariable liegt darin, dass durch sie die Verbindung zwischen dem Resultat
eines Zufallsexperiments und seiner mathematischen Darstellung (Realisation) hergestellt
5
wird. Bei einer diskreten Zufallsvariablen – und nur solche betrachten wir hier – sind nur
endlich viele Realisierungen möglich.
Zum Beispiel kann das Zufallsexperiment des Münzwurfs als Zufallsvariable X modelliert werden: X bildet die Menge der Wurfergebnisse Kopf,Zahl auf die Menge der Realisationen {0, 1} ab:
(
0, wenn ω = Kopf,
X(ω) =
1, wenn ω = Zahl.
Das Zufallsexperiment Wurf mit drei (fairen) Würfeln“ und die Frage nach der Augen”
summe kann so mit Hilfe einer Zufallsvariablen modelliert werden:
Z((ω1 , ω2 , ω3 )) := ω1 + ω2 + ω3 , ωi ∈ {1, 2, . . . , 6} .
Sei X eine Zufallsvariable. Die Wahrscheinlichkeitsfunktion
Ws(X = x) , x Realisierung
gibt die Wahrscheinlichkeit der Realisierungen an. Die Verteilungsfunktion von X ist
definiert durch
F (x) := Ws(X ≤ x) .
Der Erwartungswert der Zufallsvariablen X ist jener Wert, der sich (in der Regel) bei
oftmaligem Wiederholen des zugrunde liegenden Experiments als Mittelwert der Ergebnisse ergibt. Ein Erwartungswert muss kein mögliches Ergebnis des zugrunde liegenden Zufallsexperiments sein. Er wird als gewichtetes Mittel – die Gewichte sind die Wahrscheinlichkeiten für das Eintreten der Elementarereignisse – der Werte der Zufallsvariablen
berechnet. Beispielsweise ist der Erwartungswert der Augen beim Würfelwurf gegeben
durch
1
1
1
7
1 · + 2 · + ··· + 6 · = .
6
6
6
2
Das Galton-Brett
Das Galtonbrett5 besteht aus einer regelmäßigen Anordnung von Hindernissen, an denen
eine von oben eingeworfene Kugel jeweils nach links oder rechts abprallen kann. Nach dem
Passieren der Hindernisse werden die Kugeln in Fächern aufgefangen, um dort gezählt
zu werden; siehe Abbildung 3(vergleiche mit einem Flipperspiel). Jedes Aufprallen einer
Kugel auf eines der Hindernisse ist ein Bernoulli-Versuch. Die beiden möglichen Ausgänge
sind Kugel fällt nach rechts und Kugel fällt nach links.
Bei symmetrischem Aufbau ist die Wahrscheinlichkeit, nach rechts zu fallen, p = 12
und die Wahrscheinlichkeit, nach links zu fallen, q = 1 − p = 12 . Durch unsymmetrischen
Aufbau oder durch Schiefstellen des Brettes kann man auch einen anderen Wert für p
erreichen, wobei aber natürlich weiterhin q = 1 − p ist, denn die Kugeln, die nicht nach
rechts fallen, fallen nach links. Indem die Kugel nach Passieren des ersten Hindernisses auf ein neues trifft, bei dem die gleichen Voraussetzungen gelten, wird hier ein weiterer Bernoulli-Versuch durchgeführt; das Durchlaufen des ganzen Gerätes ist also eine
mehrstufige Bernoulli-Kette, wobei die Zahl der waagrechten Reihen von Hindernissen,
die Ebenen, die Länge dieser Kette ist. In der Abbildung 3 handelt es sich demnach um ein
Galtonbrett mit 6 Ebenen und um eine 6-malige Wiederholung eines Bernoulli-Versuchs,
d.h. eine Bernoulli-Kette der Länge 6.
5
Sir Francis Galton, 1822-1911; Cousin von C.R. Darwin
6
Sei n die Anzahl der Ebenen eines Galtonbretts. Die
Anzahl der Fächer, in die die Kugeln fallen können,
ist dann n + 1 . Jeden Durchlauf einer Kugel kann
man mit einem Wort der Länge n über dem Alphabet {L, R} in Verbindung bringen, wobei wir
festlegen, dass L (links) bzw. R (rechts) mit der
Draufsicht gemeint ist. Beispielsweise ist der in der
Abbildung 3 eingezeichnete Durchlauf beschrieben
durch das Wort RLLRRR .
Sei nun ein Wort der Länge n betrachtet, in
dem l-mal der Buchstabe L vorkommt. Dann ist
die Wahrscheinlichkeit für dieses Wort ( 12 )l ( 12 )n−l =
( 21 )n . Wenn wir die Fächer von links nach rechts
durchnummerieren mit den Nummern 0, 1, . . . , n,
dann haben wir nach der Pfadregel für die
Wahrscheinlichkeit, dass eine Kugel in das Fach mit
der Nummer m fällt, die Wahrscheinlichkeiten aller
Pfade, die zum Fach m führen, aufzusummieren.
Das Fach mit der Nummer m kann erreicht werAbbildung 3: Das Galtonbrett
den durch einen Durchlauf, der durch die Worte
n
beschrieben wird, die m-mal den Buchstaben R enthalten. Dies sind m
-viele, denn es
ist ja m-mal der Buchstabe R auf n vorhandene Position zu verteilen. Damit ergibt sich
für die Wahrscheinlichkeit b(m, n), dass eine Kugel in das Fach m fällt als
n
n
1
b(m, n) =
(1)
2
m
An der Abbildung 3 erkennen wir, dass die Füllung der Fächer für großes n sehr schön die
Gaußsche Glockenkurve (siehe den ehemaligen 10 DM-Schein) annähert. Diese Approximationsgüte lässt sich analytisch erklären.
1.3
Zufallszahlen und deren Ersatz
Das Thema dieser Ausarbeitung sind Zahlen, die als echte“ Zufallszahlen, als Pseudo”
oder Quasi-Zufallszahlen betrachtet werden können. Die zugehörigen Erzeugungsmechanismen nenen wir (Pseudo-)Zufallszahlen-Generatoren. Der Wunsch, zufällige Ereignisse zu generieren, ist zwar keine ausschließliche Erscheinung des Computerzeitalters, er
wurde aber durch die Rechenmöglichkeiten doch stark in den Vordergrund gerückt. Zur
Geschichte:
• 1938: Kendall und Babington-Smith erzeugen mit einer schnell drehenden Scheibe
100 000 zufällige Ziffern.
• Seit 1940/50 werden numerische und arithmetische Verfahren verwendet, um Zufallszahlen zu generieren.
• 1957: Das 1. ERNIE-Projekt (Electronic Random Number Indicator Equipment)
wurde durch Sidney Broadhurst, Tommy Flowers and Harry Fensom realisiert. Es
wurden mit Hilfe von Vakuumröhren bis zu 50 Zufallsziffern pro Sekunde erzeugt.
• 1955: Die Rand-Corporation veröffentlicht ein Buch mit ca. 1 Million Zufallsziffern.
• 1983: Miyatake baut eine Vorrichtung, um durch das Zählen von Gammastahlen
zufällige Ergebnisse zu generieren.
7
• 1995 Marsaglia produziert eine CD-ROM, auf der ca. 4.8 Milliarden Zufallszahlen
gespeichert sind.6
Was ist die Motivation für das Bestreben,
(Pseudo-)Zufallszahlen zu erzeugen? Warum zu
Generatoren von Pseudozufallszahlen greifen,
also zu Generatoren, die nicht den “echten
Zufall“ verwenden? Es sind die vielfältigen
Anwendungsbereiche, die nach Zufallszahlen
fragen: Experimente, die Gerechtigkeit produzieren, Erzeugung zufälliger Ereignisse entsprechend statistischer Vorgaben, Verfahren,
die die Echtheit von Meßdaten überprüfen,
kryptographische Anwendungen (Erzeugung von
Schlüsselzahlen,. . . ), Monte Carlo Simulation
(insbesondere in Computational Finance), Simulation von Abläufen der realen Welt (Ampelschaltungen), Globale Optimierung, Spiele
(wo taucht der Bösewicht auf ?),. . . ; siehe [7].
i
0
1
2
3
...
12
13
14
...
zi ui := 0.zi
7182
−−−
5811
0.5811
7677
0.7677
9363
0.9363
...
...
0012
0.0012
0001
0.0001
0000
0.0000
...
...
zi2
51 5811 24
33 7677 21
58 9363 29
87 6657 69
...
00 0001 44
00 0000 01
00 0000 00
...
Abbildung 4: Middle-Square
Das Problem jeden Vorgehens, Zufallszahlen (auf dem Computer) mittels eines Algorithmus zu erzeugen, ist offenbar, dass Erzeugen“ und Zufall“ ein Widerspruch in
”
”
sich ist. Da der Determinismus schon per Definition eine Eigenschaft eines Algorithmus
ist, steht jeder Nachfolger einer Zufallszahl deterministisch fest. Für die oben genannten
Anwendungsgebiete genügen jedoch diese Pseudozufallszahlen“. Wir lassen das Präfix
”
Pseudo“ meist weg.
”
Wir beschränken uns fast ausschließlich auf die Generierung von Zufallszahlen, die
gleichverteilt sind im Einheitsintervall [0, 1] der reellen Zahlengeraden. Diese Einschränkung kann man überwinden, wir werden später Anmerkungen dazu machen.
Was soll man unter einer Folge von Zufallszahlen verstehen? Der österreichische Mathematiker Richard von Mises versuchte es in der ersten Hälfte des 20. Jahrhunderts mit
fehlender Vorhersehbarkeit: Eine 0-1-Sequenz sollte als zufällig gelten, wenn es keine
Regel gibt, die an irgendeiner Stelle das nächste Glied aus den vorhergehenden mit einer
Wahrscheinlichkeit größer als 50 Prozent prognostiziert. Für den Münzwurf bedeutet das:
Systeme, die dem Spieler einen Vorteil versprechen, existieren nicht. Erst in den sechziger
Jahren des letzten Jahrhunderts fanden der Russe Andrej Nikolajewitsch Kolmogorow
und der Amerikaner Gregory Chaitin unabhängig voneinander mit einer speziellen Komplexitätstheorie einen Ausweg: Eine Zahlenfolge ist ihrer Meinung nach zufällig, wenn sie
sich nicht mit einer kürzeren Zeichensequenz beschreiben lässt. Die Folge 11111. . . etwa
kann man knapp ausdrücken mithilfe des mit Nullen und Einsen geschriebenen Computerbefehls für Schreibe lauter Einsen!, 01010101. . . mit einem entsprechenden wiederhole
01!. Bei Zufallsfolgen darf es keine solche Umschreibung in Kurzform geben.
Pseudozufallszahlen sollen Zahlenfolgen sein, die zufällig“ sind, d.h. die Eigenschaften
”
besitzen, die dem echten Zufall nahe kommen. Also ist man gezwungen, den Zufall deterministisch möglichst gut nachzustellen. Um die umständliche Verwendung von Tabellen
zu vermeiden, werden Zufallszahlen verwendet, die im Allgemeinen durch Iterationen nach
einer Formel ad hoc hergestellt werden. Die so erzeugten Zufallszahlen haben den Vorteil,
6
random.org brüstet sich, seit 1998 857 Milliarden Zufallsbits, also zufällige Nullen und Einsen, erzeugt
zu haben.
8
dass sie konstruierbar sind, und haben den Nachteil, dass sie vollkommen deterministischen Charakter besitzen. Alles, was wir hier zunächst zur Sprechweise Zufallszahl“ sagen
”
können, ist, dass jedenfalls kein Muster, keine Struktur in der Folge erkennbar sein soll.
Die Wahrscheinlichkeitstheorie und Statistik stellt Hilfsmittel bereit, solche Folgen auf
ihre Zufälligkeit zu testen.
Im Lichte dieser Begriffsbildungen können wir nun Forderungen formulieren, die an
einen Zufallszahlen-Generator zu stellen sind. Er soll Zahlen erzeugen, die folgende Eigenschaften haben:
Gleichverteilung Die Zufallsfolge genügt der Gleichverteilung in [0, 1] .
Unvorhersagbarkeit Kennt man eine Zufallszahl (Vorgänger), sollte die nächste konstruierte Zufallszahl (Nachfolger) nicht vorhersagbar sein. Dies bedeutet, dass der
Konstruktionsmechanismus komplex genug ist, um zu vermeiden, dass das Konstruktionsprinzip abgelesen werden kann.
Reproduzierbarkeit Um die Fehlersuche zu erleichtern und verschiedene Simulationen
einfacher miteinander vergleichen zu können, ist es wichtig, dass eine einmal erzeugte
Zufallsfolge immer wieder reproduziert werden kann.
Bei Spielen (der Bösewicht soll nicht immer zur selben Zeit auf der Bildfläche erscheinen) und in der Kryptologie steht dem gegenüber die Forderung nach Irreproduzierbarkeit. In der Kryptographie ist diese Forderung unverzichtbar“.
”
Effizienz Dazu kommen die Forderungen, dass der Generator schnell ist und möglichst
wenig Speicherplatz auf dem Computer belegt.
Wie soll man nun gute und weniger gute Generatoren auseinanderhalten? Klar, indem man neben der Ausschöpfung“ des zur Verfügung stehenden Zahlraumes [0, 1] die
”
obigen Forderungen abprüft. Dies geschieht im Allgemeinen mit theoretischen und empirischen Tests für die Güte von Generatoren. Theoretische Tests setzen am Generator
selbst an, empirische Tests nehmen sich die erzeugten Zahlenfolgen vor. Wir gehen auf
die Kriterien Gleichverteiltheit, Unkorreliertheit ein, die Effizienz übergehen wir.
1.4
Die middle square-Methode von J. von Neumann
Eine erste Realisierung der Pseudozufallserzeugung bestand in der Nutzung der Dezimalziffern transzendenter Zahlen. Die Zahl π wurde 1873 mit 703, 1960 mit 100 000 und
1986 mit 107 Dezimalstellen berechnet. Die Analyse ergab, dass kein signifikanter Mangel
zu erkennen war, was die Zufälligkeit der Dezimalstellen hinsichtlich Gleichverteilung in
0, 1, . . . , 9 betrifft. Da die Algorithmen zur Berechnung transzendenter Zahlen in der Regel
sehr kompliziert sind, werden in der Praxis meist andere Algorithmen benutzt.
Einer der ältesten Generatoren ist die Middle-Square-Methode, die um 1940 von
von J. von Neumann, Metropolis und Ulam entwickelt wurde7 und die wie folgt durchgeführt
wird.
Wähle eine 4-stellige Zahl, quadriere sie, man erhält eine höchstens 8-stellige
Zahl. Ist das Ergebnis nicht 8-stellig, füllt man sie links mit Nullen auf 8
Stellen auf. Die mittleren 4 Ziffern wählt man nun als erste Zufallszahl und
als neuen Startwert für das Vorgehen.
7
Diese Methode wurde um 1946 im Rahmen des Los-Alamos-Projekts zur Entwicklung der Wasserstoffbombe für Computer-Simulationen eingesetzt.
9
Ist man unvorsichtigt“ bei der Wahl des Startwertes, bekommt man eine nicht sehr
”
brauchbare Folge. Etwa erhält man mit dem Startwert 8441:
8441, 2504, 2700, 2900, 4100, 8100, 6100, 2100, 4100, 8100, . . . .
Es ist sogar noch schlimmer“, wie das Beispiel
”
in der Tabelle 4 andeutet: die ersten Schritte
des Middle-square-Algorithmus scheinen brauchbare Zufallszahlen zu liefern, die Fortsetzung bei
i = 12 zeigt aber, dass die Iteration bei der Zu”
fallszahl“ Null endet. In der Tat tendiert der Algorithmus in vielen Fällen dazu, bei Null zu enden. Also scheint der Algorithmus unbrauchbar
zu sein, Zufallszahlen zu erzeugen. Anderenfalls
ist das obige kurze Stück 8100, 6100, . . . , 8100
das periodische Stück einer doch recht langen
nichtperiodischen Zahlensequenz, die mit dem
Startwert 6239 beginnt (man rechne dies nach).
1.5 Zufallszahlen der Natur entnommen
Abbildung 5: RAND-Tabelle
Bei den Generatoren für echte Zufallszahlen unterscheidet man zwischen physikalischen Generatoren und Tabellenwerken. Physikalische Generatoren beruhen in der Regel auf der nicht
exakten Reproduzierbarkeit von physikalischen Ereignissen. Man verwendet nicht deterministische physikalische Prozesse als Zufallszahlenquelle. Beispiele für physikalische Generatoren sind:
• Die Beobachtung der Zeit zwischen der Emission von Partikeln beim radioaktiven
Zerfall
• Die Messung thermischen Rauschen
• Die Messung der Ladungsdifferenz zweier eng benachbarter Halbleiter
• Die Beobachtung von Frequenzschwankungen aufgrund der Instabilität eines frei
laufenden Oszillators
• Die Messung des Betrags, um den ein Halbleiter während einer festen Zeitspanne
geladen werden kann
• Die Aufzeichnung von Klang mit einem Mikrofon oder von Bildern mit einer Videokamera.
• Laufzähler mit Stoppereignissen. Dabei kommt ein modulo n-Zähler“ zum Einsatz,
”
der laufend von 0 bis (n−1) zählt. Beim Auftreten eines zufälligen zählerunabhängigen Stoppereignisses wird der Zählerstand ausgelesen.
Man nennt solche physikalische Effekte nutzende Generatoren Hardware-Generatoren8 .
Hier steht natürlich die Frage im Raume, ob das physikalische Phänomen wirklich den Zufall simuliert, wie es etwa die Quantenmechanik voraussagt. Die Vorteile solcher HardwareGeneratoren sind:
8
http://www.westphal-electronic.com/ZrandomUSB− Manual.pdf
10
• Keine Periodizität (siehe Kongruenzgeneratoren)
• Generation basiert nicht auf einem Algorithmus
• Keine Voraussagbarkeit der Zahlen
• Sehr gute statistische Eigenschaften der Zufallszahlen.
1.6
RAND-Tabelle
Bereits 1955, als Computer noch neu“ waren,
”
veröffentlichte die RAND-Corporation ein Buch
mit einer Million Zufallsziffern. Darin wird
Ziffer Häufigkeit in %
die Vorgehensweise beschrieben, wie man zu
0
5
den Zufallszahlen kam: Die Zufallszahlen wur1
10
den durch erneute Randomisierung“ einer
2
13
”
Grundtabelle erzeugt, die mit einer elektro3
8
nischen Roulettscheibe generiert wurde. Eine
4
8
Pulsquelle mit zufälliger Frequenz wurde et5
10
wa einmal pro Sekunde von einem Puls
6
10
konstanter Frequenz durchlaufen. Standard7
15
isierungsschaltkreise leiteten den Puls durch
8
13
einen fünfstelligen Binärzähler. Die Anord9
7
nung entsprach im Prinzip einer Roulettscheibe
mit 32 Plätzen, die pro Versuch durchschnitAbbildung 6: 1. Ziffer in RAND
tlich 3000 Umdrehungen machte und eine Zahl
pro Sekunde produzierte. Ein Binär/DezimalKonverter wandelte 20 der 32 Zahlen um (der Rest wurde verworfen) und behielt
nur die letzte Stelle der zweistelligen Zahlen. Diese letzte Stelle steuerte einen IBMLochkartenstanzer, der schließlich eine Lochkartentabelle mit Zufallsziffern ausgab. Der
Hauptteil des Buches umfasst die Tabelle der Zufallsziffern“. Sie werden in Gruppen zu
”
je fünf Ziffern aufgelistet.
Die Häufigkeit der ersten Ziffern in den Blöcken sind in der Tabelle 6 aufgelistet.
Sie werden im Folgenden noch eine Rolle spielen. Hier kann man festhalten, dass die
Zufälligkeit“ der ersten Ziffer – in Anbetracht des kleinen Ausschnitts der Zufallstabelle
”
– nicht sehr ausgeprägt ist.
11
Literatur
[1] J. Bewersdorff. Glück, Logik und Bluff. Vieweg, Braunschweig, 1998.
[2] N. Henze. Stochastik für Einsteiger. Vieweg, Braunschweig, 1997.
[3] R. Ineichen. Der schlechte Würfel – ein selten behandeltes Problem in der Geschichte
der Stochastik. Historia Mathematica, 18:253–261, 1991.
[4] L. Russio. Die vergessene Revolution. Springer, New York, 2003.
[5] L. Tarassow.
Berlin, 1998.
Wie der Zufall will? Vom Wesen der Wahrscheinlichkeit.
[6] W. Riemer und D. Stoyan.
Springer,
Würfeln“ mit Quadern - die Gibbs-Verteilung, 2010.
”
.
http://www.studienseminare-ge-gym.nrw.de/K/riemer/mathematik/quader/quader-gibbs.pdf
[7] C. Weizel.
Erzeugung sicherer Zufallszahlen.
Universität Koblenz, 2004.
https://www.uni-koblenz.de/∼steigner/seminar-asym-krypt/weizel.pdf.
12