Effizient suchen leicht gemacht

Transcription

Effizient suchen leicht gemacht
Ein Lehrmittel für den IKT-Unterricht
von Giancarlo Gareiss
EFFIZIENT SUCHEN
LEICHT GEMACHT
2
Inhaltsverzeichnis
Vorwort zum Gebrauch
4
1.
2.
3.
4.
5.
6.
Bedeutung von Suchmaschinen
Die Entwicklung des Internets
Wie funktionieren Suchmaschinen
Effizientes Suchen
Gefahren im Umgang mit Google
Anhang A
a. Glossar
b. Nützliche Links
c. Quellenangabe
7. Anhang B
a. Lösungen
5
6
11
18
25
30
30
34
36
43
43
3
Vorwort zum Gebrauch
Was ist das Ziel des vorliegenden Lehrmittels?
Das Lehrmittel „Effizient Suchen leicht gemacht“ soll dir einen
Einblick in verschiedene Aspekte von Suchmaschinen und insbesondere Google verleihen. Es bringt dir einerseits die Funktionsweise von Suchmaschinen näher, andererseits lernst du Techniken
für ein gezielteres Suchen im Internet und wirst auf die Gefahren
im Umgang mit Google aufmerksam gemacht. Die Entstehungsgeschichte des Internets und die Bedeutung von Google und Co. runden das Lehrmittel ab und setzen Suchprogramme in einen grösseren Zusammenhang. Für die Bearbeitung brauchst du keinerlei
Vorkenntnisse. Dein Wissen vom täglichen googeln reicht vollständig aus.
Wie ist es aufgebaut?
Das Lehrmittel ist in fünf Kapitel unterteilt, die jeweils verschiedene Aspekte von Suchmaschinen abhandeln. Zu Beginn jedes
Kapitels steht eine Einführungsseite in grün, die einerseits dein
Vorwissen aktivieren soll und andererseits eine Heranführung an
die Thematik des Kapitels darstellt. Der blaugefärbte Hauptteil
eines jeden Kapitels ist in eine linke und rechte Spalte unterteilt.
Die linke soll dir Informationen zum Thema beschaffen und enthält auch Theorieteile, die rechte dient der Vertiefung mittels Aufgaben und der Auflockerung. Zum Schluss jedes Kapitels folgt
eine rote Abschlussseite, die einerseits mit einer Zusammenfassung der wichtigsten Punkte, andererseits mit Repetitionsaufgaben
dienen soll. Im Anhang finden sich die Lösungen sämtlicher Aufgaben, ein Glossar, welcher die unterstrichenen Begriffe erklärt
und dazu noch einige nützliche Internetseiten für den Schulalltag.
Tipps zur Bearbeitung





Bearbeite das Lehrmittel in der vorgegebenen Reihenfolge
der Kapitel und Unterkapitel.
Lies vor den Aufgaben immer den Theorieteil genau
durch.
Versuche die Aufgaben, sofern nicht anders vermerkt,
selbständig zu lösen und notiere die Lösungen auf ein separates Blatt Papier.
Die Lösungen im Anhang müssen nicht immer mit deinen
übereinstimmen.
Löse auch die Einstiegs- und Repetitionsaufgaben. Sie
dienen der Aktivierung deines Vorwissens bzw. der Festigung des Erlernten.
4
Die Entstehung des Internet
1. Bedeutung von Suchmaschinen
1958
Menschen
stellten
schon
immer Satelliten
Fragen. EsSputnik
liegt wohl
einfach
in
Als Reaktion
auf den
russischen
(1957)
ruft das
der
Natur
des
Menschen
neugierig
zu
sein
und
alles
wissen
zu
Verteidigungsministerium der USA die ARPA (Advanced Rewollen.
Denn wir
suchenins
fürLeben.
alles Gründe
und wollen
als
search Projects
Agency)
Das erklärte
Ziel dernichts
Behörde
gegeben
hinnehmen.
Früher vor
zweitausend
Jahren stellist, im Bereich
der Technik
nie mehr
mehr als
überraschend
geschlagen
zu
ten
die
Griechen
ihre
Fragen
einem
Orakel.
werden.
Aber
1964 in dem unaufhaltsamen Prozess der technischen Weiterentwicklung,
dem sich als
dieerster
Menschheit
Anbeginn ihrer
Paul Baraninentwickelt
die Ideeseit
zurdem
Paketvermittlung
in
Existenz
befindet,
war
es
nur
eine
Frage
der
Zeit,
bis
auch
das
einem verteilten Netz. Sie stellt ein alternatives Verfahren zur
Beantworten
von Fragendar.
automatisiert
und zu neuer Perfektion
[1]
Durchschaltevermittlung
vorangetrieben werden sollte.
1969
Heutzutage
in aller Munde.
Die Rede ist
SuchmaschiDie Rechnersind
dersie
Universität
von Kalifornien,
dervon
Universität
von
nen.
Allen
voran
von
einer.
Von
Google,
dem
InformationsliefeKalifornien in Santa Barbara, der Universität von Utah und des
ranten
schlechthin.
Wenn man
Leutemiteinander
fragt, einemverbunden
eine SuchmaStanford
Research Institute
werden
und
schine
zu nennen,das
werden
sie einem
die Antwort
in einem
bilden zusammen
ARPANET.
Finanziert
und geleitet
wirdWort
das
geben:
Google.
Google
ist
omnipräsent.
Keine
andere
SuchmaProjekt von der ARPA. Das Ziel ist, eine Möglichkeit für die Zuschine
ist so oft
in den
den Datenaustausch
Medien, wie derder
Suchgigant
aus Kalifornisammenarbeit
und
Universitäten
zu schafen.
fen.[2]Google stellt andere wie Yahoo! oder Microsofts Bing in den
Schatten. Doch was steckt wirklich hinter dem Weltkonzern und
welche
1970 Bedeutung kommt der Suchmaschine zu?
Das ARPANET wächst praktisch jeden Monat um einen RechDank
ner.[3] Google finden wir heute auf viele Fragen eine Antwort.
Nicht nach fragen über den Sinn des Lebens oder der Zukunft
(noch
1971 nicht), aber z.B. nach Zugverbindungen. Vor ein paar Jahren
wäre
das nochumfasst
unmöglich
gewesen.
vollbringen
Das Netzwerk
mittlerweile
15 Suchmaschinen
Knoten,[4] wird aber
weiterrein
technisch
gesehen
eine grossartige
Leistung. Informatiker
Und wir müssen
hin nur
von einigen
Wenigen
genutzt. Meistens
und
noch
nicht
einmal
lange
auf
die
Antworten
warten.
Denn
das
ganze
Studenten an Universitäten und Forschungseinrichtungen. Die
passiert
in Sekundenbruchteilen.
Fast nichts
schon schneller
als wir denbreite Öffentlichkeit
weiss praktisch
von der Existenz
des
[5]
ken
können, bekommen wir die Resultate. Menschen fragen GoogNetzwerks.
le für praktisch alles. Die Suchmaschine kontrolliert die Informati1973
onen, wie niemand jemals zuvor in der Geschichte der Menschheit.
Vint
Cerf
und Robert
Kahn
legenUnd
den somit
Grundstein
für das
Google
bestimmt
was wir
finden.
auch was
wir Zusamwissen.
menschliessen
von
verschiedenen
Netzwerken:
Was wir für ein Weltbild haben. Mehr als Zeitungen oder das
Sie
entwickeln
die Protokolle TCP/IP[6] und das Konzept der GaFernsehen
dies tun.
teways (Netzkoppler), mit deren Hilfe Netzwerke mit unterschiedDeshalb
ist es wichtig,
dass wir uns bewusst
werden, kommuniwie gross
lichen Protokollen
und Geschwindigkeiten
miteinander
Googles
Einfluss
ist konnte
und wirmitandere
kennen,
an
zieren können.
Jetzt
einemMöglichkeiten
Router, der als
Gateway
Informationen
zu
kommen.
Denn
was
wir
nicht
finden
–
oder
auf
fungierte, und dem TCP/IP-Protokoll jedes beliebige Netzwerk mit
den
Ergebnisseiten
weit hinten
steht[7] –,
für viele
auch
einem
anderen in Verbindung
treten.
Alsexistiert
erster nicht
amerikaninicht.
Gerade auch
ist esdes
so NORSAR
wichtig, dass
wir lernen
im
scher Rechner
wird deshalb
ein Rechner
(Norwegian
SeisInternet
gezielt
nachARPANET
den Informationen
zu [8]
suchen und diese auch
mic Array)
mit dem
verbunden.
kritisch zu bewerten.
5
 Suchmaschinen vollbringen eine
grossartige technische Leistung.
 Wenn wir etwas mit einer Suchmaschine nicht finden, heisst das
nicht, dass es die Sache nicht gibt.
 Suchmaschinen beeinflussen unser
Weltbild.
Wusstest du, dass…
 Im Jahr 1972 das erste Mal gechattet wurde?
 das Verb „googeln“ im Duden
steht?
 der Absender des ersten SpamMails Ärger mit dem amerikanischen Verteidigungsministerium
bekam?
2. Die Entwicklung des Internets
Was weiss ich schon?
Diskutiere mit deinen Kollegen, was ihr über folgende Stichworte
schon wisst? Haltet eure Gedanken schriftlich fest.





ARPANET
Internet
WWW
E-Mail
Google
Nach diesem Kapitel weiss ich…







wie sich das Internet entwickelte.
was man unter Paketvermittlung versteht.
was ein verteiltes Netzwerk ist und welche Vorteile es besitzt.
dass das Internet und WWW nicht dasselbe sind.
was die Aufgaben der Protokolle TCP und IP sind.
wann es die ersten Suchmaschinen gab.
einige Fakten über Google.
Eine Entwicklung, die unser Leben veränderte…
Das Internet, wie wir es heute kennen (mit Suchergebnissen in
Sekundenbruchteilen, mit sozialen Netzen und Plattformen für
Musikdownloads) entwickelte sich nicht von heute auf morgen.
Ebenso wenig wurde es von einem einzelnen entwickelt. Nicht
einmal die ARPA (eine Forschungsbehörde), die als Begründer des
Internets gilt, kann die Entdeckung des Internets als ihre alleinige
Erfindung beanspruchen. Vielmehr waren es unzählige Erfindungen über Jahre hin weg, die immer wieder Teilprobleme lösten.
Aufgabe:
Studiere die Zeitlinie auf den nächsten Seiten und bearbeite anschliessend die Seite mit der Zusammenfassung. Die Bemerkungen
in der rechten Spalte dienen dir, wie immer, mit zusätzlichen Informationen und witzigem Zusatzmaterial.
6
Die Entstehung des Internet
1958
Als Reaktion auf den russischen Satelliten Sputnik (1957) ruft das
Verteidigungsministerium der USA die ARPA (Advanced Research Projects Agency) ins Leben. Das erklärte Ziel der Behörde
ist, im Bereich der Technik nie mehr überraschend geschlagen zu
werden.
1964
Paul Baran entwickelt als erster die Idee zur Paketvermittlung in
einem verteilten Netz. Sie stellt ein alternatives Verfahren zur
Durchschaltevermittlung dar.[1]
1969
Die Rechner der Universität von Kalifornien, der Universität von
Kalifornien in Santa Barbara, der Universität von Utah und des
Stanford Research Institute werden miteinander verbunden und
bilden zusammen das ARPANET. Finanziert und geleitet wird das
Projekt von der ARPA. Das Ziel ist, eine Möglichkeit für die Zusammenarbeit und den Datenaustausch der Universitäten zu schaffen.[2]
1970
Das ARPANET wächst praktisch jeden Monat um einen Rechner.[3]
1971
Das Netzwerk umfasst mittlerweile 15 Knoten,[4] wird aber weiterhin nur von einigen Wenigen genutzt. Meistens Informatiker und
Studenten an Universitäten und Forschungseinrichtungen. Die
breite Öffentlichkeit weiss praktisch nichts von der Existenz des
Netzwerks.[5]
1973
Vint Cerf und Robert Kahn legen den Grundstein für das Zusammenschliessen von verschiedenen Netzwerken:
Sie entwickeln die Protokolle TCP/IP[6] und das Konzept der Gateways (Netzkoppler), mit deren Hilfe Netzwerke mit unterschiedlichen Protokollen und Geschwindigkeiten miteinander kommunizieren können. Jetzt konnte mit einem Router, der als Gateway
fungierte, und dem TCP/IP-Protokoll jedes beliebige Netzwerk mit
einem anderen in Verbindung treten.[7] Als erster nicht amerikanischer Rechner wird ein Rechner des NORSAR (Norwegian Seismic Array) mit dem ARPANET verbunden.[8]
7
Oft glauben die Leute, das
ARPANET wurde erstellt, um nach
einem atomaren Anschlag auf die
USA die Kommunikation aufrecht zu
erhalten. Dies war nicht das Ziel des
Netzwerkes. Vielmehr wollte man
eine Möglichkeit finden die knappen
Rechnerkapazitäten der Universitäten
miteinander zu verbinden und so den
Datenaustausch untereinander zu
fördern. Natürlich wurde das Netzwerk auch auf Ausfallsicherheit und
Stabilität getestet, was aber eher auf
die sowieso - auch ohne nukleare
Angriffe - schon sensiblen Netzwerkverbindungen zurückzuführen ist.[9]
NICE TO KNOW:
Die ersten Daten, die über das ARPANET verschickt wurden, waren 1969
ein „LOG“ – ein verunglücktes „LOGIN“. Die Universität von Kalifornien
versuchte sich in den Rechner der Universität Stanford einzuwählen.[10]
Aufgabe 2.1
Schau auf der folgenden Seite die
verschiedenen Karten an und informiere dich darüber, wie sich das ARPANET im Laufe der Zeit verändert
hat:
http://som.csudh.edu/fac/lpress/
history/arpamaps/
Löse mit Hilfe der Karten folgende
Aufgaben:
1. In welchem Jahr wurde das Pentagon an das ARPANET angeschlossen?
2. Warum sind gerade in Boston und
um Kalifornien herum so viele
Rechner ans Netzwerk angeschlossen?
Wann wurde das erste Mal gechattet?
1972 fand ein Chat zwischen zwei
Kommunikationsprogrammen statt, das
eine lief auf einem Rechner am SRI,
das andere bei BBN. PARRY spielte
einen Psychotiker mit Verfolgungswahn und „Der Doktor“ imitierte einen
Psychiater. Die Programme gaben dabei vorgefertigte Antworten und wenn
sie etwas nicht verstanden eine neutrale
Aussage zum Besten.[22]
NICE TO KNOW:
1978 wurde von Gary Thuerk das erste
Spam-Mail verschickt. Dieser wollte so
für den Computerhersteller DEC werben, bekam aber prompt Ärger mit dem
Verteidigungsministerium, dem Betreiber des ARPANET.[23]
Für weitere Informationen: Google
selbst!
NICE TO KNOW:
Vielfach wird „googeln“ synonym für
die Internetrecherche verwendet. 2004
wurde das Verb „googeln“ sogar in den
Duden aufgenommen.[24]
1982
Mit EUnet entsteht eines der ersten Netzwerke in Europa. Es verbindet Rechner in Grossbritannien, Holland, Dänemark und
Schweden.[11]
1983
Ein Anschluss an das ARPANET ist teuer. So bilden die vielen
amerikanischen Informatikfakultäten, die sich das nicht leisten
können, ihr eigenes Netzwerk. Dank den TCP/IP-Protokolle konnten diese völlig verschiedenen Netzwerke über das ARPANET
vereint werden und wachsen so mit der Zeit zu einem grossen Netz
zusammen. Langsam kommt der Begriff Internet auf.[12]
1988
Zwischen den USA, Frankreich und England wird das erste transatlantische Glasfaserkabel verlegt.[13]
1989
Das ARPANET wird stillgelegt. Die Netzwerke des ARPANET
werden an das NSFNET angeschlossen, welches jetzt zum zentralen Backbone des Internet wird.[14]
1990
Archie, die erste eigentliche Suchmaschine, mit deren Hilfe Archive durchsucht werden können, geht online.[15] Folgende Länder
haben ein eigenes Netz an das NSFNET angeschlossen und somit
Zugang zum Internet: Argentinien, Belgien, Brasilien, Chile,
Griechenland, Indien, Irland, Österreich, die Schweiz, Spanien und
Südkorea.[16]
1991
Das von Tim Berners-Lee am CERN entwickelte World Wide
Web wird für die Öffentlichkeit zugänglich gemacht. Mit dem
WWW lassen sich verschiedene Webseiten zu einem sogenannten
Hypertextsystem verlinken.[17]
1994
Erstmals in der Geschichte des Internets gibt es mehr kommerzielle als wissenschaftliche Seiten.[18] Mit der Gründung von Amazon
erfolgt ein Meilenstein im Onlinehandel. Ein Jahr später wird Ebay
gegründet. Das heute grösste Internetauktionshaus macht den Online-Einkauf günstig und bequem.[19]
1995
Die beiden bedeutendsten Suchmaschinen der 90er-Jahre werden
gegründet: Altavista[20] und Yahoo[21]. Altavistas Babel Fish war
der erste Internet-Übersetzungsdienst.
8
1998
Netscapes Internetbrowser Netscape Navigator verliert den Browserkrieg gegen Microsofts Internet Explorer und wird eingestellt.
Der Internet Explorer ist somit lange Zeit ohne ernsthafte Konkurrenz.[25] Mit Napster entsteht die erste Musiktauschbörse im Internet und darüber hinaus eine unglaublich schnell wachsende Community.[26] Völlig neuartig ist das dabei verwendete Peer-to-PeerVerfahren (P2P).[27]
2001
Jimmy Wales gründet Wikipedia, eine Enzyklopädie, bei der jeder
und jede zum Autor werden kann.[28]
2003
Der Begriff Web 2.0 wird erstmals öffentlich verwendet. Inbegriff
des neuen Internet Zeitalters sind Plattformen wie Facebook,
MySpace, YouTube, Wikipedia oder auch Twitter. Der Nutzer
erstellt und verteilt Inhalte selber.[29]
2007
Weltweit werden 97 Milliarden Mails verschickt - täglich. 40 Milliarden sind Spam-Mails.[30]
Google: Der Weg zum Imperium[33]
1996
Larry Page und Sergey Brin arbeiten
an der Universität Stanford gemeinsam an einer Suchmaschine.
1998
Google wird als Firma eingetragen
und das Suchprogramm öffentlich
zugänglich.
Mai 2000
AdWords startet mit 350 Kunden.
Juni 2000
Mit einer Milliarde indizierten Seiten
ist Google die grösste Suchmaschine
der Welt.
2006
Google übernimmt für 1.65 Milliarden Dollar YouTube.
2009
Im Jahr 2009 werden ungefähr 176 Exabyte Daten über das Internet transportiert. Dies entspricht der 424‘000-fachen Datenmenge
aller Bücher der Welt.[31]
2007
Google ist erstmals die am meisten
aufgerufene Website des Internets.
2010
Die Spam-Quote bei E-Mails ist auf 97% angestiegen.[32]
2008
Google hat im Internet eine Billion
Seiten gefunden.
2009
99% der gesamten Einnahmen generiert Google aus dem Anzeigensystem
AdWords.[34]
2010
Google ist die wertvollste Marke und
hat einen weltweiten Marktanteil von
85%.[35]
Google ist ein Wortspiel mit dem
Begriff Googol. Dieser steht für eine
1 gefolgt von 100 Nullen. Die grosse
Zahl versinnbildlicht das Bestreben
der Firma die schier unendlich grosse
Menge aller vorhandenen Informationen zu ordnen.[36]
9
Aufgabe 2.2
Diskutiert in Gruppen was die Vorteile eines verteilten Netzes (Bild unten,
rechte Graphik) gegenüber einem
zentralen Netz sind! Ihr könnt euch
dabei auch am Beispiel mit „dem
Zügeln“ orientieren. (Weshalb ist es
bei einer Fahrt von A nach B besser,
wenn nicht alle Autobahnen über
einen Knoten laufen?)
Abbildung 1:
Zentrales, dezentrales und verteiltes
Knotennetz (v.l.n.r.).
Aufgabe 2.3
Beschreibe das Verfahren der Direktvermittlung anhand des Beispiels
links mit der Paketvermittlung.
„Am Anfang schuf die ARPA das
ARPANET.
Und das ARPANET war wüst und leer.
Und es war finster in der Tiefe.
Und der Geist der ARPA schwebte über
dem Netzwerk, und die ARPA sprach:
„Es werde ein Protokoll.“ Und es ward
ein Protokoll.
Und die ARPA sah, dass es gut war.
Und die ARPA sagte:“Es seien mehr
Protokolle.“ Und es geschah so. Und
die ARPA sah, dass es gut war. Und die
ARPA sagte:“Es seien mehr Netzwerke.“
Und so geschah es.“ [38]
Zusammenfassung
Paketvermittlung
Um das Prinzip der Paketvermittlung und des verteilten Netzwerkes besser zu verstehen, soll hier ein Vergleich mit einem Umzug
herangezogen werden:
Bei einem Umzug finden unmöglich alle Möbel in einem Auto
platz. Also verteilen du und deine Freunde, die dir beim Zügeln
helfen, das Mobiliar auf mehrere Fahrzeuge. Um den Überblick
nicht zu verlieren, schreibt ihr die Zügelkisten an. Genauso funktioniert das Verschicken von Informationen durch ein Netzwerk:
Die Information wird in kleine Stücke (Pakete) aufgeteilt, welche
alle beschriftet werden. Dann fahren sie los: Zuerst geht’s von der
Einfahrt auf die Quartierstrasse, danach auf die Hauptstrasse, von
dort auf die Schnellstrasse und schliesslich auf die Autobahn. In
einem Netzwerk gehen die Nachrichten vom PC zuerst in ein lokales Netzwerk (LAN), dann in ein MAN, von dort in ein WAN und
schliesslich laufen sie über ein Backbone. Es spielt jedoch keine
Rolle, welches Auto welche Route wählt oder welches wann ankommt. Entscheidend ist einzig und allein, dass alle am Zielort
eintreffen. Das Auto welches als erstes losgefahren ist, kann also
durchaus auch als letztes ankommen (macht nichts: Die Zügelkisten sind ja angeschrieben und müssen nicht in der richtigen Reihenfolge ankommen.). Deine Freunde, welche die Autobahn nicht
kennen, benutzen dafür ein GPS und werden so automatisch zum
richtigen Ort geführt. Die Datenpakete werden durch das Internet
Protocol zum Zielort geführt. Am Ziel wird kurz kontrolliert, ob
alle eingetroffen sind, dann geht’s ans Auspacken. Die Kisten sind
angeschrieben und können so effizient in die neuen Zimmer gebracht werden. Ein grosses Büchergestell, das wegen seiner Grösse
in mehreren Kisten transportiert werden musste, kann nun wieder
zusammengesetzt werden. Das TCP (Transmission Control Protocol) sorgt dafür, dass die Information am Zielort wieder in der
richtigen Reihenfolge zusammengesetzt wird. Zusätzlich kontrolliert es, ob auch alle Pakete angekommen sind und fragt fehlende
einzeln noch einmal an.
Unterscheidung Internet – WWW
Das Internet und das World Wide Web sind nicht dasselbe. Das
Internet ist die Hardware (die Infrastruktur, welche die verschiedenen Rechner miteinander verbindet). Das WWW hingegen ist die
Software (also das Programm, das verwendet wird um Seiten, die
auf den Rechnern liegen, miteinander zu einem „weltweiten Netz
an Webseiten“ zu verknüpfen). Die Seiten des WWW sind durch
Links miteinander verknüpft.[37]
10
3. Wie funktionieren Suchmaschinen?




Archiv
Web-Suchmaschinen
Meta-Suchmaschine
Index





den Unterschied zwischen einem Verzeichnisdienst und
einer Suchmaschine.
wie eine Suchmaschine den Index erstellt.
was bei einer Suchanfrage passiert.
einige Kriterien, mit denen die Relevanz der Suchergebnisse bewertet wird.
was der PageRank bedeutet und was nicht.
Als alles unübersichtlich wurde…
Vor noch gar nicht so langer Zeit gab es keine Suchmaschinen.
Jetzt wirst du dich wahrscheinlich fragen warum? Ganz einfach:
Man brauchte keine. Zu klein war die Zahl der existierenden Webseiten. Doch dann, als in den Neunzigerjahren die Anzahl an Seiten im Internet immer grösser und das gesamte Netz unübersichtlich wurde,[39] musste eine Lösung auf den Tisch um schneller an
Informationen zu kommen. Irgendwie musste die unüberblickbare
Flut an Informationen in vernünftiger Zeit durchsucht werden können.
Aufgabe:

Überlege dir, wie du ausserhalb des Internets nach Informationen suchst. Versuche dabei vor allem auf die zwei
folgenden Fragen einzugehen:
- Wo suchst du?
- Wie findest du dich in diesen Medien zurecht?
11
 die Google-Gründer am Anfang
für ihre Suchmaschine einfache
Computer verwendet haben?
 heute hingegen ein Google Rechenzentrum eigene Kühltürme für
die Rechner hat und den Strom einer Kleinstadt verbraucht?
Suchmaschinen für…
Definition einer Suchmaschine:
- Websites: http://www.google.ch/
- Dokumente: http://docmazy.com/
- Bilder:
http://www.google.ch/imghp
- Musik: http://www.playlist.com/
- Videos: http://www.youtube.com/
Eine Suchmaschine ist in erster Linie ein Programm das nach Informationen sucht. Diese Suche kann einerseits auf nur einem
Rechner stattfinden oder sich über ein ganzes Netzwerk, wie z.B.
das Internet, erstrecken. Unter dem Begriff Informationen werden
Webseiten, Dokumente, Bilder, Musik- und Filmdateien zusammengefasst. Mit Suchmaschinen sucht (und findet) man also Informationen in den unüberschaubaren Tiefen des Internets.
Aufgabe 3.1
Suchmaschine ist nicht gleich Suchmaschine…
Diskutiert die Vor- und Nachteile von
Katalog-Diensten im Gegensatz zu
Websuchmaschinen und erstellt davon eine Tabelle. Beachtet folgende
Punkte:
Wie du sicher schon erahnen wirst, gibt es für diese verschiedenen
Anforderungen auch unterschiedliche Arten von Suchmaschinen.
Und wie du auch schnell sehen wirst, verdient nicht einmal jede
den Namen Suchmaschine.
Es gibt verschiedene Arten von Suchmaschinen…
Effektivität, Subjektivität, Aktualität,
Vollständigkeit, Kosten.
-
Kataloge:
Excite, All One Search.
Websuchmaschinen:
Google, Yahoo!, Bing, Alta Vista.
Metasuchmaschine:
Ixquick, Meta Crawler.
Vertikale Suchmaschine:
Tucows, Medivista.
Man kann Suchmaschinen anhand von verschiedenen Kriterien
unterscheiden. Ein erstes bezieht sich auf die Daten, welche das
Programm sucht (Websites, Dokumente, Bilder, Musik, Videos).[40] Beispiele dazu findest du rechts (oberes blaues Textfeld).
Ein weiteres Kriterium untersucht den Ursprung der Information:[41] Beispiele zu den unterschiedlichen Arten von Suchmaschinen findest du wieder rechts (im unteren blauen Textfeld).




Bei Katalogen (auch Verzeichnis genannt) tragen Menschen von Hand eine Zusammenstellung von verschiedenen Seiten nach Themen sortiert zusammen. Meist nur zu
einzelnen Themenbereichen, manchmal jedoch auch themenübergreifend.[42]
Websuchmaschinen durchsuchen grosse Teile des WWW
nach allen möglichen Themen. Im Vergleich zu Katalogen
werden hier die Seiten jedoch nicht von Hand in den Index
übertragen, sondern von Programmen. Diese Pragramme
(Crawler) durchsuchen das Web vollautomatisch nach
neuen Seiten.[43]
Metasuchmaschinen durchsuchen den Index von mehreren
Suchmaschinen und können so deutlich grössere Bereiche
des WWW abdecken.[44]
Vertikale Websuchmaschinen indexieren nur Seiten zu einem bestimmten Thema und erfassen daher nur einen
Teilbereich des WWW.[45]
12
Bevor wir mit Suchmaschinen irgendetwas suchen können, muss
das Suchprogramm jedoch zuerst einmal einen Index erstellen, in
welchem später gesucht werden kann. Denn Suchmaschinen
durchsuchen nicht bei jeder einzelnen Suchanfrage das gesamte
Web, sondern nur ihren Index.[46] Der Index ist vergleichbar mit
dem Stichwortverzeichnis/Index am Ende eines Buches.[47] Hier
steht auf welchen Seiten die Suchbegriffe vorkommen. Um zu
untersuchen, wie ein Index einer Websuchmaschine erstellt wird,
wollen wir unser Augenmerk jetzt auf das bekannteste und vielleicht auch wichtigste Suchprogramm richten: Google.
Wie funktioniert Google?
Studiere folgende Abbildung und versuche dir die Funktionsweise
einer Suchmaschine mit Hilfe des Textes auf der nächsten Seite
klar zu machen.
Abbildung 2:
Crawler
Zwischenablage
Dokumente
Index
Lexikon
Suchergebnisse
Abbildung 3:
13
Wir betrachten nun den Aufbau einer typischen Websuchmaschine
am Beispiel von Google (Siehe Graphik Seite 13):
Abbildung 4:
Die Rechner der Google-Gründer an
der Stanford University. Auf diesen
einfachen Computern lief die Suchmaschine in den Anfangszeiten.
Mithilfe der Crawler durchsucht Google das Web. Ein Crawler ist
ein Programm, das nichts anderes macht, als bei einer beliebigen
Seite zu starten und dann von da aus den Links zu folgen. Die
besuchten Seiten werden vollständig heruntergeladen und in der
Zwischenablage gespeichert. Die heruntergeladenen Seiten werden
sortiert und auf den Rechnern nach Stichworten abgelegt. Welches
Dokument wo abgelegt wurde, steht im Index. Zusätzlich werden
alle neuen Begriffe in einem Lexikon gespeichert.[48]
Der Ablauf einer Suchanfrage an Google:
Eine Suchanfrage wird über eine Eingabe von Keywords in die
Suchmaske der Seite von google.ch (Query) an den Google Web
Server gestellt. Dieser leitet die Anfrage weiter an den Index
Server, der Seiten sucht, welche die Keywords enthalten. Danach
reicht der Index Server die Abfrage an die Doc Servers weiter.
Diese enthalten die indexierten Seiten. Aus allen Seiten, welche zu
den Stichwörtern passen, werden mit Hilfe von Bewertungskriterien die Ergebnissseiten (Snippets) zusammengestellt. Die
Snippets werden an den Rechner des Benutzers geschickt. Was
zurückkommt ist die Ergebnisseite, mit den einzelnen Treffern.
Der ganze Prozess dauert selten länger als eine halbe Sekunde.[49]
Abbildung 5:
Google Rechenzentrum in Oregon
(USA) in der Grösse eines Footballfeldes.
Aufgabe 3.2
Auf dem Pausenhof geht ein neues
Gerücht um. Diskutiert in Gruppen,
was Kriterien sind diesem Glauben zu
schenken?
Abbildung 3
14
Zusammenfassung
Bewertung
der Relevanz
Aufgabe 3.3
Suchmaschinen
Was
ist Relevanz?
Vergleiche den PageRank von folgenden Seiten miteinander und ziehe
daraus Schlüsse über den Zusammenhang zwischen Qualität und dem von
Google erstellten Ranking:
Im gibt
Es
Zusammenhang
mehrere Arten
mitvon
Suchmaschinen
Suchmaschinen,
taucht
nichtimmer
nur Websuchmawieder der
schinen.Relevanz
Begriff
Aber selbst
auf. bei
Vielfach
diesenwird
gibtvon
es relevanten
unzählige Seiten
und nicht
gespronur
Google.
chen.
Aber
Eine
wasListe
bedeutet
mit verschiedenen
das überhaupt?Suchmaschinen
Um relevant zu sein,
findest
muss
du
im Anhang
eine
Seite oder
(untereinNützliche
Dokument
Links).
denjenigen
Es lohntTeil
sicheiner
auch Information
hier einmal
etwas anderes
enthalten,
der auszuprobieren.
zur Aufklärung der Fragestellung dient. Im Klartext
heisst das, eine Seite ist dann relevant, wenn sie die Frage, die
Suchmaschinen
durchforsten
nichtbeantworten
erst bei einer
Suchanfrage das
hinter deiner Suchanfrage
steckt,
kann.
gesamte Web und finden dann die richtige Seite. Vielmehr wird
vorher
ein Index
erstellt und laufend
aktualisiert,
welcher
Wie
bewerten
Suchmaschinen
die Relevanz
einer
Seite?dann bei
einer Suchanfrage nach den passenden Seiten durchsucht wird.[60]
Um aus den vielen Seiten, die zum gestellten Suchbegriff passen,
Zur relevantesten
die
Relevanzbewertung
zu finden,
werden
gibt es
unterschiedliche
für Suchmaschinen
Kriterien
verschiedeheran[61]
gezogen.
ne
Möglichkeiten,
Nicht nur
welche
der PageRank,
meistens alle
sondern
miteinander
auch der
angewandt
Abstand
zwischenSo
werden.
zwei
kann
Suchbegriffen,
z.B. der Abstand
die Position
von zwei
derSuchbegriffen
Suchbegriffe innerin eihalb Dokument
nem
des Dokuments,
relativder
mitStandort,
dem Abstand
von wo
in anderen
aus die Dokumenten
Suchanfrage
[50]
gestellt wird,
verglichen
werden.
das Dateiformat,
Da sich dieses
die Aktualität
Kriterium
und
aufbei
den
Google
Text einer
neu[62]
erdings
Seite
bezieht,
auch die
nennt
Ladegeschwindigkeit
man es auch textbezogenes
einer Seite.
Relevanzkriterium.
Mehr dazu in Kapitel vier. Es gibt jedoch noch unzählige weitere
PageRank
Kriterien zur Berechnung der Relevanz. So benutzt Google insge[51]
samt
über 200 verschiedene
geheime)
Kriterien.
Das
Das Wichtigste
am PageRank(meistens
ist nicht die
Berechnung
zu kennen,
sicher
bekannteste
davon
ist
der
PageRank.
sondern seine Bedeutung:
Er sagt nichts
die Qualität
aus, sondern einzig und
Löseüber
nun Aufgabe
3.3 einer
bevorSeite
du weiterliest.
allein etwas über ihre Wichtigkeit. Dies solltest du für das Kapitel
fünf im Hinterkopf behalten. Beim Erstellen von Suchstrategien
PageRank
gilt es dies zu beachten.
Beim PageRank Verfahren wird eine Seite aufgrund von den Seiten, die auf sie verweisen, bewertet. Je mehr sogenannte Links
(oder Backlinks genannt) eine Seite bekommt, desto höher ist ihr
Wert. Natürlich spielt es eine nicht unwesentliche Rolle was für
Seiten auf sie verweisen: Je höher der Wert der verweisenden Seite, desto grösser der Anstieg bei der anderen Seite. Der PageRank
wird also vererbt.[52]
Der PageRank sagt jedoch rein gar nichts über die Qualität einer
Seite aus, sondern nur etwas darüber wie beliebt oder bekannt eine
Seite ist.[53] So gesehen sagt der PageRank auch etwas über die
Wichtigkeit einer Seite aus. Aber Achtung: Dadurch werden unbekannte Seiten benachteiligt und somit eher nicht gefunden.
15









www.ethz.ch
www.ksrychenberg.ch
www.sf.tv
www.blick.ch
www.nytimes.com
www.nzz.ch
www.google.com
www.google.ch
www.yahoo.com
Den PageRank jeder Seite kannst du
hier herausfinden:
http://www.databasesearch.com/sys/pre-check.php
Gib dazu im Feld „Prüfe URL“ die
Internetadresse ein, gib den auf der
Seite angezeigten Code ein und klicke
anschliessend auf „Prüfung starten“.
Die Bewertung wird mit einer Zahl
zwischen 1 und 10 ausgedrückt. Dabei bedeutet 10 hervorragend und 1
schlecht.
 Der PageRank sagt nichts über die
Qualität einer Seite aus.
 Sondern nur über die Wichtigkeit.
 Unbekanntere Seiten werden durch
den PageRank benachteiligt.
Aufgabe 3.4[58]
Berechne den PageRank für die Seite
A. Jeder Pfeil stellt einen Link dar.
Die Seiten B, C und D haben einen
PageRank von 1. Der Dämpfungsfaktor wird auf 0.85 gesetzt:
B
Die folgende Seite ist freiwillig. Sie ist entweder für etwas
schnellere oder für besonders interessierte Schüler gedacht.
Wenn du sie nicht bearbeiten willst, kannst du sie überspringen
und direkt zur Zusammenfassung auf Seite 15 übergehen.
Berechnung des PageRanks
Der PageRank drückt im Grunde nichts anderes aus, als die Wahrscheinlichkeit, dass eine Seite besucht wird.
D
A
C
Abbildung 6
NICE TO KNOW:
Der PageRank hat seinen Namen nicht
etwa von den Seiten, die er bewertet,
sondern von seinem Erfinder Larry
Page.[59]
Angenommen jemand der im Internet „surft“ startet willkürlich auf
irgendeiner Seite und folgt dann immer den Links, so drückt der
PageRank der nächsten Seite aus, wie gross die Wahrscheinlichkeit
war auf dieser und nicht auf einer anderen Seite zu landen.[54] Nur
rechnet man diese Wahrscheinlichkeit nicht wie in unserem Beispiel von nur einer Seite (Startseite des „Surfers“) sondern von
allen Seiten, die einen Link zu dieser Seite gesetzt haben.
Angenommen wir haben zwei Seiten (Seiten B und C), welche
auf eine dritte Seite (Seite A) verweisen. N steht für die Anzahl
der gesamten Links, welche auf der jeweiligen Seite gesetzt
sind. PR ist der PageRank der Seiten. Die Folgende vereinfachte Formel besagt zur Berechnung des PageRanks also:
Der PRA ist definiert durch den PageRank der darauf verweisenden Seiten dividiert durch ihre gesamte Anzahl ausgehender
Links (N).
d = Dämpfungsfaktor, definiert zwischen 0 und 1.
Gewöhnlich auf 0.85 gesetzt.[55]
N = Anzahl der ausgehenden Links.[56]
Diese Berechnung ist natürlich stark vereinfacht. In Wirklichkeit
setzt sich die Formel zur Berechnung des PageRanks aus über 500
Millionen Variablen und zwei Milliarden Ausdrücken zusammen.[57]
16
Zusammenfassung
Aufgabe 3.5
Suchmaschinen
Suche je ein Verzeichnisdienst, eine
Schweizer Websuchmaschine, eine
internationale Suchmaschine (nicht
Google, Yahoo! oder Bing), eine Meta-Suchmaschine und eine vertikale
Suchmaschine.
Es gibt mehrere Arten von Suchmaschinen, nicht nur Websuchmaschinen. Aber selbst bei diesen gibt es unzählige und nicht nur
Google. Eine Liste mit verschiedenen Suchmaschinen findest du
im Anhang (unter Nützliche Links). Es lohnt sich auch hier einmal
etwas anderes auszuprobieren.
Suchmaschinen durchforsten nicht erst bei einer Suchanfrage das
gesamte Web und finden dann die richtige Seite. Vielmehr wird
vorher ein Index erstellt und laufend aktualisiert, welcher dann bei
einer Suchanfrage nach den passenden Seiten durchsucht wird.[60]
Zur Relevanzbewertung werden unterschiedliche Kriterien herangezogen.[61] Nicht nur der PageRank, sondern auch der Abstand
zwischen zwei Suchbegriffen, die Position der Suchbegriffe innerhalb des Dokuments, der Standort, von wo aus die Suchanfrage
gestellt wird, das Dateiformat, die Aktualität und bei Google neuerdings auch die Ladegeschwindigkeit einer Seite.[62]
PageRank
Das Wichtigste am PageRank ist nicht die Berechnung zu kennen,
sondern seine Bedeutung:
Er sagt nichts über die Qualität einer Seite aus, sondern einzig und
allein etwas über ihre Wichtigkeit. Dies solltest du für das Kapitel
fünf im Hinterkopf behalten. Beim Erstellen von Suchstrategien
gilt es dies zu beachten.
17
Aufgabe 3.6
Vergleiche die Grösse des Index von
Google, Ixquick und Lycos mit den
Suchanfragen „Taio Cruz“ und „the“.
Aufgabe 3.7
Suche in den Suchmaschinen Google,
Yahoo! und Ixquick nach dem Begriff
„facebook“ und stelle Unterschiede
bei den Top Ten-Platzierungen fest.
 Googles Index mehr als 25 Milliarden Seiten umfasst?
 die Seltenheit, dass man bei einer
Suchanfrage nur ein einziges Resultat zurück bekommt, einen eigenen Namen trägt?
4. Effizientes Suchen.




Rangierung
Katalog vs. Suchmaschine
Wie suche ich im Internet nach Informationen?
Suchstrategie






wie sich die Relevanzkriterien konkret auf meine Suchresultate auswirken.
wann ich einen Katalog und wann ich eine Suchmaschine
verwenden soll.
zwei Suchstrategien, die bei jeder Suchanfrage effizient
zum Ziel führen.
wie man mit einfachen Operatoren umgeht.
wie man die erweiterte Suche einsetzt und wie ich in kurzer Zeit komplizierte Suchanfragen formulieren kann und
so schneller zur gesuchten Information komme.
dass auch das Suchen etwas Übung braucht.
Die Internetrecherche schneller und besser machen…
Im Internet findet man alles! Ok, zugegeben, alles ist ein bisschen
übertrieben. Aber sehr, sehr vieles lässt sich im Internet finden.
Deutlich mehr als du dir vorstellen kannst. Das einzige Problem
dabei? Viele Leute wissen nicht, wie sie suchen müssen, um an
dieser Unmenge an Informationen teilzuhaben. Wenn man nämlich
wüsste wie, würde man innert kürzester Zeit genau das finden, was
man wissen will. Damit du diesem Ziel zumindest etwas näher
kommst, werden wir im folgenden Kapitel zwei Suchstrategien
anschauen, die gepaart mit dem Wissen, wie man Anfragen richtig
formuliert, in vielen Fällen zum Ziel führen.
Aufgabe:
 Überlege dir wie lange du im Internet suchst, wenn du etwas
wissen willst? Eine Suchanfrage lang? Zehn Minuten? Oder gar
bis du es gefunden hast?
 Hast du bei der Internetrecherche eine feste Strategie oder
suchst du einfach mal drauf los?
18
Rangierungsprinzipien
Aufgabe 4.1[64]
Um zu wissen wie man effizient sucht, müssen wir zuerst die Rangierungsprinzipien von Suchmaschinen etwas genauer unter die
Lupe nehmen. Im Unterkapitel Relevanz hast du schon einiges
über die Relevanzbewertung, die ein Suchprogramm durchführt,
erfahren.
Eingabe:
Taio Cruz Break Your Heart Lyrics
Ein weiteres wichtiges Kriterium ist das Vorkommen von sogenannten Schlüsselwörtern im Text einer Seite.[63] Doch nicht nur
dort, sondern bereits auf der Ergebnisseite sieht man in den kurzen
Ausschnitten der Websites, dass die Suchbegriffe fett markiert
sind. Du wirst dir die sechs wichtigsten Rangierungsprinzipien in
den Aufgaben 4.1 bis 4.6 selbständig erarbeiten. In den Lösungen
findest du anschliessend die korrekten Kriterien. Im obersten Textfeld siehst du jeweils die gestellte Suchanfrage mit den Stichworten. Danach folgen zwei weitere Textfelder, mit den Stichworten
fett markiert. Du must nun entscheiden, weshalb das obere Textfeld besser zur gestellten Suchanfrage passt. Daraus formulierst du
dann ein Rangierungsprinzip. Jede Aufgabe behandelt ein Rangierungsprinzip. Halte deine Ergebnisse wie immer schriftlich fest.
1. Treffer:
Original Lyrics. Break Your Heart.
2. Treffer:
Download Taio Cruz Pop, R&B, Hip
Hop music singles.
Aufgabe 4.2
Eingabe:
Roger Federer
1. Treffer:
Roger Federer hat zum 5. Mal die ATPFinals gewonnen. Mit diesem Sieg hat
Roger Federer…
2. Treffer:
Roger Federer ist ein Schweizer Tennisspieler.
Löse nun die Aufgaben 4.1 bis 4.6 bevor du hier weiterliest.
Aufgabe 4.3
Neben diesen sechs Kriterien die den Inhalt betreffen, gibt es auch
noch solche, die vom Inhalt unabhängig sind. Das können Ranking-Verfahren, wie etwa der PageRank sein. Aber auch solche
wie die Anzahl der Zugriffe auf die Seite. Seiten, welche häufiger
angeklickt werden, sind auf der Ergebnisseite sicher weiter oben
zu finden als andere. Somit ergibt sich ein ewiger Kreislauf, denn
Seiten die auf der Ergebnisseite weiter oben angezeigt werden,
werden wiederum häufiger angeklickt.
19
Eingabe:
Nati WM Vorbereitung Feusisberg
1. Treffer:
Die Schweizer Nati hat in Feusisberg mit
der Vorbereitung auf das…
2. Treffer:
Die Schweizer Fussball-Nati testet im
Rahmen der WM-Vorbereitung gegen
Uruguay.
Aufgabe 4.4
Alles eine Frage der richtigen Suchstrategie
Eingabe:
Champions League
Die eben neu gelernten Rangierungsprinzipien, welche bei den
meisten Suchmaschinen verwendet werden, helfen uns, sich in die
Funktionsweise eines Suchprogramms einzudenken und so für jede
Suchanfrage die optimale Strategie zu entwickeln.
1. Treffer:
Wetten zur UEFA Champions League.
2. Treffer:
Perhaps one of the oddest champions in
the League of Legends is the yordle
known as Amumu.
Aufgabe 4.5
Eingabe:
Usain Bolt
1. Treffer:
Usain Bolt (* 21. August 1986 im Trelawny Parish) ist ein jamaikanischer
Sprinter.
2. Treffer:
Usain Bolt wird in diesem Jahr keine
Rennen mehr absolvieren. Der herausragende Leichtahlet bricht seine Saison
wegen Rückenbeschwerden vorzeitig ab.
Der Jamaicaner hätte noch an den Meetings in Zürich und Brüssel teilnehmen
sollen.
Aufgabe 4.6
Eingabe:
Xherdan Shaqiri
1. Treffer:
Xherdan Shaqiri (* 10. Oktober 1991 in
Gjilan) ist ein Schweizer Fussballspieler
kosovarischer Herkunft.
2. Treffer:
Er ist einer der grössten Talente im
Schweizer Fussball: Der 18-jährige FCBSpieler Xherdan Shaqiri.
Jedoch gleich vorneweg: Es gibt nicht eine richtige Suchstrategie,
vielmehr erfordert jede Recherche eine etwas anders ausgelegte
Suche. Wir werden uns jetzt zusammen zwei verschiedene Strategien erarbeiten, die beide zum Ziel führen. Anschliessend wirst du
die wichtigsten Operatoren kennen lernen, die von Google unterstützt werden, um die Suchstrategien auch umsetzen zu können.
Zum Abschluss werde ich dir noch die Erweiterte Suche vorstellen. Versuche dich jedoch nicht gleich dort, sondern arbeite dich
Schritt für Schritt durch, denn das Suchen erfordert vor allem eins
– Übung. Du wirst später auch die „Anfänger-Tipps“ gebrauchen.
Strategie 1: Synonyme
1. Überlege dir als erstes, was du genau suchst. Mach dir Notizen,
was du wissen willst. Mit etwas Übung wird dir dieser Teil
leichter fallen und du kannst ihn im Kopf erledigen. Schreibe
dir zu Beginn diesen Schritt präzise auf. Eine Suchmaschine
kann keine Gedanken lesen, du musst also ganz genau umschreiben was du suchst. Dafür musst du dir zuerst selbst darüber im Klaren sein.
2. Denke dich in das Dokument, das du finden willst, ein. Was für
Stichwörter werden darin vorkommen? Wähle den Begriff der
dir am wahrscheinlichsten erscheint. Versuche jetzt dein Vorwissen zu aktivieren. Suche Synonyme zu diesem Begriff. Du
brauchst, wie schon gesagt, ein paar Wörter, die charakteristisch sind für das Dokument oder die Seite die du suchst,
gleichzeitig aber auf möglichst wenigen anderen Seiten vorkommen.
3. Jetzt kommen die Rangierungsprinzipien ins Spiel. Beachte vor
allem die Kriterien eins bis drei. Versuche möglichst viele Wörter zu finden, welche im Zieldokument vorkommen könnten.
Achte darauf, dass sie im Text häufig vertreten sind und versuche sehr spezifische, nicht allgemein verwendete zu finden, die
auf anderen Seiten sehr wahrscheinlich nicht vorhanden sind.
4. Jetzt erst gibst du deine Suchbegriffe in die Suchmaske von
Google ein. Die Reihenfolge der Wörter ist egal.
5. Überfliege die Suchresultate (Titel, Zusammenfassung, Internetadresse).
20
6. Ist keines dabei, das dir die relevanten Informationen liefert, so
gehe zurück zu Schritt 2.
Suchstrategie 2: Verfeinern
1. Als erstes machst du dir wieder darüber Gedanken, was du genau wissen willst. Notiere es wieder auf einem Blatt Papier.
2. Überlege dir ein Stichwort, welches möglichst charakteristisch
ist für die Seite die du suchst.
3. Dann geht’s schon ab ins Netz. Gib den Suchbegriff in die
Suchmaske der Suchmaschine ein.
4. Überfliege wieder die Suchresultate (Titel, Textausschnitt, Internetadresse).
5. Wenn du mit dem Ergebnis nicht zufrieden bist, was sehr wahrscheinlich ist, versuchst du ein Stichwort hinzuzufügen. So dass
deine Suche eingeschränkt wird. Das siehst du ja anhand der
Anzahl der Treffer, die das Suchprogramm anzeigt. Wie genau
man Suchbegriffe hinzufügt, wird im Abschnitt Einfache Operatoren erklärt.
6. Verfeinere deine Anfrage solange, bis du zur gewünschten Information kommst.
Du fragst dich wahrscheinlich, warum du bei dieser Methode nicht
gleich von Anfang an mit mehreren Suchbegriffen arbeiten kannst.
Das wirst du mit der Zeit können. Für den Beginn ist es jedoch
ganz gut, wenn du siehst, wie die Suchmaschine auf veränderte
Suchanfragen reagiert.
Merke:
Du siehst, man kann beide Suchtechniken verwenden, um ans Ziel
zu kommen. Es ist auch etwas eine „Geschmackssache“, welche du
lieber verwendest. Du kannst natürlich auch deine eigene Suchstrategie entwickeln.
Im nächsten Unterkapitel werden wir die Operatoren behandeln.
Mit der Hilfe von Operatoren können wir noch genauere Abfragen
formulieren.
Aufgabe 4.7
Im Jahresbericht der KS Rychenberg
sind Klassenlisten aufgeführt. Suche
die Liste deiner Klasse (über die
Suchmaske in Google und nicht über
die Homepage der Schule).
TIPP:
Wenn du in einem Themengebiet
suchst, über welches du kein eigenes
Vorwissen besitzt, so kann Wikipedia
eine gute Hilfestellung leisten. Gib
einfach das Hauptstichwort (siehe
Schritt 2) in Wikipedia ein und überfliege die Seite nach weiteren Schlüsselwörtern.
Aufgabe 4.8:
Suche mit Hilfe von Suchstrategie 2
eine Seite die Kino- und Fernsehprogramme aus der Schweiz publiziert.
TIPP:
Es ist sehr wahrscheinlich – vor allem
am Anfang, dass du mehrere Suchanfragen starten musst um zum Ziel zu
kommen. Habe also etwas Geduld und
nimm dir die nötige Zeit.
Aufgabe 4.9
Katalog oder Suchmaschine?
1. Petrologie
2. Schauspieler, der in der Fernsehserie „Two and a Half Men“ den
Jungen „Jake“ spielt.
3. Du möchtest dich über alle
Schweizer Universitäten erkundigen.
4. Liste aller Schweizer Olympiasieger
21
Aufgabe 4.10
Einfache Operatoren[65]
Suche mit Hilfe der Operatoren nach
Ballsportarten, nicht aber nach Fussball.
Logische Operatoren sind eigentlich nichts anderes, als „mathematische Rechenarten“. Sie werden auch Boolsche Operatoren genannt, nach George Boole.[66] Sie verknüpfen die verschiedenen
Suchbegriffe miteinander. Die gängigsten Google-Operatoren sind:
Klein schreiben
Du kannst die Stichwörter in der
Google-Suche alle klein schreiben.
Grossgeschriebene Wörter werden automatisch als klein interpretiert.
Aufgabe 4.11
Suche einen Preisvergleichsbericht
über die Produkte aus der Migros und
dem Coop.
Aufgabe 4.12
 AND (kann in Google durch Leerschlag ersetzt werden.)
Der Operator AND verbindet zwei Suchbegriffe miteinander.
So wird ein Dokument gesucht, in welchem die beiden Begriffe
vorkommen.
 NOT
Der Operator NOT (bei Google geht auch einfach ein Minuszeichen) schliesst einen Begriff aus. So wird nach dem ersten
Begriff gesucht, nicht aber nach dem Begriff, der nach dem
Operator steht.
 OR
Mit dem Operator OR wird entweder nach dem einen, oder
nach dem anderen Begriff gesucht.
Erweiterte Suche[67]
Welches der sechs Rangierungsprinzipien könnte man missbrauchen,
so dass eine Suchmaschine eine Website als relevanter einstuft?
Aufgabe 4.13
Suche das weltberühmte Foto, auf
dem Bauarbeiter auf einem Stahlträger des Rockefeller Centers Mittagspause machen.
Abbildung 7
Mit der erweiterten Google-Suche können wir gezielter und
schneller Suchen. Die erweiterte Suche findest du unter:
http://www.google.ch/advanced_search?hl=de.
Abbildung 8:
Bauarbeiter auf Stahlträger.
Auf der nächsten Seite erfährst du im Detail was dir für verschiedene Möglichkeiten zur Verfügung stehen mit der erweiterten Suche. Wir wollen uns im Folgenden auf die nützlichsten Möglichkeiten beschränken: Die Suche nach Sprache, Region, Dateiformat,
Datum, Position, Domains.
22
All diese Optionen kannst du miteinander mischen. Du musst dafür
im hellblau gefärbten Bereich der Googlesuche als erstes die
Suchbegriffe eingeben. Diese funktionieren genau gleich wie die
einfachen Operatoren:
 mit allen Wörtern: Funktioniert genau gleich wie die Suche
mit AND. Liefert Treffer mit allen Stichwörtern. Bsp.: „Fussball, Ballsportarten“. So zeigt Google Seiten an, welche die
Stichworte Fussball und Ballsportarten enthalten.
 mit der genauen Wortgruppe: Sucht nach den Stichworten in
der genauen Reihenfolge. Bsp.: „Übung macht den Meister“.
Diese Anfrage liefert Treffer, welche diese Wörter in derselben
Reihenfolge beinhalten. Alternativ kann die Wortgruppe auch
in der normalen Suchmaske mit Anführungs- und Schlusszeichen gesetzt werden.
 mit irgendeinem der Wörter: Liefert entweder den einen oder
den anderen Suchbegriff. Bsp.: „Fussball, Ballsportarten“ liefert Seiten, welche entweder mit Fussball oder mit Ballsportarten zu tun haben. Funktioniert genau gleich wie „OR“.
 ohne die Wörter: Liefert Suchergebnisse ohne die erwähnten
Wörter. Bsp.: „Fussball“ liefert Seiten auf denen Fussball nicht
vorkommt. Funktioniert genau wie „NOT“. Achtung: Geht nur
wenn du in einem der oberen drei Felder etwas eingibst.
Jetzt hast du die Suchbegriffe eingegeben, nach denen du suchen
möchtest. Nun kannst du deine Suchergebnisse mit den folgenden
Möglichkeiten einschränken:
 Sprache: Hier kannst du deine Treffer auf eine Sprache beschränken. Zum Beispiel auf Deutsch.
 Region: Hier kannst du deine Suchergebnisse auf ein Land beschränken. Zum Beispiel nur Schweizer Treffer.
 Dateiformat: Um nach einem gewissen Format zu suchen. Zum
Beispiel nur nach Word-Dokumenten: Einfach „Microsoft
Word (.doc)“ auswählen.
 Datum: Wenn du nach Seiten suchst, die z.B. im letzten Monat
in den Index aufgenommen wurden, einfach „im letzten Monat“
auswählen.
 Position: Mit dieser Funktion kannst du den Ort auf der Seite
bestimmen, an dem dein Suchbegriff gefunden werden sollte.
Z.B. in der Internetadresse. Dafür einfach „in der URL der Seite“ wählen.
 Domains: Hier kannst du z.B. nach Seiten suchen, welche die
Domain „.com“ haben. Einfach „.com“ eingeben.
23
Googlewhack[68]
Einen Googlewhack schafft man wohl
sehr selten. Wenn nach der Eingabe
eines oder zweier Wörter (ohne Anführungszeichen!) als Suchergebnis nur ein
einziger Treffer zurück kommt, spricht
man von einem Googlewhack. Jemanden, der nach solchen Google-whacks
Ausschau hält, nennt man Googlewhacker. Eine Auflistung aktueller
Googlwhacks findet man unter folgendem Link:
http://www.googlewhack.com/tally.pl
Aufgabe 4.14
Wie findest du heraus wer beim 3:3
zwischen dem FC Liverpool und der
AC Milan im Champions League
Final 2005 das 3:2 schoss?
Google ignoriert dich
Deine Google-Suchanfrage darf übrigens höchstens 32 Stichwörter beinhalten. Alles was darüber geht wird von
Google nicht beachtet.
Aufgabe 4.15
Suche alle PDF Dokumente, die
Google in den letzten 24 Stunden
indiziert hat.
Indexgrösse
Auch wenn Google zur tatsächlichen
Grösse seines Indexes schweigt, so
kann man doch erahnen in welchen
Dimensionen sich dieser bewegt. Die
Suche nach „the*“ liefert fast 25.5 Milliarden Treffer. Das Sternchen steht
dabei für ein beliebiges anderes Stichwort.
„Mancher suchet, um zu finden; und
mancher findet, um nicht weiter suchen
zu müssen“[69]
Aufgabe 4.16
Finde einen Plan mit den verschiedenen Buslinien von Winterthur.
Aufgabe 4.17
Wo suchst du um alle Verfilmungen
von „Wall Street“ zu finden?
Zusammenfassung
Rangierungsprinzipien
Es gibt unzählige Rangierungsprinzipien, die von Suchmaschinen
verwendet werden. Teilweise sind diese auch von Suchmaschine
zu Suchmaschine etwas anders. Vor allem die textunabhängigen
Kriterien (z.B.: wie oft eine Seite angeklickt wird) sind für uns
meist unsichtbar. Diejenigen, die jedoch vom Text abhängig sind,
sind für uns direkt wahrnehmbar und auch umso wichtiger für
unsere Suchstrategie. Deshalb beachten wir bei jeder Suchanfrage,
die wir stellen die oben gelernten Rangierungsprinzipien.
Suchstrategien
Es gibt unzählige Suchstrategien und nicht falsche oder richtige.
Wähle deine Strategie der Situation angepasst und nach deinen
Vorlieben.
Katalog versus Suchmaschine
Suchmaschinen – allen voran Google – stellen mittlerweile ein
sehr mächtiges und auch effizientes Suchinstrument dar. Deshalb
ist es vernünftig, in den meisten Fällen auch auf sie zurückzugreifen. In einigen wenigen Fällen jedoch ist es besser, wenn man einen Katalog bemüht. Vor allem, wenn man einen Überblick über
den Inhalt eines Gebietes gewinnen möchte.
Einfache Operatoren
Mit den einfachen Operatoren (-, +) können wir unsere Suchanfragen differenzierter gestalten.
Erweiterte Suche
Mit den erweiterten Suchoptionen eröffnen sich uns ganz neue
Suchmöglichkeiten. Mit der Profisuche schöpfen wir das riesige
Potential, das in Google steckt, noch einen Schritt besser aus, als
mit den einfachen Operatoren. Die Suchmaske der erweiterten
Suche ist ausserdem sehr einfach zu bedienen.
24
5. Gefahren im Umgang mit Google.







Cookies, IP-Adresse
Umgang mit persönlichen Daten, Persönlichkeitsprofile
Google Street View
sichere Browser-Einstellungen
Meinungsfreiheit
Zensur im Internet
Was für verschiedene Suchmaschinen kennst du?






wie und warum Google Daten über seine Benutzer sammelt.
wie ich mich davor schützen kann.
wie ein Cookie funktioniert.
welche Möglichkeiten es gibt im Web anonym zu bleiben.
wo und warum im Internet zensiert wird.
was die Gefahren der Monopolstellung von Google sind.
Google kennt dich besser als du denkst…
Google sammelt Daten – schon seit Jahren. Und erstellt damit Nutzerprofile um die Suchergebnisse zu verbessern. Gefährlich wird
dies vor allem, wenn die Daten der verschiedenen Dienste verbunden würden. Denn dann hätte Google keine Nutzerprofile mehr,
sondern Persönlichkeitsprofile von Millionen von Menschen. So
oder so, Google hat so viele Informationen angehäuft wie niemand
zuvor.
Aufgabe:
Überlege dir wie du dich schützt, wenn du im Internet unterwegs
bist und bearbeite anschliessend das Kapitel.
25
 Google all deine Suchanfragen
speichert?
 Suchergebnisse auch in der
Schweiz zensiert werden?
„Die perfekte Suchmaschine würde
genau erkennen, was der Nutzer meint
und genau die gewünschten Ergebnisse
anzeigen.“[70]
Larry Page, Mitbegründer von Google.
Unter dem folgenden Link kannst du
deine FacebookSicherheitseinstellungen testen:
http://www.reclaimprivacy.org/
Datenschutz
Personalisierte Suche
Wie du in Kapitel zwei gesehen hast, ist es Googles Vision einerseits alle verfügbaren Informationen dieser Welt zusammenzutragen und zu organisieren, andererseits haben die Google-Gründer
den Anspruch ihre Suchmaschine so weit zu perfektionieren, dass
sie alle Fragen beantworten kann.[71] Das Ziel, so Googles Vision,
soll ein Instrument sein, das nicht nur für die Beantwortung einfacher Fragen wie die nach den aktuellen Zugverbindungen, sondern
auch auf Fragen wie: „Welches Auto soll ich kaufen?“ irgendwann
einmal eine Antwort bereit halten soll. Nicht nächstes Jahr, sehr
wahrscheinlich auch nicht in nächster, aber vielleicht in ferner
Zukunft. Was eine Suchmaschine für eine sogenannte personalisierte Suche benötigt, sind Informationen. Informationen über den
Benutzer. Und zwar nicht einmal eine Menge davon. Um obige
Suchanfrage zu beantworten, müsste eine Suchmaschine nur einige
Vorlieben des Benutzers kennen: Sportwagen oder Geländewagen.
Seine Lieblingsfarbe, Lieblingsmarke. Diese drei einfachen Informationen reichen vollständig aus, um dem Benutzer Werbung mit
perfekt auf seine Wünsche zugeschnittenen Angeboten vorzuschlagen. Was ein Autohersteller, der den perfekten Wagen für den
oben erwähnten Benutzer hat, für diese drei einfachen Informationen zahlen würde – unvorstellbar.
Googles Datenerhebung
Abbildung 9: Ein „Choco-Cookie“
Personalisierte Suche ist schon längst Realität. Nicht im grossen
Stil, wie oben beschrieben, aber (bisher) im Kleinen. Was für
Suchresultate angezeigt werden, ist schon jetzt von Person zu Person unterschiedlich. Ein spezielles Cookie (für Erklärung siehe S.
27) mit einer Lebensdauer von 180 Tagen speichert alle Seiten die
du anklickst, alle Stichwörter die du in Google eingibst und wann
du das tust. Darauf basierend sehen die Suchergebnisse bei jedem,
ganz auf seine Vorlieben abgestützt, wieder etwas anders aus.[72]
Aber nebst diesem Cookie sammelt Google noch viel mehr: Zusätzlich zu den gespeicherten Daten für die personalisierte Suche,
speichert der Suchriese Suchanfragen für 18 Monate inklusive IPAdresse, Google-Domain, Zeitpunkt der Suchabfrage, Stichwörter
der Suche und Informationen über den Browser. Da ist es auch ein
schwacher Trost, dass die Lebensdauer der Cookies auf 18 Monate
heruntergesetzt wurde. Zuvor setzte Google Cookies, die bis ins
Jahr 2038 lebten. Denn bei jeder erneuten Suchanfrage beginnen
die 18 Monate von neuem. Wer bei einem Google-Dienst
26
angemeldet ist, der kann über Google Web History all seine Suchanfragen, die jemals gestellt worden waren, nachschlagen. Diese
Daten hat somit auch Google. Wer ein GMail Konto besitzt liefert
dem Unternehmen zu seinen Daten den Namen. Beim E-Mail
Dienst werden alle Nachrichten mitgelesen. Google scannt die
Nachrichten mit einer Analyse-Software auf Stichwörter um in den
Mails Werbung platzieren zu können. Passend zum Inhalt. Wenn
du in einer Nachricht einem Freund von deinen geplanten Ferien
erzählst, ist die Wahrscheinlichkeit hoch, dass darin Werbung von
einem Reisebüro platziert wird. Besonders gefährlich werden diese
Daten, wenn sie miteinander verbunden würden. So liessen sich
ganze Persönlichkeitsprofile erstellen.
Die Cookies, die von Webseiten gesetzt wurden, kannst du in der Regel
auch wieder löschen. Dies kannst du
in deinem Webbrowser tun. Und zwar
unter Tools, Options, Privacy, Cookies. Klicke auf „Show Cookies“.
Jetzt werden alle Cookies angezeigt,
die auf deinen Browser angesetzt
worden sind. Um sie zu löschen,
kannst du einfach „Remove all Cookies“ drücken. Wenn du nach einer
Weile wieder nachschaust, siehst du,
wie schnell welche gesetzt werden.
Schutzmassnahmen
Du bist der Sammelwut des kalifornischen Suchgiganten aber nicht
schutzlos ausgeliefert. Es gibt durchaus ein paar Sicherheitsvorkehrungen, die du treffen kannst, um im Internet Fremden nicht
alles preiszugeben und nicht auf Googles hervorragende Suchmaschine verzichten zu müssen.
 Als erstes solltest du die Cookies in den Griff bekommen. Cookies sind nichts anderes als Informationen in Form von Textdateien, die von bestimmten Webseiten erstellt werden, um Informationen, wie persönliche Einstellungen auf der entsprechenden Webseite zu protokollieren. Diese werden dann auf
dem Browser abgelegt. Das nächste Mal, wenn die Seite aufgerufen wird, kann das Cookies die Informationen an den Server
des Webseitenbetreibers übergeben. Bei einem erneuten Abrufen der Webseite, kann das Cookie zudem den Besucher identifizieren. Dadurch kann man sich zum Beispiel automatisch auf
einer Seite anmelden. Dies kann unter Umständen sehr nützlich
sein. So kann man heutzutage eine Vielzahl an Webseiten nur
noch besuchen, wenn man in den Browsereinstellungen Cookies akzeptiert. So praktisch sie auch sein können, teilweise
stellen sie auch eine Gefahr dar. Vor allem mit langlebigen
Cookies kann der Serverbetreiber der Webseite von den Benutzern ein Nutzerprofil erstellen, die ihm seine Surfgewohnheiten
verraten. Denn beim auswerten der „Kekse“ sieht man was für
Seiten abgefragt worden sind. Auch die E-Mail-Adresse ist, auf
der Webseite einmal eingetragen, im Cookie gespeichert. Dies
kann der Betreiber der Webseite zusammen mit seinem Wissen
über die Vorlieben des Benutzers ausnutzen und gezielte SpamMails an ihn verschicken.[73]
27
Unter den Sicherheitseinstellungen
deines Browsers kannst du einstellen,
wie strikt du mit Cookies umgehen
möchtest. Aber Achtung, wenn du sie
ganz aussperrst, können gewisse
Webseiten nicht angezeigt werden. Es
gilt also einen Kompromiss zu finden
zwischen Sicherheit und Bequemlichkeit.
Aufgabe 5.1
Versuche dich daran zu erinnern, was
du gestern gegoogelt hast? In der
letzten Woche? Im letzten Monat? Im
letzten Jahr? Die letzten 18 Monate?
Wenn du jetzt eine Liste machst mit
all diesen Stichwörtern, weisst du was
Google über dich weiss!
Natürlich kann Google damit keinen
Namen, sondern nur eine Nummer in
Verbindung bringen – sofern du kein
GMail-Konto hast.
Schau auf der folgenden Seite mit und
ohne Proxy nach, was für Informationen du im Web preisgibst:
http://www.whatsmyip.de/
Hier findest du eine Seite mit einigen
Proxy-Servern:
http://www.onionproxy.com/
Auch in der Schweiz wurde und wird
teilweise politisch motivierte Zensur
betrieben. So wurde die Seite
www.appel-au-peuple.org mit einem
richterlichen Beschluss wegen ehrverletzenden Verschwörungstheorien
über die Schweizer Justiz gesperrt.
Mit einem ausländischen ProxyServer kann jedoch weiterhin darauf
zugegriffen werden.[78]
Mit dem China Channel Firefox Addon kann man die chinesische Zensur
nachempfinden.
http://chinachannel.hk/
 Google kriegt neben deinen Suchbegriffen auch noch deine IPAdresse. Dadurch kann er deine Aktivitäten im Netz dir zuordnen. Aber auch dagegen kann etwas getan werden. Mit sogenannten Proxy-Servern. Wenn du mit einem Proxy-Server im
Web unterwegs bist, bleibt deine eigene IP-Adresse geheim. Du
„surfst“ dann sozusagen mit derjenigen des Proxy-Servers.[74]
 Benutze, wenn du nicht anonym im Netz bist, Google (und
auch andere Suchmaschinenanbieter) mit Bedacht. Suchmaschinen sind, auch wenn sie auf den ersten Blick anonym wirken, kein Ort an dem man vertrauenswürdige Sachen deponieren sollte. Gib nicht alles in eine Suchmaschine ein. Eigentlich
solltest du nichts in Google eingeben, was du nicht auch einem
Fremden erzählen würdest.
Zensur
Zensiert wird im Internet nicht nur in Staaten wie China, Burma,
Iran, Saudi-Arabien, Syrien, Kuba, Ägypten, Nord Korea oder dem
Vietnam.[75] Nein, auch in Europa wird zensiert. Zugegeben nicht
in demselben Mass wie in diesen teilweise totalitären Staaten und
auch nicht aus demselben Grund, aber es wird zensiert. Während
in China oder anderswo aus politischen Gründen zensiert wird, so
werden in der westlichen Welt Seiten mit pornographischem Inhalt, Seiten der Kinderpornographie oder rechtsradikale, neosozialistische Seiten zensiert.[76] Sogar die Schweizer Regierung stellt
immer wieder Anfragen gewisse Inhalte entfernen zu lassen. Sie
fordert aber auch immer wieder die Herausgabe von sensiblen
personenbezogenen Daten.[77] In China wird alles zensiert, was der
Regierung nicht genehm ist. Begriffe wie „Free Tibet“ oder „Tian’anmen Massacre“ werden in China von einer Firewall der Zensurbehörde systematisch geblockt. Du fragst dich jetzt sicher, was
das ganze mit Suchmaschinen zu tun haben soll. Eine ganze Menge. Denn in einer Zeit, in der fast in allen Staaten dieser Welt die
Suchergebnisse „geschönt“ werden, wird der Druck auf die Suchmaschinen, allen voran auf Google, immer grösser. Sie werden von
den Regierungen teilweise gezwungen Seiten aus dem Index zu
löschen oder Daten herauszugeben. Suchergebnisse sind also auch
beeinflussbar.
Monopolstellung?
Aufgabe 5.2:
Erkundige dich nach Alternativen zu
Google und probiere sie aus. Im Anhang steht eine Liste mit unzähligen
anderen Suchprogrammen.
Benutze auch einmal eine andere Suchmaschine als Google. Es
gibt unzählige Alternativen. So kannst du etwas vergleichen. Wenn
du danach zum Schluss kommst, Google ist doch die Beste, kannst
du ja immer noch zurückwechseln. Wie sagt man so schön: Abwechslung macht das Leben süss.
28
Zusammenfassung
Datenschutz
Google sammelt Daten, Daten und nochmal Daten. Doch dagegen
kann (und soll) man sich schützen.
Dazu gibt es unterschiedliche Methoden, die natürlich auch kombiniert angewandt werden können:



Alte Cookies löschen und die Einstellungen des Internetbrowsers optimieren.
Sich anonym im Netz bewegen. Entweder durch ein Proxy-Server oder durch einen Anonymizer.
Sich überlegen, was man in die Google Suchmaske eintippt. Denn: Die Google Datenbanken vergessen niemals!
Zensur
In China und anderen totalitären Ländern wird Zensur betrieben.
Gegen alle politischen Feinde. Aber auch in den USA und Europa
wird zensiert. Vorrangig Kinderpornographie, andere pornographische Inhalte, rechtsradikale und andere „populistisch gefährliche“
Seiten. Aber nicht nur. Auch hier werden manchmal Seiten aus den
Suchergebnissen gelöscht, die politisch „nicht korrekt“ sind. Aber
Zensur kann, sofern man von der Seite schon die Internet-Adresse
kennt, umgangen werden. Mit einem Proxy-Server. Der muss
jedoch (in den meisten Fällen) eine ausländische Domain haben,
da Internetprovider – auf Druck von Regierungen – Seiten meistens für eine gewisse Domain sperren (z.B. für alle Computer mit
einer Schweizer IP-Adresse).
Abbildung 10: Googeln in China.
Monopolstellung Google
Über Google laufen vier von fünf Suchanfragen – weltweit![79] Das
bedeutet, dass Google für jeden zweiten Menschen mit einem Internetanschluss die Informationen organisiert.[80] Vorderhand machen so viele Menschen Gebrauch von Google, weil die Suchmaschine den mit Abstand grössten Index hat, am schnellsten ist, die
relevantesten Suchergebnisse liefert, die Startseite und das Layout
allgemein schlicht und einfach ist und Google cool, hip und beliebt
ist. Vielfach kennen die Benutzer jedoch auch gar keine andere
Suchmaschine. Google wurde zum Inbegriff des Suchens. Zurück
zum Thema: Wenn eine Firma den Informationsfluss von beinahe
einer Milliarde Menschen regelt, ist Vorsicht geboten. Denn für die
meisten ist Google die einzige Informationsquelle.
29
Abbildung 11
Anhang A:
a. Glossar:
A:
AdWords
AdWords ist Googles Anzeigensystem mit dem es sein Geld verdient. Mit Adwords kann man zu gewissen Stichwörtern Anzeigeplätze ersteigern, an denen dann die eigene Werbung steht. Die
Werbung ist immer von den Suchergebnissen getrennt in der rechten Spalte platziert.
Archiv
Ein Archiv ist eine Art Katalogdienst, auf den online zugegriffen
werden kann.
B:
Backbone
Das Backbone ist die Autobahn des Internetverkehrs. Ein Backbone kann mit einem riesigen Kabel verglichen werden, durch das die
ganzen Daten laufen.
Bit
Ein Bit ist eine Grösse aus der elektronischen Datenspeicherung.
Daten speichert man durch zwei verschiedene Zustände. Entweder
fliesst Strom oder es fliesst kein Strom durch die Schalter der
Harddisk (Hauptspeicher). Diese beiden Zustände werden mathematisch durch eine 1 oder eine 0 dargestellt. Die Information ob
Strom fliesst oder nicht nennt man ein Bit. Acht Bits ergeben ein
Byte. Um bei grossen Datenmengen besser rechnen zu können, hat
man Bytes weiter zusammengefasst: 1024 Bytes sind ein Kilobyte
(KB), 1024 KB sind ein Megabyte (MB), 1024 MB sind ein Gigabyte (GB), 1024 GB sind ein Terabyte (TB), 1024 TB sind ein
Petabyte (PB) und 1024 PB sind ein Exabyte (EB).
Browser
Ein Browser ist ein Programm für die Darstellung von Webseiten.
Mit ihm navigiert man durch das Web. Beispiele sind: Internet
Explorer, Firefox, Opera oder Safari.
D:
Domain
Als Domain wird ein im Web zusammenhängender Teil bezeichnet. Anhand der Top-Level-Domain sieht man in welchem Land
der Rechner steht.
30
Durchschaltevermittlung
Die Durchschaltevermittlung ist eine Möglichkeit, wie man die
Daten über ein Netzwerk vermitteln kann. Bei der Durchschaltevermittlung wird immer eine Leitung für die Datenvermittlung
oder ein Telefongespräch (die Durchschaltevermittlung kommt aus
der Telekommunikation) freigeschaltet. Dabei kann die Leitung
jeweils nur für einen Datentransfer auf einmal genutzt werden.
Dies änderte sich mit der Paketvermittlung. Bei der die Nachrichten in kleine Pakete aufgeteilt werden und unabhängig zu welchem
Gespräch sie gehören durch die Leitung gehen und am Zielort
wieder zusammengesetzt werden. So kann eine Leitung für mehrere Datentransfers auf einmal genutzt werden.
E:
Exabyte
siehe Bit.
G:
Gateways
Unter einem Gateway versteht man ein Protokollübersetzer. So
können Netzwerke mit unterschiedlichen Protokollen miteinander
kommunizieren.
Glasfaserkabel
Kabel aus Glasfäden mit denen sehr hohe Datenraten übertragen
werden können.
H:
History
In der History sind alle Suchbegriffe gespeichert, die früher einmal
eingegeben worden sind.
Hypertextsystem
Ein Hypertextsystem verbindet verschiedene Seiten durch Links.
So kann man durch das Anklicken von Links auf eine andere Seite
gelangen.
I:
Internetbrowser
siehe Browser.
K:
Knoten
Ein Rechner der über ein Netzwerk mit anderen Rechnern verbunden ist.
31
L:
LAN
LAN steht für Local Area Network. Ein LAN ist ein lokales Netzwerk über das man mit Rechnern Daten austauschen kann. Dies
kann entweder (wie heute üblich) über Wireless-LAN oder über
ein normales LAN mit Netzwerkkabeln sein.
M:
MAN
Ein MAN ist ein Netzwerk, das sich über eine ganze Region erstreckt (Metropolitan Area Network).
P:
Paketvermittlung
siehe Durchschaltevermittlung.
Peer-To-Peer
Ein Peer-To-Peer-Netzwerk steht im Gegensatz zu einem traditionellen Client-Server basierten Netzwerk, bei dem der Server den
Dienst anbietet und der Client ihn nutzt. In einem P2P-Netzwerk
hingegen sind alle Rechner gleichberechtigt. Sie sind vor allem
typisch für Dienste wie Musiktauschbörsen, bei denen alle die
Musik über viele verschieden Rechner gleichzeitig heruntergeladen wird und nicht wie sonst von nur einem Server.
Protokoll
Protokolle sind für die Kommunikation zwischen den verschiedenen Rechnern im Web zuständig. Sie legen fest, wie und in welcher Reihenfolge der Datenaustausch erfolgt.
S:
Spam-Mail
Eine Spam-Mail ist eine Werbemail, welche in der Regel ohne
Zustimmung des Empfängers zugestellt wird.
T:
TCP/IP
Die Protokolle „Transmission Control Protocol“ und „Internet
Protocol“ sind für die Paketvermittlung in Netzwerken zuständig.
Das Internet Protocol schaut, dass die Daten am richtigen Ort ankommen. Das Transmission Control Protocol unterteilt die Nachricht in kleine Pakete, setzt sie am Zielort wieder zusammen und
kontrolliert ob alle Pakete angekommen sind.
32
W:
WAN
Ein Wide Area Network erstreckt sich im Gegensatz zu einem
LAN oder MAN über ein grosses Gebiet. Manchmal sogar über
ganze Regionen oder Länder.
WWW
Unter dem World Wide Web (auch WWW oder einfach Netz genannt) versteht man die Software, welche verwendet wird um die
einzelnen Webseiten miteinander zu verknüpfen. Somit wird das
WWW auch als Hypertextsystem bezeichnet. Die einzelnen Seiten
sind durch sogenannte Hyperlinks (Links) miteinander verbunden.
Wichtig ist die Unterscheidung zwischen dem WWW und dem
Internet. Das Internet ist lediglich die Hardware. Also die Infrastruktur, welche die verschiedenen Rechner, auf welchen die Seiten liegen, mit einander verbindet.
33
b. Nützliche Links
Internationale Suchdienste
Google
Yahoo!
Bing (Microsoft)
All The Web
AltaVista
Northern Light Search
Ask
EntireWeb
http://www.google.com/
http://www.yahoo.com/
http://www.bing.com/
http://www.alltheweb.com/
http://www.altavista.com/
http://www.nlsearch.com/
http://www.ask.com/
http://www.entireweb.com/
Schweizer Suchdienste
The Swiss Search Engine
Google Schweiz
Yahoo Schweiz
AltaVista
Schweizer Homepage Directory
Die Schweizer Suchmaschine
http://www.swisspage.ch/
http://www.google.ch/
http://ch.search.yahoo.com/
http://ch.altavista.com/
http://www.swisspage.ch/
http://www.yoodle.ch/
Meta-Suchmaschinen
Ixquick
Web Crawler
Meta Crawler
Apollo 7
Highway 61
MetaGer
http://www.ixquick.com/
http://www.webcrawler.com/
http://www.metacrawler.com/
http://www.apollo7.de/
http://www.highway61.com/
http://www.metager.de/
Internationale Verzeichnisdienste
Yahoo!
Excite
All One Search
Alles klar
Sharelook
http://www.yahoo.com/
http://www.excite.com/
http://www.allonesearch.com/
http://www.allesklar.de/
http://www.sharelook.co.uk/
Schweizer Verzeichnisdienste
Sharelook
http://www.sharelook.ch/
Vertikale Suchmaschinen International
Software
Filme
Medizin und Gesundheit
Zeitungsartikel
34
http://www.tucows.com/
http://www.imdb.com/
http://www.medivista.de/
http://www.paperball.de/
Vertikale Suchmaschinen Schweiz
Firmen, Produkte, Marken
Schweizer Musikszene
Literapedia
http://www.swissguide.ch/
http://www.music.ch/
http://literapedia.wikispaces.com
Internet-Archive
Zeitungsartikel
FAZ-Archiv
NZZ-Archiv
Die Zeit
Der Spiegel
3Sat-Mediathek
GEO
http://www.paperball.de/
http://fazarchiv.faz.net/FAZ.ein
http://nzz.gbi.de/NZZ.ein
http://www.zeit.de/2010/index
http://www.spiegel.de/
http://www.3sat.de/mediathek/
http://www.geo.de/
Bibliothekskataloge
Schweizer Vitueller Katalog
Deutsche-Internet-Bibliothek
NEBIS
ETH-Bibliothek
Schweizerisches Sozialarchiv
Zentralbibliothek Zürich
Winterthurer Bibliotheken
http://www.chvk.ch/
http://www.internetbibliothek.de/
http://opac.nebis.ch/
http://www.library.ethz.ch/
http://www.sozialarchiv.ch/
http://www.zb.unizh.ch/
http://bibliotheken.winterthur.ch/
Enzyklopädien/Lexika
Wikipedia
Encyclopedia Britannica
Brockhaus Enzyklopädie
Meyers Lexikon Online
One Look
http://en.wikipedia.org/
http://www.britannica.com/
http://www.brockhaus.de/
http://www.iicm.tugraz.at/
http://www.onelook.com/
Wörterbücher
LEO
CANOO
Google Translate
Babelfish
LENGUA
Computer-Wörterbuch
http://www.leo.org/
http://www.canoo.net/
http://translate.google.com/
http://babelfish.yahoo.com/
http://www.lengua.com/
http://foldoc.org/
Abbildung 12:
Titelseite der „Encyclopédie“ von
Diderot und D’Alembert.
35
c. Quellenangabe:
Abbildungen:
Titelbild:
Rechenzentrum: http://farm4.static.flickr.com/3380/3419237278_d5da5f22bb_o.jpg
Google-Logo aus Lebensmittelverpackungen: http://picasaweb.google.com/gblogphotos/ Googley
ArtWalls?feat=flashalbum#5509770875559110002
Abbildung 1:
http://interaktiv.mlpd.de/rf0502/rfart15.htm
Abbildung 2:
Graphik zur Funktionsweise von Google. Aus der Doktorarbeit der Google-Gründer übernommen
(stark vereinfacht): http://infolab.stanford.edu/~backrub/google.html
Abbildung 3:
http://www.google.ch/intl/de/corporate/tech.html
Abbildung 4:
http://geektechnique.org/media/google/googlehardware.html
Abbildung 5:
http://communication.howstuffworks.com/google-docs5.htm
Abbildung 6:
Graphik (leicht modifiziert) übernommen aus: Hübener, Markus: Suchmaschinenoptimierung kompakt. Heidelberg 2009. S. 18.
Abbildung 7:
http://www.suchfibel.de/2kunst/feldsuche.htm
Abbildung 8:
http://lequattrostagioni.wordpress.com/2009/11/06/1931-2001-bilder-die-bewegen/
Abbildung 9:
http://commons.wikimedia.org/wiki/File:Choco_chip_cookie.jpg
Abbildung 10: http://bureau.comandantina.com/archivos/2006/02/
Abbildung 11: http://marketgoodstocks.com/humor-news/google-china-changing-im-feeling-lucky-to-im-feelingcommunist/
Abbildung 12: http://en.wikipedia.org/wiki/File:ENC_1-NA5_600px.jpeg
Endnoten:
[1]
Viele glauben der Brite Donald Davies hätte das Paketvermittlungsverfahren als erster entdeckt. Fakt ist
aber: Er war zwar der Namensgeber des neuartigen Verfahrens, der Amerikaner Paul Baran hatte dieses jedoch zuerst entwickelt. Er erfuhr jedoch nicht dieselbe Unterstützung der Telefongesellschaften wie sein
englischer Konkurrent, da die amerikanische Telefongesellschaft AT&T vorerst kein Interesse an der
Technik der Paketvermittlung hatte. Siehe dazu: Wikipedia, Die freie Enzyklopädie, „Packet switching“,
Bearbeitungsstand: 14.10.2010, 18:13 UTC. http://en.wikipedia.org/wiki/Packet_switching (17.10.10).
Oder auch in: Hafner, Katie und Lyon, Matthew: ARPA KADABRA oder die Anfänge des Internet. Heidelberg 2008. S. 72-75.
[2]
H'obbes' Zakon, Robert: Hobbes‘ Internet Timeline 10. http://www.zakon.org/robert/internet/timeline/
(17.10.10).
[3]
Hafner und Lyon S. 198.
36
[4]
H'obbes' Zakon, Robert: Hobbes‘ Internet Timeline 10. http://www.zakon.org/robert/internet/ timeline/
(17.10.10). Oder folgende Seite: California State University Dominguez Hills: ARPANET maps.
http://som.csudh.edu/fac/lpress/history/arpamaps/f8sep1971.jpg (17.10.10). Auf letzterer sind zwar 18
Hosts zu sehen. Drei davon scheint jedoch eine Sonderfunktion zuzukommen und sind auf der Karte mit
einem „T“ versehen. Gut möglich, dass auch die erste Seite vom selben Bericht (ARPANET Completion
Report) ausgeht, die drei speziellen Hosts jedoch nicht mitzählt.
[5]
Hafner und Lyon S. 210.
Die meisten Amerikaner erfuhren zum ersten Mal überhaupt von der Existenz des ARPANET im Jahre
1975. Und zwar durch einen Skandal: Militärische Geheimdienste sammelten während der Zeit des Kalten
Krieges Informationen wie selten zuvor. Sie hatten nicht nur Daten über den kommunistischen Osten, sondern auch innerhalb der USA wurden die örtlichen Geschehnisse vom Pentagon aus genau mit verfolgt. Als
dies 1972 an die Öffentlichkeit kam, wurde die Löschung dieser Daten verlangt. 1975 gingen jedoch Behauptungen umher, wonach die Daten gar nicht gelöscht, sondern vom Geheimdienst an einen anderen Ort
geschickt worden waren – per ARPANET. Siehe dazu Ebd. S. 274.
[6]
Weiterführende Lektüre zu den Internet-Protokollen TCP/IP: Universität Karlsruhe: TCP/IP.
http://www.lehrer.uni-karlsruhe.de/~za151/netz/tcpip.html (17.10.10).
[7]
Hafner und Lyon S. 264–269.
[8]
Wikipedia, Die freie Enzyklopädie, „NORSAR“, Bearbeitungsstand: 14.05.2010, 12:49 UTC.
http://en.wikipedia.org/wiki/NORSAR (17.10.10).
[9]
Hafner und Lyon S. 10. Entkräftet den weitverbreiteten Mythos über die Ziele des ARPANET.
Oder auch: Internet Society: A Brief History oft he Internet.
http://www.isoc.org/internet/history/brief.shtml (17.10.10)
Auch ein ehemaliger Direktor der DARPA (ehemals ARPA) konnte den Mythos, das ARPANET sei nur
als Kommunikationsmöglichkeit nach einem nuklearen Anschlag erbaut worden, als falsche Annahme erklären: About.com: Charles Herzfeld on ARPANET and Computers. http://inventors.about.com/library/
inventors/bl_Charles_Herzfeld.htm (17.10.10).
[10]
Hafner und Lyon S. 176f.
[11]
Wikipedia, Die freie Enzyklopädie, „EUnet“, Bearbeitungsstand: 05.07.2010, 11:49 UTC.
http://en.wikipedia.org/wiki/EUnet (17.10.10).
[12]
Wann genau der Begriff Internet aufkam, ist schwierig zu sagen, da das Aufkommen eines Begriffes selten
dokumentiert wird und oftmals einen langsamen Prozess darstellt, der sich über Jahre hinweg ziehen kann.
Es wird jedoch vermutet, dass er Mitte der 80er-Jahre populär wurde. Zudem hatte sich eine Unterscheidung zwischen Gross- und Kleinschreibung entwickelt: Ein „internet“ war ein privates, kleines Netzwerk,
das TCP/IP benutzte. Das „Internet“ schafte es zum festen Begriff, wie die Grossschreibung in englischer
Sprache verrät und ist definiert als das grosse, staatliche Netzwerk. Man könnte es auch Backbone nennen.
Siehe dazu: Hafner und Lyon S. 289.
[13]
Wikipedia, Die freie Enzyklopädie, „TAT-8“, Bearbeitungsstand: 26.08.2010, 19:38 UTC.
http://en.wikipedia.org/wiki/TAT-8 (28.11.10).
[14]
Hafner und Lyon S. 301–303.
37
[15]
Wikipedia, Die freie Enzyklopädie, „Archie“, Bearbeitungsstand: 18.05.2010, 11:29 UTC.
http://de.wikipedia.org/wiki/Archie (17.10.10).
[16]
H'obbes' Zakon, Robert: Hobbes‘ Internet Timeline 10. http://www.zakon.org/robert/internet/ timeline/#1990s (17.10.10).
[17]
Wikipedia, Die freie Enzyklopädie, „WWW“, Bearbeitungsstand: 25.09.2010, 22:20 UTC.
http://de.wikipedia.org/wiki/World_Wide_Web (17.10.10).
Oder auch: Hafner und Lyon S. 305f.
[18]
Wikipedia, Die freie Enzyklopädie, „Chronologie des Internets“, Bearbeitungsstand: 14.09.2010, 20:55
UTC. http://de.wikipedia.org/wiki/Chronologie_des_Internets (17.10.10).
[19]
Wikipedia, Die freie Enzyklopädie, „Chronologie des Internets“, Bearbeitungsstand: 14.09.2010, 20:55
UTC. http://de.wikipedia.org/wiki/Chronologie_des_Internets (17.10.10).
[20]
Wikipedia, Die freie Enzyklopädie, „Alta Vista“, Bearbeitungsstand: 14.09.2010, 01:30 UTC.
http://en.wikipedia.org/wiki/AltaVista (17.10.10).
[21]
Wikipedia, Die freie Enzyklopädie, „Yahoo“, Bearbeitungsstand: 14.10.2010, 22:21 UTC.
http://de.wikipedia.org/wiki/Yahoo (17.10.10).
[22]
Den vollständigen Chat findet man in: Hafner und Lyon S. 218-220.
[23]
Wikipedia, Die freie Enzyklopädie, „Spam“, Bearbeitungsstand: 16.10.2010, 20:25 UTC.
http://en.wikipedia.org/wiki/Spam_(electronic) (17.10.10).
[24]
Neue Zürcher Zeitung: Google lässt Duden-Eintrag „googeln“ ändern. http://www.nzz.ch/2006/08/16/
vm/newzzEQXM1K6L-12.html (17.10.10).
Auf Wunsch des Unternehmens wurde der Begriff in der nächsten Auflage des Dudens mittels „mit Google
im Internet recherchieren“ genauer definiert, um eine Gattungsbegriffbildung zu verhindern, die schon
längst Tatsache geworden ist.
[25]
Wikipedia, Die freie Enzyklopädie, „Browserkrieg“, Bearbeitungsstand: 09.10.2010, 19:11 UTC.
http://de.wikipedia.org/wiki/Browserkrieg (17.10.10).
[26]
Wikipedia, Die freie Enzyklopädie, „Napster“, Bearbeitungsstand: 16.10.2010, 09:06 UTC.
http://de.wikipedia.org/wiki/Napster (17.10.10).
[27]
Das Peer-To-Peer-Verfahren wird ausführlich erklärt auf: Wikipedia, Die freie Enzyklopädie, „Peer-toPeer“, Bearbeitungsstand: 12.10.2010, 12:41 UTC. http://de.wikipedia.org/wiki/Peer-to-Peer (17.10.10).
[28]
Wikipedia, Die freie Enzyklopädie, „Jimbo Wales“, Bearbeitungsstand: 16.10.2010, 10:43 UTC.
http://de.wikipedia.org/wiki/Jimbo_Wales (17.10.10).
[29]
Wikipedia, Die freie Enzyklopädie, „Web 2.0“, Bearbeitungsstand: 16.10.2010, 01:42 UTC.
http://de.wikipedia.org/wiki/Web_2.0 (17.10.10).
[30]
Marketing Boerse: 2007 täglich 97 Milliarden E-Mails weltweit.
http://www.marketing-boerse.de/News/details/2007-t%E4glich-97-Milliarden-E-Mails-weltweit/6555
(17.10.10).
38
[31]
Im Jahr 2009 wurden durchschnittlich 11‘627 Petabyte Daten pro Monat über das (öffentlich zugängliche)
Internet transportiert, was einem täglichen Datenaufkommen von mehr als 415 Petabyte entspricht (415 Petabyte entsprechen der tausendfachen Datenmenge aller Bücher, die jemals in jeder Sprache auf der Welt
geschrieben wurden). Die Tendenz ist weiter steigend: Bis zum Jahr 2014 wird sich die weltweit verschickte Datenmenge um ungefähr den Faktor 3.5 auf 485 Exabyte erhöhen. Ein Grossteil dieser Daten wird
durch Videos verursacht.
Siehe dazu: Wikipedia, Die freie Enzyklopädie, „Internet“, Bearbeitungsstand: 16.10.2010, 07:28 UTC.
http://de.wikipedia.org/wiki/Internet (17.10.10).
Das Telekommunikationsunternehmen Cisco Systems, welches in der Branche von Routern und Internetverkehr eine feste Grösse ist, spricht im Jahr 2009 von 176 Exabyte Daten. Zudem erstaunlich: Um sich das
gesamte Videomaterial, das im Jahr 2014 in einer Sekunde über das Web verschickt werden wird, anzusehen, bräuchte man mehr als zwei volle Jahre: Cisco Systems: Forecast and Methodology, 2009-2014.
http://www.cisco.com/en/US/solutions/collateral/ ns341/ns525/ns537/ns705/ns827/white_paper_c11481360_ns827_Networking_Solutions_White_ Paper. html (17.10.10).
[32]
Das Löschen von Spam-Mails raubt weltweit 100 Milliarden Stunden Arbeitszeit: Wikipedia, Die freie
Enzyklopädie, „Spam“, Bearbeitungsstand: 14.10.2010, 18:48 UTC. http://de.wikipedia.org/wiki/ Spam
(17.10.10). Spam-Mails sind jedoch nicht nur nervig und halten einem vom Wesentlichen ab, nein sie sind
auch umweltschädlich: Laut einer Studie von McAfee könnten in den USA mit dem weltweiten Energieverbrauch, der beim versenden, sichten, lesen und bekämpfen von Spam-Mails entsteht 2,4 Millionen Häuser versorgt werden. Spam-Filter sind deshalb auch umwelttechnisch gesehen ein Vorteil: Alle Filter zusammen sparen die Energie von 13 Millionen Autos pro Jahr. Für weitere Informationen:
McAfee: The Carbon Footprint of Email Spam Report.
http://newsroom.mcafee.com/images/10039/carbonfootprint2009.pdf (17.10.10).
[33]
Die Fakten und Zahlen der „Google-Timeline“ stammen, sofern nicht anders vermerkt, aus: Kowalsky,
Marc: Krieg der Welten. Der Kampf zwischen Apple und Google um die Vorherrschaft in der IT-Industrie
ist voll entbrannt – mit Konzepten, die unterschiedlicher nicht sein könnten. In: BILANZ. Das Schweizer
Wirtschaftsmagazin Nr. 14. Zürich 2010. S. 28-35. Hier S. 31-33.
[34]
Maass Christian et al.: Der Markt für Internet-Suchmaschinen. In: Lewandowski, Dirk (Hrsg.): Handbuch
Internet-Suchmaschinen. Nutzerorientierung in Wissenschaft und Praxis. Heidelberg 2009. S. 3-17. Hier S.
7.
Google AdWords ist ein Auktionssystem, bei dem die Anzeigen versteigert werden. Wie bei allen Auktionssystemen wird auch hier der Markt voll ausgelastet. Denn der Preis kann niemals zu hoch oder zu tief
sein. Sondern pendelt sich immer auf dem Niveau ein, das der Markt bereit ist zu zahlen. Für genauere Informationen siehe: Brandt, Richard: Googles kleines Weissbuch. Die Managementstrategien der wertvollsten Marke der Welt. München 2010. S. 86.
[35]
Becker, Hendrik und Arnold, Arne: Die Akte Google. In: PC WELT Nr. 8. München 2010. S. 72-82. Hier
S. 75.
[36]
In ihrer Doktorarbeit äussern sich die Google-Gründer über die Hintergründe der Namensgebung: Brin,
Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web Search Engine.
http://infolab.stanford.edu/~backrub/google.html (16.11.10).
Zudem findet man auf Wikipedia etwas zur Herkunft des Begriffs „Googol“: Wikipedia, Die freie Enzyklopädie, „Googol“, Bearbeitungsstand: 16.10.2010, 12:26 UTC.
http://de.wikipedia.org/wiki/Googol (17.10.10).
39
[37]
Wikipedia, Die freie Enzyklopädie, „WWW“, Bearbeitungsstand: 14.11.2010, 02:15 UTC.
http://de.wikipedia.org/wiki/World_Wide_Web (28.11.10).
[38]
Zitat aus Hafner und Lyon S. 304.
1989 von Danny Cohen vorgetragen als Hommage an das ARPANET auf dem Act One Symposium an der
UCLA (University of California Los Angeles) anlässlich des 20. Geburtstags des ARPANET, leicht angepasst und überarbeitet von den Autoren des Buches.
[39]
Wikipedia, Die freie Enzyklopädie, „Geschichte des Internets“, Bearbeitungsstand: 14.11.2010, 13:20
UTC. http://de.wikipedia.org/wiki/Geschichte_des_Internets (28.11.10).
[40]
Wikipedia, Die freie Enzyklopädie, „Suchmaschine“, Bearbeitungsstand: 01.10.2010, 20:56 UTC.
http://de.wikipedia.org/wiki/Suchmaschine (18.10.10).
[41]
Ebd.
[42]
Wikipedia, Die freie Enzyklopädie, „Webkatalog“, Bearbeitungsstand: 25.09.2010, 08:31 UTC.
http://de.wikipedia.org/wiki/Webkatalog (18.10.10).
[43]
[44]
Wikipedia, Die freie Enzyklopädie, „Metasuchmaschine“, Bearbeitungsstand: 25.09.2010, 08:31 UTC.
http://de.wikipedia.org/wiki/Metasuchmaschine (18.10.10).
[45]
[46]
SirValUse: Wer sucht, der findet! Google liefert nach wie vor die besten Suchergebnisse.
http://www.sirvaluse.de/presse/nutzenforschung-report/09-suchen-im-internet/das-interview/index.html
(28.11.10).
[47]
Google: Unternehmensbezogene Informationen. http://www.google.ch/intl/de/corporate/tech.html
(28.11.10).
[48]
Brin, Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web Search Engine.
[49]
Google: Unternehmensbezogene Informationen. http://www.google. ch/intl/de/corporate/tech.html
(28.10.10).
[50]
Search Engine Optimization: Relevanzkriterien – Basis für Onpage- und Offpage-Optimierung.
http://www.seo-duesseldorf.de/suchmaschinenoptimierung/relevanzkriterien.html (18.10.10).
[51]
SEO für Google: Suchmaschinenoptimierung (SEO). http://www.jugendwettbewerb.de/ (18.10.10).
[52]
Brin, Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web Search Engine.
[53]
Reischl, Gerald: Die Google Falle. Die unkontrollierte Weltmacht im Internet. Wien 2008. S. 32.
Kontrovers dazu: Brin, Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web
Search Engine. http://infolab.stanford.edu/~backrub/google.html (16.11.10).
40
In ihrer Doktorarbeit argumentieren die beiden Google-Gründer, dass je mehr Links auf eine Seite verweisen, desto höher müsse automatisch auch ihre Wichtigkeit sein. Besonders, da bei Backlinks von Seiten mit
einem hohen Ranking, sprich meistens renommierte Seiten, ein Teil deren Wert weitervererbt wird. Es gibt
also Bonuspunkte für Links von gutbewerteten Seiten.
[54]
Ebd.
[55]
Ebd.
[56]
Das Beispiel wurde aus folgendem Buch, leicht modifiziert, übernommen: Hübener, Markus: Suchmaschinenoptimierung kompakt. Heidelberg 2009. S. 18.
[57]
(18.10.10).
[58]
Die Aufgabe wurde, leicht abgeändert, übernommen aus: Hübener S. 18.
[59]
Wikipedia, Die freie Enzyklopädie, „PageRank“, Bearbeitungsstand: 08.09.2010, 20:25 UTC.
http://de.wikipedia.org/wiki/PageRank (18.10.10).
[60]
The Official Google Blog: Our new search index: Caffeine. http://googleblog.blogspot.com/2010/06/ournew-search-index-caffeine.html (18.10.10).
Laut dieser Quelle, wurde früher der Google Index nur alle paar Wochen aktualisiert. Mit der Einführung
des neuen Systems „Caffeine“ geschieht dies nun regelmässiger, in kleineren Portionen. So kommen jeden
Tag einige Hunderttausend Gigabyte an neuen, aktualisierten Daten hinzu.
[61]
Official Google Webmaster Central Blog: Using site speed in web search ranking.
http://googlewebmastercentral.blogspot.com/2010/04/using-site-speed-in-web-search-ranking.html
(18.10.10).
[62]
Ebd.
Laut dem offiziellen Google-Blog fliesst neuerdings, neben den übrigen Relevanzkriterien, auch die Ladegeschwindigkeit einer Seite in ihr Ranking mit ein. Dieser Faktor wird jedoch erst auf der englischsprachigen Seite Google.com angewandt und hat, laut Google, einen sehr geringen Einfluss. Was diese neue Methode jedoch tatsächlich für Auswirkungen mit sich bringt, ist noch nicht klar. Einige befürchten, dass Bilder und Videos grösstenteils aus dem Web verschwinden könnten, würde sich das „Speed-Ranking“ weltweit durchsetzten, da diese die Ladegeschwindigkeit enorm beeinträchtigen. Siehe dazu: tagSEOBlog:
Neuer Rankingfaktor „page speed“ – Googles Bildersturm? http://www.tagseoblog.de/ neuerrankingfaktor-ladezeit-googles-bildersturm-im-internet (18.10.10).
[63]
Hartmann, Werner et al.: Informationsbeschaffung im Internet. Grundlegende Konzepte verstehen und
umsetzen. Zürich 2000. S. 38.
[64]
Die Idee für die Aufgaben zum Herleiten der Relevanzkriterien stammt von mir. Die sechs Rangierungsprinzipien sind jedoch dem folgenden Buch entnommen: Ebd. S. 38-43. Die tatsächlichen Beispiele wurden
von mir jedoch frei erfunden und der Text dazu der (entsprechenden) Abfrage bei Google entnommen.
Teilweise musste auch auf leicht modifizierte Ergebnisseiten gewechselt werden, um explizitere Beispiele
zu generieren.
[65]
Long, Johnny: Google Hacking. Bonn 2005. S. 28-30 und S. 88-91.
41
[66]
Wikipedia, Die freie Enzyklopädie, „Boolescher Operator“, Bearbeitungsstand: 01.05.2010, 09:00 UTC.
http://de.wikipedia.org/wiki/Boolescher_Operator (19.10.10).
[67]
Übernommen von: Google: Erweiterte Suche. http://www.google.ch/advanced_search?hl=de (28.11.10).
[68]
Der Text über „Googlewhack“ wurde von der folgenden Seite übernommen und leicht abgeändert: Reischl,
Gerald: Die Googlefalle. http://www.googlefalle.com/googlefalle/index.php/about/wussten-sie-dass/
(20.10.10).
[69]
Weilenmann, Anne-Katharina: Fachspezifische Internetrecherche. München 2006. S. 9.
[70]
(20.10.10).
[71]
Ebd.
[72]
The Official Google Blog: Personalized Search for everyone. http://googleblog.blogspot.com/2009/12/
personalized-search-for-everyone.html (20.10.10).
[73]
Glos, Michael: Sicher surfen, mailen, Daten tauschen. Poing 2004. S. 47.
[74]
Ebd. S. 205.
[75]
Reporters without Borders: Enemies of the Internet. http://en.rsf.org/IMG/pdf/Internet_enemies.pdf
(21.10.10).
[76]
Wikipedia, Die freie Enzyklopädie, „Zensur im Internet“, Bearbeitungsstand: 07.10.2010, 08:36 UTC.
http://de.wikipedia.org/wiki/Zensur_im_Internet (21.10.10).
[77]
Google: Transparency Report: Government Requests. http://www.google.com/transparencyreport/ governmentrequests/ (21.10.10).
[78]
Wikipedia, Die freie Enzyklopädie, „Zensur im Internet“, Bearbeitungsstand: 07.10.2010, 08:36 UTC.
http://de.wikipedia.org/wiki/Zensur_im_Internet (21.10.10).
Mit einem ausländischen Proxy-Server kann weiterhin auf die Seite zugegriffen werden. Zum Beispiel: Auf
http://youproxified.info/ einfach die Internet-Adresse: www.appel-au-peuple.org in das Feld „URL“ eingeben.
[79]
Becker, Hendrik und Arnold, Arne S. 75.
[80]
Weichert, Thilo: Datenschutz bei Suchmaschinen. In: Lewandowski, Dirk (Hrsg.): Handbuch InternetSuchmaschinen. Nutzerorientierung in Wissenschaft und Praxis. Heidelberg 2009. S. 285-300. Hier S. 288.
42
Anhang B:
Lösungen:
Lösungen zu 2.1
1. 1976.
2. In Kalifornien und Boston liegen besonders viele führende
amerikanische Universitäten und Forschungseinrichtungen.
Und das ursprüngliche Ziel des ARPANET war ja ein verbesserter Datenaustausch unter diesen.
Lösungen zu 2.2
Ein verteiltes (und in Ansätzen auch ein dezentralisiertes) Netz ist
bei einem Ausfall eines Knotens oder auch mehrerer Knoten nicht
einfach stillgelegt, sondern kann den Datenverkehr über die verbleibenden Knoten abwickeln.
Lösungen zu 2.3
Bei der Durchschaltevermittlung werden alle Möbel in einem Auto
transportiert und nicht auf mehrere verteilt. Der Hauptunterschied
besteht aber darin, dass bei dieser Methode die Autobahn für den
Zügelwagen reserviert ist und zu dieser Zeit keine anderen Autos
auf der Autobahn fahren dürfen.
Lösungen zu 3.1
 Kataloge sind zumindest in kleiner Grösse aktueller und zu
einem kleinen Thema auch umfassender.
 Suchmaschinen sind effizienter, objektiver, aktueller, vollständiger und auch vom Kosten-Nutzen-Aspekt her gesehen effektiver. Hier kann im Vergleich zu einem Katalog mit einem kleineren finanziellen Aufwand ein grosser Index erstellt und gepflegt werden.
Lösungen zu 3.2
Bei der Glaubwürdigkeit kommt es auf die Quelle an. Also wer das
Gesagte verbreitet. Ist die Person auch sonst glaubhaft, wird dem
Gerücht wohl eher Glauben geschenkt.
Lösungen zu 3.3




www.ethz.ch (9)
www.ksrychenberg.ch (5)
www.sf.tv (7)
www.blick.ch (7)
43





www.nytimes.com (9)
www.nzz.ch (8)
www.google.com (10)
www.google.ch (7)
www.yahoo.com (9)
Wie du sicher unschwer erkennen kannst, hat der PageRank also
nicht direkt mit Qualität, sondern mit Popularität zu tun. Die Seite
der ETH wird deutlich öfter zitiert, als die Seite der KSR, hat demzufolge also deutlich mehr Backlinks. Die Seiten des Schweizer
Fernsehens und des Blicks sind was den PageRank betrifft gleichauf, was man vom Inhalt der Seiten sicher nicht behaupten kann.
Die Website der New York Times hat ein leicht besseres Ranking
als die NZZ, da die New York Times wahrscheinlich weltweit
gesehen öfter zitiert wird, da sie über die Landesgrenzen hinaus
bekannt ist. Dasselbe trifft auch auf den Vergleich zwischen den
Google-Startseiten zu. Die Schweizer Seite wird im Vergleich zur
internationalen Startseite deutlich weniger oft zitiert. Auch die
Yahoo-Startseite kann „google.com“ nicht das Wasser reichen.
Lösungen zu 3.4
Bedenke jedoch, dass diese Rechnung stark vereinfacht ist. In
Wirklichkeit setzt sich der PageRank aus einer riesigen Formel mit
unzähligen Unbekannten zusammen. Diese Formel ist jedoch ein
Firmengeheimnis.
Lösungen zu 3.5
Verzeichnisdienste: Open Directory Project, Sharelook, voodoo-it.
Schweizer Suchmaschinen: search.ch
Internationale Suchmaschinen: AltaVista, Entire Web, Ask,
Gigablast, Lycos,
Meta-Suchmaschine: Ixquick
Vertikale Suchmaschinen: Google Code Search, ingenieur.de,
Medisuch.
Lösungen zu 3.6
Mit einer Suchanfrage wie „Taio Cruz“ lässt sich gut die Aktualität
der Indizes überprüfen. Während es Lycos nur auf schwache
111‘000 Treffer bringt. Schafft Google gut 8 Millionen und
Ixquick sogar gut 15 Millionen. Beide haben also einen sehr aktu-
44
ellen Index. Bei der Grösse gilt es jedoch zu beachten, dass
Ixquick Google nur schlägt, weil es eine Meta-Suchmaschine ist
und die Indizes von Yahoo, Bing, AltaVista, Ask, EntireWeb,
Gigablast, ODP, Semager, Sharelook, Suchclip, Voodoo-it und
Wikipedia bemüht. Ein wahrlich unfairer Vergleich. Dennoch
bringt es Ixquick auf nicht mehr als doppelt so viele Treffer. Der
Index von Google ist also klar der Grösste. Bei der Eingabe von
„the“ schafft Lycos gut 2 Milliarden, Google 12 Milliarden und
Ixquick nicht mehr als gut 3,2 Milliarden Treffer.
Lösungen zu 3.7
Bei Google rangiert Wikipedia auf dem 5., bei Yahoo auf dem 7.
und bei Ixquick auf dem 1. Platz. Dies liegt wahrscheinlich daran,
dass Ixquick auch Wikipedia selbst durchsucht.
Lösungen zu 4.1
Das erste Ergebnis ist relevanter, da mehr Suchbegriffe darin vorkommen.
Rangierungsprinzip 1
Je mehr Suchbegriffe in einem Dokument vorkommen, desto
wahrscheinlicher ist das Dokument relevant.
Lösungen zu 4.2
Der erste Treffer ist relevanter, da ein Stichwort häufiger vorkommt als im ersten.
Je häufiger ein Suchbegriff in einem Dokument vorkommt,
desto wahrscheinlicher ist das Dokument relevant.
Lösungen zu 4.3
Das erste Suchergebnis ist relevanter als das zweite, da mit
„Feusisberg“ ein seltener Begriff darin vorkommt.
Dokumente, die seltene Suchbegriffe enthalten, sind mit einer
höheren Wahrscheinlichkeit relevant, als Dokumente, die häufige Suchbegriffe enthalten.
45
Lösungen zu 4.4
Der erste Treffer ist relevanter, da die Suchbegriffe näher beieinander liegen.
Je näher die Suchbegriffe beieinander liegen, desto wahrscheinlicher ist das Dokument relevant.
Lösungen zu 4.5
Der erste Treffer ist relevanter, da das Dokument kürzer ist, die
Suchbegriffe aber gleich häufig enthält.
Ein kurzes Dokument ist mit einer höheren Wahrscheinlichkeit
relevant als ein langes Dokument, welches die gleichen Suchbegriffe gleich häufig enthält.
Lösungen zu 4.6
Hier ist das erste Dokument relevanter, da die gleichen Suchbegriffe früher vorkommen als im zweiten.
Je früher die Suchbegriffe in einem Dokument vorkommen,
desto höher seine Relevanz.
Lösungen zu 4.7
Dein Vorwissen, das du aktivieren kannst, sind die Namen. Gib ein
paar Nachnamen deiner Klassenkammeraden bei Google ein. Fünf
sollten genügen und du kannst die Treffer an einer Hand abzählen.
Wenn du selbiges bei Yahoo und Bing versuchst, wirst du sehen,
dass du keine brauchbaren Treffer bekommst…
Lösungen zu 4.8
Als erstes Stichwort wäre wahrscheinlich „Fernsehprogramm“ eine
gute Wahl. Da du jetzt keine Treffer mit integriertem Kinoprogramm dabei hast, versuchen wir es mit „Fernsehprogramm Kino“.
Mit dem geben wir uns aber nicht zufrieden und geben „Fernsehprogramm Kino Schweiz“ ein. Einer der ersten Treffer scheint
somit gleich brauchbar. „Cineman“ bietet sowohl das Kinoprogramm aus fast allen Schweizer Grossstädten, wie auch das Fernsehprogramm aller wesentlichen Sender an.
46
Lösungen zu 4.9
1. Hier empfiehlt sich eine Suchmaschine. Gleich der erste Treffer
ist von Wikipedia. Wo du erfährst, dass Petrologie die Lehre
von der Entstehung, den Eigenschaften und der Nutzung der
Gesteine ist.
2. Am besten suchst du hier über einen Katalog. Am geeignetsten
ist wohl die „Internet Movie Database“. Gib hier einfach den
Titel der Serie „Two and a Half Men“ in das Suchfeld ein. Der
erste Treffer ist gleich der beste. Unter der Rubrik „Cast“ findest du jetzt die verschiedenen Schauspieler. So auch „Angus
T. Jones“, der in der Fernsehserie „Jake Harper“ spielt.
3. Am besten suchst du im Schweizer Katalog Sharelook.
4. Wenn wir hier kein Vorwissen aktivieren können, versuche wir
es erst einmal mit den simplen Stichwörtern „Schweizer Olympiasieger“. Der Auszug der ersten Seite sieht gleich interessant
aus. Denn auf der offiziellen Seite des Swissolympic Verbandes
wird „Louis Zutter, der erste Olympiasieger der Neuzeit“ erwähnt. Sagt uns zwar nichts. Aber egal, wir klicken drauf. Hier
finden wir eine Liste „Spotlights der Schweizer Sportgeschichte“. Die Seite liefert aber keine vernünftige Antwort auf unsere
Frage. Eine übersichtliche Tabelle wäre nett. Aber vielleicht
finden wir ja etwas Vorwissen auf dieser Seite. Also suchen wir
einmal die Passage, wo Louis Zutter erwähnt wurde. In Windows einfach den Namen eingeben und die Stelle wird grün
markiert. Darunter finden wir eine nützliche Information: Dort
steht nämlich, dass die erste Olympiasiegerin der Neuzeit „Helen de Pourtalès“ hiess. Gleich darunter finden wir in Verbindung mit einem Olympiasieg noch den Namen „Josef Imbach“.
Wir geben also bei Google diese drei Namen ein: „Josef Imbach Louis Zutter Helen de Pourtalès“. Der erste Treffer ist logischerweise die gleiche Seite. Der zweite scheint jedoch sehr
interessant zu sein: Olympians from switzerland – alphabetical
listing. Wir klicken die Seite an und siehe da: Eine Liste mit allen Schweizer Olympiasiegern, erst noch alphabetisch geordnet.
Was haben wir genau gemacht: Wir konnten zum Thema kein
eigenes Vorwissen aktivieren. Also haben wir uns das Vorwissen durch das Eingeben von umschreibenden Stichwörtern beschafft.
47
Lösungen zu 4.10
Stichwörter: Ballsportart –Fussball
Lösungen zu 4.11
Stichwörter: Preisvergleich Produkte Migros Coop. Auch hier
scheinen schon unter den ersten Treffern einige vernünftige darunter zu sein.
Lösungen zu 4.12
Am häufigsten wird wohl das Rangierungsprinzip zwei missbraucht. So schreiben viele Webseiten-Betreiber gewisse Stichwörter mehrere Tausend Mal auf ihre Website (Natürlich in der Farbe
des Hintergrunds, sodass die Seite trotzdem noch lesbar bleibt).
Denn das Rangierungsprinzip zwei besagt: Je häufiger ein Stichwort vorkommt, desto wahrscheinlicher ist das Dokument relevant.
Lösungen zu 4.13
Die Stichwörter „Rockefeller Center Bauarbeiter“ bei „Google
Bilder“ eingeben genügt schon.
Lösungen zu 4.14
Hier überlegen wir uns als erstes wieder, wie eine Seite aussieht,
die unsere Informationen bereithält. Am besten suchen wir nach
einem Matchbericht. Dort sind alle Daten und Geschehnisse der
ganzen Partei aufgelistet. Um den richtigen Matchbericht zu erwischen, müssen wir nur noch den Match eindeutig beschreiben. Wir
versuchen es also mit: „Matchbericht CL Final 2005 Milan Liverpool“. Und siehe da. Der erste Treffer ist bereits ein Volltreffer.
Bei Wikipedia unter der Rubrik Details erfahren wir, dass der
Tscheche Vladimír Šmicer Liverpool in der 56. Minute zurück ins
Spiel gebracht hat.
Lösungen zu 4.15
Für diese Aufgabe verwenden wir die „Erweiterte Suche“. Im Feld
„Dateiformat“ wählen wir „PDF“ und im Feld „Datum“ „in den
letzten 24 Stunden“.
48
Lösungen zu 4.16
Stichwörter: „stadtbus linie plan winterthur“.
Der erste Treffer ist gleich der beste.
Lösungen zu 4.17
Internet Movie Database
Lösungen zu 5.1
Die Lösungen zu 5.1 können hier leider nicht angegeben werden:
Weil ich erstens nicht Google bin und zweitens aus Platzgründen.
Lösungen zu 5.2
Auf den Seiten 34 und 35 findest du eine Liste mit einigen anderen
Suchmaschinen.
49

Effizient suchen leicht gemacht

Transcription

Similar documents

Integration im Bezirk - Die Kärntner Regionalmedien

1. und (5876) - Täglich laufen

39/2008

urgenlän e he fen dem rgen and

Jahresbericht 2013/2014 - Kantonsschule Rychenberg

Auszug Suchsysteme - QUALITY WEBSERVICES