WEB 2.0 - Die Otto-von-Guericke

Transcription

WEB 2.0 - Die Otto-von-Guericke
Einführung in die Informationstechnik
IV – Internet, Grundlagen und Dienste
2
Überblick
Grundlagen Datenkommunikation
 Datenübertragung analog, digital

 ISDN, DSL
Netzarten und ‐topologien
 Protokolle
 Internet
 Dienste im Internet
 IP‐Adressen, DNS

3
Allgemeines
seit Windows 3.11 – Netzwerkunterstützung
 Linux von Beginn an netzwerkfähig
 heute jeder Rechner vernetzt
 außerdem

 Tablets mit Bluetooth & WLAN
 Handys mit Bluetooth & WLAN
 Drucker, HiFi Anlage, intelligentes Wohnen
4
Prinzip der Datenkommunikation
DEE
DÜE
DÜE
DEE
Übertragungskanal
•analog/digital
•drahtgebunden/drahtlos, optisch
Standardschnittstelle
•seriell
•parallel
•USB
•Rechnerbussystem
•drahtlos (Bluetooth)
DEE
DÜE
Datenendeinrichtung (Rechner, Tablet, Handy)
Datenübertragungseinrichtung (Modem,
Netzwerkkarte, WLAN‐Einheit, Surfstick, etc.)
6
Übertragungskanäle

analog, drahtgebunden
klassisches Telefonnetz (POTS), Wählleitung
 veraltet: analoge Standleitungen


digital, drahtgebunden
ISDN, Wählleitung
 DSL
 digitale Standleitungen

7
Datenübertragung Telefon – analog
langsam veraltet




bisher (ohne ISDN) analoge Übertragung
zur Datenübertragung: „aufprägen“ von Daten auf analoge Signale – modulieren
Empfänger demoduliert Signal
Modem = Modulator/Demodulator
Modem
öffentliches
Telefonnetz
Modem
8
Datenübertragung Telefon – digital
ISDN – Integrated Services Digital Network
 ermöglicht schnelleren Verbindungsaufbau
 zwei Nutzkanäle von je 64KBit/s
 zwei Gespräche gleichzeitig möglich
 durchgehende digitale Verbindung
 keine „Vertonung“ der Daten wie bei Modem
 Abschaltung geplant: 2018

9
ISDN
NTBA
Terminator
S0 Bus
Computer
mit ISDN‐Karte (ISDN Modem)
NTBA=Network Termination Basic Access
öffentliches
Telefonnetz
Telefonnetz
10
Datenübertragung Telefon – digital




DSL – Digital Subscriber Line
hohe Datenübertragung über Telefonleitung
entwickelt Ende der 1980er Jahre
ADSL: Asynchrones Verfahren
 Downstream: „klassisch“ 768KBit/s
 Upstream: 128KBit/s
 Heutzutage bis 24MBit/s Downstream, 1MBit/s Upstream

VDSL: Very High Speed Digital Subscriber Line
 bis 50MBit/s (200MBit/s technisch möglich) Downstream
 parallele Übertragung von: Internet, Telefon, TV
DSL mit ISDN
Computer
mit ISDN‐ und
Netzwerkkarte
Ethernet
öffentliches
Telefonnetz
Telefonnetz
NTBA
S0 Bus
DSL‐
Modem/
Router
Splitter
(NTBBA)
Heute meist „Blackbox“
OVSt
NTBBA= Network Termination Broad Band Access
13
Netzarten mit Kabel

LAN: Local Area Network
räumlich begrenzter Bereich (wenige km)
 10...1000MBit/s


MAN: Metropolitan Area Network


Stadt oder größere Firma, 100MBit/s ... 10GBit/s
WAN: Wide Area Network
innerhalb eines Landes, Wissenschaftsnetz
 2.5 ... 100GBit/s


GAN: Global Area Network

weltweite Vernetzung, logische Zusammenfassung von LANs, MANs und WANs
14
Netzarten – Drahtlos

WLAN: Wireless Local Area Network


drahtloses LAN, 2.4 ... 450MBit/s
Bluetooth: Funkverbindung von Geräten zum Datenaustausch – PAN: Personal Area Network
Name erinnert an Harald Blåtand, genannt Blauzahn, König von Dänemark, lebte 940‐985
 1MBit/s


weitere Möglichkeiten:
Infrarot
 Mobilfunk: 
15
Datenübertragung Mobilfunk


GPRS ‐ General Packet Radio Service
Long Term Evolution (LTE): Mobilfunkstandard der vierten Generation (4G)


UMTS: Mobilfunkstandard der dritten Generation (3G)



100MBit/s
High Speed Packet Access (HSPA): HSDPA, HSUPA: 3,6 bzw. 7,2 Mbit/s
HSPA+: 28‐84 Mbit/s
Global System for Mobile Communications (GSM): Mobilfunkstandard der zweiten Generation (2G), 55‐
220KBit/s
16
Netztopologien – LAN
Bus
Stern
Backbone
Ring
18
Netzwerktechnologie Ethernet






Anfang der 70er Jahre entwickelt
Urheber: Robert Metcalfe
Ether steht für Äther
traditionell nur innerhalb eines Gebäudes
heute auch weiter entfernte Geräte
paketorientierte Datenübertragung
BNC
RJ 48
19
Skizze zum Ethernet
(Robert Metcalfe 1976)
20
Datenpaket
Im Netz versandte Dateneinheit
 Enthält neben den zu übermittelnden Informationen

 Adressdaten
 Verwaltungsinformationen

Unterschiedliche Datenpakete einer Übertragung wählen unterschiedliche Wege
21
Protokolle

für Kommunikation notwendig:


physikalische Verbindung
Vereinbarung über Art und Abfolge des Datenaustausches
 Kommunikationsprotokoll
 beschreibt Aufbau eines Datenpaketes
dessen Absender und Empfänger
den Typ des Pakets (z. B. Verbindungsaufbau, Verbindungsabbau oder reine Nutzdaten)
 die Paketlänge
 eine Prüfsumme



regelt unter anderem:




elektrischen Signale während Kommunikation
Reihenfolge in der Partner kommunizieren
Sprache die sie sprechen
Beispiele: TCP, IP, HTTP, FTP, SMTP, IMAP, POP3, 22
Protokoll – Beispiel
Ablauf eines handvermittelten Ferngesprächs (ab 1877)

1.
2.

3.

3.
4.


Teilnehmer teilt Amt Verbindungswunsch durch Betätigen des Kurbelinduktors mit
Amt: Hier Amt, was beliebt?
Teilnehmer: wünsche mit Nummer 44 zu sprechen
Wenn der gewünschte Teilnehmer frei war, hieß es:
Amt: bitte rufen und die Vermittlungskraft stellte mittels eines Schnurpaares die Verbindung zum B‐Teilnehmer her
andernfalls:
Amt: schon besetzt, werde melden wenn frei
Teilnehmer: Verstanden
Das Gesprächsende teilte der Anrufende der Vermittlungs‐
kraft durch erneutes Betätigen des Kurbelinduktors mit. Vermittlungskraft trennte die Verbindung und brachte die Klappe per Hand wieder in die Ausgangslage.
Quellen: http://de.wikipedia.org/wiki/Klappenschrank
http://www.devcon3.de/vermittlungstechnik.htm
23
Protokolle – Beispiel
Rechnerkommunikation

Verbindungsaufbau zwischen Rechnern:
Computer 1 schickt Paket mit Verbindungswunsch
2. Computer 2 schickt Paket mit Verbindungsbestätigung
3. Computer 1 bestätigt Computer 2, dass er verstanden hat, dass Computer 2 bereit ist
 Handshake
1.

oft ist Kommunikation Zusammenspiel verschiedener Protokolle
24
Netze von Netzen

Nicht immer können alle Teilnehmer in einem Netz vereint werden
zu viele Benutzer
 starke räumliche Trennung der Benutzer


Verknüpfung mehrerer Netze erfolgt durch Verbindungsrechner (VR)
VR

Internet
VR
25
Verbindungsrechner ‐ Beispiele

Gateway: Rechner der Verbindung zum Internet herstellt
 Auch oft als Router bezeichnet

Router:
 Verbinden Teilnetze des Internets
 Bestimmt nächsten Rechner, zu dem Datenpaket gesendet wird
 Dienen der Paketvermittlung für IP‐Protokoll
 komplexe Funktionalität zum optimalen versenden von Paketen


Zustand der Routen
Kosten (Zeitdauer) für den Versand
26
Map of the Internet
Visualisierung
des Internets
→Routing

http://upload.wikimedia.org/wikipedia/commons/b/bd/Internet_ma
p_1024_-_transparent.png
27
Internet




1957 Sputnikschock
→ ab 1962 Entwicklung militärisches Netz
1969 entstand erstes „richtiges“ Netz → ARPA‐Net
verbunden wurden vier Standorte



Zentren militärischer Forschung
UCLA, SRI, UCSB, University of Utah in Salt Lake City
zwei wichtige Dienste:
TelNET – Arbeit auf und Steuerung von entfernt liegenden Rechnern
 FTP – Datentransfer zwischen entfernten Rechnern


Schub durch Entwicklung von


TCP – Transmission Control Protocol
IP – Internet Protocol
28
Internet

1972 erstes Emailprogramm (Ray Tomlinson)
 Erste Nutzung von @ für someone@someplace
1973 Entwicklung von TCP/IP
 1981 Entwicklung des CSNet
 1983 Domain Name System (University of
Wisconsin)
 1990 Abschaltung des ARPANET

30
Zahlen und Fakten
31
Was passiert in einer Sekunde?
Quelle: http://t3n.de/news/infografik-passiert-60-sekunden-internet-314062/
32
Protokolle im Internet


Internet – Netz von Netzen
Basis für die Übertragung bilden Protokolle (Beschreibungen über Format und Ablauf des Datenaustausches auf verschiedenen Ebenen):
 TCP: Transmission Control Protocol
 IP: Internet Protocol


TCP sorgt für das Verpacken der Daten in Datenpakete
IP ist für den Versand zuständig
33
Einschub
BINÄRES ZAHLENSYSTEM
34
Bits



kleinste mögliche Informationseinheit
Wortschöpfung aus binary und digit
zwei Zustände






technisch einfache Realisierung möglich





ja / nein
wahr / falsch
hell / dunkel
Männlein / Weiblein
links / rechts
geladen / ungeladen
Strom fließt / Strom fließt nicht
5V Spannung / 0V Spannung
magnetisiert / nicht magnetisiert
ultimativ: 1 oder 0
35
Bytes
komplexe Informationen werden durch Folgen von Bits dargestellt
 Die kleinste adressierbare Speichereinheit im Rechner ist das Byte

 (engl.: byte; Kunstwort, ausgesprochen: Bait)
 Folge von acht Bits
 können gemeinsam in einem Rechner verarbeitet werden
36
Positions‐ oder Stellenwertsysteme




heute gebräuchlichste Art der Zahlensysteme
kompakte Darstellung beliebig großer Zahlen mit wenigen Symbolen (Ziffern oder Zahlzeichen)
Anzahl der Symbole: Basis des Zahlensystems Beispiele:
 Binärsystem: {0,1}
 Oktalsystem: {0,1,2,3,4,5,6,7}
 Dezimalsystem: {0,1,2,3,4,5,6,7,8,9} 
 Hexadezimalsystem: {0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F} 37

allgemeine Darstellung:
 Basis des Zahlensystems: B
ai  {0, 1, 2, … , B‐1}
 Zahl: <a0, a1, a2, … , an>
geschrieben: anan‐1…a2a1a0
 Ziffer:  Wert:
a0*B0 + a1*B1 + … + an*Bn=  ai*Bi
38
Dezimalsystem
heute meist verwendetes System  Basis: 10
 Ziffern: {0,1,2,3,4,5,6,7,8,9}


Beispiel:
 4361 = 4*103 + 3*102 + 6*101 + 1*100
= 4*1000 + 3*100 + 6*10 + 1*1
= 4000 + 300 + 60 + 1
39
Dual‐ oder Binärsystem
Basis für Computer  Basis: 2
 Ziffern: {0,1}


Beispiel:
 10011
= 1*24 + 0*23 + 0*22 + 1*21 + 1*20
= 1*16 + 0*8 + 0*4 + 1*2 + 1*1
= 16 + 0 + 0 + 2 + 1
= 19
40
Natürliche Zahlen binär

Bitfolgen zur Darstellung größerer Zahlen
 1 Bit: 0 und 1
 2 Bit: 0 bis 3
 3 Bit: 0 bis 7
 4 Bit: 0 bis 15
 8 Bit: 0 bis 255
 16 Bit: 0 bis 65535
 32 Bit: 0 bis 4.294.967.296
 n Bit: 0 bis 2n‐1

Darstellung der natürlichen (positiven!) Zahlen
41
INTERNET GRUNDLAGEN
42
IP – Adressen




Jeder Rechner im Internet braucht eine Adresse
Paketvermittlung erfolgt nur über Adressen
IP‐Adresse ist 32 Bit lang = 4Byte, daher maximal 232
(4.294.967.296) Rechner adressierbar
Zur besseren Lesbarkeit dargestellt als: d1.d2.d3.d4





Dezimalwerte der 4 verwendeten Bytes
Beispiel: 141.44.27.70
Mögliche Abfrage ob ein Rechner im Netz verfügbar ist: ping <ip_adresse> oder <hostname>
Letzte IP V4 Adressbereich im April 2011 ausgegeben
neues Adressformat IPv6 eingeführt, besteht aus 6 Bytes



2128 Rechner adressierbar = 340 Sextillionen Adressen
genau: 340.282.366.920.938.463.463.374.607.431.768.211.456
5×1028 für jeden der 6.5 Mrd. auf der Erde lebenden Menschen
43
IP V6

Adressnotation hexadezimal statt dezimal (V4)
 8 Blöcke zu je 16Bit (65536 Werte)
 2001:0db8:85a3:08d3:1319:8a2e:0370:7344
 Als URL: http://[2001:0db8:85a3:08d3:1319:8a2e:0370:73
44]/

Provider bekommt üblicherweise die ersten 32 Bit
http://www.networkworld.com/article/2228449/microsoft-subnet/ipv6-addressing--subnets--private-addresses.html
44
IP V6 – Besonderheiten

Netzmaske ex. nicht mehr explizit (wird nach Schrägstrich angegeben)
 fd01:2:3:4:5:6:7:8/24

Führende Nullen können weggelassen werden
 fd30:0000:0000:1234:0001:0011:2468:003e ‐>
fd30::1234:1:11:2648:3e

Unique Local Address (ULA):  Alles was mit FD anfängt: fdxx:xxxx:xxxx:…
http://www.networkworld.com/article/2228449/microsoft-subnet/ipv6-addressing--subnets--private-addresses.html
45

Subnetzmaske:
 Möglichkeit
ein Netz in
„Unter“-Netze zu teilen
 Ähnlich einer Vorwahl

Vorteil:
 Teilnetze
können
bestimmten
Institutionsteilen
zugeordnet werden
 Vereinfacht die Suche
nach IP-Adressen
46
Vergabe von IP‐Adressen
statisch oder dynamisch
 statisch: IANA/ICANN

 Deutschland: DENIC: www.denic.de

dynamisch durch Serverdienst: DHCP
 dynamic host configuration protocol
IANA - Internet Assigned Numbers Authority
ICANN - Internet Corporation for Assigned
Names and Numbers
RIPE - Réseaux IP Européens
ARIN
DENIC - Deutsches Network Information
Center
IANA
RIPE
DENIC
APNIC LACNIC AfriNIC
47
Spezielle IP‐Adressen

127.0.0.0 – lokaler Rechner (loopback)
 127.0.0.1 – localhost

private (nicht öffentliche) IP‐Adressen:
 10.0.0.0–10.255.255.255
 172.16.0.0–172.31.255.255
 192.168.0.0–192.168.255.255
siehe auch: ping
48
Einführung in die Informationstechnik
INTERNET, WEB 1.0 & WEB 2.0
49
Domainnamen
Anfangszeit des Internet: Adressierung nur über IP‐Adressen
 Alternativ: verteilte Datenbank zur Verwaltung von Namen im Internet
 Idee: Jedes Teilnetz verwaltet einen Bereich von Namen und hat selbst Bereichsnamen (domain name)

50
Domainnamen

Domainnamen bestehen aus mindestens zwei Komponenten:
domain.ToplevelDomain, Beispiel: ovgu.de
subdomain.domain.ToplevelDomain, Beispiel: fgse.ovgu.de

ToplevelDomain: bezeichnet geographischen oder organisatorischen Bereich
 Beispiel: de … Deutschland, edu … education

Zweite Komponente: Domain
 Beispiel: uni‐magdeburg

vollständig: uni‐magdeburg.de
51
Toplevel Domains
Geographische: de, it, fr, cz, pl, eu
 Organisatorische: edu, biz, mil, gov, org, info, name
 Teilweise werden freiwillige Kategorien eingefügt

 Beispiel: ac.uk, co.uk
Vergabe in Deutschland über DENIC
 Domainnamen nicht nur für WWW

siehe auch: nslookup
52
Dienste im Internet



Verschiedene Protokolle für verschiedene Aufgaben bzw. zur Realisierung verschiedener Dienste
Internet stellt nur Kommunikationsinfrastruktur zur Verfügung
Beispieldienste:






Email
World Wide Web
Dateitransfer (FTP)
Benutzung entfernter Rechner (Telnet, SSH)
Domain Name Service (DNS)
Instant Messagin (ICQ, etc.)
53
DNS




Domain Name System
verteilte Datenbank die den Namensraum der Adressen im Internet verwaltet
Umsetzung von Domainnamen in IP‐Adressen (forward lookup) und umgekehrt (reverse lookup)
Vorteile: dezentrale Verwaltung hierarchische Strukturierung des Namensraums in Baumform  Eindeutigkeit der Namen  Erweiterbarkeit 

Quelle. Wikipedia
54
E‐Mail


zum Versand (und Empfang) elektronischer Post
verwendete Protokolle:
SMTP – Simple Mail Transfer Protocol
 POP 3 – Post Office Protocol Version 3
 IMAP – Internet Message Access Protocol



Anwendungen: E‐Mail‐Clients
Zahlen & Fakten (2011):

3,146 Milliarden Emailkonten

Zahl der Spam‐Emails von 2010
zu 2011 um 20% gesunken
55
Message Transfer System (MTS)
E-Mail
Client
Port 25
(SMTP)
SMTP
Server
POP3/
IMAP
Server
Port 110
(POP3)
Port 143
(IMAP)




E-Mail
Client
E-Mail
Client
SMTP (Simple Mail Transfer Protocol): Zuverlässiger Nachrichtentransfer
Suche nach Ziel‐SMTP‐Server über DNS (Domain Name System)
Weiterleitung
dann lokale Auslieferung an POP3/IMAP‐Server
56
POP3 vs. IMAP

POP3:
 Keine ständige Verbindung zum Mailserver
 erlaubt nur das Auflisten, Abholen und Löschen von E‐
Mails am E‐Mail‐Server  Keine Verwaltungsmöglichkeiten auf dem Server
 Emails werden heruntergeladen und vom Anwendungsprogramm verwaltet

IMAP:
 Emails bleiben auf dem Server
 Gesamte Verwaltung erfolgt auf dem Server
 Vorteil: Mehrere Zugänge von unterschiedlichen Rechnern
57
Ports


Adresskomponenten, in Netzwerkprotokollen eingesetzt, um Datenpakete den richtigen Diensten zuzuordnen
bei TCP: Portnummer 16Bit: 65535 Werte
 0...49151 registrierte Ports (IANA), darüber frei
 Beispiel HTTP‐Port: 80
80
HTTP
143
IMAP
5190
ICQ
20
FTP
58
weitere Dienste

FTP zur Übertragung von Dateien
 Protokoll: FTP – File Transfer Protocol
 Anwendungen: FileZilla, integriert in TotalCommander

Telnet zur Benutzung entfernter Rechner
 Protokoll: Telnet Protocol

SSH zur sicheren Benutzung entfernter Rechner
 Ähnlich Telnet aber mit verschlüsselter Datenübertragung
 Protokoll: SSH Protocol
59
Weitere Dienste

Peer‐To‐Peer‐Systeme zum Austausch von Dateien
 BitTorrent, eDonkey, eMule, Gnutella, FastTrack
 Gleichgestellte Rechner (Gegensatz Client‐Server)
 Rechner, die Dienste in Anspruch nehmen und diese ebenfalls zur Verfügung stellen

Internet‐Telephonie
 Direkte Internet‐Telefonie
 Voice over IP
 Datenübertragung mittels TCP/IP
60
Internetdienste
WEB 1.0 UND WEB 2.0
61
World Wide Web




„Weltweites Gewebe“
Weltweite durch Hyperlinks „verwobene“ Dokumente
Internet realisiert die Übertragung von Webseiten
verwendete Protokolle:
 HTTP – HyperText Transfer Protocol
 HTTPS – HyperText Transfer Protocol Secure

Anwendungen: Webbrowser
62
Total Sites Across All Domains
August 1995 – Mai 2012
http://news.netcraft.com/
63
Total Sites Across All Domains
August 1995 – Februar 2013
http://news.netcraft.com/
66
Organisation des WWW: W3C




Auch: WWW‐Consortium: www.w3c.org
kümmert sich um Standardisierung und Normierung
W3C keine zwischenstaatliche Organisa on → legt keine ISO‐
Normen fest
Zusammenschluss verschiedener Mitgliedsorganisationen u.a.:

Apple, AT&T, Intel, Microsoft, SAP, SUN
67
Organisation des WWW: W3C






Leitung: MIT (USA), INRIA (Frankreich), Keio University (Japan)
Gründung: 1994
Gründer und Vorsitzender: Tim Berners‐Lee
deutsch‐österreichisches Büro: FH‐Potsdam
Techniken (Auswahl): HTML, XHTML, XML, RDF, OWL, CSS, SVG, RSS
Empfehlungen für barrierefreie Gestaltung von Webauftritten
68
HTTP
Hypertext Transfer Protocol
 1989 von Tim Berners‐Lee zusammen mit dem URL und der Sprache HTML entwickelt
 Zustandsloses Protokoll:

 nach erfolgreicher Datenübertragung wird Verbindung nicht aufrecht erhalten
 Sitzungsdaten gehen verloren
 Cookies für Speicherung der Sitzungsdaten
69
HTTP‐Kommunikationsablauf
Aktivieren des Links http://www.example.net/infotext.html schickt an www.example.net die Anfrage, die Ressource /infotext.html zurückzusenden
 Umsetzen des Namens www.example.net
über das DNS‐Protokoll in eine IP‐Adresse  Senden einer Anforderung an den Webserver 
GET /infotext.html HTTP/1.1
Host: www.example.net

weitere Informationen in der Anfrage möglich
70
HTTP‐Kommunikationsablauf

Antwort des Servers bestehend aus
 Header‐Informationen
 Inhalt der Nachricht = Webseiten‐Quellcode
HTTP/1.1 200 OK
Server: Apache/1.3.29 (Unix) PHP/4.3.4
Content-Length: (Größe von infotext.html in Byte)
Content-Language: de
Content-Type: text/html
Connection: close
(Inhalt von infotext.html)
71
HTTP Statuscodes: Serverantworten, die Informationen über Fehlermeldungen etc. liefern







200 – OK: Die Anfrage wurde erfolgreich bearbeitet und das Ergebnis der Anfrage wird in der Antwort übertragen. 201 – Created: Die Anfrage wurde erfolgreich bearbeitet. Die angeforderte Ressource wurde vor dem Senden der Antwort erstellt. 400 – Bad Request: Die Anfrage‐Nachricht war fehlerhaft aufgebaut. 401 – Unauthorized: Die Anfrage kann nicht ohne gültige Authentifizierung durchgeführt werden. Wie die Authentifizierung durchgeführt werden soll wird im „WWW‐Authenticate“‐Header der Antwort übermittelt. 403 – Forbidden: Die Anfrage wurde mangels Berechtigung des Clients nicht durchgeführt. Diese Entscheidung wurde – anders als im Fall des Statuscodes 401 – unabhängig von Authentifizierungsinformationen getroffen. 404 – Not Found: Die angeforderte Ressource wurde nicht gefunden. Dieser Statuscode kann ebenfalls verwendet werden, um eine Anfrage ohne näheren Grund abzuweisen. 500 – Internal Server Error: „Sammel‐Statuscode“ für unerwartete Serverfehler 72
Cookies

Problem: Zustand einer Web‐Sitzung nicht oder nur auf dem WebServer speicherbar
→ IP‐Adressen meist dynamisch vergeben
 Beispiel: Inhalt des Warenkorbs, Surfverhalten

Lösung: Speicherung von Informationen zu einer Webseite auf dem Clientrechner
→ Cookies

Cookies: kurze Texte (4KB)
 vom Webserver an den Webbrowser gesandt
 Vom Webbrowser in Datenbank gespeichert
73
Flash‐Cookies

Benutzung wie „normale“ Text‐Cookies allerdings
 100KB groß danach Information des Anwenders


Flash: Technologie von Adobe zur Erstellung (Programmierung) multimedialer, interaktiver Inhalte
Problem: Datenschutz
 Browserübergreifend, da an Flash‐Player gebunden
 Kann zur Überwachung des Nutzers eingesetzt werden
 Nicht einfach über den Browser löschbar
 Kann normale Text‐Cookies kopieren und auch wiederherstellen (selbst wenn der Nutzer sie löscht)
74
Web 2.0
Cloud Computing
Social Web
Blogs
Tagging
Social Cataloging
Kollaboration
Wikis
Web 2.0
Webservices
Virtuelle Welten
Communitys
Folksonomy
Social Bookmarking
Podcasting
Semantic Web
75
Begriff: Web 2.0

Grundlage:  Weiterentwicklung der Web‐Technologien
 Veränderung der Wahrnehmung des Webs
technische Sicht vs. soziale Sicht
 Benutzung einer Versionsnummer, ähnlich wie bei Software
 Definition des Begriffs schwierig

→ Versuch einer Annäherung
76
Web 2.0 ‐ Sichtweisen
O‘Reilly: Web 2.0 als Computerplattform, die Daten und Anwendungen bereitstellt
 Meckel: Idee der gemeinsamen Maximierung kollektiver Intelligenz und der Bereitstellung von Nutzenwerten für jeden Teilnehmer durch formalisierte und dynamische Informationsteilung und ‐herstellung

aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007
77
Web 2.0 ‐ Sichtweisen
Breeding: neue Vision des Internets, die größere Interaktivität, Kontrolle des Nutzers über Informationen, radikale Personalisierung, die Entwicklung von Online‐Gemeinschaften und demokratisches Management von Informationen verspricht.
 Krol definiert Web 2.0 als Kombination von Geschäftsprozessen, Prinzipien und Technologien, die dem Nutzer Partizipation und Zusammenarbeit ermöglichen

aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007
78
Web 2.0 ‐ Sichtweisen

Tapscott: Bedeutung von Web 2.0: globale Infrastruktur, in der Kollaborationskosten gegen Null fallen
aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007
79
Web 2.0 - Beobachtungen

Beispiele die die Veränderung des Webs
charakterisieren (O‘Reilly, 2005!):
Web 1.0
DoubleClick
Ofoto
mp3.com
Britannica Online
personal websites
domain name speculation
publishing
directories (taxonomy)
content management systems

Web 2.0









Google AdSense
Flickr
Napster
Wikipedia
blogging
search engine optimization
participation
tagging ("folksonomy")
wikis
Was unterscheidet aber nun eine Web 1.0Anwendung von einer Web 2.0-Anwendung?
80
Web 2.0 – Kriterien
das Web als Plattform (anstatt des lokalen Rechners)
 Daten als wichtigste Grundlage
 „Architektur des Mitwirkens“ → Verstärkung der Vernetzung, Partizipation
 Modulare Zusammenstellung von Systemen und Seiten

 Module von unterschiedlichen Entwicklern (Prinzip ähnlich OpenSource)
81
Web 2.0 – Kriterien



verteiltes, gemeinsames Nutzen von Inhalten und technischen Diensten → einfache (neue) Geschäftsmodelle
Ende des klassischen So warelebenszyklus‘ → immerwährendes Beta‐Stadium
Die Software geht über die Fähigkeiten eines einzelnen Verwendungszwecks hinaus.
82
Web als Plattform
Vom Desktop zum Webtop
 zentrales Ziel von Web 2.0 – Webbrowser als Plattform
 Plattform Vorteile gegenüber Anwendung

 keine Portierung auf andere Betriebssysteme
 keine neuen Software Ausgaben

kontinuierliche Verbesserung
 Höhere Scherheit

Software als Service, Vermittler
83
Web als Plattform ‐ WebOS



„Betriebssystem“ für Webanwendungen
Kein Betriebssystem im eigentlichen Sinne
OS stellt Schnittstelle zwischen Hardware und Software dar
 Verantwortlich für Dateisystem

WebOS: Schnittstelle zur Programmierung von Webanwendungen
 Zwischen Anwendung und Hardware
 WebOS ist mehr eine Art Oberfläche → WebDesktop
 Bietet aber auch Funktionen zur Verwaltung von Dateien
84
Web als Plattform: WebDesktop
WebOs eigentlich im Hintergrund →
Funktionalität
 WebDesktop im Vordergrund → Sichtbare Schnittstelle zur Steuerung und Verwaltung von Webanwendungen
 Meist ähnlich Windows

85
Web als Plattform

Beispiele für WebDesktop, WebOS:
 eyeOS: http://eyeos.org
 GlideOS: http://www.glideos.com
 OnlineOS: http://icube.at/home.jsp
 Übersicht siehe: http://en.wikipedia.org/wiki/Web_desktop
86
Web als Plattform: eyeOS
87
88
89
Einführung in die Informationstechnik
WEB 2.0
90
Aspekte des Web 2.0: Cloud Computing
Rechnen in der Wolke
 Bereitstellung von Diensten, on‐demand:

 Rechner, Speicher, Netz
 Anwendungen, Betriebssysteme, Tools

Lokale Anschaffung/Installation entfällt
 Lediglich Zugangssystem muss vorhanden sein
91
Cloud Computing

Amazon Cloud Drive
 Online Speicher zum Ablegen von Dateien
 Auch Musik, incl. Musicplayer (Cloudplayer)

Alternative: DropBox, Apple iCloud
 Ebenfalls Online‐Speicher zur Dateiablage und ‐austausch

Google Drive
 Online Speicher, Zugriff auf Dokumente von Google Docs
92
Interaktive Anwendungen im Web
Mindmaps, Office‐Anwendungen
 Chart‐ und Diagrammerstellung
 Bildbearbeitung, Fotogallerien
 Communities: Freunde finden, gemeinsam Einkaufen, personalisierte Angebote
 Speicherplatz für Dateien
…
 Übersicht: go2web20.net

Gemeinschaftliches Bearbeiten von Dokumenten

GoogleDocs, WizIQ, Zoho, ThinkFree

http://mashable.com/2008/02/11/13‐word‐processors/
94
Gliffy
Mindmeister
96
Aspekte des Web 2.0: Abonnementdienste

Bereitstellung von Inhalten, die abonniert werden können
 Feeds: RSS, Atom

RSS: Really Simple Syndicate
 Zusätzliches Programm erforderlich: Feedreader
 Abonnement durch Eingabe der Feedadresse
 Feedreader lädt Feed automatisch (zeitgesteuert)
97
Aspekte des Web 2.0: WebServices
Web 1.0: alles auf einem Rechner
 Web 2.0: Software‐Bausteine, die auf verschiedenen Rechnern laufen
→ komponentenbasierte Webservices (SOA)
 Verbindung zu einer Anwendung über das Internet
 Service kann Daten bereitstellen, auswerten
 Anwendung kann im Netz laufen oder lokal
 Beispiel: Amazon Webservices, Projekt Deutscher Wortschatz (http://wortschatz.uni‐leipzig.de/Webservices/), Interaktion zwischen Fluggesellschaften und Reisebüros 
(http://de.wikipedia.org/wiki/Webservice#Beispiele)
98
Soziale Aspekte des Web 2.0


Web 1.0: Autoren sind für Inhalte verantwortlich
Web 2.0: Benutzer/innen wirken an Inhalten mit
→ Architektur des Mitwirkens


Nutzung kollektiver Intelligenz, kollektiven Wissens
Organisation von persönlichen Informationen
 Reflexion und Sammlung von Erfahrungen
 (Chronologische) Dokumentation von Ideen und Gedanken
Reinmann & Sporer (2007)
99
Soziale Aspekte des Web 2.0

Kollaborative Organisation von Informationen:
 Öffentliche Sammlung von interessanten Informationen
 Auffinden von Kontakten mit gleicher Interessensbasis

Soziales „Suchen & Finden“ von Informationen
 Beispiel:


Verknüpfung von Bibliographien mit bestimmten Nutzern
Auffinden von Publikationen durch dessen Bibliographie
Reinmann & Sporer (2007)
100
Soziale Aspekte I ‐ Folksonomy
Gemeinschaftliches Indexieren → Tagging
 Zuordnen von Descriptoren, Schlagwörtern (Tags) zu Objekten

 Lesezeichen
 Photos
 wissenschaftliche Paper

Meist keine Festlegungen über Vokabular
 Jeder kann frei Taggen
 Herausbildung gemeinschftlicher Wortschatz
101
Soziale Aspekte I ‐ Folksonomy

Probleme:
 Synonyme
 Unterschiedliche Sprachen
 Getrennt‐, Zusammenschreibung  WebDesktop, Web‐Desktop, Web Desktop, Web_Desktop
 Kontextbedeutungen: Apple, Virgin
 Singular/Plural
→ Bildung unterschiedlicher Kategorien

Vorteile:
 Arbeitsverteilung
 Benutzer fügen Schlagworte hinzu, nicht Autoren → bessere Benutzbarkeit (Suchergebnisse)?
102
Soziale Aspekte I - Folksonomy


Phototagging: „Flickr“,
Social Bookmarking:
 „Delicious“,
 „Bibsonomy“
 Digg

Social Cataloging:
 Library
Thing
Beispiel: Flickr
104
Soziale Aspekte II ‐ Blogging

Blog – Wortkreuzung aus Web Log
 Web‐Tagebuch

Umfrage ergab:
 73% der Blogger schreiben aus Spass
 27% nicht persönlich, zur Wissensvermittlung


Beispiele für textuelle Blogs: …
Blogs nicht nur textuell
 Podcasts
 VideoBlogs, Vlogs
106
Soziale Aspekte III: Microblogging
Blog bei dem nur Kurznachrichten versandt werden
 Postings können abboniert werden
 Öffentlich oder privat zugänglich
 Bekanntester Dienst: Twitter

107
Soziale Aspekte IV: Wikis
Name stammt von Wikiwiki (hawaianisch für schnell)
 Content‐Management‐System (CMS)
 Erlaubt die gemeinsame Erstellung von Webseiten
 Prominentes Beispiel: Wikipedia
 Desktop Wikis: WikidPad, Tomboy, TiddlyWiki

108
Soziale Aspekte V: Social Networking
Webseiten mit denen Menschen in Kontakt treten/bleiben können
 Management von sozialen Netzwerken
 Zweck:

 Kommunikation
 Bildung neuer Geschaftsverbindungen
 Entwicklung neuer Projekte
 Terminmanagement, ‐abstimmung
110
Social Networking Beispiele
Interessen: Fotocommunity, StudiVZ, Flickr
 Dating: Urbanite
 Beziehungsorientiert: OpenNetworX, LinkedIn, Friendster, StayFriends, Facebook
 Geschäftsorientiert: Ecademy, Xing

111
Personalisiertes Web




Web 1.0: Webseite statisch, alle konsumieren die gleichen Inhalte
Web 2.0: Benutzer/innen können Inhalte ihren Interessen entsprechend anpassen
Personalisierung, Definition: Anpassen an persönliche Bedürfnisse
Bei digitalen Dokumenten:
Anpassung des Inhalts
 Anpassung der Darstellung


Grundsätzliche Unterscheidung:
Für den Benutzer/Benutzerin
 Durch den Benutzer/Benutzerin

112
Personalisiertes Web

Personalisierung durch den Benutzer/in:
 Inhalte von Webseiten

Beispiel: NetVibes, Pageflakes
 Webradio:


Last.fm, MusiMap, musiclens, pandora
Personalisierung für den Benutzer/in:
 Google AdSense
113
Netvibes
114
Musiclens
115
Daten‐getriebene Anwendungen



Web 1.0: Wer Inhalte konsumiert war unbekannt
Web 2.0: Nutzung von Daten (über Benutzer/innen → Profile)
jede erfolgreiche Internet Anwendung basiert auf einer speziellen Datenbasis







eBay: Produkte und Verkäufer
Amazon: Produkte und Rezensionen
Google: Webseiten
Teleatlas, Geocontent: Geo‐Daten
Kontrolle über Daten=Kontrolle über Markt
Management einer Datenbasis ist die Kernkompetenz von Web 2.0 Firmen
Software wird zu „Infoware“
116
Sicherheit im Web 2.0


Allgemeine vs. Persönliche Daten
Allgemein:


Rezensionen, Statistiken, Landkarten
Persönliche Datenspuren im Netz:
Einkaufsverhalten → Vorlieben
Browseverhalten → Interessen
Persönliche Daten: Geburtstag, Adresse, Bankverbindung, Telefonnummer, Kreditkartendaten
→ komple es Nutzerprofil, Identitätssubsystem für Web 2.0?






Was passiert mit diesen Informationen?
Wie sicher sind sie?
Daten resultieren nicht nur aus Web‐Verhalten, auch von Payback u.ä. Datensammlern
117
News im Web 2.0
Web 1.0: Traditionelle Medien stellen ihre Informationen im Web zur Verfügung
 Web 2.0: alle sind Journalisten?

 Stirbt der traditionelle Journalismus?
 Werden Nachrichten nur noch elektronisch gefiltert und aufbereitet?
 Journalist als Moderator zwischen bloggenden Bürgern?
→ Graswurzel oder Bürgerjournalismus
118
Aspekte des Web 2.0: Bürgerjournalismus







The Giraffe Project (Christopher Grotke, Lisa LePage): Schaffung einer „News‐Community“
Wikimedia
IndyMedia
The Huffington Post
Verbindung zwischen Radio und Blog: Blogspiel
(Deutschlandfunk)
Google News
Leser (Consumer) und Journalist (Producer) vermischen sich zu:
Produser
 Prosumer

119
Internet Grundlagen
SEMANTIC WEB
120
Semantic Web

Codierung von Bedeutung im Web
 In rechnerverständlicher Form
Ermöglicht automatische Auswertung von Bedeutungen
 Vorteile: 
 Daten können in Beziehung zueinander gesetzt werden
 Neue Erkenntnisse können gewonnen werden

I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web –
the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day‐to‐day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize.

– Tim Berners‐Lee, 1999

„The Semantic Web is not a separate Web, but an extension of the current one, in which information is given well‐defined meaning, better enabling computers and people to work in cooperation.”
Tim Berners‐Lee, James Hendler, Ora Lassila
→From a Web of Documents to a Web of Data
Das Web – Probleme
oder warum Semantic Web?

Inhalte des Webs auf Menschen zugeschnitten
 Layout, Struktur → einfache Nutzung


Problem: Finden von (gesuchten) Informationen
Suchmaschinen können Fundstellen suchen

Stichwortbasiert, ohne Kontext



Bsp.: Suche nach Apple bringt Frucht und Rechner
Wahl des richtigen Stichwortes ist entscheidend
Ergebnisse sind immer einzelne Webseiten



müssen von Menschen interpretiert und kombiniert werden
oft ist gesuchte Info auf mehrere Webseiten verteilt
→ Informa onsintegra on
Relevanz kann nur schwer durch Maschine geprüft werden
Web – Probleme
oder warum Semantic Web?

Web ist heterogen:  unterschiedliche Informationsdarstellung: Bilder, Text, Audio
 unterschiedliche Codierung: ASCII, Unicode, ISO…
 unterschiedliche Sprachen

→ Informa onen zu einem Thema sind nur schwer aufzufinden
Beispiele


Gegenüberstellung von Informationen zum Wahlprogramm einzelner Parteien
Verknüpfung von verteilt im Netz liegenden Informationen:
 Vortrag, Termin in Hawthorne/NY
 Reisebuchung von Berlin nach Hawthorne:
 Berlin liegt in Deutschland/Europa
 Hawthorne liegt in den USA/Amerika
 → Flugbuchung notwendig, Anschlusszug notwendig oder Mietwagen
Beispiel: Abendliche Planung


Essen gehen, Kino gehen, Cocktailbar
Problem:  Finden eines guten Restaurants (je nach persönlicher Vorliebe, Preisklasse, Einschätzung durch andere)
 Ermittlung des Kinoprogramms in unterschiedlichen Kinos mit Genrevorgabe, Reservierung von Karten
 Cocktailbar sollte in der Nähe des Kinos liegen

Mögliche Anfrage: Finde ein Restaurant mit italienischer Küche in mittlerer Preislage, und zeige mir die Kritiken zu den neuen Filmen der letzten zwei Wochen
Beispiel aus: http://www2.informatik.hu-berlin.de/mac/lehre/WS04/Ausarbeitungen/SemanticWeb.pdf
Mögliche Anwendungsbereiche


allgemein: wissensintensive Prozesse
Beispiel:
 kontextbezogene Informationsvernetzung
 intelligentes Information Retrieval
 personalisierte Wissensportale
 Helpdesk‐Systeme


→ Anwendungsso ware muss „logisch denken“
→ neues Wissen aus vorhandenem erschließen
http://rewerse.net/press_releases_approved/www.uni-protokolle.de/id/105246/index.html
Semantic Web
Beschreibung von Daten und deren Semantik in rechnerverständlicher/‐verarbeitbarer Form
 Daten brauchen Informationen darüber, wie sie zu strukturieren und zu interpretieren sind
 → Wissensrepräsenta on im Web

Semantic Web Prinzipien (Auswahl)
1. Alles kann durch eine URI identifiziert werden
http://www.magdeburg.de
mailto: marcel.goetze@ovgu.de
http://www.w3.org/2001/12/semweb-fin/w3csw
Semantic Web Prinzipien (Auswahl)
2. Ressourcen und Links können typisiert sein
Software
Ressource
href
href
Ressource
Ressource
href
href
erzeugt
erzeugt
Buch
Report
geschrieben von
Ressource
gelesen von
href
Ressource
Autor
kommuniziert mit
Lektor
http://www.w3.org/2001/12/semweb-fin/w3csw
Semantic Web Prinzipien (Auswahl)
3. Unvollständige Informationen sind unproblematisch
Software
Ressource
href
href
Ressource
Ressource
href
href
erzeugt
erzeugt
Buch
Report
geschrieben von
Ressource
gelesen von
href
Ressource
•
Autor
kommuniziert mit
404 not found
Lektor
404 not found
im Semantic Web können fehlende Informationen rekonstruiert werden
http://www.w3.org/2001/12/semweb-fin/w3csw
Semantic Web Prinzipien (Auswahl)
4. Eine absolute Wahrheit ist nicht notwendig
 neues Wissen kann aus vorhandenen Informationen geschlussfolgert werden
 Marcel arbeitet in der Otto‐von‐Guericke‐
Universität
 Stefan ist Kollege von Marcel
→ Stefan arbeitet ebenfalls an der OvG‐Uni
http://www.w3.org/2001/12/semweb-fin/w3csw
Semantic Web Prinzipien (Auswahl)
5. Evolution wird unterstützt
 Informationen können auf einfache Weise in einen neuen Kontext gesetzt werden
 Beispiel: Stefan bekommt einen Ruf an eine andere Universität → neue Verknüpfung http://www.w3.org/2001/12/semweb-fin/w3csw
134
Web 3.0?


Weiterführende semantische Vernetzung?
Internet 2.0: jedes Gerät hat eine eigene IP‐Adresse





IPv6: 128 Bit lange Adresse = 2128 Adressen
reicht, für 6,65 ∙ 1023 Adressen/m2 Erdoberfläche
Jeder kann jederzeit online sein
Vielleicht aber auch nicht nur jedes Gerät sondern jeder Blog, jeder Artikel, Autor,…
Verarbeiten von Informationen erfolgt dezentral, getrennt vom Medium, unabhängig vom Autor
Man liest nicht mehr ein Blog sondern von einem Autor in mehreren Blogs
Orte wären irrelevant. Bild wird durch IP bestimmt, nicht Position
Neue Zugangswege wären notwendig
Artikel werden nicht mehr in einem Blog veröffentlicht sondern „zur Verfügung gestellt“
 Informationen werden anhand ihrer IP identifiziert und entsprechend zusammengestellt




135
Zusammenfassung
WWW: Dienst im Internet
 Weltweites Gewebe durch Verlinkung
 Protokoll: Hypertext Transfer Protokoll


Web 2.0:
 Webseite als Plattform für Anwendungen
 Daten wichtiger als Aussehen
 Nutzung verteilter Daten und Anwendungsteile
 Ausnutzen der Kompetenz vieler Web‐Nutzer
137
Einführung in die Informationstechnik
VOM URL-RATEN ZUR
SUCHMASCHINE
138
Vom URL‐Raten zur Suchmaschine


Web 1.0: URL‐Raten, Web 2.0: Suchmaschinen
Letztere analysieren Webseiten
 Robots durchforsten das Web, in der Regel durch das Folgen von Links
 Analyse des Anfangs oder des gesamten Textes (Altavista, Fireball)


Auswertung von Metatags
Auswertung von Verlinkung: PageRank (Google)
139
Dienste und deren Nutzung
Suchmaschinen

Arten von Suchmaschinen:
 Manuell erstellte Kataloge
 Automatisch erstellte Indizes
 Suchmaschinen für spezielle Zwecke

Datenbank von Suchmaschinen: http://www.suchlexikon.de/
http://www.suchfibel.de
140
Suchmaschinen, der manuell erstellte Katalog

Generell: von Menschen gemacht
Von einer zusammen arbeitenden Gruppe → Redak on
 Von vielen Beteiligten unabhängig voneinander → Folksonomy


Meist hierarchische Präsentation des Katalogs




Beispiel: Yahoo, Web.de
Eignung: Suche nach einem Thema, Sachgebiet, Stichwort
Vorteil: Redaktion kann Inhalt eines Dokuments berücksichtigen
Nachteil: Zusammenhänge können verloren gehen:

Beispiel: Name einer Person + Sachverhalt
http://www.suchfibel.de
141
Suchmaschinen, der automatisch erstellte Katalog




Software (Robot, Crawler, Spider) browsen vollautomatisch durchs Netz → Von Link zu Link
Indexierungssoftware analysiert und strukturiert Daten
Suchmaschinen arbeiten auf Begriffen, ohne die Relevanz eines Wortes für den Inhalt des Dokumentes zu berücksichtigen
→ für die Suchanfrage wich g zu wissen
Eingrenzen des Suchraumes: Welche Begriffe könnten im Zusammenhang mit dem Suchwort stehen

explizites Ausschließen von Begriffen
http://www.suchfibel.de
142
Suchmaschinen, wichtigste Befehle

Plus (+): Verknüpfung zweier Wörter, beide müssen im Ergebnisdokument vorkommen


Minus (‐): schließt ein Wort aus, das nachfolgende darf nicht im Ergebnisdokument vorkommen


‐preis
Anführungsstriche: Verbinden von Worten zu einer Phrase. Wird wie ein Wort behandelt


+Fahrrad
„Der oide Depp“
Trotzdem: nicht jede Suchmaschine erfasst das gesamte Web
http://www.suchfibel.de
143
Barrieren für Suchmaschinen

Die Internetseite …  … ist nicht verlinkt
 … ist zu versteckt
 … ist zu aktuell
 … darf nicht indexiert werden
 … hat zuviel Text
 … hat keinen Text
 ... ist nicht frei zugänglich
 … hat ein unbekanntes Dateiformat
→ Unsichtbares Netz
http://www.ub.uni-bielefeld.de/biblio/search/help/invisibleweb.htm
144
Suchmaschinen, Google


Automa sches Browsen durch Links → Robot
Relevanzsortierung durch PageRank
 Larry Page und Sergey Brin
 Grundprinzip: Je mehr Links auf eine Seite verweisen, desto höher ist das „Gewicht“ der Seite
 Je höher das „Gewicht“ der verweisenden Seiten, desto höher der Effekt → wich ger die Seite
 Ziel: Liste der zu einem Suchbegriff wichtigsten Seiten
http://www.suchfibel.de
145
Suchmaschinen, Google → Benutzung


Plus (+), Minus (‐), Anführungsstriche
Oder (|): Verknüpfung zweier Wörter, beide können im Ergebnisdokument vorkommen





Strand | Beach
Berechnungen: ((3*8)/6)^2
Einheiten umrechnen: foot in cm
Zug, Kino und Wetterauskunft
Erweiterte Syntax
http://de.wikipedia.org/wiki/Google
146
Suchmaschinen, Google → Erweiterte Syntax










cache: Sucht in von Google gespeicherten Seiten
define: Suche nach Definitionen
filetype: Suche nach bestimmten Dateiendungen
inanchor: Suche nur in Links
intitle: Suche nur im Titel einer Seite
inurl: Suche nur in der Adresse
intext: Suche nach Begriffen, die nur im Text vorkommen
link: Ausgabe aller Seiten, die auf eine bestimmte verlinken
site: Suche auf eine bestimmte Domain eingrenzen.
related: Sucht nach ähnlichen Seiten
http://de.wikipedia.org/wiki/Google
147
Spezielle Suchmaschinen, Wolfram Alpha




Weniger Suchmaschine, eher Antwortmaschine
Entwickelt vom Mathematica‐Erfinder Stephen Wolfram
Daten wurden von 100 Mitarbeitern manuell aufbereitet
Fragen können in Suchbegriffen oder direkt gestellt werden
→ Seman sche Suchmaschine


Sehr gut bei Fakten zu Mathematik, Technik, Naturwissenschaften, Linguistik, Wirtschaft
Beispiel: How old is Barack Obama?
148
149
150
Microsoft Bing



Suchmaschine von Microsoft
Seit 3. Juni 2009 online
Entscheidungsmaschine
 Hilfe bei Kaufentscheidungen, Reservierungen, Reisevorbereitungen, etc.

Gute Suche nach Bildern und Videos
 Incl. Interaktiver Vorschaufunktion
151
Spezielle Suchmaschinen, Bildindex





Spezielle Suchmaschine für Bilder
Bildindex der Kunst und Architektur
2 Millionen Bilder aus 13 europäischen Ländern
Nach Künstler, Ort, Porträt und Themen katalogisiert
Suche in unterschiedlichen Bereichen möglich
 Jahr, Genre, http://www.bildindex.de
152
Spezielle Suchmaschinen, 
Metasuchmaschinen
 Weiterleiten einer Suchanfrage an viele Suchmaschinen
 Oft langsamer
 Erste Metasuchmaschine: MetaCrawler.de
 Deutsche Metasuchmaschine: MetaGer.de

Weitere Spezialsuchmaschinen:
 Medienarchive, Bildarchive, Menschsuchmaschinen
 Nachrichtendienste, Bibliotheken und Buchkataloge
 Beispiel: http://www.bundesarchiv.de/index.html.de
153
Zusammenfassung



Suchmaschinen: manuell erstellt oder automatisch
Automatisch: Robots browsen durchs Netz → Indexierung von Webseiten nach Suchbegriffen und Schlüsselwörtern
Suchanfragen haben spezielle Syntax
 +, ‐, „“, |, 

Größter Teil des Netzes ist nicht sichtbar
Zugang zu Informationen teilweise über spezielle Suchmaschinen