1 Einführung in die Informationstechnik - Die Otto-von
Transcription
1 Einführung in die Informationstechnik - Die Otto-von
2 Überblick Einführung in die Informationstechnik Grundlagen Datenkommunikation Datenübertragung analog, digital ISDN, DSL Netzarten und ‐topologien Protokolle Internet Dienste im Internet IP‐Adressen, DNS IV – Internet, Grundlagen und Dienste 3 4 Allgemeines seit Windows 3.11 – Netzwerkunterstützung Linux von Beginn an netzwerkfähig heute jeder Rechner vernetzt außerdem Tablets mit Bluetooth & WLAN Handys mit Bluetooth & WLAN Drucker, HiFi Anlage, intelligentes Wohnen 6 Prinzip der Datenkommunikation Übertragungskanäle DEE DÜE DÜE DEE Übertragungskanal •analog/digital •drahtgebunden/drahtlos, optisch Standardschnittstelle •seriell •parallel •USB •Rechnerbussystem •drahtlos (Bluetooth) DEE DÜE analog, drahtgebunden klassisches Telefonnetz (POTS), Wählleitung veraltet: analoge Standleitungen digital, drahtgebunden ISDN, Wählleitung DSL digitale Standleitungen Datenendeinrichtung (Rechner, Tablet, Handy) Datenübertragungseinrichtung (Modem, Netzwerkkarte, WLAN‐Einheit, Surfstick, etc.) 1 7 Datenübertragung Telefon – analog Datenübertragung Telefon – digital langsam veraltet bisher (ohne ISDN) analoge Übertragung zur Datenübertragung: „aufprägen“ von Daten auf analoge Signale – modulieren Empfänger demoduliert Signal Modem = Modulator/Demodulator öffentliches Telefonnetz Modem 8 ISDN – Integrated Services Digital Network ermöglicht schnelleren Verbindungsaufbau zwei Nutzkanäle von je 64KBit/s zwei Gespräche gleichzeitig möglich durchgehende digitale Verbindung keine „Vertonung“ der Daten wie bei Modem Abschaltung geplant: 2018 Modem 9 ISDN 10 Datenübertragung Telefon – digital Terminator NTBA S0 Bus DSL – Digital Subscriber Line hohe Datenübertragung über Telefonleitung entwickelt Ende der 1980er Jahre ADSL: Asynchrones Verfahren Downstream: „klassisch“ 768KBit/s Upstream: 128KBit/s Computer mit ISDN‐Karte (ISDN Modem) öffentliches Telefonnetz Telefonnetz Heutzutage bis 24MBit/s Downstream, 1MBit/s Upstream VDSL: Very High Speed Digital Subscriber Line bis 50MBit/s (200MBit/s technisch möglich) Downstream NTBA=Network Termination Basic Access parallele Übertragung von: Internet, Telefon, TV 13 DSL mit ISDN Netzarten mit Kabel NTBA S0 Bus LAN: Local Area Network Computer mit ISDN‐ und Netzwerkkarte Ethernet MAN: Metropolitan Area Network WAN: Wide Area Network DSL‐ Modem/ Router öffentliches Telefonnetz Telefonnetz Splitter (NTBBA) Heute meist „Blackbox“ räumlich begrenzter Bereich (wenige km) 10...1000MBit/s Stadt oder größere Firma, 100MBit/s ... 10GBit/s innerhalb eines Landes, Wissenschaftsnetz 2.5 ... 100GBit/s GAN: Global Area Network weltweite Vernetzung, logische Zusammenfassung von LANs, MANs und WANs OVSt NTBBA= Network Termination Broad Band Access 2 14 Netzarten – Drahtlos Datenübertragung Mobilfunk WLAN: Wireless Local Area Network GPRS ‐ General Packet Radio Service Long Term Evolution (LTE): Mobilfunkstandard der vierten Generation (4G) UMTS: Mobilfunkstandard der dritten Generation (3G) drahtloses LAN, 2.4 ... 450MBit/s Bluetooth: Funkverbindung von Geräten zum Datenaustausch – PAN: Personal Area Network Name erinnert an Harald Blåtand, genannt Blauzahn, König von Dänemark, lebte 940‐985 1MBit/s 15 weitere Möglichkeiten: Infrarot Mobilfunk: 100MBit/s High Speed Packet Access (HSPA): HSDPA, HSUPA: 3,6 bzw. 7,2 Mbit/s HSPA+: 28‐84 Mbit/s Global System for Mobile Communications (GSM): Mobilfunkstandard der zweiten Generation (2G), 55‐ 220KBit/s 16 Netztopologien – LAN 18 Netzwerktechnologie Ethernet Bus Ring Stern Backbone Anfang der 70er Jahre entwickelt Urheber: Robert Metcalfe Ether steht für Äther traditionell nur innerhalb eines Gebäudes heute auch weiter entfernte Geräte paketorientierte Datenübertragung BNC RJ 48 19 Skizze zum Ethernet (Robert Metcalfe 1976) 20 Datenpaket Im Netz versandte Dateneinheit Enthält neben den zu übermittelnden Informationen Adressdaten Verwaltungsinformationen Unterschiedliche Datenpakete einer Übertragung wählen unterschiedliche Wege 3 21 Protokoll – Beispiel Protokolle Ablauf eines handvermittelten Ferngesprächs (ab 1877) für Kommunikation notwendig: physikalische Verbindung Vereinbarung über Art und Abfolge des Datenaustausches 1. Kommunikationsprotokoll beschreibt Aufbau eines Datenpaketes 2. dessen Absender und Empfänger den Typ des Pakets (z. B. Verbindungsaufbau, Verbindungsabbau oder reine Nutzdaten) die Paketlänge eine Prüfsumme 3. 3. regelt unter anderem: 22 4. elektrischen Signale während Kommunikation Reihenfolge in der Partner kommunizieren Sprache die sie sprechen Beispiele: TCP, IP, HTTP, FTP, SMTP, IMAP, POP3, Teilnehmer teilt Amt Verbindungswunsch durch Betätigen des Kurbelinduktors mit Amt: Hier Amt, was beliebt? Teilnehmer: wünsche mit Nummer 44 zu sprechen Wenn der gewünschte Teilnehmer frei war, hieß es: Amt: bitte rufen und die Vermittlungskraft stellte mittels eines Schnurpaares die Verbindung zum B‐Teilnehmer her andernfalls: Amt: schon besetzt, werde melden wenn frei Teilnehmer: Verstanden Das Gesprächsende teilte der Anrufende der Vermittlungs‐ kraft durch erneutes Betätigen des Kurbelinduktors mit. Vermittlungskraft trennte die Verbindung und brachte die Klappe per Hand wieder in die Ausgangslage. Quellen: http://de.wikipedia.org/wiki/Klappenschrank http://www.devcon3.de/vermittlungstechnik.htm 23 Protokolle – Beispiel Netze von Netzen Rechnerkommunikation 24 Verbindungsaufbau zwischen Rechnern: Computer 1 schickt Paket mit Verbindungswunsch Computer 2 schickt Paket mit Verbindungsbestätigung 3. Computer 1 bestätigt Computer 2, dass er verstanden hat, dass Computer 2 bereit ist Handshake 1. 2. Nicht immer können alle Teilnehmer in einem Netz vereint werden zu viele Benutzer starke räumliche Trennung der Benutzer Verknüpfung mehrerer Netze erfolgt durch Verbindungsrechner (VR) VR oft ist Kommunikation Zusammenspiel verschiedener Protokolle Internet VR 25 Verbindungsrechner ‐ Beispiele Gateway: Rechner der Verbindung zum Internet herstellt Router: Auch oft als Router bezeichnet 26 Map of the Internet Visualisierung des Internets →Routing Verbinden Teilnetze des Internets Bestimmt nächsten Rechner, zu dem Datenpaket gesendet wird Dienen der Paketvermittlung für IP‐Protokoll komplexe Funktionalität zum optimalen versenden von Paketen Zustand der Routen Kosten (Zeitdauer) für den Versand http://upload.wikimedia.org/wikipedia/commons/b/bd/Internet_ma p_1024_-_transparent.png 4 27 Internet 1973 Entwicklung von TCP/IP 1981 Entwicklung des CSNet 1983 Domain Name System (University of Wisconsin) 1990 Abschaltung des ARPANET Zentren militärischer Forschung UCLA, SRI, UCSB, University of Utah in Salt Lake City TelNET – Arbeit auf und Steuerung von entfernt liegenden Rechnern FTP – Datentransfer zwischen entfernten Rechnern Schub durch Entwicklung von 1972 erstes Emailprogramm (Ray Tomlinson) Erste Nutzung von @ für someone@someplace zwei wichtige Dienste: Internet 1957 Sputnikschock → ab 1962 Entwicklung militärisches Netz 1969 entstand erstes „richtiges“ Netz → ARPA‐Net verbunden wurden vier Standorte 28 TCP – Transmission Control Protocol IP – Internet Protocol 30 Zahlen und Fakten 31 Was passiert in einer Sekunde? Quelle: http://t3n.de/news/infografik-passiert-60-sekunden-internet-314062/ 32 33 Protokolle im Internet Internet – Netz von Netzen Basis für die Übertragung bilden Protokolle (Beschreibungen über Format und Ablauf des Datenaustausches auf verschiedenen Ebenen): TCP: Transmission Control Protocol IP: Internet Protocol TCP sorgt für das Verpacken der Daten in Datenpakete IP ist für den Versand zuständig Einschub BINÄRES ZAHLENSYSTEM 5 34 Bits Bytes komplexe Informationen werden durch Folgen von Bits dargestellt Die kleinste adressierbare Speichereinheit im Rechner ist das Byte kleinste mögliche Informationseinheit Wortschöpfung aus binary und digit zwei Zustände ja / nein wahr / falsch hell / dunkel Männlein / Weiblein links / rechts 35 (engl.: byte; Kunstwort, ausgesprochen: Bait) Folge von acht Bits können gemeinsam in einem Rechner verarbeitet werden technisch einfache Realisierung möglich geladen / ungeladen Strom fließt / Strom fließt nicht 5V Spannung / 0V Spannung magnetisiert / nicht magnetisiert ultimativ: 1 oder 0 36 37 Positions‐ oder Stellenwertsysteme heute gebräuchlichste Art der Zahlensysteme kompakte Darstellung beliebig großer Zahlen mit wenigen Symbolen (Ziffern oder Zahlzeichen) Anzahl der Symbole: Basis des Zahlensystems Beispiele: allgemeine Darstellung: Basis des Zahlensystems: B Ziffer: Zahl: Binärsystem: {0,1} Wert: Oktalsystem: {0,1,2,3,4,5,6,7} ai {0, 1, 2, … , B‐1} <a0, a1, a2, … , an> geschrieben: anan‐1…a2a1a0 a0*B0 + a1*B1 + … + an*Bn= ai*Bi Dezimalsystem: {0,1,2,3,4,5,6,7,8,9} Hexadezimalsystem: {0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F} 38 39 Dezimalsystem Dual‐ oder Binärsystem heute meist verwendetes System Basis: 10 Ziffern: {0,1,2,3,4,5,6,7,8,9} Beispiel: 4361 Basis für Computer Basis: 2 Ziffern: {0,1} = 4*103 + 3*102 + 6*101 + 1*100 = 4*1000 + 3*100 + 6*10 + 1*1 = 4000 + 300 + 60 + 1 Beispiel: 10011 = 1*24 + 0*23 + 0*22 + 1*21 + 1*20 = 1*16 + 0*8 + 0*4 + 1*2 + 1*1 = 16 + 0 + 0 + 2 + 1 = 19 6 40 41 Natürliche Zahlen binär Bitfolgen zur Darstellung größerer Zahlen 1 Bit: 0 und 1 2 Bit: 0 bis 3 3 Bit: 0 bis 7 4 Bit: 0 bis 15 8 Bit: 0 bis 255 16 Bit: 0 bis 65535 INTERNET GRUNDLAGEN 32 Bit: 0 bis 4.294.967.296 n Bit: 0 bis 2n‐1 Darstellung der natürlichen (positiven!) Zahlen 42 IP – Adressen IP V6 Jeder Rechner im Internet braucht eine Adresse Paketvermittlung erfolgt nur über Adressen IP‐Adresse ist 32 Bit lang = 4Byte, daher maximal 232 (4.294.967.296) Rechner adressierbar Zur besseren Lesbarkeit dargestellt als: d1.d2.d3.d4 43 Adressnotation hexadezimal statt dezimal (V4) 8 Blöcke zu je 16Bit (65536 Werte) 2001:0db8:85a3:08d3:1319:8a2e:0370:7344 Als URL: Dezimalwerte der 4 verwendeten Bytes Beispiel: 141.44.27.70 http://[2001:0db8:85a3:08d3:1319:8a2e:0370:73 44]/ Mögliche Abfrage ob ein Rechner im Netz verfügbar ist: ping <ip_adresse> oder <hostname> Letzte IP V4 Adressbereich im April 2011 ausgegeben neues Adressformat IPv6 eingeführt, besteht aus 6 Bytes 2128 Rechner adressierbar = 340 Sextillionen Adressen genau: 340.282.366.920.938.463.463.374.607.431.768.211.456 5×1028 für jeden der 6.5 Mrd. auf der Erde lebenden Menschen Provider bekommt üblicherweise die ersten 32 Bit http://www.networkworld.com/article/2228449/microsoft-subnet/ipv6-addressing--subnets--private-addresses.html 44 45 IP V6 – Besonderheiten Netzmaske ex. nicht mehr explizit (wird nach Schrägstrich angegeben) Möglichkeit ein Netz in „Unter“-Netze zu teilen Ähnlich einer Vorwahl fd01:2:3:4:5:6:7:8/24 Führende Nullen können weggelassen werden fd30:0000:0000:1234:0001:0011:2468:003e ‐> fd30::1234:1:11:2648:3e Unique Local Address (ULA): Alles was mit FD anfängt: fdxx:xxxx:xxxx:… Subnetzmaske: Vorteil: Teilnetze können bestimmten Institutionsteilen zugeordnet werden Vereinfacht die Suche nach IP-Adressen http://www.networkworld.com/article/2228449/microsoft-subnet/ipv6-addressing--subnets--private-addresses.html 7 46 Vergabe von IP‐Adressen Spezielle IP‐Adressen statisch oder dynamisch statisch: IANA/ICANN dynamisch durch Serverdienst: DHCP 47 127.0.0.1 – localhost Deutschland: DENIC: www.denic.de private (nicht öffentliche) IP‐Adressen: 10.0.0.0–10.255.255.255 172.16.0.0–172.31.255.255 dynamic host configuration protocol IANA - Internet Assigned Numbers Authority ICANN - Internet Corporation for Assigned Names and Numbers RIPE - Réseaux IP Européens ARIN DENIC - Deutsches Network Information Center 127.0.0.0 – lokaler Rechner (loopback) 192.168.0.0–192.168.255.255 IANA RIPE APNIC LACNIC AfriNIC DENIC siehe auch: ping 48 49 Domainnamen Anfangszeit des Internet: Adressierung nur über IP‐Adressen Alternativ: verteilte Datenbank zur Verwaltung von Namen im Internet Idee: Jedes Teilnetz verwaltet einen Bereich von Namen und hat selbst Bereichsnamen (domain name) Einführung in die Informationstechnik INTERNET, WEB 1.0 & WEB 2.0 50 Domainnamen Domainnamen bestehen aus mindestens zwei Komponenten: domain.ToplevelDomain, Beispiel: ovgu.de subdomain.domain.ToplevelDomain, Beispiel: fgse.ovgu.de ToplevelDomain: bezeichnet geographischen oder organisatorischen Bereich Zweite Komponente: Domain vollständig: uni‐magdeburg.de Beispiel: de … Deutschland, edu … education Beispiel: uni‐magdeburg 51 Toplevel Domains Geographische: de, it, fr, cz, pl, eu Organisatorische: edu, biz, mil, gov, org, info, name Teilweise werden freiwillige Kategorien eingefügt Beispiel: ac.uk, co.uk Vergabe in Deutschland über DENIC Domainnamen nicht nur für WWW siehe auch: nslookup 8 52 Dienste im Internet DNS Verschiedene Protokolle für verschiedene Aufgaben bzw. zur Realisierung verschiedener Dienste Internet stellt nur Kommunikationsinfrastruktur zur Verfügung Beispieldienste: 53 Email World Wide Web Dateitransfer (FTP) Benutzung entfernter Rechner (Telnet, SSH) Domain Name Service (DNS) Instant Messagin (ICQ, etc.) Domain Name System verteilte Datenbank die den Namensraum der Adressen im Internet verwaltet Umsetzung von Domainnamen in IP‐Adressen (forward lookup) und umgekehrt (reverse lookup) Vorteile: dezentrale Verwaltung hierarchische Strukturierung des Namensraums in Baumform Eindeutigkeit der Namen Erweiterbarkeit Quelle. Wikipedia 54 55 E‐Mail Message Transfer System (MTS) E-Mail Client zum Versand (und Empfang) elektronischer Post verwendete Protokolle: Port 25 (SMTP) SMTP Server POP3/ IMAP Server SMTP – Simple Mail Transfer Protocol POP 3 – Post Office Protocol Version 3 IMAP – Internet Message Access Protocol Port 143 (IMAP) Anwendungen: E‐Mail‐Clients Zahlen & Fakten (2011): 3,146 Milliarden Emailkonten Zahl der Spam‐Emails von 2010 zu 2011 um 20% gesunken Port 110 (POP3) E-Mail Client E-Mail Client SMTP (Simple Mail Transfer Protocol): Zuverlässiger Nachrichtentransfer Suche nach Ziel‐SMTP‐Server über DNS (Domain Name System) Weiterleitung dann lokale Auslieferung an POP3/IMAP‐Server 56 POP3 vs. IMAP POP3: 57 Ports Keine ständige Verbindung zum Mailserver erlaubt nur das Auflisten, Abholen und Löschen von E‐ Mails am E‐Mail‐Server Keine Verwaltungsmöglichkeiten auf dem Server Emails werden heruntergeladen und vom Anwendungsprogramm verwaltet IMAP: Adresskomponenten, in Netzwerkprotokollen eingesetzt, um Datenpakete den richtigen Diensten zuzuordnen bei TCP: Portnummer 16Bit: 65535 Werte 0...49151 registrierte Ports (IANA), darüber frei Beispiel HTTP‐Port: 80 80 HTTP 143 IMAP 5190 ICQ 20 FTP Emails bleiben auf dem Server Gesamte Verwaltung erfolgt auf dem Server Vorteil: Mehrere Zugänge von unterschiedlichen Rechnern 9 58 weitere Dienste Weitere Dienste FTP zur Übertragung von Dateien Peer‐To‐Peer‐Systeme zum Austausch von Dateien Protokoll: FTP – File Transfer Protocol BitTorrent, eDonkey, eMule, Gnutella, FastTrack Anwendungen: FileZilla, integriert in TotalCommander Gleichgestellte Rechner (Gegensatz Client‐Server) Rechner, die Dienste in Anspruch nehmen und diese Telnet zur Benutzung entfernter Rechner ebenfalls zur Verfügung stellen Protokoll: Telnet Protocol 59 SSH zur sicheren Benutzung entfernter Rechner Internet‐Telephonie Direkte Internet‐Telefonie Ähnlich Telnet aber mit verschlüsselter Datenübertragung Voice over Protokoll: SSH Protocol IP Datenübertragung mittels TCP/IP 60 61 World Wide Web „Weltweites Gewebe“ Weltweite durch Hyperlinks „verwobene“ Dokumente Internet realisiert die Übertragung von Webseiten verwendete Protokolle: Internetdienste HTTP – HyperText WEB 1.0 UND WEB 2.0 HTTPS – HyperText Transfer Protocol Transfer Protocol Secure Anwendungen: Webbrowser 62 63 Total Sites Across All Domains Total Sites Across All Domains August 1995 – Mai 2012 August 1995 – Februar 2013 http://news.netcraft.com/ http://news.netcraft.com/ 10 66 Organisation des WWW: W3C Organisation des WWW: W3C Auch: WWW‐Consortium: www.w3c.org kümmert sich um Standardisierung und Normierung W3C keine zwischenstaatliche Organisa on → legt keine ISO‐ Normen fest Zusammenschluss verschiedener Mitgliedsorganisationen u.a.: 67 Apple, AT&T, Intel, Microsoft, SAP, SUN Leitung: MIT (USA), INRIA (Frankreich), Keio University (Japan) Gründung: 1994 Gründer und Vorsitzender: Tim Berners‐Lee deutsch‐österreichisches Büro: FH‐Potsdam Techniken (Auswahl): HTML, XHTML, XML, RDF, OWL, CSS, SVG, RSS Empfehlungen für barrierefreie Gestaltung von Webauftritten 68 69 HTTP HTTP‐Kommunikationsablauf Hypertext Transfer Protocol 1989 von Tim Berners‐Lee zusammen mit dem URL und der Sprache HTML entwickelt Zustandsloses Protokoll: Aktivieren des Links http://www.example.net/infotext.html schickt an www.example.net die Anfrage, die Ressource /infotext.html zurückzusenden Umsetzen des Namens www.example.net über das DNS‐Protokoll in eine IP‐Adresse Senden einer Anforderung an den Webserver nach erfolgreicher Datenübertragung wird Verbindung nicht aufrecht erhalten Sitzungsdaten gehen verloren Cookies für Speicherung der Sitzungsdaten GET /infotext.html HTTP/1.1 Host: www.example.net weitere Informationen in der Anfrage möglich 70 HTTP‐Kommunikationsablauf Antwort des Servers bestehend aus 71 HTTP Statuscodes: Serverantworten, die Informationen über Fehlermeldungen etc. liefern Header‐Informationen Inhalt der Nachricht = Webseiten‐Quellcode HTTP/1.1 200 OK Server: Apache/1.3.29 (Unix) PHP/4.3.4 Content-Length: (Größe von infotext.html in Byte) Content-Language: de Content-Type: text/html Connection: close (Inhalt von infotext.html) 200 – OK: Die Anfrage wurde erfolgreich bearbeitet und das Ergebnis der Anfrage wird in der Antwort übertragen. 201 – Created: Die Anfrage wurde erfolgreich bearbeitet. Die angeforderte Ressource wurde vor dem Senden der Antwort erstellt. 400 – Bad Request: Die Anfrage‐Nachricht war fehlerhaft aufgebaut. 401 – Unauthorized: Die Anfrage kann nicht ohne gültige Authentifizierung durchgeführt werden. Wie die Authentifizierung durchgeführt werden soll wird im „WWW‐Authenticate“‐Header der Antwort übermittelt. 403 – Forbidden: Die Anfrage wurde mangels Berechtigung des Clients nicht durchgeführt. Diese Entscheidung wurde – anders als im Fall des Statuscodes 401 – unabhängig von Authentifizierungsinformationen getroffen. 404 – Not Found: Die angeforderte Ressource wurde nicht gefunden. Dieser Statuscode kann ebenfalls verwendet werden, um eine Anfrage ohne näheren Grund abzuweisen. 500 – Internal Server Error: „Sammel‐Statuscode“ für unerwartete Serverfehler 11 72 Cookies 73 Flash‐Cookies Problem: Zustand einer Web‐Sitzung nicht oder nur auf dem WebServer speicherbar → IP‐Adressen meist dynamisch vergeben Beispiel: Inhalt des Warenkorbs, Surfverhalten Lösung: Speicherung von Informationen zu einer Webseite auf dem Clientrechner Cookies: kurze Texte (4KB) → Cookies vom Webserver an den Webbrowser gesandt Vom Webbrowser in Datenbank gespeichert Benutzung wie „normale“ Text‐Cookies allerdings 100KB groß danach Information des Anwenders Flash: Technologie von Adobe zur Erstellung (Programmierung) multimedialer, interaktiver Inhalte Problem: Datenschutz Browserübergreifend, da an Flash‐Player gebunden Kann zur Überwachung des Nutzers eingesetzt werden Nicht einfach über den Browser löschbar Kann normale Text‐Cookies kopieren und auch wiederherstellen (selbst wenn der Nutzer sie löscht) 74 Web 2.0 75 Begriff: Web 2.0 Cloud Computing Veränderung der Wahrnehmung des Webs Wikis Web 2.0 technische Sicht vs. soziale Sicht Benutzung einer Versionsnummer, ähnlich wie bei Software Definition des Begriffs schwierig Webservices Communitys Virtuelle Welten Folksonomy Grundlage: Weiterentwicklung der Web‐Technologien Tagging Social Cataloging Kollaboration Social Web Blogs Semantic Web Social Bookmarking → Versuch einer Annäherung Podcasting 76 77 Web 2.0 ‐ Sichtweisen Web 2.0 ‐ Sichtweisen O‘Reilly: Web 2.0 als Computerplattform, die Daten und Anwendungen bereitstellt Meckel: Idee der gemeinsamen Maximierung kollektiver Intelligenz und der Bereitstellung von Nutzenwerten für jeden Teilnehmer durch formalisierte und dynamische Informationsteilung und ‐herstellung aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007 Breeding: neue Vision des Internets, die größere Interaktivität, Kontrolle des Nutzers über Informationen, radikale Personalisierung, die Entwicklung von Online‐Gemeinschaften und demokratisches Management von Informationen verspricht. Krol definiert Web 2.0 als Kombination von Geschäftsprozessen, Prinzipien und Technologien, die dem Nutzer Partizipation und Zusammenarbeit ermöglichen aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007 12 78 Web 2.0 ‐ Sichtweisen 79 Web 2.0 - Beobachtungen Tapscott: Bedeutung von Web 2.0: globale Infrastruktur, in der Kollaborationskosten gegen Null fallen Beispiele die die Veränderung des Webs charakterisieren (O‘Reilly, 2005!): Web 1.0 DoubleClick Ofoto mp3.com Britannica Online personal websites domain name speculation publishing directories (taxonomy) content management systems Web 2.0 Google AdSense Flickr Napster Wikipedia blogging search engine optimization participation tagging ("folksonomy") wikis Was unterscheidet aber nun eine Web 1.0Anwendung von einer Web 2.0-Anwendung? aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007 80 81 Web 2.0 – Kriterien Web 2.0 – Kriterien das Web als Plattform (anstatt des lokalen Rechners) Daten als wichtigste Grundlage „Architektur des Mitwirkens“ → Verstärkung der Vernetzung, Partizipation Modulare Zusammenstellung von Systemen und Seiten verteiltes, gemeinsames Nutzen von Inhalten und technischen Diensten → einfache (neue) Geschäftsmodelle Ende des klassischen So warelebenszyklus‘ → immerwährendes Beta‐Stadium Die Software geht über die Fähigkeiten eines einzelnen Verwendungszwecks hinaus. Module von unterschiedlichen Entwicklern (Prinzip ähnlich OpenSource) 82 83 Web als Plattform Web als Plattform ‐ WebOS Vom Desktop zum Webtop zentrales Ziel von Web 2.0 – Webbrowser als Plattform Plattform Vorteile gegenüber Anwendung keine Portierung auf andere Betriebssysteme keine neuen Software Ausgaben kontinuierliche Verbesserung Höhere Scherheit Software als Service, Vermittler „Betriebssystem“ für Webanwendungen Kein Betriebssystem im eigentlichen Sinne OS stellt Schnittstelle zwischen Hardware und Software dar Verantwortlich für Dateisystem WebOS: Schnittstelle zur Programmierung von Webanwendungen Zwischen Anwendung und Hardware WebOS ist mehr eine Art Oberfläche → WebDesktop Bietet aber auch Funktionen zur Verwaltung von Dateien 13 84 85 Web als Plattform: WebDesktop Web als Plattform WebOs eigentlich im Hintergrund → Funktionalität WebDesktop im Vordergrund → Sichtbare Schnittstelle zur Steuerung und Verwaltung von Webanwendungen Meist ähnlich Windows Beispiele für WebDesktop, WebOS: eyeOS: http://eyeos.org GlideOS: http://www.glideos.com OnlineOS: http://icube.at/home.jsp Übersicht siehe: http://en.wikipedia.org/wiki/Web_desktop 86 87 88 89 Web als Plattform: eyeOS Einführung in die Informationstechnik WEB 2.0 14 90 Aspekte des Web 2.0: Cloud Computing 91 Cloud Computing Rechnen in der Wolke Bereitstellung von Diensten, on‐demand: Online Speicher zum Ablegen von Dateien Auch Musik, incl. Musicplayer (Cloudplayer) Rechner, Speicher, Netz Anwendungen, Betriebssysteme, Tools Amazon Cloud Drive Alternative: DropBox, Apple iCloud Ebenfalls Online‐Speicher zur Dateiablage und Lokale Anschaffung/Installation entfällt ‐austausch Lediglich Zugangssystem muss vorhanden sein Google Drive Online Speicher, Zugriff auf Dokumente von Google Docs 92 Gemeinschaftliches Bearbeiten von Dokumenten Interaktive Anwendungen im Web Mindmaps, Office‐Anwendungen Chart‐ und Diagrammerstellung Bildbearbeitung, Fotogallerien Communities: Freunde finden, gemeinsam Einkaufen, personalisierte Angebote Speicherplatz für Dateien … Übersicht: go2web20.net GoogleDocs, WizIQ, Zoho, ThinkFree http://mashable.com/2008/02/11/13‐word‐processors/ 94 Gliffy Mindmeister 15 96 Aspekte des Web 2.0: Abonnementdienste Aspekte des Web 2.0: WebServices Web 1.0: alles auf einem Rechner Web 2.0: Software‐Bausteine, die auf verschiedenen Rechnern laufen → komponentenbasierte Webservices (SOA) Verbindung zu einer Anwendung über das Internet Service kann Daten bereitstellen, auswerten Anwendung kann im Netz laufen oder lokal Beispiel: Amazon Webservices, Projekt Deutscher Wortschatz (http://wortschatz.uni‐leipzig.de/Webservices/), Interaktion zwischen Fluggesellschaften und Reisebüros Bereitstellung von Inhalten, die abonniert werden können Feeds: RSS, Atom 97 RSS: Really Simple Syndicate Zusätzliches Programm erforderlich: Feedreader Abonnement durch Eingabe der Feedadresse Feedreader lädt Feed automatisch (zeitgesteuert) (http://de.wikipedia.org/wiki/Webservice#Beispiele) 98 Soziale Aspekte des Web 2.0 99 Soziale Aspekte des Web 2.0 Web 1.0: Autoren sind für Inhalte verantwortlich Web 2.0: Benutzer/innen wirken an Inhalten mit Öffentliche Sammlung von interessanten Informationen Auffinden von Kontakten mit gleicher Interessensbasis → Architektur des Mitwirkens Kollaborative Organisation von Informationen: Nutzung kollektiver Intelligenz, kollektiven Wissens Organisation von persönlichen Informationen Soziales „Suchen & Finden“ von Informationen Beispiel: Reflexion und Sammlung von Erfahrungen (Chronologische) Dokumentation von Ideen und Verknüpfung von Bibliographien mit bestimmten Nutzern Auffinden von Publikationen durch dessen Bibliographie Gedanken Reinmann & Sporer (2007) Reinmann & Sporer (2007) 100 101 Soziale Aspekte I ‐ Folksonomy Soziale Aspekte I ‐ Folksonomy Gemeinschaftliches Indexieren → Tagging Zuordnen von Descriptoren, Schlagwörtern (Tags) zu Objekten Synonyme Unterschiedliche Sprachen Getrennt‐, Zusammenschreibung WebDesktop, Web‐Desktop, Web Desktop, Web_Desktop Kontextbedeutungen: Apple, Virgin Singular/Plural Lesezeichen Photos wissenschaftliche Paper Meist keine Festlegungen über Vokabular Jeder kann frei Taggen Herausbildung gemeinschftlicher Wortschatz Probleme: → Bildung unterschiedlicher Kategorien Vorteile: Arbeitsverteilung Benutzer fügen Schlagworte hinzu, nicht Autoren → bessere Benutzbarkeit (Suchergebnisse)? 16 102 Beispiel: Flickr Soziale Aspekte I - Folksonomy Phototagging: „Flickr“, Social Bookmarking: „Delicious“, „Bibsonomy“ Digg Social Cataloging: Library Thing 104 Soziale Aspekte II ‐ Blogging Soziale Aspekte III: Microblogging Blog – Wortkreuzung aus Web Log Blog bei dem nur Kurznachrichten versandt werden Postings können abboniert werden Öffentlich oder privat zugänglich Bekanntester Dienst: Twitter Web‐Tagebuch Umfrage ergab: 73% der Blogger schreiben aus Spass 27% nicht persönlich, zur Wissensvermittlung 106 Beispiele für textuelle Blogs: … Blogs nicht nur textuell Podcasts VideoBlogs, Vlogs 107 108 Soziale Aspekte IV: Wikis Soziale Aspekte V: Social Networking Name stammt von Wikiwiki (hawaianisch für schnell) Content‐Management‐System (CMS) Erlaubt die gemeinsame Erstellung von Webseiten Prominentes Beispiel: Wikipedia Desktop Wikis: WikidPad, Tomboy, TiddlyWiki Webseiten mit denen Menschen in Kontakt treten/bleiben können Management von sozialen Netzwerken Zweck: Kommunikation Bildung neuer Geschaftsverbindungen Entwicklung neuer Projekte Terminmanagement, ‐abstimmung 17 110 Social Networking 111 Personalisiertes Web Beispiele Interessen: Fotocommunity, StudiVZ, Flickr Dating: Urbanite Beziehungsorientiert: OpenNetworX, LinkedIn, Friendster, StayFriends, Facebook Geschäftsorientiert: Ecademy, Xing Web 1.0: Webseite statisch, alle konsumieren die gleichen Inhalte Web 2.0: Benutzer/innen können Inhalte ihren Interessen entsprechend anpassen Personalisierung, Definition: Anpassen an persönliche Bedürfnisse Bei digitalen Dokumenten: Anpassung des Inhalts Anpassung der Darstellung Grundsätzliche Unterscheidung: Für den Benutzer/Benutzerin Durch den Benutzer/Benutzerin 112 Personalisiertes Web 113 Netvibes Personalisierung durch den Benutzer/in: Inhalte von Webseiten Beispiel: NetVibes, Pageflakes Webradio: Last.fm, MusiMap, musiclens, pandora Personalisierung für den Benutzer/in: Google AdSense 114 Musiclens 115 Daten‐getriebene Anwendungen Web 1.0: Wer Inhalte konsumiert war unbekannt Web 2.0: Nutzung von Daten (über Benutzer/innen → Profile) jede erfolgreiche Internet Anwendung basiert auf einer speziellen Datenbasis eBay: Produkte und Verkäufer Amazon: Produkte und Rezensionen Google: Webseiten Teleatlas, Geocontent: Geo‐Daten Kontrolle über Daten=Kontrolle über Markt Management einer Datenbasis ist die Kernkompetenz von Web 2.0 Firmen Software wird zu „Infoware“ 18 116 Sicherheit im Web 2.0 News im Web 2.0 Allgemeine vs. Persönliche Daten Allgemein: Web 1.0: Traditionelle Medien stellen ihre Informationen im Web zur Verfügung Web 2.0: alle sind Journalisten? Rezensionen, Statistiken, Landkarten Persönliche Datenspuren im Netz: Einkaufsverhalten → Vorlieben Browseverhalten → Interessen Persönliche Daten: Geburtstag, Adresse, Bankverbindung, Telefonnummer, Kreditkartendaten → komple es Nutzerprofil, Identitätssubsystem für Web 2.0? 117 Stirbt der traditionelle Journalismus? Werden Nachrichten nur noch elektronisch gefiltert und aufbereitet? Was passiert mit diesen Informationen? Wie sicher sind sie? Daten resultieren nicht nur aus Web‐Verhalten, auch von Payback u.ä. Datensammlern Journalist als Moderator zwischen bloggenden Bürgern? → Graswurzel oder Bürgerjournalismus 118 119 Aspekte des Web 2.0: Bürgerjournalismus The Giraffe Project (Christopher Grotke, Lisa LePage): Schaffung einer „News‐Community“ Wikimedia IndyMedia The Huffington Post Verbindung zwischen Radio und Blog: Blogspiel (Deutschlandfunk) Google News Leser (Consumer) und Journalist (Producer) vermischen sich zu: Internet Grundlagen SEMANTIC WEB Produser Prosumer 120 Semantic Web Codierung von Bedeutung im Web I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day‐to‐day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize. – Tim Berners‐Lee, 1999 In rechnerverständlicher Form Ermöglicht automatische Auswertung von Bedeutungen Vorteile: Daten können in Beziehung zueinander gesetzt werden Neue Erkenntnisse können gewonnen werden 19 Das Web – Probleme oder warum Semantic Web? „The Semantic Web is not a separate Web, but an extension of the current one, in which information is given well‐defined meaning, better enabling computers and people to work in cooperation.” Inhalte des Webs auf Menschen zugeschnitten Problem: Finden von (gesuchten) Informationen Suchmaschinen können Fundstellen suchen Layout, Struktur → einfache Nutzung Stichwortbasiert, ohne Kontext Wahl des richtigen Stichwortes ist entscheidend Ergebnisse sind immer einzelne Webseiten Tim Berners‐Lee, James Hendler, Ora Lassila →From a Web of Documents to a Web of Data Web – Probleme oder warum Semantic Web? Web ist heterogen: unterschiedliche Informationsdarstellung: Bilder, Text, Audio unterschiedliche Codierung: ASCII, Unicode, ISO… unterschiedliche Sprachen Bsp.: Suche nach Apple bringt Frucht und Rechner müssen von Menschen interpretiert und kombiniert werden oft ist gesuchte Info auf mehrere Webseiten verteilt → Informa onsintegra on Relevanz kann nur schwer durch Maschine geprüft werden Beispiele Gegenüberstellung von Informationen zum Wahlprogramm einzelner Parteien Verknüpfung von verteilt im Netz liegenden Informationen: Vortrag, Termin in Hawthorne/NY Reisebuchung von Berlin nach Hawthorne: → Informa onen zu einem Thema sind nur schwer aufzufinden Berlin liegt in Deutschland/Europa Hawthorne liegt in den USA/Amerika → Flugbuchung notwendig, Anschlusszug notwendig oder Mietwagen Beispiel: Abendliche Planung Essen gehen, Kino gehen, Cocktailbar Problem: Finden eines guten Restaurants (je nach persönlicher Mögliche Anwendungsbereiche kontextbezogene Informationsvernetzung Vorliebe, Preisklasse, Einschätzung durch andere) Ermittlung des Kinoprogramms in unterschiedlichen Kinos mit Genrevorgabe, Reservierung von Karten Cocktailbar sollte in der Nähe des Kinos liegen Mögliche Anfrage: Finde ein Restaurant mit italienischer Küche in mittlerer Preislage, und zeige mir die Kritiken zu den neuen Filmen der letzten zwei Wochen Beispiel aus: http://www2.informatik.hu-berlin.de/mac/lehre/WS04/Ausarbeitungen/SemanticWeb.pdf allgemein: wissensintensive Prozesse Beispiel: intelligentes Information Retrieval personalisierte Wissensportale Helpdesk‐Systeme → Anwendungsso ware muss „logisch denken“ → neues Wissen aus vorhandenem erschließen http://rewerse.net/press_releases_approved/www.uni-protokolle.de/id/105246/index.html 20 Semantic Web Semantic Web Prinzipien (Auswahl) Beschreibung von Daten und deren Semantik in rechnerverständlicher/‐verarbeitbarer Form Daten brauchen Informationen darüber, wie sie zu strukturieren und zu interpretieren sind → Wissensrepräsenta on im Web 1. Alles kann durch eine URI identifiziert werden http://www.magdeburg.de mailto: marcel.goetze@ovgu.de http://www.w3.org/2001/12/semweb-fin/w3csw Semantic Web Prinzipien (Auswahl) 2. Ressourcen und Links können typisiert sein href Ressource Ressource href href erzeugt Buch Report gelesen von Ressource Ressource href href Autor erzeugt erzeugt Buch Report geschrieben von Ressource gelesen von href kommuniziert mit Ressource Lektor • http://www.w3.org/2001/12/semweb-fin/w3csw href href geschrieben von Ressource Software Ressource erzeugt href Ressource 3. Unvollständige Informationen sind unproblematisch Software Ressource href Semantic Web Prinzipien (Auswahl) Autor kommuniziert mit 404 not found Lektor 404 not found im Semantic Web können fehlende Informationen rekonstruiert werden http://www.w3.org/2001/12/semweb-fin/w3csw Semantic Web Prinzipien (Auswahl) Semantic Web Prinzipien (Auswahl) 4. Eine absolute Wahrheit ist nicht notwendig neues Wissen kann aus vorhandenen Informationen geschlussfolgert werden Marcel arbeitet in der Otto‐von‐Guericke‐ Universität Stefan ist Kollege von Marcel → Stefan arbeitet ebenfalls an der OvG‐Uni 5. Evolution wird unterstützt Informationen können auf einfache Weise in einen neuen Kontext gesetzt werden Beispiel: Stefan bekommt einen Ruf an eine andere Universität → neue Verknüpfung http://www.w3.org/2001/12/semweb-fin/w3csw http://www.w3.org/2001/12/semweb-fin/w3csw 21 134 Web 3.0? Zusammenfassung Weiterführende semantische Vernetzung? Internet 2.0: jedes Gerät hat eine eigene IP‐Adresse WWW: Dienst im Internet Weltweites Gewebe durch Verlinkung Protokoll: Hypertext Transfer Protokoll IPv6: 128 Bit lange Adresse = 2128 Adressen reicht, für 6,65 ∙ 1023 Adressen/m2 Erdoberfläche Jeder kann jederzeit online sein Vielleicht aber auch nicht nur jedes Gerät sondern jeder Blog, jeder Artikel, Autor,… Verarbeiten von Informationen erfolgt dezentral, getrennt vom Medium, unabhängig vom Autor 135 Web 2.0: Webseite als Plattform für Anwendungen Daten wichtiger als Aussehen Man liest nicht mehr ein Blog sondern von einem Autor in mehreren Blogs Orte wären irrelevant. Bild wird durch IP bestimmt, nicht Position Neue Zugangswege wären notwendig Artikel werden nicht mehr in einem Blog veröffentlicht sondern „zur Verfügung gestellt“ Informationen werden anhand ihrer IP identifiziert und entsprechend zusammengestellt Nutzung verteilter Daten und Anwendungsteile Ausnutzen der Kompetenz vieler Web‐Nutzer 137 138 Vom URL‐Raten zur Suchmaschine Web 1.0: URL‐Raten, Web 2.0: Suchmaschinen Letztere analysieren Webseiten Robots durchforsten das Web, in der Regel durch das Folgen von Links Analyse des Anfangs oder des gesamten Textes (Altavista, Fireball) Einführung in die Informationstechnik VOM URL-RATEN ZUR SUCHMASCHINE Auswertung von Metatags Auswertung von Verlinkung: PageRank (Google) 139 Dienste und deren Nutzung Suchmaschinen, der manuell erstellte Katalog Suchmaschinen 140 Arten von Suchmaschinen: Manuell erstellte Kataloge Automatisch erstellte Indizes Datenbank von Suchmaschinen: http://www.suchlexikon.de/ Meist hierarchische Präsentation des Katalogs Eignung: Suche nach einem Thema, Sachgebiet, Stichwort Vorteil: Redaktion kann Inhalt eines Dokuments berücksichtigen Nachteil: Zusammenhänge können verloren gehen: http://www.suchfibel.de Von einer zusammen arbeitenden Gruppe → Redak on Von vielen Beteiligten unabhängig voneinander → Folksonomy Suchmaschinen für spezielle Zwecke Generell: von Menschen gemacht Beispiel: Yahoo, Web.de Beispiel: Name einer Person + Sachverhalt http://www.suchfibel.de 22 141 Suchmaschinen, der automatisch erstellte Katalog Suchmaschinen, wichtigste Befehle Software (Robot, Crawler, Spider) browsen vollautomatisch durchs Netz → Von Link zu Link Indexierungssoftware analysiert und strukturiert Daten Suchmaschinen arbeiten auf Begriffen, ohne die Relevanz eines Wortes für den Inhalt des Dokumentes zu berücksichtigen → für die Suchanfrage wich g zu wissen Eingrenzen des Suchraumes: Welche Begriffe könnten im Zusammenhang mit dem Suchwort stehen 142 Plus (+): Verknüpfung zweier Wörter, beide müssen im Ergebnisdokument vorkommen Minus (‐): schließt ein Wort aus, das nachfolgende darf nicht im Ergebnisdokument vorkommen Anführungsstriche: Verbinden von Worten zu einer Phrase. Wird wie ein Wort behandelt Trotzdem: nicht jede Suchmaschine erfasst das gesamte Web explizites Ausschließen von Begriffen +Fahrrad ‐preis „Der oide Depp“ http://www.suchfibel.de http://www.suchfibel.de 143 Barrieren für Suchmaschinen 144 Suchmaschinen, Google Die Internetseite … … ist nicht verlinkt Automa sches Browsen durch Links → Robot Relevanzsortierung durch PageRank … ist zu versteckt Larry Page und Sergey Brin … ist zu aktuell Grundprinzip: Je mehr Links auf eine Seite verweisen, desto höher ist das „Gewicht“ der Seite … darf nicht indexiert werden … hat zuviel Text Je höher das „Gewicht“ der verweisenden Seiten, desto höher der Effekt → wich ger die Seite … hat keinen Text Ziel: Liste der zu einem Suchbegriff wichtigsten Seiten ... ist nicht frei zugänglich … hat ein unbekanntes Dateiformat → Unsichtbares Netz http://www.suchfibel.de http://www.ub.uni-bielefeld.de/biblio/search/help/invisibleweb.htm 145 Suchmaschinen, Google → Benutzung Plus (+), Minus (‐), Anführungsstriche Oder (|): Verknüpfung zweier Wörter, beide können im Ergebnisdokument vorkommen Strand | Beach 146 Suchmaschinen, Google → Erweiterte Syntax Berechnungen: ((3*8)/6)^2 Einheiten umrechnen: foot in cm Zug, Kino und Wetterauskunft Erweiterte Syntax http://de.wikipedia.org/wiki/Google cache: Sucht in von Google gespeicherten Seiten define: Suche nach Definitionen filetype: Suche nach bestimmten Dateiendungen inanchor: Suche nur in Links intitle: Suche nur im Titel einer Seite inurl: Suche nur in der Adresse intext: Suche nach Begriffen, die nur im Text vorkommen link: Ausgabe aller Seiten, die auf eine bestimmte verlinken site: Suche auf eine bestimmte Domain eingrenzen. related: Sucht nach ähnlichen Seiten http://de.wikipedia.org/wiki/Google 23 147 148 149 150 Spezielle Suchmaschinen, Wolfram Alpha Weniger Suchmaschine, eher Antwortmaschine Entwickelt vom Mathematica‐Erfinder Stephen Wolfram Daten wurden von 100 Mitarbeitern manuell aufbereitet Fragen können in Suchbegriffen oder direkt gestellt werden → Seman sche Suchmaschine Sehr gut bei Fakten zu Mathematik, Technik, Naturwissenschaften, Linguistik, Wirtschaft Beispiel: How old is Barack Obama? Microsoft Bing Suchmaschine von Microsoft Seit 3. Juni 2009 online Entscheidungsmaschine Hilfe bei Kaufentscheidungen, Reservierungen, Reisevorbereitungen, etc. Gute Suche nach Bildern und Videos Incl. Interaktiver Vorschaufunktion 151 Spezielle Suchmaschinen, Bildindex Spezielle Suchmaschine für Bilder Bildindex der Kunst und Architektur 2 Millionen Bilder aus 13 europäischen Ländern Nach Künstler, Ort, Porträt und Themen katalogisiert Suche in unterschiedlichen Bereichen möglich Jahr, Genre, 152 Spezielle Suchmaschinen, Metasuchmaschinen Weiterleiten einer Suchanfrage an viele Suchmaschinen Oft langsamer Erste Metasuchmaschine: MetaCrawler.de Deutsche Metasuchmaschine: MetaGer.de Weitere Spezialsuchmaschinen: Medienarchive, Bildarchive, Menschsuchmaschinen Nachrichtendienste, Bibliotheken und Buchkataloge Beispiel: http://www.bundesarchiv.de/index.html.de http://www.bildindex.de 24 153 Zusammenfassung Suchmaschinen: manuell erstellt oder automatisch Automatisch: Robots browsen durchs Netz → Indexierung von Webseiten nach Suchbegriffen und Schlüsselwörtern Suchanfragen haben spezielle Syntax +, ‐, „“, |, Größter Teil des Netzes ist nicht sichtbar Zugang zu Informationen teilweise über spezielle Suchmaschinen 25