4:1 - Informationssysteme
Transcription
4:1 - Informationssysteme
Inhaltsverzeichnis Übersicht über die Vorlesung Information Engineering und Information Life Cycle Information Engineering Informationskompetenz Norbert Fuhr Suchkompetenz Universität Duisburg-Essen Information Engineering SS 2013 Daten – Information – Wissen Wissensmanagement Information Lifecycle Zusammenfassung (Vorläufige) Übersicht über die Vorlesung Übersicht über die Vorlesung 1. Grundlagen 2. Methoden 3. Systeme 4. Anwendungen 5. Evaluierung Grundlagen Methoden I Information Engineering I Information Lifecycle I Daten – Information – Wissen I Wissen und Prozesse: Workflows / Wissensintensive Aufgaben I Information Seeking & Searching I Repositories, Datenbanken I Digitale Bibliotheken und Collaboratories Systeme I (Autorensysteme) I Digitalisierung I Informationsextraktion I Architekturen I (Information Mining) I Repositories I Metadaten I Web Server I Ontologien I Content-Management-Systeme I Annotationen I Wikis I Digital Preservation (Langzeitarchivierung) I Digitale Bibliotheken I (Information Retrieval) I Recommendation I Evaluierung Anwendungen Information Engineering I DAFFODIL I COLLATE I Soziale Netze / Kollaborative Web 2.0-Systeme Definition Eigenschaften Was ist Information Engineering? Was ist Information Engineering? Eine erste Definition von Information Engineering: I Formale Methoden zur I The application of an interlocking set of formal techniques for the planning, analysis, design and construction of information systems, applied on an enterprisewide basis or across a major sector of an enterprise. I I I Planung Analyse Entwurf Realisierung von Informationssystemen I Methoden bauen aufeinander auf und sind voneinander abhängig I Methoden werden zumeist unternehmensweit verwendet James Martin Was ist Information Engineering? Eigenschaften des IE Information Engineering is an integrated set of techniques, based on corporate strategic planning, which results in the analysis, design and development of systems which supports those plans exactly. Information Engineering is applied by managers and users with no knowledge of computers, but instead with an expert knowledge of their business - in conjunction with expert systems which provide rapid feedback to management for refinement of the strategic plans. I I 1. 2. 3. 4. 5. Finkelstein I Strategische Planung I Kooperation und Partnerschaft von Managern und Nutzern mit Entwicklern Eigenschaften des IE Information Engineering beschreibt keine starre Methodik, sondern Methoden IE fördert Top-Down-Ansatz von Informationssystemen: Unternehmensweite Informationssystemplanung Analyse von Geschäftsbereichen Informationssystementwurf Informationsystemrealisierung Informationssystemeinführung Eigenschaften des IE Keine Beschränkung auf Unternehmen! I IE unterstützt Aufbau eines sich laufend weiterentwickelnden Bestands an Wissen über ein Unternehmen I Klassische Definition des IE zugeschnitten auf das “computerisierte Unternehmen“ I IE unterstützt langfristige Evolution der Informationssysteme I Web-Informationssysteme, Digitale Bibliotheken I Orientierung an Unternehmenszielen I Offene Communities vs. geschlossene Unternehmen I Benutzerbeteiligung I Vermittlung von Inhalt und Wissen an Communities I Strategische Planung I Kollaborative Erstellung neuen Wissens und neuer Inhalte I IE-Methoden auch auf diese Informationsysteme erweiterbar Information/Wissen als Entscheidungsgrundlage Informationskompetenz Informationskompetenz - 6 Schritte Implizierte Fähigkeiten Benachbarte Kompetenzen (Potenzielle) Systemunterstützung ”People’s actions are based more on what they believe than on what is objectively true” [Bandura, 1997; Pajares, 2002]. “What you see is all there is (WYSIATI)” (Entscheidung allein aufgrund der vorhandenen, unzureichenden Information) (Kahneman, 2011: Thinking fast and slow) → Informationskompetenz als notwendige Fähigkeit, um Glauben durch Wissen zu ersetzen Informationskompetenz - 6 Schritte 1. Aufgabendefinition I I Definiere das Informationsproblem Identifiziere das Informationsbedürfnis 2. Informations-Beschaffungs-Strategien I I Bestimme alle möglichen Quellen Wähle die besten Quellen aus 3. Lokalisierung und Zugriff I I Lokalisiere die Quellen (intellektuell und physisch) Finde die Information innerhalb der Quelle 4. Benutze die Information I I Anschauen (z.B. lesen, hören, betrachten, anfassen) Extrahiere die relevante Information 5. Synthese I I Organisiere die Information aus verschiedenen Quellen Präsentiere die Information 6. Bewertung I I Beurteile das Produkt (Effektivität) Beurteile den Prozess (Effizienz) Implizierte Fähigkeiten Benachbarte Kompetenzen 1. Aufgabendefinition I Informationsbedarf erkennen 2. Informations-Beschaffungs-Strategien I I Kenntnis von Strategien Kenntnis von Quellen I Bibliothekskompetenz I Computerkompetenz I Digitalkompetenz (Fähigkeit, über Computer dargestellte Informationen unterschiedlicher Formate verstehen und anwenden zu können) I Internet-Kompetenz I Suchkompetenz I Kommunikationskompetenz I Lesekompetenz I Medienkompetenz I Schreibkompetenz 3. Lokalisierung und Zugriff I I Lokalisierung von Information zielgerichtete Selektion von Information 4. Benutze die Information I Organisation von Information 5. Synthese I zweckoptimierte Gestaltung und Präsentation 6. Bewertung I kritische Beurteilung von Information (Potenzielle) Systemunterstützung 1. Aufgabendefinition I Wissenstests in Lehr-/Lernumgebungen 2. Informations-Beschaffungs-Strategien I Strategien für Standardprobleme (z.B. known item search) Suchkompetenz 3. Lokalisierung und Zugriff I I Hilfe bei der Anfrageformulierung (→ Daffodil) situationsabhängige Vorschläge zur Suchfortsetzung (→ Daffodil) 4. Benutze die Information I I strukturierte Ablage (→ persönliche Handbibliothek in Daffodil) Annotationsmöglichkeiten 5. Synthese I ? 6. Bewertung I ? Suchbarkeit Linguistische Funktionen Anfragesprache Ranking Suchtaktiken und Strategien Suchkompetenz I Aufbau einer Web-Suchmaschine I Suchbarkeit I Linguistische Funktionen I Anfragesprache I Ranking I Suchtaktiken und Strategeme Aufbau einer Web-Suchmaschine Basiskomponenten einer Web-Suchmaschine Crawler Sammelt Webseiten, interagiert mit Webservern beim Dokumentzugriff, folgt Links zu neuen Quellen Parser/Indexer Extrahiert Schlüsselwörter aus Texten und indexiert die Dokumente Datenbank Effiziente Speicherung der extrahierten und aufbereiteten Daten (z.B. in einer Datenbank mit invertierten Listen) Searcher Entgegenname von Anfragen, sucht in der Datenbank nach den passenden Antworten Suchbarkeit Suchkompetenz - linguistische Funktionen Welche Dokumente können überhaupt gefunden werden? I Zugriff: I I I I I I Aktualität Dokumentformat I I I öffentlich zugänglich verlinkt durch robots.txt erlaubt keine Datenbankinhalte (außer wenn verlinkt) nur Texte (kein Faksimile, andere Medien nur über Text) keine exotischen Dokumentformate Wortnormalisierung Fuhr – fuhr, Schuss – Schuß, colour – color, meta tag – meta-tag – metatag – meta tag’s Grundformreduktion Häuser – Hauses – Hause – Haus, Duisburg – Duisburgs, ¬ Duisburger Nominalphrasen ”information retrieval”, ”retrieval * information” Komposita Einfamilienhaus, Reihenendhaus, Doppelhaushälfte Synonyme Handy Mobiltelefon Smartphone / ∼handy keine Sprachübersetzung Anfragesprache Ranking Faktoren, die eine Seite nach oben bringen I UND, ODER, Negation handy -vertrag I Zahlenbereiche: 100..200 EURO I Suchbegriffe kommen häufig in der Seite vor I Facetten: Objekttyp (Bilder/Maps/Videos/News/Shopping/..), Standort, Sprache, Zeitraum I Suchbegriffe kommen in Ankertexten vor I Page rank I Nutzer-Klicks: fremde, eigene, Freunde (Google+) I Diversität I I site:, link:, filetype:, related: link:uni-due.de -site:uni-due.de inurl:, intitle:, intext:, inanchor: duisburg -intext:duisburg (Faktoren werden als Merkmale in einem learning to rank-Ansatz verwendet, auf Klick-Daten trainiert) Search engine optimization: Maßnahmen, eine Seite nach oben zu bringen aber: Web spam Suchtaktiken und Strategien Taktiken: Monitoring Daten – Information – Wissen ”Tactics to keep the search on track and efficient” Strukturelle Taktiken auf der Menge der potenziellen Antworten Suchformulierung verbreitern/einengen, viele/wenige Terme Term-Taktiken Auswahl/Variation der Suchterme Ideen-Taktiken offene Suchmöglichkeiten/Variation Die Begriffe Daten, Information und Wissen Sichtweisen auf Wissen Strategie: Plan zu Durchführung einer komplexen Suche Daten – Information – Wissen I Im Zusammenhang mit Informationssystemen tauchen die Begriffe “Daten“, “Wissen“ und “Information“ auf I In der Informatik redet man auch von “Datenbanken“ oder “Wissensmanagement“ I Was also ist der Unterschied zwischen Daten, Wissen und Information? Sichtweise des Wissensmanagement I Unterscheidung zwischen Daten und Information auf der einen und Wissen der anderen Seite I Kontinuum Daten – Information – Wissen Abgrenzung hinsichtlich der Fragestellung I I I I Daten und Information: “wer – was – wo – und wann?“ Wissen: “wie?“ und “warum?“ Prozessorientierter Ansatz: I I I Wissen als Ressource, die zur Erledigung einer Aufgabe notwendig ist Neues Wissen kann aus der Erledigung der Aufgabe entstehen Integrierte Betrachtung von Daten, Information und Wissen Sicht der Informationswissenschaft I Ursprünglich: Kontinuum Daten – Wissen – Information I Gegensatz zur allgemein üblichen Begrifflichkeit I Daher: Daten – Information – Wissen, mit Erläuterungen aus der Informationswissenschaft Daten — Information — Wissen Syntax, Semantik und Pragmatik Syntax: Hierbei wird ein Objekt als Folge von Symbolen aufgefasst. Semantik beschäftigt sich mit der Bedeutung eines Objektes. Pragmatik orientiert sich an der Nutzung eines Objektes für einen bestimmten Zweck. Wissen I Wissen ist die Teilmenge von Information, die von jemandem in einer konkreten Situation zur Lösung von Problemen benötigt wird I Suche nach Wissen in externen Quellen I Informationssysteme: Extraktion des benötigten Wissens aus der bereitgestellten Information I Transformation von Information in Wissen als ein Mehrwert erzeugender Prozess I Wissen ist Information in Aktion Beispiel: LINUX Manuals Anderes Beispiel: Daten I Beinhalten Information über Linux I Beispiel: wie drucke ich ein Dokument? I Benötigtes Wissen: Teilmenge der insgesamt in den Manuals verfügbaren, umfangreichen Information I Mehrwert durch gezielte Bereitstellung (z.B. durch das Linux man-Kommando) Aus Daten wird Information 1:2 T03 -- T04 2:0 T05 -- T06 2:4 T07 -- T08 1:4 T09 -- T10 1:1 T11 -- T12 1:0 T13 -- T14 1:4 T15 -- T16 1:3 T17 -- T18 3:2 Wissen zur Entscheidungsfindung Ergebnisse Fußball-Bundesliga 28. Spieltag Hannover – Bayern Schalke – Gladbach Hamburg – Stuttgart Aachen – Dortmund Berlin – Bielefeld Bremen – Nürnberg Leverkusen – Bochum Frankfurt – Cottbus Wolfsburg – Mainz T01 -- T02 1:2 2:0 2:4 1:4 1:1 1:0 1:4 1:3 3:2 Problem: Soll ich heute mein BVB-Trikot auf der Arbeit anziehen? Ergebnisse Fußball-Bundesliga 28. Spieltag Hannover – Bayern Schalke – Gladbach Hamburg – Stuttgart Aachen – Dortmund Berlin – Bielefeld Bremen – Nürnberg Leverkusen – Bochum Frankfurt – Cottbus Wolfsburg – Mainz 1:2 2:0 2:4 1:4 1:1 1:0 1:4 1:3 3:2 Rolle des Wissens zur Entscheidungsunterstützung Wissen dient zur “informationellen Handlungsabsicherung“ Sichtweisen auf Wissen I Enzyklopädisches Wissen I 1) Verfügbarkeit a) Bereitstellung b) Zugänglichkeit 2) Interpretierbarkeit Daten 3) Neuigkeit 4) Glaubwürdigkeit Information 5) Relevanz a) Kontext−Relevanz b) Aktualität 6) Entsch.−Verfügbark. a) Bereitstellung b) Zugänglichkeit Wissen I 7) Validität a) Informationsgehalt b) Verständlichkeit 8) Informationswert Entscheidung Alltagswissen Nützlichkeit I I Alltagswissen Lexikalisches Wissen Fachwissen Erfahrungswissen I Handlungswissen I Räumliches Wissen I Episodisches Wissen Lexikalisches Wissen Dies sind 4 Äpfel Schimmel bezeichnet weißes Pferd Unternehmen sollen Gewinne erwirtschaften Abbildung: Weißes Pferd, Jerzy Panek Fohlen bezeichnet junges Pferd... und das Team von Borussia Mönchengladbach ;-) Fachwissen Erfahrungswissen Gewinn ist Umsatz minus Kosten Unreife Früchte können Durchfall verursachen G =U −K Komplexe Zahlen besitzen einen Real- und Imaginärteil Realteil z }| { 4.73i 1.631 , | {z } Imaginärteil Handlungswissen Abbildung: Unreife Frucht der Red Savina, schärfster Chili der Welt Räumliches Wissen Analoge Repräsentation physischer Objekte durch Repräsentation räumlicher Information und Verhältnisse Kenntnis von Prozeduren und Problemlösungen Beispiel: Mentale Rotation analoger Objekte Episodisches Wissen Autobiografisches Wissen, das aus erinnerbaren Erlebnissen besteht Beispiel: George spielt Golf in Yale Implizites vs. explizites Wissen Implizites Wissen: In mentalen Modellen, kognitiven Bildern Konstrukten und Karten sowie routinierten Verhaltens- und Vorgehensweisen eingelagertes Wissen bezeichnet man als implizites Wissen (tacit knowledge ), auch als Know-how oder Fingerspitzengefühl beschrieben Explizites Wissen (Polanyi) Spezifisches, reproduzierbares Wissen, In der Regel schriftlich (oder anderweitig explizit) repräsentiert Implizites vs. explizites Wissen Wissensmanagement Aufgabe von Informationssystemen: I Implizites Wissen in Explizites überführen I Explizites Wissen bei Anwendung evtl. wieder implizit SECI-Modell Wissensmanagement ”Wissensmanagement beschäftigt sich mit den Möglichkeiten, auf die Wissensbasis eines Unternehmens Einfluss zu nehmen. Unter der Wissensbasis eines Unternehmens werden alle Daten und Informationen, alles Wissen und alle Fähigkeiten verstanden, die diese Organisation zur Lösung ihrer vielfältigen Aufgaben benötigt.” (Wikipedia) I Wissen als Produktionsfaktor I Informationssysteme zur Verwaltung des Wissens I Chief Information Officer (CIO) für Informationsmanagement I Kritik: Wissensmanagement verwendet undifferenzierten Wissensbegriff SECI-Modell [Nonaka & Takeuchi 95] Modell der Wissenserzeugung: I Sozialisation I Externalisierung I Kombination I Internalisierung Sozialisation I Lernen durch Beobachtung Anderer I Besprechungen, Brainstorming Externalisierung I Dokumentieren, Veröffentlichung I Abspeichern in Datenbanken Kombination I Organisation von Wissen I Integration von Wissen aus verschiedenen Quellen Internalisierung I Verinnerlichen von Wissen (Lernen) I Wissen erhalten und anwenden Information Lifecycle Der Information Lifecycle im Information Engineering Phasen des Information Lifecycle IE-Methoden im Information Lifecycle Information Lifecycle im IE I In dieser VL: Konzentration auf Methoden und Werkzeuge des IE I Grundlage der weiteren Betrachtungen: Information Lifecycle I Betrachtung aller Lebensphasen von Information (Erstellung bis Anwendung) I Ideal: Informationssystem unterstützt alle Phasen I Einsatz von Methoden hängt vom Informationssystementwurf ab (nach Planung und Analyse) I Implementierung und Integration der Methoden und Werkzeuge Teil der Realisierung des Informationssystems Information Lifecycle Information Lifecycle Creation/Receipt I Autorensysteme (Authoring) I I I Information dient der Erfüllung einer Aufgabe I Formulierung als Prozess I I Teilaufgaben als untergeordnete Prozesse I I Wissensintensive Aufgaben I I Metadaten Daten über Dokumente z.B. bibliographische Daten Annotationen I I I I Erstellung einfacher Texte Hypertext- und Multimediadokumente, Hypermedia Spezielle Art von Metadaten Verschlagwortung, “tagging“ bzw. semantische Annotation Textuelle Kommentare, Diskussionen Markup Creation/Receipt I Digitalisierung I I I I Storage Erfassung und Umsetzung von nicht-digitalen Quellen in digitale Textuelle Dokumente (Scanning, OCR) Nicht-textuelle Daten (Schall, Messdaten, Video, Bilder) → Sampling Modellierung I Formale Darstellung von Prozessabläufen, Sequenzen, Anwendungsfällen, Zuständen und Beziehungen Dissemination I Kurz- bis langfristige Speicherung der Information I Flüchtige Information im Hauptspeicher I Ablage in Dateien I Größere Datenmengen, (semi-)strukturierte Daten: Datenbanken I Dokumente: Digitale Bibliotheken/Repositories I Langzeitarchivierung (digital preservation) I Wissensrepräsentation und Organisation, Ontologien I Aufbereitung für die Suche: Indexierung I Informationssysteme dienen häufig der Erfüllung einer bestimmten Aufgabe oder eines bestimmten Zwecks Use I Information Retrieval I Informationssystem kann Anwendungen gezielt unterstützen I Recommender-Systeme I I Zugangsmanagement (access management) Beispiel Geisteswissenschaften: Interpretation des Materials mittels annotationsbasierter Diskussion (damit auch Generierung neuer Information) I Beispiel Informationssystem für Multimediadokumente: Abspielfunktionen für Videos oder Musik Zusammenfassung I Begriff des Information Engineering erläutert I Zusammenfassung I Keine starre Methodik, sondern Methoden und Werkzeuge Konzentration auf Realisierung von Informationssystemen I Informationskompetenz als notwendige Voraussetzung I Daten – Information – Wissen I Wissensmanagement Information Lifecycle I I I 4 Phasen Mögliche Methoden für jede Phase