4:1
Transcription
4:1
Inhaltsverzeichnis Übersicht über die Vorlesung Information Engineering und Information Life Cycle Information Engineering Informationskompetenz Norbert Fuhr Suchkompetenz Universität Duisburg-Essen Information Engineering Einführung Daten – Information – Wissen Wissensmanagement Information Lifecycle Zusammenfassung 2 / 73 (Vorläufige) Übersicht über die Vorlesung Übersicht über die Vorlesung 1. Grundlagen 2. Methoden 3. Systeme 4. Anwendungen 5. Evaluierung 4 / 73 Grundlagen I Information Engineering I Information Lifecycle I Daten – Information – Wissen I Wissen und Prozesse: Workflows / Wissensintensive Aufgaben I Information Seeking & Searching I Repositories, Datenbanken I Digitale Bibliotheken und Collaboratories Methoden I (Autorensysteme) I Digitalisierung I Informationsextraktion I (Information Mining) I Metadaten I Ontologien I Annotationen I Digital Preservation (Langzeitarchivierung) I (Information Retrieval) I Recommendation I Evaluierung 5 / 73 Systeme 6 / 73 Anwendungen I Architekturen I Repositories I DAFFODIL I Web Server I COLLATE I Content-Management-Systeme I Soziale Netze / Kollaborative Web 2.0-Systeme I Wikis I Digitale Bibliotheken 7 / 73 8 / 73 Konzepte Konzepte Bs.: Taktiken, Strategeme, Proaktivität Bs.: Ontologien 9 / 73 10 / 73 Was ist Information Engineering? Information Engineering Definition Eigenschaften Eine erste Definition von Information Engineering: The application of an interlocking set of formal techniques for the planning, analysis, design and construction of information systems, applied on an enterprisewide basis or across a major sector of an enterprise. James Martin 12 / 73 Was ist Information Engineering? I Was ist Information Engineering? Information Engineering is an integrated set of techniques, based on corporate strategic planning, which results in the analysis, design and development of systems which supports those plans exactly. Information Engineering is applied by managers and users with no knowledge of computers, but instead with an expert knowledge of their business - in conjunction with expert systems which provide rapid feedback to management for refinement of the strategic plans. Formale Methoden zur I I I I Planung Analyse Entwurf Realisierung von Informationssystemen I Methoden bauen aufeinander auf und sind voneinander abhängig I Methoden werden zumeist unternehmensweit verwendet Finkelstein I Strategische Planung I Kooperation und Partnerschaft von Managern und Nutzern mit Entwicklern 14 / 73 13 / 73 Eigenschaften des IE I I Eigenschaften des IE Information Engineering beschreibt keine starre Methodik, sondern Methoden IE fördert Top-Down-Ansatz von Informationssystemen: 1. 2. 3. 4. 5. Unternehmensweite Informationssystemplanung Analyse von Geschäftsbereichen Informationssystementwurf Informationsystemrealisierung Informationssystemeinführung 15 / 73 I IE unterstützt Aufbau eines sich laufend weiterentwickelnden Bestands an Wissen über ein Unternehmen I IE unterstützt langfristige Evolution der Informationssysteme I Orientierung an Unternehmenszielen I Benutzerbeteiligung I Strategische Planung 16 / 73 Eigenschaften des IE Probleme 2014 Findwise survey: main obstacles for finding information: Keine Beschränkung auf Unternehmen! I Klassische Definition des IE zugeschnitten auf das “computerisierte Unternehmen“ I Web-Informationssysteme, Digitale Bibliotheken I Offene Communities vs. geschlossene Unternehmen I Vermittlung von Inhalt und Wissen an Communities I Kollaborative Erstellung neuen Wissens und neuer Inhalte I IE-Methoden auch auf diese Informationsysteme erweiterbar I Lack of appropriate metatags I Search results not relevant I Don’t know where to look I Not all content sources are searchable I Information is outdated I Search skills are lacking I Poor navigation functionality I Access restrictions to content that could be of value I Search process takes too long 17 / 73 18 / 73 Information/Wissen als Entscheidungsgrundlage Informationskompetenz Informationskompetenz - 6 Schritte Implizierte Fähigkeiten Benachbarte Kompetenzen (Potenzielle) Systemunterstützung ”People’s actions are based more on what they believe than on what is objectively true” [Bandura, 1997; Pajares, 2002]. “What you see is all there is (WYSIATI)” (Entscheidung allein aufgrund der vorhandenen, unzureichenden Information) (Kahneman, 2011: Thinking fast and slow) → Informationskompetenz als notwendige Fähigkeit, um Glauben durch Wissen zu ersetzen 20 / 73 Informationskompetenz - 6 Schritte Informationskompetenz - Beispiel 1. Aufgabendefinition I I Definiere das Informationsproblem Identifiziere das Informationsbedürfnis I 1. Aufgabendefinition I 2. Informations-Beschaffungs-Strategien I I Bestimme alle möglichen Quellen Wähle die besten Quellen aus I 3. Lokalisierung und Zugriff I I I Lokalisiere die Quellen (intellektuell und physisch) Finde die Information innerhalb der Quelle 2. Informations-Beschaffungs-Strategien I 4. Benutze die Information I I Anschauen (z.B. lesen, hören, betrachten, anfassen) Extrahiere die relevante Information I I 5. Synthese I I I 6. Bewertung I I Bestimme alle möglichen Quellen Freunde, Handy-Shop, Google, Preisvergleichs-Seiten, Amazon, ... Wähle die besten Quellen aus 3. Lokalisierung und Zugriff I Organisiere die Information aus verschiedenen Quellen Präsentiere die Information Definiere das Informationsproblem Ich will das neue Handy Galaxy Xperia Lumia kaufen Identifiziere das Informationsbedürfnis Wo kriege ich es am günstigsten? Lokalisiere die Quellen (intellektuell und physisch) Freunde/Shops aufsuchen, Web-Seiten aufrufen Finde die Information innerhalb der Quelle Fragen / Suchen / Browsen Ergebnisse bewerten Rechercheweg bewerten 22 / 73 21 / 73 Informationskompetenz - Beispiel (2) Implizierte Fähigkeiten 1. Aufgabendefinition I 4. Benutze die Information I I I I I I I Kenntnis von Strategien Kenntnis von Quellen 3. Lokalisierung und Zugriff Organisiere die Information aus verschiedenen Quellen Vergleichbare Zusammenstellung Prozessiere/Präsentiere die Information Übersichtstabelle, . . . I I Lokalisierung von Informationsquellen Suchen nach Information 4. Benutze die Information I 6. Bewertung I Informationsbedarf erkennen 2. Informations-Beschaffungs-Strategien Anschauen (z.B. lesen, hören, betrachten, anfassen) Extrahiere die relevante Information Mit/ohne Vertrag, Lieferzeit, Gesamtpreis inkl. Versand 5. Synthese I I I I Ergebnisse bewerten Habe ich das günstigste Angebot gefunden? Rechercheweg bewerten Hätte ich schneller zum Ziel kommen können? Was war überflüssig? verschiedene Medien anschauen und Inhalt erfassen Extraktion der relevanten Information 5. Synthese I I Organisation von Information zweckoptimierte Gestaltung und Präsentation 6. Bewertung I I 23 / 73 kritische Beurteilung von Information Selbstreflektion bzgl. Vorgehensweise 24 / 73 Benachbarte Kompetenzen (Potenzielle) Systemunterstützung 1. Aufgabendefinition I Bibliothekskompetenz I Computerkompetenz I Digitalkompetenz (Fähigkeit, über Computer dargestellte Informationen unterschiedlicher Formate verstehen und anwenden zu können) I Wissenstests in Lehr-/Lernumgebungen 2. Informations-Beschaffungs-Strategien I Strategien für Standardprobleme (z.B. known item search) 3. Lokalisierung und Zugriff I I Hilfe bei der Anfrageformulierung (→ Daffodil) situationsabhängige Vorschläge zur Suchfortsetzung (→ Daffodil) I Internet-Kompetenz I Suchkompetenz I Kommunikationskompetenz I Lesekompetenz I Medienkompetenz 5. Synthese I Schreibkompetenz I 4. Benutze die Information I I strukturierte Ablage (→ persönliche Handbibliothek in Daffodil) Annotationsmöglichkeiten ? 6. Bewertung I ? 26 / 73 25 / 73 Suchkompetenz Suchkompetenz Suchbarkeit Linguistische Funktionen Anfragesprache Ranking Suchtaktiken und Strategeme I Aufbau einer Web-Suchmaschine I Suchbarkeit I Linguistische Funktionen I Anfragesprache I Ranking I Suchtaktiken und Strategeme 28 / 73 Aufbau einer Web-Suchmaschine 29 / 73 Basiskomponenten einer Web-Suchmaschine Suchbarkeit Welche Dokumente können überhaupt gefunden werden? Crawler Sammelt Webseiten, interagiert mit Webservern beim Dokumentzugriff, folgt Links zu neuen Quellen I Zugriff: I Parser/Indexer Extrahiert Schlüsselwörter aus Texten und indexiert die Dokumente I I I Datenbank Effiziente Speicherung der extrahierten und aufbereiteten Daten (z.B. in einer Datenbank mit invertierten Listen) I I Aktualität Dokumentformat I Searcher Entgegenname von Anfragen, sucht in der Datenbank nach den passenden Antworten I I 31 / 73 öffentlich zugänglich verlinkt durch robots.txt erlaubt keine Datenbankinhalte (außer wenn verlinkt) nur Texte (kein Faksimile, andere Medien nur über Text) keine exotischen Dokumentformate keine Sprachübersetzung 32 / 73 Suchkompetenz - linguistische Funktionen Anfragesprache Wortnormalisierung Fuhr – fuhr, Schuss – Schuß, colour – color, meta tag – meta-tag – metatag – meta tag’s I UND, ODER, Negation handy -vertrag I Zahlenbereiche: 100..200 EURO I Facetten: Objekttyp (Bilder/Maps/Videos/News/Shopping/..), Standort, Sprache, Zeitraum I site:, link:, filetype:, related: link:uni-due.de -site:uni-due.de I inurl:, intitle:, intext:, inanchor: duisburg -intext:duisburg Grundformreduktion Häuser – Hauses – Hause – Haus, Duisburg – Duisburgs, ¬ Duisburger Nominalphrasen ”information retrieval”, ”retrieval * information” Komposita Einfamilienhaus, Reihenendhaus, Doppelhaushälfte Synonyme Handy Mobiltelefon Smartphone / ∼handy 34 / 73 33 / 73 Ranking Suchtaktiken und Strategeme Faktoren, die eine Seite nach oben bringen I Suchbegriffe kommen häufig in der Seite vor I Suchbegriffe kommen in Ankertexten vor I Page rank I Nutzer-Klicks: fremde, eigene, Freunde (Google+) I Diversität Taktiken: Monitoring ”Tactics to keep the search on track and efficient” Strukturelle Taktiken auf der Menge der potenziellen Antworten Suchformulierung verbreitern/einengen, viele/wenige Terme Term-Taktiken Auswahl/Variation der Suchterme Ideen-Taktiken offene Suchmöglichkeiten/Variation (Faktoren werden als Merkmale in einem learning to rank-Ansatz verwendet, auf Klick-Daten trainiert) Strategem: Aktionen in einer Suchdomäne Search engine optimization: Maßnahmen, eine Seite nach oben zu bringen aber: Web spam Strategie: Plan zu Durchführung einer komplexen Suche 35 / 73 36 / 73 Daten – Information – Wissen Daten – Information – Wissen Die Begriffe Daten, Information und Wissen Sichtweisen auf Wissen I Im Zusammenhang mit Informationssystemen tauchen die Begriffe “Daten“, “Wissen“ und “Information“ auf I In der Informatik redet man auch von “Datenbanken“ oder “Wissensmanagement“ I Was also ist der Unterschied zwischen Daten, Wissen und Information? 38 / 73 Sichtweise des Wissensmanagement I Unterscheidung zwischen Daten und Information auf der einen und Wissen der anderen Seite I Kontinuum Daten – Information – Wissen Abgrenzung hinsichtlich der Fragestellung I I I I Sicht der Informationswissenschaft Daten und Information: “wer – was – wo – und wann?“ Wissen: “wie?“ und “warum?“ Prozessorientierter Ansatz: I I I I Ursprünglich: Kontinuum Daten – Wissen – Information I Gegensatz zur allgemein üblichen Begrifflichkeit I Daher: Daten – Information – Wissen, mit Erläuterungen aus der Informationswissenschaft Wissen als Ressource, die zur Erledigung einer Aufgabe notwendig ist Neues Wissen kann aus der Erledigung der Aufgabe entstehen Integrierte Betrachtung von Daten, Information und Wissen 39 / 73 40 / 73 Syntax, Semantik und Pragmatik Daten — Information — Wissen Syntax: Hierbei wird ein Objekt als Folge von Symbolen aufgefasst. Semantik beschäftigt sich mit der Bedeutung eines Objektes. Pragmatik orientiert sich an der Nutzung eines Objektes für einen bestimmten Zweck. 41 / 73 Wissen I 42 / 73 Beispiel: LINUX Manuals Wissen ist die Teilmenge von Information, die von jemandem in einer konkreten Situation zur Lösung von Problemen benötigt wird I Suche nach Wissen in externen Quellen I Informationssysteme: Extraktion des benötigten Wissens aus der bereitgestellten Information I Transformation von Information in Wissen als ein Mehrwert erzeugender Prozess I Wissen ist Information in Aktion 43 / 73 I Beinhalten Information über Linux I Beispiel: wie drucke ich ein Dokument? I Benötigtes Wissen: Teilmenge der insgesamt in den Manuals verfügbaren, umfangreichen Information I Mehrwert durch gezielte Bereitstellung (z.B. durch das Linux man-Kommando) 44 / 73 Anderes Beispiel: Daten Aus Daten wird Information T01 -- T02 1:2 T03 -- T04 2:0 T05 -- T06 2:4 T07 -- T08 1:4 T09 -- T10 1:1 T11 -- T12 1:0 T13 -- T14 1:4 T15 -- T16 1:3 T17 -- T18 3:2 Ergebnisse Fußball-Bundesliga 28. Spieltag Hannover – Bayern Schalke – Gladbach Hamburg – Stuttgart Aachen – Dortmund Berlin – Bielefeld Bremen – Nürnberg Leverkusen – Bochum Frankfurt – Cottbus Wolfsburg – Mainz 1:2 2:0 2:4 1:4 1:1 1:0 1:4 1:3 3:2 45 / 73 Wissen zur Entscheidungsfindung Rolle des Wissens zur Entscheidungsunterstützung Problem: Soll ich heute mein BVB-Trikot auf der Arbeit anziehen? Wissen dient zur “informationellen Handlungsabsicherung“ 1) Verfügbarkeit a) Bereitstellung b) Zugänglichkeit 2) Interpretierbarkeit Ergebnisse Fußball-Bundesliga 28. Spieltag Hannover – Bayern Schalke – Gladbach Hamburg – Stuttgart Aachen – Dortmund Berlin – Bielefeld Bremen – Nürnberg Leverkusen – Bochum Frankfurt – Cottbus Wolfsburg – Mainz 46 / 73 1:2 2:0 2:4 1:4 1:1 1:0 1:4 1:3 3:2 Daten 47 / 73 3) Neuigkeit 4) Glaubwürdigkeit Information 5) Relevanz a) Kontext−Relevanz b) Aktualität 6) Entsch.−Verfügbark. a) Bereitstellung b) Zugänglichkeit Wissen 7) Validität a) Informationsgehalt b) Verständlichkeit 8) Informationswert Entscheidung Nützlichkeit 48 / 73 Sichtweisen auf Wissen Alltagswissen Dies sind 4 Äpfel I Enzyklopädisches Wissen I I I I Alltagswissen Lexikalisches Wissen Fachwissen Erfahrungswissen I Handlungswissen I Räumliches Wissen I Episodisches Wissen Unternehmen sollen Gewinne erwirtschaften 49 / 73 Lexikalisches Wissen 50 / 73 Fachwissen Schimmel bezeichnet weißes Pferd Gewinn ist Umsatz minus Kosten G =U −K Komplexe Zahlen besitzen einen Real- und Imaginärteil Realteil z }| { 4.73i 1.631 , | {z } Imaginärteil Abbildung: Weißes Pferd, Jerzy Panek Fohlen bezeichnet junges Pferd... und das Team von Borussia Mönchengladbach ;-) 51 / 73 52 / 73 Erfahrungswissen Handlungswissen Unreife Früchte können Durchfall verursachen Kenntnis von Prozeduren und Problemlösungen Abbildung: Unreife Frucht der Red Savina, schärfster Chili der Welt 53 / 73 Räumliches Wissen 54 / 73 Episodisches Wissen Analoge Repräsentation physischer Objekte durch Repräsentation räumlicher Information und Verhältnisse Autobiografisches Wissen, das aus erinnerbaren Erlebnissen besteht Beispiel: Mentale Rotation analoger Objekte Beispiel: George spielt Golf in Yale 55 / 73 56 / 73 Implizites vs. explizites Wissen Implizites vs. explizites Wissen Implizites Wissen: In mentalen Modellen, kognitiven Bildern Konstrukten und Karten sowie routinierten Verhaltens- und Vorgehensweisen eingelagertes Wissen bezeichnet man als implizites Wissen (tacit knowledge ), auch als Know-how oder Fingerspitzengefühl beschrieben Aufgabe von Informationssystemen: I Implizites Wissen in Explizites überführen I Explizites Wissen bei Anwendung evtl. wieder implizit Explizites Wissen (Polanyi) Spezifisches, reproduzierbares Wissen, In der Regel schriftlich (oder anderweitig explizit) repräsentiert 57 / 73 58 / 73 Wissensmanagement Wissensmanagement SECI-Modell ”Wissensmanagement beschäftigt sich mit den Möglichkeiten, auf die Wissensbasis eines Unternehmens Einfluss zu nehmen. Unter der Wissensbasis eines Unternehmens werden alle Daten und Informationen, alles Wissen und alle Fähigkeiten verstanden, die diese Organisation zur Lösung ihrer vielfältigen Aufgaben benötigt.” (Wikipedia) I Wissen als Produktionsfaktor I Informationssysteme zur Verwaltung des Wissens I Chief Information Officer (CIO) für Informationsmanagement I Kritik: Wissensmanagement verwendet undifferenzierten Wissensbegriff 60 / 73 Sozialisation SECI-Modell Modell der Wissenserzeugung: Sozialisation I Externalisierung I Kombination I Internalisierung Lernen durch Beobachtung Anderer I Besprechungen, Brainstorming Externalisierung [Nonaka & Takeuchi 95] I I I Dokumentieren, Veröffentlichung I Abspeichern in Datenbanken Kombination I Organisation von Wissen I Integration von Wissen aus verschiedenen Quellen Internalisierung I Verinnerlichen von Wissen (Lernen) I Wissen erhalten und anwenden 61 / 73 62 / 73 Information Lifecycle im IE Information Lifecycle Der Information Lifecycle im Information Engineering Phasen des Information Lifecycle IE-Methoden im Information Lifecycle I In dieser VL: Konzentration auf Methoden und Werkzeuge des IE I Grundlage der weiteren Betrachtungen: Information Lifecycle I Betrachtung aller Lebensphasen von Information (Erstellung bis Anwendung) I Ideal: Informationssystem unterstützt alle Phasen I Einsatz von Methoden hängt vom Informationssystementwurf ab (nach Planung und Analyse) I Implementierung und Integration der Methoden und Werkzeuge Teil der Realisierung des Informationssystems 64 / 73 Information Lifecycle Information Lifecycle I Information dient der Erfüllung einer Aufgabe I Formulierung als Prozess I Teilaufgaben als untergeordnete Prozesse I Wissensintensive Aufgaben 65 / 73 Creation/Receipt I I I Digitalisierung I I Daten über Dokumente z.B. bibliographische Daten I Annotationen I I I I I Erstellung einfacher Texte Hypertext- und Multimediadokumente, Hypermedia Metadaten I I Creation/Receipt Autorensysteme (Authoring) I I 66 / 73 I Spezielle Art von Metadaten Verschlagwortung, “tagging“ bzw. semantische Annotation Textuelle Kommentare, Diskussionen Erfassung und Umsetzung von nicht-digitalen Quellen in digitale Textuelle Dokumente (Scanning, OCR) Nicht-textuelle Daten (Schall, Messdaten, Video, Bilder) → Sampling Modellierung I Formale Darstellung von Prozessabläufen, Sequenzen, Anwendungsfällen, Zuständen und Beziehungen Markup 67 / 73 68 / 73 Storage I Kurz- bis langfristige Speicherung der Information I Flüchtige Information im Hauptspeicher I Ablage in Dateien I Größere Datenmengen, (semi-)strukturierte Daten: Datenbanken I Dokumente: Digitale Bibliotheken/Repositories I Langzeitarchivierung (digital preservation) I Wissensrepräsentation und Organisation, Ontologien I Aufbereitung für die Suche: Indexierung Dissemination I Information Retrieval I Recommender-Systeme I Zugangsmanagement (access management) 70 / 73 69 / 73 Use I Informationssysteme dienen häufig der Erfüllung einer bestimmten Aufgabe oder eines bestimmten Zwecks I Informationssystem kann Anwendungen gezielt unterstützen I Beispiel Geisteswissenschaften: Interpretation des Materials mittels annotationsbasierter Diskussion (damit auch Generierung neuer Information) I Beispiel Informationssystem für Multimediadokumente: Abspielfunktionen für Videos oder Musik Zusammenfassung 71 / 73 Zusammenfassung I Begriff des Information Engineering erläutert I I Keine starre Methodik, sondern Methoden und Werkzeuge Konzentration auf Realisierung von Informationssystemen I Informationskompetenz als notwendige Voraussetzung I Daten – Information – Wissen I Wissensmanagement Information Lifecycle I I I 4 Phasen Mögliche Methoden für jede Phase 73 / 73