4:1

Transcription

4:1
Inhaltsverzeichnis
Übersicht über die Vorlesung
Information Engineering und Information Life
Cycle
Information Engineering
Informationskompetenz
Norbert Fuhr
Suchkompetenz
Universität Duisburg-Essen
Information Engineering
Einführung
Daten – Information – Wissen
Wissensmanagement
Information Lifecycle
Zusammenfassung
2 / 73
(Vorläufige) Übersicht über die Vorlesung
Übersicht über die Vorlesung
1. Grundlagen
2. Methoden
3. Systeme
4. Anwendungen
5. Evaluierung
4 / 73
Grundlagen
I
Information Engineering
I
Information Lifecycle
I
Daten – Information – Wissen
I
Wissen und Prozesse: Workflows / Wissensintensive Aufgaben
I
Information Seeking & Searching
I
Repositories, Datenbanken
I
Digitale Bibliotheken und Collaboratories
Methoden
I
(Autorensysteme)
I
Digitalisierung
I
Informationsextraktion
I
(Information Mining)
I
Metadaten
I
Ontologien
I
Annotationen
I
Digital Preservation (Langzeitarchivierung)
I
(Information Retrieval)
I
Recommendation
I
Evaluierung
5 / 73
Systeme
6 / 73
Anwendungen
I
Architekturen
I
Repositories
I
DAFFODIL
I
Web Server
I
COLLATE
I
Content-Management-Systeme
I
Soziale Netze / Kollaborative Web 2.0-Systeme
I
Wikis
I
Digitale Bibliotheken
7 / 73
8 / 73
Konzepte
Konzepte
Bs.: Taktiken, Strategeme, Proaktivität
Bs.: Ontologien
9 / 73
10 / 73
Was ist Information Engineering?
Information Engineering
Definition
Eigenschaften
Eine erste Definition von Information Engineering:
The application of an interlocking set of formal
techniques for the planning, analysis, design and
construction of information systems, applied on an
enterprisewide basis or across a major sector of an
enterprise.
James Martin
12 / 73
Was ist Information Engineering?
I
Was ist Information Engineering?
Information Engineering is an integrated set of
techniques, based on corporate strategic planning, which
results in the analysis, design and development of
systems which supports those plans exactly. Information
Engineering is applied by managers and users with no
knowledge of computers, but instead with an expert
knowledge of their business - in conjunction with expert
systems which provide rapid feedback to management for
refinement of the strategic plans.
Formale Methoden zur
I
I
I
I
Planung
Analyse
Entwurf
Realisierung
von Informationssystemen
I
Methoden bauen aufeinander auf und sind voneinander
abhängig
I
Methoden werden zumeist unternehmensweit verwendet
Finkelstein
I
Strategische Planung
I
Kooperation und Partnerschaft von Managern und Nutzern
mit Entwicklern
14 / 73
13 / 73
Eigenschaften des IE
I
I
Eigenschaften des IE
Information Engineering beschreibt keine starre Methodik,
sondern Methoden
IE fördert Top-Down-Ansatz von Informationssystemen:
1.
2.
3.
4.
5.
Unternehmensweite Informationssystemplanung
Analyse von Geschäftsbereichen
Informationssystementwurf
Informationsystemrealisierung
Informationssystemeinführung
15 / 73
I
IE unterstützt Aufbau eines sich laufend weiterentwickelnden
Bestands an Wissen über ein Unternehmen
I
IE unterstützt langfristige Evolution der Informationssysteme
I
Orientierung an Unternehmenszielen
I
Benutzerbeteiligung
I
Strategische Planung
16 / 73
Eigenschaften des IE
Probleme
2014 Findwise survey: main obstacles for finding information:
Keine Beschränkung auf Unternehmen!
I
Klassische Definition des IE zugeschnitten auf das
“computerisierte Unternehmen“
I
Web-Informationssysteme, Digitale Bibliotheken
I
Offene Communities vs. geschlossene Unternehmen
I
Vermittlung von Inhalt und Wissen an Communities
I
Kollaborative Erstellung neuen Wissens und neuer Inhalte
I
IE-Methoden auch auf diese Informationsysteme erweiterbar
I
Lack of appropriate metatags
I
Search results not relevant
I
Don’t know where to look
I
Not all content sources are searchable
I
Information is outdated
I
Search skills are lacking
I
Poor navigation functionality
I
Access restrictions to content that could be of value
I
Search process takes too long
17 / 73
18 / 73
Information/Wissen als Entscheidungsgrundlage
Informationskompetenz
Informationskompetenz - 6 Schritte
Implizierte Fähigkeiten
Benachbarte Kompetenzen
(Potenzielle) Systemunterstützung
”People’s actions are based more on what they believe than on
what is objectively true”
[Bandura, 1997; Pajares, 2002].
“What you see is all there is (WYSIATI)”
(Entscheidung allein aufgrund der vorhandenen, unzureichenden
Information)
(Kahneman, 2011: Thinking fast and slow)
→ Informationskompetenz als notwendige Fähigkeit, um Glauben
durch Wissen zu ersetzen
20 / 73
Informationskompetenz - 6 Schritte
Informationskompetenz - Beispiel
1. Aufgabendefinition
I
I
Definiere das Informationsproblem
Identifiziere das Informationsbedürfnis
I
1. Aufgabendefinition
I
2. Informations-Beschaffungs-Strategien
I
I
Bestimme alle möglichen Quellen
Wähle die besten Quellen aus
I
3. Lokalisierung und Zugriff
I
I
I
Lokalisiere die Quellen (intellektuell und physisch)
Finde die Information innerhalb der Quelle
2. Informations-Beschaffungs-Strategien
I
4. Benutze die Information
I
I
Anschauen (z.B. lesen, hören, betrachten, anfassen)
Extrahiere die relevante Information
I
I
5. Synthese
I
I
I
6. Bewertung
I
I
Bestimme alle möglichen Quellen
Freunde, Handy-Shop, Google, Preisvergleichs-Seiten, Amazon,
...
Wähle die besten Quellen aus
3. Lokalisierung und Zugriff
I
Organisiere die Information aus verschiedenen Quellen
Präsentiere die Information
Definiere das Informationsproblem
Ich will das neue Handy Galaxy Xperia Lumia kaufen
Identifiziere das Informationsbedürfnis
Wo kriege ich es am günstigsten?
Lokalisiere die Quellen (intellektuell und physisch)
Freunde/Shops aufsuchen, Web-Seiten aufrufen
Finde die Information innerhalb der Quelle
Fragen / Suchen / Browsen
Ergebnisse bewerten
Rechercheweg bewerten
22 / 73
21 / 73
Informationskompetenz - Beispiel (2)
Implizierte Fähigkeiten
1. Aufgabendefinition
I
4. Benutze die Information
I
I
I
I
I
I
I
Kenntnis von Strategien
Kenntnis von Quellen
3. Lokalisierung und Zugriff
Organisiere die Information aus verschiedenen Quellen
Vergleichbare Zusammenstellung
Prozessiere/Präsentiere die Information
Übersichtstabelle, . . .
I
I
Lokalisierung von Informationsquellen
Suchen nach Information
4. Benutze die Information
I
6. Bewertung
I
Informationsbedarf erkennen
2. Informations-Beschaffungs-Strategien
Anschauen (z.B. lesen, hören, betrachten, anfassen)
Extrahiere die relevante Information
Mit/ohne Vertrag, Lieferzeit, Gesamtpreis inkl. Versand
5. Synthese
I
I
I
I
Ergebnisse bewerten
Habe ich das günstigste Angebot gefunden?
Rechercheweg bewerten
Hätte ich schneller zum Ziel kommen können? Was war
überflüssig?
verschiedene Medien anschauen und Inhalt erfassen
Extraktion der relevanten Information
5. Synthese
I
I
Organisation von Information
zweckoptimierte Gestaltung und Präsentation
6. Bewertung
I
I
23 / 73
kritische Beurteilung von Information
Selbstreflektion bzgl. Vorgehensweise
24 / 73
Benachbarte Kompetenzen
(Potenzielle) Systemunterstützung
1. Aufgabendefinition
I
Bibliothekskompetenz
I
Computerkompetenz
I
Digitalkompetenz (Fähigkeit, über Computer dargestellte
Informationen unterschiedlicher Formate verstehen und
anwenden zu können)
I
Wissenstests in Lehr-/Lernumgebungen
2. Informations-Beschaffungs-Strategien
I
Strategien für Standardprobleme (z.B. known item search)
3. Lokalisierung und Zugriff
I
I
Hilfe bei der Anfrageformulierung (→ Daffodil)
situationsabhängige Vorschläge zur Suchfortsetzung (→
Daffodil)
I
Internet-Kompetenz
I
Suchkompetenz
I
Kommunikationskompetenz
I
Lesekompetenz
I
Medienkompetenz
5. Synthese
I
Schreibkompetenz
I
4. Benutze die Information
I
I
strukturierte Ablage (→ persönliche Handbibliothek in
Daffodil)
Annotationsmöglichkeiten
?
6. Bewertung
I
?
26 / 73
25 / 73
Suchkompetenz
Suchkompetenz
Suchbarkeit
Linguistische Funktionen
Anfragesprache
Ranking
Suchtaktiken und Strategeme
I
Aufbau einer Web-Suchmaschine
I
Suchbarkeit
I
Linguistische Funktionen
I
Anfragesprache
I
Ranking
I
Suchtaktiken und Strategeme
28 / 73
Aufbau einer Web-Suchmaschine
29 / 73
Basiskomponenten einer Web-Suchmaschine
Suchbarkeit
Welche Dokumente können überhaupt gefunden werden?
Crawler Sammelt Webseiten, interagiert mit Webservern beim
Dokumentzugriff, folgt Links zu neuen Quellen
I
Zugriff:
I
Parser/Indexer Extrahiert Schlüsselwörter aus Texten und indexiert
die Dokumente
I
I
I
Datenbank Effiziente Speicherung der extrahierten und
aufbereiteten Daten (z.B. in einer Datenbank mit
invertierten Listen)
I
I
Aktualität
Dokumentformat
I
Searcher Entgegenname von Anfragen, sucht in der Datenbank
nach den passenden Antworten
I
I
31 / 73
öffentlich zugänglich
verlinkt
durch robots.txt erlaubt
keine Datenbankinhalte (außer wenn verlinkt)
nur Texte (kein Faksimile, andere Medien nur über Text)
keine exotischen Dokumentformate
keine Sprachübersetzung
32 / 73
Suchkompetenz - linguistische Funktionen
Anfragesprache
Wortnormalisierung Fuhr – fuhr, Schuss – Schuß, colour – color,
meta tag – meta-tag – metatag – meta tag’s
I
UND, ODER, Negation
handy -vertrag
I
Zahlenbereiche: 100..200 EURO
I
Facetten: Objekttyp (Bilder/Maps/Videos/News/Shopping/..),
Standort, Sprache, Zeitraum
I
site:, link:, filetype:,
related:
link:uni-due.de -site:uni-due.de
I
inurl:, intitle:, intext:,
inanchor:
duisburg -intext:duisburg
Grundformreduktion Häuser – Hauses – Hause – Haus, Duisburg –
Duisburgs, ¬ Duisburger
Nominalphrasen ”information retrieval”, ”retrieval * information”
Komposita Einfamilienhaus, Reihenendhaus, Doppelhaushälfte
Synonyme Handy Mobiltelefon Smartphone / ∼handy
34 / 73
33 / 73
Ranking
Suchtaktiken und Strategeme
Faktoren, die eine Seite nach oben bringen
I
Suchbegriffe kommen häufig in der Seite vor
I
Suchbegriffe kommen in Ankertexten vor
I
Page rank
I
Nutzer-Klicks: fremde, eigene, Freunde (Google+)
I
Diversität
Taktiken:
Monitoring
”Tactics to keep the search on track and efficient”
Strukturelle Taktiken auf der Menge der potenziellen Antworten
Suchformulierung verbreitern/einengen, viele/wenige Terme
Term-Taktiken Auswahl/Variation der Suchterme
Ideen-Taktiken offene Suchmöglichkeiten/Variation
(Faktoren werden als Merkmale in einem learning to rank-Ansatz
verwendet, auf Klick-Daten trainiert)
Strategem: Aktionen in einer Suchdomäne
Search engine optimization:
Maßnahmen, eine Seite nach oben zu bringen
aber: Web spam
Strategie: Plan zu Durchführung einer komplexen Suche
35 / 73
36 / 73
Daten – Information – Wissen
Daten – Information – Wissen
Die Begriffe Daten, Information und Wissen
Sichtweisen auf Wissen
I
Im Zusammenhang mit Informationssystemen tauchen die
Begriffe “Daten“, “Wissen“ und “Information“ auf
I
In der Informatik redet man auch von “Datenbanken“ oder
“Wissensmanagement“
I
Was also ist der Unterschied zwischen Daten, Wissen und
Information?
38 / 73
Sichtweise des Wissensmanagement
I
Unterscheidung zwischen Daten und Information auf der einen
und Wissen der anderen Seite
I
Kontinuum Daten – Information – Wissen
Abgrenzung hinsichtlich der Fragestellung
I
I
I
I
Sicht der Informationswissenschaft
Daten und Information: “wer – was – wo – und wann?“
Wissen: “wie?“ und “warum?“
Prozessorientierter Ansatz:
I
I
I
I
Ursprünglich: Kontinuum Daten – Wissen – Information
I
Gegensatz zur allgemein üblichen Begrifflichkeit
I
Daher: Daten – Information – Wissen, mit Erläuterungen aus
der Informationswissenschaft
Wissen als Ressource, die zur Erledigung einer Aufgabe
notwendig ist
Neues Wissen kann aus der Erledigung der Aufgabe entstehen
Integrierte Betrachtung von Daten, Information und Wissen
39 / 73
40 / 73
Syntax, Semantik und Pragmatik
Daten — Information — Wissen
Syntax: Hierbei wird ein Objekt als Folge von Symbolen
aufgefasst.
Semantik beschäftigt sich mit der Bedeutung eines Objektes.
Pragmatik orientiert sich an der Nutzung eines Objektes für
einen bestimmten Zweck.
41 / 73
Wissen
I
42 / 73
Beispiel: LINUX Manuals
Wissen ist die Teilmenge von Information, die von jemandem
in einer konkreten Situation zur Lösung von Problemen
benötigt wird
I
Suche nach Wissen in externen Quellen
I
Informationssysteme: Extraktion des benötigten Wissens aus
der bereitgestellten Information
I
Transformation von Information in Wissen als ein Mehrwert
erzeugender Prozess
I
Wissen ist Information in Aktion
43 / 73
I
Beinhalten Information über Linux
I
Beispiel: wie drucke ich ein Dokument?
I
Benötigtes Wissen: Teilmenge der insgesamt in den Manuals
verfügbaren, umfangreichen Information
I
Mehrwert durch gezielte Bereitstellung (z.B. durch das Linux
man-Kommando)
44 / 73
Anderes Beispiel: Daten
Aus Daten wird Information
T01 -- T02
1:2
T03 -- T04
2:0
T05 -- T06
2:4
T07 -- T08
1:4
T09 -- T10
1:1
T11 -- T12
1:0
T13 -- T14
1:4
T15 -- T16
1:3
T17 -- T18
3:2
Ergebnisse Fußball-Bundesliga 28. Spieltag
Hannover – Bayern
Schalke – Gladbach
Hamburg – Stuttgart
Aachen – Dortmund
Berlin – Bielefeld
Bremen – Nürnberg
Leverkusen – Bochum
Frankfurt – Cottbus
Wolfsburg – Mainz
1:2
2:0
2:4
1:4
1:1
1:0
1:4
1:3
3:2
45 / 73
Wissen zur Entscheidungsfindung
Rolle des Wissens zur Entscheidungsunterstützung
Problem: Soll ich heute mein BVB-Trikot
auf der Arbeit anziehen?
Wissen dient zur “informationellen Handlungsabsicherung“
1) Verfügbarkeit
a) Bereitstellung
b) Zugänglichkeit
2) Interpretierbarkeit
Ergebnisse Fußball-Bundesliga 28. Spieltag
Hannover – Bayern
Schalke – Gladbach
Hamburg – Stuttgart
Aachen – Dortmund
Berlin – Bielefeld
Bremen – Nürnberg
Leverkusen – Bochum
Frankfurt – Cottbus
Wolfsburg – Mainz
46 / 73
1:2
2:0
2:4
1:4
1:1
1:0
1:4
1:3
3:2
Daten
47 / 73
3) Neuigkeit
4) Glaubwürdigkeit
Information
5) Relevanz
a) Kontext−Relevanz
b) Aktualität
6) Entsch.−Verfügbark.
a) Bereitstellung
b) Zugänglichkeit
Wissen
7) Validität
a) Informationsgehalt
b) Verständlichkeit
8) Informationswert
Entscheidung
Nützlichkeit
48 / 73
Sichtweisen auf Wissen
Alltagswissen
Dies sind 4 Äpfel
I
Enzyklopädisches Wissen
I
I
I
I
Alltagswissen
Lexikalisches Wissen
Fachwissen
Erfahrungswissen
I
Handlungswissen
I
Räumliches Wissen
I
Episodisches Wissen
Unternehmen sollen Gewinne erwirtschaften
49 / 73
Lexikalisches Wissen
50 / 73
Fachwissen
Schimmel bezeichnet weißes Pferd
Gewinn ist Umsatz minus Kosten
G =U −K
Komplexe Zahlen besitzen einen Real- und Imaginärteil


Realteil
 z }| {

4.73i
 1.631 ,
| {z } 
Imaginärteil
Abbildung: Weißes Pferd, Jerzy Panek
Fohlen bezeichnet junges Pferd... und das Team von Borussia
Mönchengladbach ;-)
51 / 73
52 / 73
Erfahrungswissen
Handlungswissen
Unreife Früchte können Durchfall verursachen
Kenntnis von Prozeduren und Problemlösungen
Abbildung: Unreife Frucht der Red Savina, schärfster Chili der Welt
53 / 73
Räumliches Wissen
54 / 73
Episodisches Wissen
Analoge Repräsentation physischer Objekte durch Repräsentation
räumlicher Information und Verhältnisse
Autobiografisches Wissen, das aus erinnerbaren Erlebnissen besteht
Beispiel: Mentale Rotation analoger Objekte
Beispiel: George spielt Golf in Yale
55 / 73
56 / 73
Implizites vs. explizites Wissen
Implizites vs. explizites Wissen
Implizites Wissen:
In mentalen Modellen, kognitiven Bildern Konstrukten
und Karten sowie routinierten Verhaltens- und
Vorgehensweisen eingelagertes Wissen bezeichnet man als
implizites Wissen (tacit knowledge ),
auch als Know-how oder Fingerspitzengefühl beschrieben
Aufgabe von Informationssystemen:
I
Implizites Wissen in Explizites überführen
I
Explizites Wissen bei Anwendung evtl. wieder implizit
Explizites Wissen (Polanyi)
Spezifisches, reproduzierbares Wissen,
In der Regel schriftlich (oder anderweitig explizit)
repräsentiert
57 / 73
58 / 73
Wissensmanagement
Wissensmanagement
SECI-Modell
”Wissensmanagement beschäftigt sich mit den Möglichkeiten, auf
die Wissensbasis eines Unternehmens Einfluss zu nehmen. Unter
der Wissensbasis eines Unternehmens werden alle Daten und
Informationen, alles Wissen und alle Fähigkeiten verstanden, die
diese Organisation zur Lösung ihrer vielfältigen Aufgaben
benötigt.” (Wikipedia)
I
Wissen als Produktionsfaktor
I
Informationssysteme zur Verwaltung des Wissens
I
Chief Information Officer (CIO) für Informationsmanagement
I
Kritik: Wissensmanagement verwendet undifferenzierten
Wissensbegriff
60 / 73
Sozialisation
SECI-Modell
Modell der Wissenserzeugung:
Sozialisation
I
Externalisierung
I
Kombination
I
Internalisierung
Lernen durch Beobachtung Anderer
I
Besprechungen, Brainstorming
Externalisierung
[Nonaka & Takeuchi 95]
I
I
I
Dokumentieren, Veröffentlichung
I
Abspeichern in Datenbanken
Kombination
I
Organisation von Wissen
I
Integration von Wissen aus verschiedenen Quellen
Internalisierung
I
Verinnerlichen von Wissen (Lernen)
I
Wissen erhalten und anwenden
61 / 73
62 / 73
Information Lifecycle im IE
Information Lifecycle
Der Information Lifecycle im Information Engineering
Phasen des Information Lifecycle
IE-Methoden im Information Lifecycle
I
In dieser VL: Konzentration auf Methoden und Werkzeuge des
IE
I
Grundlage der weiteren Betrachtungen: Information
Lifecycle
I
Betrachtung aller Lebensphasen von Information (Erstellung
bis Anwendung)
I
Ideal: Informationssystem unterstützt alle Phasen
I
Einsatz von Methoden hängt vom Informationssystementwurf
ab (nach Planung und Analyse)
I
Implementierung und Integration der Methoden und
Werkzeuge Teil der Realisierung des Informationssystems
64 / 73
Information Lifecycle
Information Lifecycle
I
Information dient der Erfüllung einer Aufgabe
I
Formulierung als Prozess
I
Teilaufgaben als untergeordnete Prozesse
I
Wissensintensive Aufgaben
65 / 73
Creation/Receipt
I
I
I
Digitalisierung
I
I
Daten über Dokumente
z.B. bibliographische Daten
I
Annotationen
I
I
I
I
I
Erstellung einfacher Texte
Hypertext- und Multimediadokumente, Hypermedia
Metadaten
I
I
Creation/Receipt
Autorensysteme (Authoring)
I
I
66 / 73
I
Spezielle Art von Metadaten
Verschlagwortung, “tagging“ bzw. semantische Annotation
Textuelle Kommentare, Diskussionen
Erfassung und Umsetzung von nicht-digitalen Quellen in
digitale
Textuelle Dokumente (Scanning, OCR)
Nicht-textuelle Daten (Schall, Messdaten, Video, Bilder) →
Sampling
Modellierung
I
Formale Darstellung von Prozessabläufen, Sequenzen,
Anwendungsfällen, Zuständen und Beziehungen
Markup
67 / 73
68 / 73
Storage
I
Kurz- bis langfristige Speicherung der Information
I
Flüchtige Information im Hauptspeicher
I
Ablage in Dateien
I
Größere Datenmengen, (semi-)strukturierte Daten:
Datenbanken
I
Dokumente: Digitale Bibliotheken/Repositories
I
Langzeitarchivierung (digital preservation)
I
Wissensrepräsentation und Organisation, Ontologien
I
Aufbereitung für die Suche: Indexierung
Dissemination
I
Information Retrieval
I
Recommender-Systeme
I
Zugangsmanagement (access management)
70 / 73
69 / 73
Use
I
Informationssysteme dienen häufig der Erfüllung einer
bestimmten Aufgabe oder eines bestimmten Zwecks
I
Informationssystem kann Anwendungen gezielt unterstützen
I
Beispiel Geisteswissenschaften: Interpretation des Materials
mittels annotationsbasierter Diskussion (damit auch
Generierung neuer Information)
I
Beispiel Informationssystem für Multimediadokumente:
Abspielfunktionen für Videos oder Musik
Zusammenfassung
71 / 73
Zusammenfassung
I
Begriff des Information Engineering erläutert
I
I
Keine starre Methodik, sondern Methoden und Werkzeuge
Konzentration auf Realisierung von Informationssystemen
I
Informationskompetenz als notwendige Voraussetzung
I
Daten – Information – Wissen
I
Wissensmanagement
Information Lifecycle
I
I
I
4 Phasen
Mögliche Methoden für jede Phase
73 / 73