4:1 - Informationssysteme

Transcription

4:1 - Informationssysteme
Inhaltsverzeichnis
Übersicht über die Vorlesung
Information Engineering und Information Life
Cycle
Information Engineering
Informationskompetenz
Norbert Fuhr
Suchkompetenz
Universität Duisburg-Essen
Information Engineering
SS 2013
Daten – Information – Wissen
Wissensmanagement
Information Lifecycle
Zusammenfassung
(Vorläufige) Übersicht über die Vorlesung
Übersicht über die Vorlesung
1. Grundlagen
2. Methoden
3. Systeme
4. Anwendungen
5. Evaluierung
Grundlagen
Methoden
I
Information Engineering
I
Information Lifecycle
I
Daten – Information – Wissen
I
Wissen und Prozesse: Workflows / Wissensintensive Aufgaben
I
Information Seeking & Searching
I
Repositories, Datenbanken
I
Digitale Bibliotheken und Collaboratories
Systeme
I
(Autorensysteme)
I
Digitalisierung
I
Informationsextraktion
I
Architekturen
I
(Information Mining)
I
Repositories
I
Metadaten
I
Web Server
I
Ontologien
I
Content-Management-Systeme
I
Annotationen
I
Wikis
I
Digital Preservation (Langzeitarchivierung)
I
Digitale Bibliotheken
I
(Information Retrieval)
I
Recommendation
I
Evaluierung
Anwendungen
Information Engineering
I
DAFFODIL
I
COLLATE
I
Soziale Netze / Kollaborative Web 2.0-Systeme
Definition
Eigenschaften
Was ist Information Engineering?
Was ist Information Engineering?
Eine erste Definition von Information Engineering:
I
Formale Methoden zur
I
The application of an interlocking set of formal
techniques for the planning, analysis, design and
construction of information systems, applied on an
enterprisewide basis or across a major sector of an
enterprise.
I
I
I
Planung
Analyse
Entwurf
Realisierung
von Informationssystemen
I
Methoden bauen aufeinander auf und sind voneinander
abhängig
I
Methoden werden zumeist unternehmensweit verwendet
James Martin
Was ist Information Engineering?
Eigenschaften des IE
Information Engineering is an integrated set of
techniques, based on corporate strategic planning, which
results in the analysis, design and development of
systems which supports those plans exactly. Information
Engineering is applied by managers and users with no
knowledge of computers, but instead with an expert
knowledge of their business - in conjunction with expert
systems which provide rapid feedback to management for
refinement of the strategic plans.
I
I
1.
2.
3.
4.
5.
Finkelstein
I
Strategische Planung
I
Kooperation und Partnerschaft von Managern und Nutzern
mit Entwicklern
Eigenschaften des IE
Information Engineering beschreibt keine starre Methodik,
sondern Methoden
IE fördert Top-Down-Ansatz von Informationssystemen:
Unternehmensweite Informationssystemplanung
Analyse von Geschäftsbereichen
Informationssystementwurf
Informationsystemrealisierung
Informationssystemeinführung
Eigenschaften des IE
Keine Beschränkung auf Unternehmen!
I
IE unterstützt Aufbau eines sich laufend weiterentwickelnden
Bestands an Wissen über ein Unternehmen
I
Klassische Definition des IE zugeschnitten auf das
“computerisierte Unternehmen“
I
IE unterstützt langfristige Evolution der Informationssysteme
I
Web-Informationssysteme, Digitale Bibliotheken
I
Orientierung an Unternehmenszielen
I
Offene Communities vs. geschlossene Unternehmen
I
Benutzerbeteiligung
I
Vermittlung von Inhalt und Wissen an Communities
I
Strategische Planung
I
Kollaborative Erstellung neuen Wissens und neuer Inhalte
I
IE-Methoden auch auf diese Informationsysteme erweiterbar
Information/Wissen als Entscheidungsgrundlage
Informationskompetenz
Informationskompetenz - 6 Schritte
Implizierte Fähigkeiten
Benachbarte Kompetenzen
(Potenzielle) Systemunterstützung
”People’s actions are based more on what they believe than on
what is objectively true”
[Bandura, 1997; Pajares, 2002].
“What you see is all there is (WYSIATI)”
(Entscheidung allein aufgrund der vorhandenen, unzureichenden
Information)
(Kahneman, 2011: Thinking fast and slow)
→ Informationskompetenz als notwendige Fähigkeit, um Glauben
durch Wissen zu ersetzen
Informationskompetenz - 6 Schritte
1. Aufgabendefinition
I
I
Definiere das Informationsproblem
Identifiziere das Informationsbedürfnis
2. Informations-Beschaffungs-Strategien
I
I
Bestimme alle möglichen Quellen
Wähle die besten Quellen aus
3. Lokalisierung und Zugriff
I
I
Lokalisiere die Quellen (intellektuell und physisch)
Finde die Information innerhalb der Quelle
4. Benutze die Information
I
I
Anschauen (z.B. lesen, hören, betrachten, anfassen)
Extrahiere die relevante Information
5. Synthese
I
I
Organisiere die Information aus verschiedenen Quellen
Präsentiere die Information
6. Bewertung
I
I
Beurteile das Produkt (Effektivität)
Beurteile den Prozess (Effizienz)
Implizierte Fähigkeiten
Benachbarte Kompetenzen
1. Aufgabendefinition
I
Informationsbedarf erkennen
2. Informations-Beschaffungs-Strategien
I
I
Kenntnis von Strategien
Kenntnis von Quellen
I
Bibliothekskompetenz
I
Computerkompetenz
I
Digitalkompetenz (Fähigkeit, über Computer dargestellte
Informationen unterschiedlicher Formate verstehen und
anwenden zu können)
I
Internet-Kompetenz
I
Suchkompetenz
I
Kommunikationskompetenz
I
Lesekompetenz
I
Medienkompetenz
I
Schreibkompetenz
3. Lokalisierung und Zugriff
I
I
Lokalisierung von Information
zielgerichtete Selektion von Information
4. Benutze die Information
I
Organisation von Information
5. Synthese
I
zweckoptimierte Gestaltung und Präsentation
6. Bewertung
I
kritische Beurteilung von Information
(Potenzielle) Systemunterstützung
1. Aufgabendefinition
I
Wissenstests in Lehr-/Lernumgebungen
2. Informations-Beschaffungs-Strategien
I
Strategien für Standardprobleme (z.B. known item search)
Suchkompetenz
3. Lokalisierung und Zugriff
I
I
Hilfe bei der Anfrageformulierung (→ Daffodil)
situationsabhängige Vorschläge zur Suchfortsetzung (→
Daffodil)
4. Benutze die Information
I
I
strukturierte Ablage (→ persönliche Handbibliothek in
Daffodil)
Annotationsmöglichkeiten
5. Synthese
I
?
6. Bewertung
I
?
Suchbarkeit
Linguistische Funktionen
Anfragesprache
Ranking
Suchtaktiken und Strategien
Suchkompetenz
I
Aufbau einer Web-Suchmaschine
I
Suchbarkeit
I
Linguistische Funktionen
I
Anfragesprache
I
Ranking
I
Suchtaktiken und Strategeme
Aufbau einer Web-Suchmaschine
Basiskomponenten einer Web-Suchmaschine
Crawler Sammelt Webseiten, interagiert mit Webservern beim
Dokumentzugriff, folgt Links zu neuen Quellen
Parser/Indexer Extrahiert Schlüsselwörter aus Texten und indexiert
die Dokumente
Datenbank Effiziente Speicherung der extrahierten und
aufbereiteten Daten (z.B. in einer Datenbank mit
invertierten Listen)
Searcher Entgegenname von Anfragen, sucht in der Datenbank
nach den passenden Antworten
Suchbarkeit
Suchkompetenz - linguistische Funktionen
Welche Dokumente können überhaupt gefunden werden?
I
Zugriff:
I
I
I
I
I
I
Aktualität
Dokumentformat
I
I
I
öffentlich zugänglich
verlinkt
durch robots.txt erlaubt
keine Datenbankinhalte (außer wenn verlinkt)
nur Texte (kein Faksimile, andere Medien nur über Text)
keine exotischen Dokumentformate
Wortnormalisierung Fuhr – fuhr, Schuss – Schuß, colour – color,
meta tag – meta-tag – metatag – meta tag’s
Grundformreduktion Häuser – Hauses – Hause – Haus, Duisburg –
Duisburgs, ¬ Duisburger
Nominalphrasen ”information retrieval”, ”retrieval * information”
Komposita Einfamilienhaus, Reihenendhaus, Doppelhaushälfte
Synonyme Handy Mobiltelefon Smartphone / ∼handy
keine Sprachübersetzung
Anfragesprache
Ranking
Faktoren, die eine Seite nach oben bringen
I
UND, ODER, Negation
handy -vertrag
I
Zahlenbereiche: 100..200 EURO
I
Suchbegriffe kommen häufig in der Seite vor
I
Facetten: Objekttyp (Bilder/Maps/Videos/News/Shopping/..),
Standort, Sprache, Zeitraum
I
Suchbegriffe kommen in Ankertexten vor
I
Page rank
I
Nutzer-Klicks: fremde, eigene, Freunde (Google+)
I
Diversität
I
I
site:, link:, filetype:,
related:
link:uni-due.de -site:uni-due.de
inurl:, intitle:, intext:,
inanchor:
duisburg -intext:duisburg
(Faktoren werden als Merkmale in einem learning to rank-Ansatz
verwendet, auf Klick-Daten trainiert)
Search engine optimization:
Maßnahmen, eine Seite nach oben zu bringen
aber: Web spam
Suchtaktiken und Strategien
Taktiken:
Monitoring
Daten – Information – Wissen
”Tactics to keep the search on track and efficient”
Strukturelle Taktiken auf der Menge der potenziellen Antworten
Suchformulierung verbreitern/einengen, viele/wenige Terme
Term-Taktiken Auswahl/Variation der Suchterme
Ideen-Taktiken offene Suchmöglichkeiten/Variation
Die Begriffe Daten, Information und Wissen
Sichtweisen auf Wissen
Strategie: Plan zu Durchführung einer komplexen Suche
Daten – Information – Wissen
I
Im Zusammenhang mit Informationssystemen tauchen die
Begriffe “Daten“, “Wissen“ und “Information“ auf
I
In der Informatik redet man auch von “Datenbanken“ oder
“Wissensmanagement“
I
Was also ist der Unterschied zwischen Daten, Wissen und
Information?
Sichtweise des Wissensmanagement
I
Unterscheidung zwischen Daten und Information auf der einen
und Wissen der anderen Seite
I
Kontinuum Daten – Information – Wissen
Abgrenzung hinsichtlich der Fragestellung
I
I
I
I
Daten und Information: “wer – was – wo – und wann?“
Wissen: “wie?“ und “warum?“
Prozessorientierter Ansatz:
I
I
I
Wissen als Ressource, die zur Erledigung einer Aufgabe
notwendig ist
Neues Wissen kann aus der Erledigung der Aufgabe entstehen
Integrierte Betrachtung von Daten, Information und Wissen
Sicht der Informationswissenschaft
I
Ursprünglich: Kontinuum Daten – Wissen – Information
I
Gegensatz zur allgemein üblichen Begrifflichkeit
I
Daher: Daten – Information – Wissen, mit Erläuterungen aus
der Informationswissenschaft
Daten — Information — Wissen
Syntax, Semantik und Pragmatik
Syntax: Hierbei wird ein Objekt als Folge von Symbolen
aufgefasst.
Semantik beschäftigt sich mit der Bedeutung eines Objektes.
Pragmatik orientiert sich an der Nutzung eines Objektes für
einen bestimmten Zweck.
Wissen
I
Wissen ist die Teilmenge von Information, die von jemandem
in einer konkreten Situation zur Lösung von Problemen
benötigt wird
I
Suche nach Wissen in externen Quellen
I
Informationssysteme: Extraktion des benötigten Wissens aus
der bereitgestellten Information
I
Transformation von Information in Wissen als ein Mehrwert
erzeugender Prozess
I
Wissen ist Information in Aktion
Beispiel: LINUX Manuals
Anderes Beispiel: Daten
I
Beinhalten Information über Linux
I
Beispiel: wie drucke ich ein Dokument?
I
Benötigtes Wissen: Teilmenge der insgesamt in den Manuals
verfügbaren, umfangreichen Information
I
Mehrwert durch gezielte Bereitstellung (z.B. durch das Linux
man-Kommando)
Aus Daten wird Information
1:2
T03 -- T04
2:0
T05 -- T06
2:4
T07 -- T08
1:4
T09 -- T10
1:1
T11 -- T12
1:0
T13 -- T14
1:4
T15 -- T16
1:3
T17 -- T18
3:2
Wissen zur Entscheidungsfindung
Ergebnisse Fußball-Bundesliga 28. Spieltag
Hannover – Bayern
Schalke – Gladbach
Hamburg – Stuttgart
Aachen – Dortmund
Berlin – Bielefeld
Bremen – Nürnberg
Leverkusen – Bochum
Frankfurt – Cottbus
Wolfsburg – Mainz
T01 -- T02
1:2
2:0
2:4
1:4
1:1
1:0
1:4
1:3
3:2
Problem: Soll ich heute mein BVB-Trikot
auf der Arbeit anziehen?
Ergebnisse Fußball-Bundesliga 28. Spieltag
Hannover – Bayern
Schalke – Gladbach
Hamburg – Stuttgart
Aachen – Dortmund
Berlin – Bielefeld
Bremen – Nürnberg
Leverkusen – Bochum
Frankfurt – Cottbus
Wolfsburg – Mainz
1:2
2:0
2:4
1:4
1:1
1:0
1:4
1:3
3:2
Rolle des Wissens zur Entscheidungsunterstützung
Wissen dient zur “informationellen Handlungsabsicherung“
Sichtweisen auf Wissen
I
Enzyklopädisches Wissen
I
1) Verfügbarkeit
a) Bereitstellung
b) Zugänglichkeit
2) Interpretierbarkeit
Daten
3) Neuigkeit
4) Glaubwürdigkeit
Information
5) Relevanz
a) Kontext−Relevanz
b) Aktualität
6) Entsch.−Verfügbark.
a) Bereitstellung
b) Zugänglichkeit
Wissen
I
7) Validität
a) Informationsgehalt
b) Verständlichkeit
8) Informationswert
Entscheidung
Alltagswissen
Nützlichkeit
I
I
Alltagswissen
Lexikalisches Wissen
Fachwissen
Erfahrungswissen
I
Handlungswissen
I
Räumliches Wissen
I
Episodisches Wissen
Lexikalisches Wissen
Dies sind 4 Äpfel
Schimmel bezeichnet weißes Pferd
Unternehmen sollen Gewinne erwirtschaften
Abbildung: Weißes Pferd, Jerzy Panek
Fohlen bezeichnet junges Pferd... und das Team von Borussia
Mönchengladbach ;-)
Fachwissen
Erfahrungswissen
Gewinn ist Umsatz minus Kosten
Unreife Früchte können Durchfall verursachen
G =U −K
Komplexe Zahlen besitzen einen Real- und Imaginärteil


Realteil
z
}|
{


4.73i
 1.631 ,
| {z } 
Imaginärteil
Handlungswissen
Abbildung: Unreife Frucht der Red Savina, schärfster Chili der Welt
Räumliches Wissen
Analoge Repräsentation physischer Objekte durch Repräsentation
räumlicher Information und Verhältnisse
Kenntnis von Prozeduren und Problemlösungen
Beispiel: Mentale Rotation analoger Objekte
Episodisches Wissen
Autobiografisches Wissen, das aus erinnerbaren Erlebnissen besteht
Beispiel: George spielt Golf in Yale
Implizites vs. explizites Wissen
Implizites Wissen:
In mentalen Modellen, kognitiven Bildern Konstrukten
und Karten sowie routinierten Verhaltens- und
Vorgehensweisen eingelagertes Wissen bezeichnet man als
implizites Wissen (tacit knowledge ),
auch als Know-how oder Fingerspitzengefühl beschrieben
Explizites Wissen (Polanyi)
Spezifisches, reproduzierbares Wissen,
In der Regel schriftlich (oder anderweitig explizit)
repräsentiert
Implizites vs. explizites Wissen
Wissensmanagement
Aufgabe von Informationssystemen:
I
Implizites Wissen in Explizites überführen
I
Explizites Wissen bei Anwendung evtl. wieder implizit
SECI-Modell
Wissensmanagement
”Wissensmanagement beschäftigt sich mit den Möglichkeiten, auf
die Wissensbasis eines Unternehmens Einfluss zu nehmen. Unter
der Wissensbasis eines Unternehmens werden alle Daten und
Informationen, alles Wissen und alle Fähigkeiten verstanden, die
diese Organisation zur Lösung ihrer vielfältigen Aufgaben
benötigt.” (Wikipedia)
I
Wissen als Produktionsfaktor
I
Informationssysteme zur Verwaltung des Wissens
I
Chief Information Officer (CIO) für Informationsmanagement
I
Kritik: Wissensmanagement verwendet undifferenzierten
Wissensbegriff
SECI-Modell
[Nonaka & Takeuchi 95]
Modell der Wissenserzeugung:
I
Sozialisation
I
Externalisierung
I
Kombination
I
Internalisierung
Sozialisation
I
Lernen durch Beobachtung Anderer
I
Besprechungen, Brainstorming
Externalisierung
I
Dokumentieren, Veröffentlichung
I
Abspeichern in Datenbanken
Kombination
I
Organisation von Wissen
I
Integration von Wissen aus verschiedenen Quellen
Internalisierung
I
Verinnerlichen von Wissen (Lernen)
I
Wissen erhalten und anwenden
Information Lifecycle
Der Information Lifecycle im Information Engineering
Phasen des Information Lifecycle
IE-Methoden im Information Lifecycle
Information Lifecycle im IE
I
In dieser VL: Konzentration auf Methoden und Werkzeuge des
IE
I
Grundlage der weiteren Betrachtungen: Information
Lifecycle
I
Betrachtung aller Lebensphasen von Information (Erstellung
bis Anwendung)
I
Ideal: Informationssystem unterstützt alle Phasen
I
Einsatz von Methoden hängt vom Informationssystementwurf
ab (nach Planung und Analyse)
I
Implementierung und Integration der Methoden und
Werkzeuge Teil der Realisierung des Informationssystems
Information Lifecycle
Information Lifecycle
Creation/Receipt
I
Autorensysteme (Authoring)
I
I
I
Information dient der Erfüllung einer Aufgabe
I
Formulierung als Prozess
I
I
Teilaufgaben als untergeordnete Prozesse
I
I
Wissensintensive Aufgaben
I
I
Metadaten
Daten über Dokumente
z.B. bibliographische Daten
Annotationen
I
I
I
I
Erstellung einfacher Texte
Hypertext- und Multimediadokumente, Hypermedia
Spezielle Art von Metadaten
Verschlagwortung, “tagging“ bzw. semantische Annotation
Textuelle Kommentare, Diskussionen
Markup
Creation/Receipt
I
Digitalisierung
I
I
I
I
Storage
Erfassung und Umsetzung von nicht-digitalen Quellen in
digitale
Textuelle Dokumente (Scanning, OCR)
Nicht-textuelle Daten (Schall, Messdaten, Video, Bilder) →
Sampling
Modellierung
I
Formale Darstellung von Prozessabläufen, Sequenzen,
Anwendungsfällen, Zuständen und Beziehungen
Dissemination
I
Kurz- bis langfristige Speicherung der Information
I
Flüchtige Information im Hauptspeicher
I
Ablage in Dateien
I
Größere Datenmengen, (semi-)strukturierte Daten:
Datenbanken
I
Dokumente: Digitale Bibliotheken/Repositories
I
Langzeitarchivierung (digital preservation)
I
Wissensrepräsentation und Organisation, Ontologien
I
Aufbereitung für die Suche: Indexierung
I
Informationssysteme dienen häufig der Erfüllung einer
bestimmten Aufgabe oder eines bestimmten Zwecks
Use
I
Information Retrieval
I
Informationssystem kann Anwendungen gezielt unterstützen
I
Recommender-Systeme
I
I
Zugangsmanagement (access management)
Beispiel Geisteswissenschaften: Interpretation des Materials
mittels annotationsbasierter Diskussion (damit auch
Generierung neuer Information)
I
Beispiel Informationssystem für Multimediadokumente:
Abspielfunktionen für Videos oder Musik
Zusammenfassung
I
Begriff des Information Engineering erläutert
I
Zusammenfassung
I
Keine starre Methodik, sondern Methoden und Werkzeuge
Konzentration auf Realisierung von Informationssystemen
I
Informationskompetenz als notwendige Voraussetzung
I
Daten – Information – Wissen
I
Wissensmanagement
Information Lifecycle
I
I
I
4 Phasen
Mögliche Methoden für jede Phase