Information Retrieval (SS 2011)

Transcription

Information Retrieval (SS 2011)
7. Seman)sche(re) Suche
Rückblick
✦
World Wide Web – dezentralisiert organisierter Hypertext
✦
Crawler sammeln dezentralisiert gespeicherte Web-­‐Inhalte
✦
Duplikate und Beinahe-­‐Duplikate müssen eliminiert werden
✦
Link-­‐Analyse für besseres Ranking miJels Web-­‐Graph
✦
Lernbasiertes Ranking kombinieren verschiedene Merkmale
✦
Web-­‐Archive – vergangene Web-­‐Inhalte als Kulturerbe
✦
Sponsored Search – Haupteinnahmequelle von Google & Co
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
2
Mo)va)on
The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-­‐de<ined meaning, better enabling computers and people to work in cooperation
[Tim Berners-Lee]
✦
World Wide Web ist für Computer nicht interpre?erbar – Suchmaschinen chancenlos für Informa)onsbedürfnisse wie
Zahnarzt in Marburg mit Sprechstunde bis 19.00 Uhr am Donnerstag
Filme in denen Ben Affleck Regie geführt und selbst mitgespielt hat
Welche Politiker haben Spenden von Energieunternehmen im
Wahlkampf erhalten und gegen einen Atomausstieg gestimmt?
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
3
Inhalt
(1) Seman)c Web
(2) URIs und RDF
(3) Ontologien und Wissensbasen
(4) SPARQL
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
4
7.1 Seman?c Web
✦
✦
✦
Seman?c Web ist eine Ergänzung des World Wide Webs mit dem Ziel Inhalte für Computer interpre?erbar zu machen
Inhalte aus verschiedenen Quellen können damit automa?sch verknüpG und neue Zusammenhänge entdeckt werden
Berners-­‐Lee et al. [3] beschreiben Vision des Seman)c Web bereits im Jahr 2001; breite Anwendung der vorgestellten Ideen jedoch erst in den letzten ca. 5 Jahren
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
5
Seman)c Web
World Wide Web Consor?um (W3C) definiert Standards
✦
✦
✦
✦
zur eindeu)gen Iden)fizierung von Ressourcen (URIs)
zur Beschreibung der Eigenschahen von Ressourcen (RDF)
zur Beschreibung von Schemata (RDF/S)
✦
zur Beschreibung von Ontologien (OWL)
✦
zum Formulieren von Anfragen (SPARQL)
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
Seman?c Web Stack
6
7.2 URIs und RDF
✦
Unified Resource Iden?fier (URI) ist eine ZeichenkeJe zur Iden?fika?on einer abstrakten oder physischen Ressource
http://www.bbc.co.uk/music/artists/67f66c07-6e61-4026-ade5-7e782fad3a5d
http://en.wikipedia.org/wiki/Foo_Fighters
http://www.musicbrainz.org/artist/67f66c07-6e61-4026-ade5-7e782fad3a5d
✦
Ein URI verweist auf genau eine Ressource
✦
Ressource kann von mehreren URIs referenziert werden
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
7
Unified Resource Iden)fier
http://www.host.org/pub/bands?query=FF#albums
Bestandteile eines Uniform Resource Iden)fiers sind
✦
✦
✦
✦
✦
✦
Scheme (z.B. hJp, urn, hp) bes)mmt Art des URI und
seine Interpreta)on
Authority (z.B. Name eines Hosts) gibt Instanz an, die für Verwaltung der Namen in diesem Raum zuständig ist
Path enthält hierarchische Angaben zur Iden)fizierung einer Ressource
Query enthält nicht hierarchische Angaben zur Iden)fizierung einer Ressource
Fragment referenziert einen Teil innerhalb einer Ressource
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
8
Resource Descrip)on Framework
✦
✦
✦
Resource Descrip)on Framework (RDF) ist Daten-­‐Modell zur
formalen Repräsenta?on von Informa?onen über Ressourcen
RDF-­‐Ausdruck (RDF statement) ist ein (S,P,O)-­‐Tripel bestehend aus Subjekt, Prädikat und Objekt, welche jeweils URIs sind
Beispiel: Foo Fighters haben Bandmitglied Dave Grohl
http://dbtune.org/musicbrainz/page/artist/67f66c07-6e61-4026-ade5-7e782fad3a5d (S)
http://xmlns.com/foaf/spec/20100809.html#member (P)
http://dbtune.org/musicbrainz/page/artist/4d5f891d-9bce-45ae-ad86-912dd27252fa (O)
Subjekt
Informa)on Retrieval (SS 2011)
Prädikat
7. Seman)sche(re) Suche
Objekt
9
Resource Descrip)on Framework
✦
Eine Menge von RDF-­‐Tripeln ergibt einen RDF-­‐Graphen
a:playsOn
a:ma
ke
a:m
✦
e
ak
r
r Of
Of
ber
m
e
a:m
a:m
em
be
r
Namespaces repräsen)eren (häufig verwendete) Präfixe von URIs und erlauben eine kompaktere Nota)on
@prefix a: http://allaboutmusic.org/
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
10
Resource Descrip)on Framework
✦
RDF/N3 als Text-­‐Format zur Darstellung von RDF-­‐Daten
@ prefix
a:
a:Foo_Fighters
a:Foo_Fighters
✦
http://allaboutmusic.org
a:member
a:member
a:Dave_Grohl
a:Pat_Smear
RDF/XML als XML-­‐Format zur Darstellung von RDF-­‐Daten
<?xml version=”1.0”>
<rdf:RDF
xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:a=”http://allaboutmusic.org/”>
<rdf:Description rdf:about=”http://allaboutmusic.org/Foo_Fighters”>
<a:member rdf:resource=”http://allaboutmusic.org/Dave_Grohl” />
<a:member rdf:resource=”http://allaboutmusic.org/Pat_Smear” />
</rdf:Description>
</rdf:RDF>
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
11
7.3 Ontologien und Wissensdatenbanken
✦
✦
✦
Taxonomie (taxonomy) beschreibt bestehende Klassen und deren subclass/superclass-­‐Rela)onen zueinander
Ontologie (ontology) beschreibt zusätzlich beliebige Rela)onen zwischen Klassen
Wissensdatenbank (knowledge base) beschreibt zusätzlich Instanzen sowie Fakten über diese Instanzen
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
entity
organization
person
musical organization
artist
subclassOf
12
7.3 Ontologien und Wissensdatenbanken
✦
✦
✦
Taxonomie (taxonomy) beschreibt bestehende Klassen und deren subclass/superclass-­‐Rela)onen zueinander
Ontologie (ontology) beschreibt zusätzlich beliebige Rela)onen zwischen Klassen
Wissensdatenbank (knowledge base) beschreibt zusätzlich Instanzen sowie Fakten über diese Instanzen
entity
organization
person
musical organization
artist
subclassOf
hasMember
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
12
7.3 Ontologien und Wissensdatenbanken
✦
✦
✦
Taxonomie (taxonomy) beschreibt bestehende Klassen und deren subclass/superclass-­‐Rela)onen zueinander
Ontologie (ontology) beschreibt zusätzlich beliebige Rela)onen zwischen Klassen
Wissensdatenbank (knowledge base) beschreibt zusätzlich Instanzen sowie Fakten über diese Instanzen
entity
organization
person
musical organization
artist
Dave_Grohl
Foo_Fighters
Pat_Smear
subclassOf
hasMember
type
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
12
Ontologien und Wissensdatenbanken
✦
✦
✦
Das Gebiet der Künstlichen Intelligenz hat sich schon lange vor dem Seman)c Web mit Ontologien, Wissensdatenbanken und anderen Methoden der Wissensrepräsenta?on befasst
Ontologien manuell zu erstellen ist ein aufwendiger Prozess, so dass Ontologien in der Vergangenheit sehr klein waren bzw. nur einen bes?mmtes Gebiet (z.B. Archäologie) abdeckten
Eine Reihe von Projekten hat in den letzten Jahren Verfahren zur Informa?onsextrak?on auf Wikipedia und andere Datenquellen angewendet, um daraus automa?sch umfassende Wissensdatenbanken abzuleiten
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
13
DBpedia
✦
✦
http://dbpedia.org
3.5 Millionen En))es / 670 Millionen Fakten
About: Foo Fighters
An Entity of Type : Band, from Named Graph : http://dbpedia.org, within Data Space : dbpedia.org
Foo Fighters are an American alternative rock band from Seattle, Washington, formed in 1995. Drummer Dave Grohl formed the group as a one-man
project after the dissolution of his previous band, Nirvana, in 1994. Prior to the release of the band's eponymous debut album in 1995, Grohl drafted
two members from the former band Sunny Day Real Estate, Nate Mendel as bassist, and William Goldsmith as drummer, as well as fellow Nirvana
bandmate Pat Smear as guitarist to complete the group.
Property
dbpedia-owl:abstract
Informa)on Retrieval (SS 2011)
Value
Foo Fighters ist eine US-amerikanische Rockband. Prominentestes Mitglied ist der ehemalige NirvanaSchlagzeuger Dave Grohl.
Foo Fighters are an American alternative rock band from Seattle, Washington, formed in 1995. Drummer Dave
Grohl formed the group as a one-man project after the dissolution of his previous band, Nirvana, in 1994. Prior
to the release of the band's eponymous debut album in 1995, Grohl drafted two members from the former band
Sunny Day Real Estate, Nate Mendel as bassist, and William Goldsmith as drummer, as well as fellow Nirvana
bandmate Pat Smear as guitarist to complete the group. The band was small, young, and began with
performances in Portland, Oregon before gaining popularity. Goldsmith left during the recording of the group's
second album, The Colour and the Shape (1997), and Smear's departure followed soon afterward. They were
replaced by Taylor Hawkins and Franz Stahl, respectively, although Stahl left prior to the recording of the
group's third album, There Is Nothing Left to Lose (1999). Chris Shiflett joined as the band's third guitarist after
the completion of There Is Nothing Left to Lose. The band released its fourth album, One by One, in 2002. The
group followed that release with the two-disc In Your Honor (2005), which was split between acoustic songs
and harder-rocking material. Foo Fighters released its sixth album, Echoes, Silence, Patience & Grace, in 2007.
Later that year, guitarist Pat Smear rejoined the band. Over the course of the band's existence, three of its
albums have won Grammy Awards for Best Rock Album, and all six have been nominated for Grammys.
Foo Fighters es una banda de origen estadounidense creada en el año 1995 por Dave Grohl, ex-baterista de
Nirvana. La banda ha conseguido varios reconocimientos y ha marcado muchísimos éxitos alrededor del
mundo, tales como "Big Me", "This is a Call", "Everlong", "Monkey Wrench", "Learn to Fly", "All My Life",
"Times Like These", "Best of You", "D.O.A. ", "No Way Back", "The Pretender", que alcanzó el puesto N° 1 en
los Hot Modern5. Rock
Tracks el
sábado
1 de septiembre del 2007 y se mantuvo como número 1 por 18
14
Evaluierung von IR-­‐Systemen
semanas consecutivas. Su último single es "Wheels", incluído en su álbum de Grandes Éxitos lanzado el 3 de
is dbpedia-owl:musicalBand of
✦
✦
dbpedia:Generator_(song)
dbpedia:Let_It_Die_(song)
dbpedia:This_Is_a_Call
dbpedia:Walking_After_You
dbpedia:Next_Year
dbpedia:Exhausted_(song)
dbpedia:For_All_the_Cows
dbpedia:My_Hero_(song)
dbpedia:Times_Like_These_(song)
dbpedia:I'll_Stick_Around
dbpedia:Monkey_Wrench_(song)
dbpedia:Everlong
dbpedia:Low_(Foo_Fighters_song)
dbpedia:Breakout_(Foo_Fighters_song)
dbpedia:Have_It_All_(song)
dbpedia:Learn_to_Fly
is dbpedia-owl:producer of
dbpedia:The_Colour_and_the_Shape
dbpedia:There_Is_Nothing_Left_to_Lose
dbpedia:One_by_One
dbpedia:Echoes,_Silence,_Patience_&_Grace
dbpedia:This_Is_a_Call
dbpedia:Greatest_Hits_(Foo_Fighters_album)
dbpedia:Exhausted_(song)
dbpedia:Foo_Fighters_(album)
dbpedia:In_Your_Honor
dbpedia:Foo_Fighters_Live_at_Wembley_Stadium
dbpedia:I'll_Stick_Around
dbpedia:Five_Songs_and_a_Cover
is dbpedia-owl:wikiPageDisambiguates of dbpedia:FF
is dbpedia-owl:wikiPageRedirects of
dbpedia:Foo_fighters
dbpedia:The_Foo_Fighters
dbpedia:Foo_Fighters_(band)
dbpedia:The_foo_fighters
dbpedia:Foo_Fighters_band_members
dbpedia:THE_FOOS
is dbpprop:associatedActs of
dbpedia:Me_First_and_the_Gimme_Gimmes
dbpedia:Jackson_United
dbpedia:Dain_Bramage
is dbpprop:producer of
dbpedia:This_Is_a_Call
dbpedia:Exhausted_(song)
is owl:sameAs of
yago-res:Foo Fighters
is foaf:primaryTopic of
http://en.wikipedia.org/wiki/Foo_Fighters
DBpedia
http://dbpedia.org
3.5 Millionen En))es / 670 Millionen Fakten
Browse using: OpenLink Data Explorer | Zitgist Data Viewer | Marbles | DISCO | Tabulator
Raw Data in: CSV | RDF ( N-Triples N3/Turtle JSON
XML ) | OData ( Atom JSON ) About
Informa)on Retrieval (SS 2011)
5. Evaluierung von IR-­‐Systemen
14
YAGO
✦
✦
http://www.mpi-inf.mpg.de/yago-naga/yago/
10 Millionen En))es / 80 Millionen Facts
Browse YAGO2
Entity:
case insensitive
← Foo fighters
← Foo Fighters
← Foo Fighters band members
← The foo fighters
← THE FOOS
Foo_Fighters
Show transitive facts
hasWonPrize
means
wasCreatedOnDate
1995-##-## →
hasPreferredName
Foo Fighters →
← Foo Fighters hasPreferredMeaning
hasWikipediaCategory
Informa)on Retrieval (SS 2011)
Grammy Award →
Kerrang! Awards →
5. Evaluierung von IR-­‐Systemen
1990s music groups →
2000s music groups →
2010s music groups →
American alternative rock groups →
American hard rock musical groups →
American post-grunge musical groups →
BRIT Award winners →
Grammy Award winners →
Kerrang! Awards winners →
Musical groups established in 1995 →
Musical groups from Seattle, Washington →
Nirvana (band) →
RCA Records artists →
A320 (song) →
Breakout (Foo Fighters song) →
Echoes, Silence, Patience & Grace →
Everlong →
Everywhere but Home →
Exhausted (song) →
Foo Fighters discography →
15
Foo Fighters Live at Wembley Stadium →
YAGO
✦
✦
American alternative rock groups →
American hard rock musical groups →
American post-grunge musical groups →
Musical groups established in 1995 →
Musical groups from Seattle, Washington →
abstraction →
entity →
group →
musical organization →
organization →
social group →
yagoLegalActor →
yagoLegalActorGeo →
http://www.mpi-inf.mpg.de/yago-naga/yago/
10 Millionen En))es / 80 Millionen Facts
type
hasGivenName
Foo →
hasWikipediaAnchorText
A320 →
ABBA →
acoustic →
Afghan Whigs →
AIDS →
Alanis Morissette →
Alive & Well →
All My Life →
Alternative rock →
Angels & Airwaves →
backing vocals →
Baltimore →
bass guitar →
Bay City Rollers →
Beatles →
Best Hard Rock Performance →
Best of You →
Best Rock Album →
Big Me →
Billboard →
...
hasWebsite
» http://www.foofighters.com/ →
hasGender
male →
hasWikipediaUrl
» http://en.wikipedia.org/wiki/Foo_Fighters →
hasFamilyName
Fighters →
hasNumberOfWikipediaLinks 167 →
Informa)on Retrieval (SS 2011)
5. Evaluierung von IR-­‐Systemen
15
Freebase
✦
✦
http://www.freebase.com
20 Millionen En))es
Find topics...
Data
Schema
Apps
Docs
Foo Fighters
Sign In or Sign Up
These people have edited this topic:
Scroll to:
Foo Fighters is an American alternative rock band originally formed
Music
in 1994 by Nirvana drummer Dave Grohl as a one-man project
Broadcast Artist
following the dissolution of his previous band. The band got its
Awards
name from the UFOs and various aerial phenomena that were
Film
reported by Allied aircraft pilots in World War II, which were known
TV Actor
collectively as foo fighters. Prior to the release of the Foo Fighters' 1995 debut album Foo
More...
Fighters, which featured Grohl as the ... More
Edit this topic
Last edited Jul 4, 2011 See all topic history »
Related Topics
Read article at Wikipedia
Pearl Jam
Active as Musical Artist (start): 1994
Place Musical Career Began: Seattle, United States of America
Song: Wasting Light
Musical Genres: Rock music, Hard rock, Post-grunge, Alternative rock, Alternative metal, Punk
rock, Post-hardcore, Grunge music
Green Day
Artist: Foo Fighters
Also known as: FooFighters, Foo Fighters
Nirvana
Music
Red Hot Chili Peppers
Albums
Informa)on Retrieval (SS 2011)
5. Evaluierung von IR-­‐Systemen
16
✦
✦
First appearance:
SNL - 21.7
Most recent
appearance:
Jon Bon Jovi/Foo Fighters
Former cast
member?:
No
Freebase
http://www.freebase.com
20 Millionen En))es
We can also tell you Foo Fighters is a…
top !
…Social network user
If you know more about Foo Fighters , you can add more facts here »
Edit and Show details
Flag this Topic
Add or delete facts, download data in JSON or RDF
formats, and explore topic metadata.
What is Freebase?
Why do you want to flag this topic?
Freebase is a huge collection of facts, built by
people like you. Freebase connects facts in ways
other sites can't, giving you new ways to explore
millions of subjects.
You can help improve it!
Label as possibly offensive
Delete from Freebase
Merge with another topic
Split into multiple topics
The album, artist, and track information for Foo Fighters originated from
MusicBrainz.org. The information is Public Domain.
Freebase data is free for use under the CC-BY license.
1
Learn more about Freebase licensing and attribution »
The original description for Foo Fighters was automatically generated from
Wikipedia.org licensed under the GNU Free Documentation License.
1
Page History
RDF
Feedback
Attribution Policy
Freebase contains information on: Arts & Entertainment
Informa)on Retrieval (SS 2011)
Terms of Service
Products & Services
About Us
Jobs
Science & Technology
Freebase Blog
Society
Special Interests
5. Evaluierung von IR-­‐Systemen
©2011
Sports
System
Time & Space
Transportation
16
7.5 SPARQL
✦
✦
SPARQL Protol and Query Language (SPARQL) ist eine vom W3C standardisierte Anfragesprache für das Seman?c Web
Syntax von SPARQL angelehnt an Syntax der Structured Query Language (SQL) zum Anfragen rela)onaler Datenbanken
SELECT name, COUNT(*)
FROM customers
GROUP BY name
✦
✦
SPARQL Anfrage definiert ein Graphmuster (graph pa7ern); Ergebnis sind alle Teilgraphen, welche diesem entsprechen
Linked Open Data schlägt vor, dass Daten miJels SPARQL Schniastelle (SPARQL endpoint) anfragbar sind
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
17
SPARQL
✦
Beispiel:
PREFIX a: <http://allmusic.org/>
SELECT DISTINCT ?p WHERE {
?b a:hasMember a:Dave_Grohl .
?b a:hasMember ?p .
?p ?r a:Seattle .
}
ORDER BY ?p
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
18
SPARQL
✦
Beispiel:
PREFIX a: <http://allmusic.org/>
SELECT DISTINCT ?p WHERE {
?b a:hasMember a:Dave_Grohl .
?b a:hasMember ?p .
?p ?r a:Seattle .
}
ORDER BY ?p
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
e
asM
h
:
a
?b
er
mb
Dave_Grohl
a:h
as
M
em
be
r
?p
?r
Seattle
18
Zusammenfassung
✦
✦
✦
✦
✦
Seman?c Web ist eine Ergänzung des World Wide Webs, mit dem Ziel, Inhalte für Computer verständlich zu machen
Uniform Resource Iden?fiers zur eindeu)gen Iden)fika)on einer abstrakten oder physischen Ressource
Resource Descrip?on Framework als Daten-­‐Modell zur Beschreibung von Informa)onen über Ressourcen
Ontologien und Wissensdatenbanken erfassen Wissen über Klassen, deren Instanzen und Rela)onen zwischen diesen SPARQL als Anfragesprache für das Seman)c Web
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
19
Quellen & Literatur
[1] [2] [3] [4] [5] [6] [7] http://semanticweb.org
http://linkeddata.org
T. Berners-­‐Lee, J. Hendler and O. Lassila: The Seman)c Web
Scien)fic American, 2001
http://www.scientificamerican.com/article.cfm?id=the-semantic-web
D. Fensel, J. Hendler, H. Lieberman and W. Wahlster: Spinning the Seman)c Web
MIT Press, 2003
I. Herman: Introduc)on to Seman)c Web Technologies
Seman)c Technology Conference Tutorial, 2010
http://www.w3.org/2010/Talks/0622-SemTech-IH/Tutorial.pdf
P. Mika and T. Tran: Seman)c Search
Seman)c Technology Conference Tutorial, 2011
http://www.slideshare.net/pmika/semtech-2011-semantic-search-tutorial
F. Suchanek, A. Varde, R. Nayak and P. Senellart: The Hidden Web, XML and the Seman)c Web: A Scien)fic Data Management Perspec)ve
EDBT Tutorial, 2011
http://suchanek.name/work/publications/edbt2011tutorial/tutorial.pdf
Informa)on Retrieval (SS 2011)
7. Seman)sche(re) Suche
20

Similar documents