Was für Information Retrieval-Modelle (Anfragemodelle) gibt es?
- Boolesches Modell: Menge von Indextermen mit booleschen Junktoren für Query und Dokumente ("Koblenz AND Billiard"), entweder in DNF (kompaktere Zwischenergebnisse) oder KNF normalisiert. Unintuitiv, keine Relevanzabstufung, keine Ähnlichkeitssuche, große Ergebnismengen.
- Fuzzy-Modell: Boolesches Modell um Zugehörigkeitswerte erweitert.. Boolesche Anfrage wird in eine Funktion überführt, die für jedes Dokument die Zugehörigkeit zwischen 0 und 1 zurückliefert. Ergebnisse über Schwellwert, dann sortiert.
- Verkorraum-Modell: Dokumente und Anfrage als Vektoren gleicher Länge (eine Dimension pro Feature). Ähnlichkeit über Kosinusmaß, der Kosinus des eingeschlossenen Winkels zwischen beiden Vektoren oder Distanzfunktion als Unähnlichkeitsmaß (schlecht für Textdokumente wegen unterschiedlicher Wortanzahl und daher unterschiedlicher Vektorlänge). VR-Modell kann prinzipiell mit Fuzzy-Modell kombiniert werden (Vektoren als Furry-Anfragen).
Tags: information retrieval, modelle
Quelle: MMDB 2009
Quelle: MMDB 2009
Kartensatzinfo:
Autor: kread
Oberthema: Informatik
Thema: Semantic Web
Schule / Uni: Universität Koblenz-Landau
Ort: Koblenz
Veröffentlicht: 22.10.2010
Schlagwörter Karten:
Alle Karten (35)
baum (9)
eigenschaften (1)
hs (1)
indexstruktur (1)
m-baum (2)
mehrdimensional (10)
modelle (1)
objektrelational (1)
oodbms (1)
probleme (1)
r-baum (3)
x-baum (2)