Was für Information Retrieval-Modelle (Anfragemodelle) gibt es?
- Boolesches Modell: Menge von Indextermen mit booleschen Junktoren für Query und Dokumente ("Koblenz AND Billiard"), entweder in DNF (kompaktere Zwischenergebnisse) oder KNF normalisiert. Unintuitiv, keine Relevanzabstufung, keine Ähnlichkeitssuche, große Ergebnismengen.
- Fuzzy-Modell: Boolesches Modell um Zugehörigkeitswerte erweitert.. Boolesche Anfrage wird in eine Funktion überführt, die für jedes Dokument die Zugehörigkeit zwischen 0 und 1 zurückliefert. Ergebnisse über Schwellwert, dann sortiert.
- Verkorraum-Modell: Dokumente und Anfrage als Vektoren gleicher Länge (eine Dimension pro Feature). Ähnlichkeit über Kosinusmaß, der Kosinus des eingeschlossenen Winkels zwischen beiden Vektoren oder Distanzfunktion als Unähnlichkeitsmaß (schlecht für Textdokumente wegen unterschiedlicher Wortanzahl und daher unterschiedlicher Vektorlänge). VR-Modell kann prinzipiell mit Fuzzy-Modell kombiniert werden (Vektoren als Furry-Anfragen).
Tags: information retrieval, modelle
Source: MMDB 2009
Source: MMDB 2009
Flashcard set info:
Author: kread
Main topic: Informatik
Topic: Semantic Web
School / Univ.: Universität Koblenz-Landau
City: Koblenz
Published: 22.10.2010
Card tags:
All cards (35)
baum (9)
eigenschaften (1)
hs (1)
indexstruktur (1)
m-baum (2)
mehrdimensional (10)
modelle (1)
objektrelational (1)
oodbms (1)
probleme (1)
r-baum (3)
x-baum (2)