INFORMATIONSWISSENSCHAFT

Title / Titel:

Information Retrieval. Informationen suchen und finden

Author / Autor:

Wolfgang G. Stock

Source / Quelle:

Oldenbourg Wissenschaftsverlag, München, Wien, 2007, pp. 599

Language / Sprache:

German / Deutsch

Information Retrieval. Informationen suchen und finden

Information Retrieval

Grundlagen der Informationswissenschaft

1 Ziel der Buchreihe
Lehrbücher zur Informationswissenschaft - Information Retrieval im Kontext der Informationswissenschaft - Zielgruppen - Danksagung
2 Informationswissenschaft
Was ist Informationswissenschaft? Eine plakative Annäherung - Informationswissenschaft im Kontext: Die Nachbardisziplinen - Geschichte der Informationswissenschaft in fünf Teilen - Einsatzbereiche: Internetwirtschaft und betriebliche Informationswirtschaft - Informationswissenschaftliche Zeitschriften und Datenbanken - Fazit
3 Information und Wissen
Signal, Daten, Wissen, Information - Information als in Bewegung gesetztes Wissen - "Wissen ist Macht" - Information als Wirtschaftsgut - Fazit

Propädeutik des Information Retrieval

4 Geschichte des Information Retrieval
Vom Memex über den Sputnik-Schock zum Weinberg-Report - Frühe kommerzielle Informationsdienste: DIALOG, SDC Orbit und Lexis-Nexis - Das World Wide Web und seine Suchwerkzeuge - Fazit
5 Grundbegriffe des Information Retrieval
Konkreter und problemorientierter Informationsbedarf - Zusammenspiel von Information Indexing und Information Retrieval - Dokumentarische Bezugseinheit und Dokumentationseinheit - Kognitive Modelle - Pull- und Pushdienste - Informationsbarrieren - Recall und Precision - Fazit
6 Relevanz und Pertinenz
Relevanz, Pertinenz, Nützlichkeit - Aspekte der Relevanz - Relevant oder nicht relevant: Der binäre Ansatz - Relevanzverteilung von Dokumenten zu einem Thema - Relevanzverteilungen - Fazit
7 Dokumente
Was ist ein Dokument? - Formal publizierte Textdokumente - Informell publizierte Texte - Nicht publizierte Texte - Nicht-textuelle Dokumente - Fazit
8 Typologie von Retrievalsystemen
Schwach strukturierte Texte - Retrievalsysteme und terminologische Kontrolle - Informationslinguistische Textbearbeitung - Retrievalmodelle - Oberflächenweb und Deep Web - Fazit
9 Architektur eines Retrievalsystems
Informatik der Retrievalsysteme - Zeichensätze - Aufnahme neuer Dokumente in die Datenbasis - Thematische Crawler - Crawling des Deep Web - Vermeidung von Spam - Erkennung von Dubletten bzw. "Spiegeln" - Aktualisierung der Dokumentationseinheiten - Speicherung und Indexierung - Invertierte Dateien - Trees und Tries - Fazit

Boolesche Retrievalsysteme

10 Boolesches Retrieval
George Booles "Denkgesetze" - Die "atomaren" Suchargumente - Boolesche Operatoren - Abstandsoperatoren - Algebraische Operatoren - Häufigkeitsoperator - Menüführung und Befehlsführung - Informationsprofile und Selective Dissemination of Information - Recherchestrategien - Vor- und Nachteile Boolescher Systeme - Fazit
11 Informetrische Analysen
Online-Informetrie - Auswahl der Dokumentenmenge - Rangordnungen - Informetrische Zeitreihen - Semantische Netze - Informationsflussanalysen - Fazit
12 Erweitertes Boolesches Retrieval
Boolesche Anfragen und Gewichtung - Der "Wunschzettel" von Cater, Kraft und Waller - Fuzzy Boolesches Retrieval - Ein unscharfer Funktor: UNDODER - Ähnlichkeiten und die p-Norm - Die Negation im erweiterten Booleschen Modell - Vor- und Nachteile erweiterter Boolescher Systeme - Fazit

Informationslinguistik - Natural Language Processing

13 n-Gramme
Worte oder Zeichenfolgen? - Henrichs' Pentagramm-Register - ACQUAINTANCE: n-Gramme im Vektorraum - HAIRCUT: n-Gramme probabilistisch bearbeitet - Abhängigkeiten innerhalb der Zeichenfolgen - Vor- und Nachteile n-Gramm-basierter Retrievalsysteme - Fazit
14 Worte
Schriftsystemerkennung - Spracherkennung - Stoppwortlisten - "Verschmelzung" von Wortformen (Conflation) - Grundformbildung (Lemmatisierung) - Wortstammbildung (Stemming) - Wortbearbeitung bei Handy-Tastaturen - Fazit
15 Phrasen, Eigennamen, Komposita
Zusammengesetzte Ausdrücke - Phrasenbildung - Eigennamenerkennung - Die Personennamendatei - Namensidentifikation - Kompositazerlegung - Fazit
16 Begriffe
Semantische Felder - Synsets und Deskriptoren als kleinste semantische Einheiten - Die Wort-Begriff-Matrix - Relationen in WordNet - Kalibrierung von Synsets - Relationen im Standard-Thesaurus Wirtschaft - Semantische Ähnlichkeit - Disambiguierung homonymer Worte - Fazit
17 Anaphora
Referenzausdrücke - Anaphora und Ellipsen beim Einsatz von Abstandsoperatoren - Anaphora und Ellipsen in der Textstatistik (298) - Anaphoraauflösung - Fazit
18 Fehlertolerantes Retrieval
Eingabefehler - Phonetische Ansätze: Soundex und Phonix - Die Damerau-Methode - Eingabefehlererkennung und -korrektur durch n-Gramme - Fazit

Klassische Retrievalmodelle

19 Textstatistik
Die These von Luhn: Termhäufigkeit als Signifikanzfaktor - Termgewichtungen - Dokumentspezifische Termgewichtung (TF / WDF) - Feldoder positionsspezifische Termgewichtung - Termgewichtung nach inverser Dokumenthäufigkeit (IDF) - TF*IDF - Textstatistik im praktischen Einsatz: Freestyle - Fazit
20 Vektorraummodell
Dokumente im n-dimensionalen Raum - Clusterung von Dokumenten mittels Zentroidbestimmung - Relevance Feedback - SMART - Termunabhängigkeit - Latent Semantic Indexing - Vor- und Nachteile des Vektorraummodells - Fazit
21 Probabilistisches Modell
Die bedingte Relevanzwahrscheinlichkeit eines Dokuments unter einer Anfrage - Suchtermgewinnung und -gewichtung durch Musterdokumente - Pseudo-Relevance-Feedback - P(D) im Intervall [0,1] - Statistische Sprachmodelle - Vor- und Nachteile des probabilistischen Modells - Fazit

Web Information Retrieval

22 Linktopologie
Web Information Retrieval - Links und Zitationen - Kleinberg-Algorithmus - PageRank - Re-Ranking - Fazit
23 Strukturinformationen in Dokumenten
Metadaten: Informationen über Dokumente - Strukturinformationen in Dokumenten - Anker - Pfadlänge - Aktualität - Fazit
24 Nutzer und Nutzung
Simulation von Auskunftsinterviews - Typen von Webanfragen - Personalisiertes Retrieval - Nutzungsstatistiken als Rankingkriterium - Ranking nach Sprache - Ranking nach Entfernung: geographisches Information Retrieval (GIR) - Ranking nach Gebot: Sponsored Links - Fazit
25 Themenentdeckung und -verfolgung
Identifizieren und Verfolgen aktueller Ereignisse - Themenentdeckung - Themenverfolgung - Anfragefreie Nachrichtensuche - Fazit

Spezialprobleme des Information Retrieval

26 Soziale Netzwerke und "small worlds"
Intertextualität und Netzwerke - Zentralität eines Akteurs - "degree" von Autoren - Trennpunkte und Brücken - "small world"-Netzwerke - Fazit
27 Kontrolliertes Vokabular
Paradigmatische und syntagmatische Relationen - Gewichtungsberechnung bei syntaktischer Indexierung - Einstellbare syntagmatische Netze - Dynamische Klassierung - Fazit
28 Sprachübergreifendes Retrieval
Übersetzung von Anfragen, von Texten oder gar keine Übersetzung? - Maschinenlesbare Wörterbücher - Fachthesauri im CLIR - Korpusbasierte Methoden - Fazit
29 Anfragedialog
Anfragemodifikationen - Intellektuelle Suchanfragemodifikation - Automatische Suchanfrageerweiterung - Relevance Feedback als Anfragemodifikation - Vorschlag neuer Suchargumente - Ähnliche Dokumente: More like this! - Vorschlagssysteme - Fazit
30 Retrieval von Textstellen
Recherche nach Absätzen und Textausschnitten - Ranking von Dokumenten nach den jeweils bestpassenden Stellen - Ranking von Textstellen innerhalb eines Dokuments - Frage-Antwort-Systeme - Faktendatenbanken - Fazit
31 Bild- und Tonretrieval
Multimedia Retrieval - Dimensionen des Bildretrieval - Anwendungsfälle von Bildretrieval - Videoretrieval - Gesprochene Suchanfragen - Gesprochene Dokumente - Dimensionen des Musikretrieval (MIR) - Musikretrieval mittels Musterdokument - Gesungene, gepfiffene und gesummte Suchanfragen - Fazit
32 Ausblick
Die Literatur zum Information Retrieval - Kombiniertes Information Retrieval - Wissensrepräsentation - Empirische Informationswissenschaft - Angewandte Informationswissenschaft - Information Retrieval: Informatik und Informationswissenschaft - Fazit
Glossar
Register
Namensregister - Sachregister