Informationsbeschaffung im Internet

Puzzle-Steine eines Informationssystems

Für den effektiven und effizienten Informationszugriff ist es wichtig, die Funktionsweise des verwendeten Werkzeugs zu kennen. Im Grunde bestehen die meisten Informationssysteme aus fünf wichtigen Komponenten, die wir einzeln und grösstenteils voneinander losgelöst betrachten können. Je nachdem wie die Komponenten dann kombiniert werden, entsteht ein Such-, ein Katalog- oder ein Push-System.



  • Die Benutzerschnittstelle ist das Einzige, was ein Benutzer vom Informationsdienst zu sehen bekommt. Sie ermöglicht die Kommunikation zwischen Dienst und Anwendern.

  • Der Web-Roboter besucht regelmässig den ihm zugewiesenen Teil des WWW auf der Suche nach neuen oder geänderten Dokumenten, die er dann dem Informationsdienst zuspielen kann.

  • Während der Indexierung werden Dokumente oder auch Anfragen untersucht und darin vorkommende Begriffe identifiziert. Das Vorgehen ist also ähnlich wie in einem Sachbuch: Nachdem der Buchinhalt geschrieben ist, identifiziert man im Text die wichtigen Begriffe und fügt diese im Stichwortverzeichnis des Buchs ein. Zu jedem Eintrag im Stichwortverzeichnis wird die entsprechende Seite vermerkt. Eine vergleichbare Funktion übernimmt der Index des Informationsdienstes.

  • Der Index ist eine Datenstruktur, die das schnelle Vergleichen von Anfragen mit Dokumenten erlaubt. Ein Suchsystem benützt den Index, um zu einem Begriff alle Webseiten zu finden, in denen das Wort auftaucht.

  • Beim Vergleich von Anfragen mit Dokumenten wird ermittelt, inwiefern ein Dokument eine Anfrage befriedigt.

Als Beispiel sind in der unten stehenden Grafik die fünf Komponenten zu einem Suchsystem zusammengestellt. Ein kurzer Überblick über das Geschehen: Der Web-Roboter durchpflügt das Internet. Alle gefundenen Dokumente werden zunächst indexiert und anschliessend im Index des Suchsystems abgelegt. Sobald eine Benutzerin mit Hilfe der Benutzerschnittstelle eine Anfrage an das System schickt, wird die Anfrage in einem ersten Schritt ebenfalls indexiert. Daraufhin wird die Anfrage mit den im Index in geeigneter Form gespeicherten Dokumenten verglichen. Zum Schluss erhält die Benutzerin eine Liste mit Verweisen auf die gefundenen Dokumente.



Viel mehr soll an dieser Stelle noch nicht verraten werden. Wir werden in den folgenden Kapiteln die einzelnen Komponenten genauer unter die Lupe nehmen. Dabei konzentrieren wir uns vorerst auf die Suchdienste. Später werden wir die Komponenten auf andere Weise kombinieren und uns mit Katalog- und Push-Diensten auseinander setzen.



Schauen wir nun, was es aus praktischer Sicht zu berichten gibt ...