Informationsbeschaffung im Internet

Puzzle gelöst: das Suchsystem ist komplett

Unterdessen haben wir alle wichtigen Komponenten eines Suchsystems besprochen und können die Funktionsweise zusammenfassend rekapitulieren. Dafür betrachten wir nochmals das Schema aus dem ersten Kapitel und überlegen uns, wie die verschiedenen Bausteine eines Suchsystems zusammenspielen: Der Web-Roboter forscht nach Dokumenten. Bei der Indexierung werden die Begriffe aus den Dokumenten extrahiert und statistische Informationen zusammengestellt. Manche Suchsysteme bieten eine umfangreichere Indexierung an, andere eine eher einfache. Die Informationen zu jedem Dokument werden im Index festgehalten.



Das Suchsystem wartet nun auf Suchaufträge von den Benutzerinnen. Alle Anfragen werden ausschliesslich mit Hilfe des Index ausgewertet. Das heisst, es werden keine Dokumente in Echtzeit untersucht. Der Vorteil: Die Suche erfolgt auf diese Weise viel schneller. Und der Nachteil: Der Index stimmt nicht immer mit der «Realität» überein. Wenn ein Dokument im WWW verändert oder gar gelöscht wird, dauert es eine gewisse Zeit, bis der Web-Roboter die Seite bei einem seiner «Rundgänge» besucht und die Änderung bemerkt. In dieser Zeit spiegelt der Index nach wie vor den ursprünglichen Inhalt der geänderten Seite wider. Für gewisse Anfragen werden deshalb manchmal Dokumente gefunden, die nicht mehr existieren oder rein gar nichts mehr mit den Suchbegriffen zu tun haben.

Sobald eine Anfrage mit Hilfe der Informationen im Index bearbeitet wurde, stellt das Suchsystem eine Rangliste mit den gefundenen, nach absteigenden Relevanzwerten sortierten Dokumenten zusammen. Im letzten Schritt wird die Rangliste der Benutzerin präsentiert.



Damit ist die Theorie im Zusammenhang von Web-Roboter und Index eines Suchsystems abgehandelt. Im Folgenden gehen wir auf einige praktische Aspekte und die Metasuchdienste ein ...