Informationsbeschaffung im Internet

Kapitel 3
Indexierung von Textdokumenten

Seit dem letzten Kapitel habe ich mir angewöhnt, mich in die gesuchten Dokumente «einzudenken». Dabei beachte ich die Rangierungsprinzipien und verwende möglichst viele charakteristische Begriffe in meinen Anfragen. Unterdessen frage ich mich aber: Wie «liest» das Suchsystem die Webseiten und meine Anfrage? Wie muss ich die Begriffe ins Suchformular eingeben?

Aufgetaucht sind diese Fragen, als ich herausfinden wollte, welche Staaten an der Europäischen Währungsunion beteiligt sind. Eine mögliche Anfrage bei OmniSearch wäre etwa Mitgliedstaaten Europäische Währungsunion. Allerdings sind auch Dutzende von anderen Varianten denkbar. Es könnte auch einfach von «Mitgliedern» die Rede sein oder von «Europa» oder von der «Währungs-Union» mit Bindestrich. Unsicher bin ich auch bei der Gross- und Kleinschreibung. Soll ich Europäische oder europäische schreiben? Zu allem Übel habe ich auch noch gehört, dass bei Computern die deutschen Umlaute häufig für Probleme sorgen. Muss ich also zusätzlich europaeische anstelle von europäische ausprobieren?

Plasmodiophora brassicae - das ist der Name eines Pilzes, der die so genannte Kohlhernie verursacht. Die Kohlhernie ist eine Krankheit, die vor allem bei Blumenkohl und anderen Kohlarten auftritt. Es kommt zu Wucherungen an den Wurzeln, die Pflanzen welken und gehen ein.

Ich wollte mich bei NewsSeeker informieren, ob die Kohlhernie jemals verantwortlich war für einen bedeutenden Ernteverlust in der Blumenkohlproduktion. Dabei habe ich eine erstaunliche Entdeckung gemacht: Auf die Anfrage Blumenkohl meldet NewsSeeker ein Dokument mit dem Titel «Rot-grüne Mehrheit für einen Machtwechsel in Bonn». Was soll das? Wählt NewsSeeker die Dokumente zufällig aus? Ich kann mir das nicht erklären.


Werfen wir zur Klärung der Fragen einen Blick hinter die Kulissen von Suchsystemen und betrachten, wie die Systeme mit Dokumenten und Anfragen umgehen ...