Informationsbeschaffung im Internet

Kapitel 10
Suchtipps

Suchdienste, Katalogdienste, Push-Dienste, Indexierung, Web-Roboter, Rangierungsprinzipien, Profile, Anfragen usw. - die bisherigen Kapitel warteten mit einer Fülle von Informationen und Begriffen für die Leserschaft auf. Funktionsweise und Verwendungszweck der drei wichtigsten Werkzeuge für den Informationszugriff im Internet wurden vermittelt. Der Blick hinter die Kulissen von Informationsdiensten sollte zu einem zielgerichteten Umgang mit diesen Hilfsmitteln führen.

In diesem letzten Kapitel geht es darum, den Notproviant für den Alltag der Informationssuche im Internet zu schnüren. Anhand von zehn Fallbeispielen werden die wichtigsten Merkpunkte vorgestellt, an die man bei einer Recherche denken sollte. Gleichzeitig bieten die zehn Suchtipps eine Kurzzusammenfassung der vorhergehenden Kapitel.

Alle zehn Suchtipps sind identisch aufgebaut. Zunächst wird ein typisches Anwenderproblem geschildert. Es folgen der Suchtipp sowie etwas Hintergrundinformation zum Thema, bevor die Lösung zum Anwenderproblem präsentiert wird.


Der Frühling steht vor der Tür. Der Garten ruft. Ich möchte mir im Internet ein paar neue Ideen besorgen. Kurzerhand konsultiere ich NewsSeeker mit der Anfrage Gartentipps. Ich arbeite gerne mit NewsSeeker, weil mir der ausführliche Indexierungsprozess viel Arbeit abnimmt. Doch in diesem Fall werde ich arg enttäuscht. Die meisten gefundenen Dokumente handeln von Kindergärten! Irgendwo wird ein neues Kindergartenkonzept eingeführt. An einem anderen Ort gab es einen Brand im Kindergarten. Immerhin in einem Dokument geht es um Gartenzwerge. Aber auch dieses Dokument ist nicht relevant: Einem rückfälligen Gartenzwergrandalierer wird der Prozess gemacht.

Richtige Dokumentenkollektion wählen!

Im Allgemeinen ist der Fehler in solchen Fällen nicht beim Suchsystem zu finden. Das Problem liegt bei der Wahl der Dokumentenkollektion. Man sollte sich immer bewusst sein, was für eine Kollektion durch den gerade verwendeten Informationsdienst abgedeckt wird. Auch das beste Suchsystem kann ein Informationsbedürfnis nicht befriedigen, wenn es keine relevanten Dokumente in der erschlossenen Kollektion gibt.

Alles klar. Ich darf natürlich nicht denjenigen Suchdienst wählen, der mir am besten gefällt. Wichtiger ist, dass der Dienst eine für mich geeignete Dokumentenkollektion anbietet. Offenbar gibt es in der gesamten Kollektion von NewsSeeker nicht ein Dokument mit dem Begriff Gartentipps. Wegen der Wortzerlegung werden stattdessen Dokumente mit Kindergärten oder Gartenzwergen gemeldet. Ein Suchsystem ohne Wortzerlegung hätte gar nichts gefunden.

Für mein Problem benütze ich also besser OmniSearch. Oder noch besser einen spezifischen Suchdienst im Bereich von Gartenbau und -pflege, falls sich so etwas finden lässt.


Reiseplanung ist angesagt! Meinen nächsten, wohlverdienten Urlaub möchte ich auf Java verbringen. Deshalb suche ich bei OmniSearch nach Informationen über diese Insel Indonesiens. Leider scheint das ein völlig hoffnungsloses Unterfangen zu sein. Ich finde Millionen von Dokumenten zu einer Programmiersprache namens Java. Was tun?

Richtiges Werkzeug benützen!

Wir haben drei Grundtypen von Werkzeugen kennen gelernt. Suchdienste liefern auf eine Anfrage eine Rangliste mit möglichst relevanten Dokumenten. Katalogdienste sind hilfreich, wenn man sich einen allgemeinen Überblick über einen Themenbereich verschaffen möchte, und wenn das Informationsbedürfnis mit einer Kategorie des Katalogs übereinstimmt. Push-Dienste versorgen die Benutzer fortlaufend mit den aktuellsten Informationen zu einem bestimmten Thema. Vor jeder Recherche sollte man sich überlegen, welches Werkzeug wohl am ehesten zum Ziel führt.

Dann lasse ich mir das nochmals durch den Kopf gehen. Ich habe nach der Insel Java gesucht und die Programmiersprache gefunden. Ausserdem gibt es auch noch eine Kaffeesorte mit demselben Namen. Drei getrennte Themenbereiche also - ein klarer Fall für einen Katalogdienst. Ein Katalog dürfte genau diese Kategorien anbieten. In meinem Fall heisst die passende Kategorie Reiseinformationen / Nach Regionen/ Asien / Indonesien / Java. Dort stosse ich auf weitere Unterkategorien zu verschiedenen Aspekten wie Kunst, Unterhaltung, Sport, Tourismus und Transportmöglichkeiten auf Java.


Am 4. Juni 1996 explodierte die Weltraumrakete Ariane 5 etwa 40 Sekunden nach dem Start. Der Schaden belief sich auf rund 500 Millionen Dollar. Ich möchte wissen, was der Grund für die Explosion war.

OmniSearch liefert gegen 100 000 Dokumente auf die Anfrage ariane. Weit und breit ist keine Spur von der gesuchten Information. Mit dem Suchbegriff explosion komme ich ebenfalls nicht zum Ziel. Und auch mit der kombinierten Anfrage rocket explosion bleibt der Erfolg aus.

Viele präzise Suchbegriffe verwenden!

Wer Mühe hat, auch nur ein einziges relevantes Dokument zu finden, soll möglichst viele Suchbegriffe verwenden. Man soll aber nicht irgendwelche allgemeinen Begriffe zur Anfrage hinzufügen, sondern eine der folgenden Strategien verfolgen: (1) Möglichst viele Suchbegriffe verwenden, die mit grosser Wahrscheinlichkeit in einem relevanten Dokument vorkommen. (2) Möglichst spezifische Suchbegriffe sowie Phrasen verwenden. Dabei soll bereits das Vorkommen eines einzigen dieser Suchbegriffe die Relevanz des entsprechenden Dokuments gewährleisten.

Ich stelle also eine Liste mit charakteristischen Suchbegriffen zusammen: Es geht um die Rakete Ariane 5, daraus kann ich vorzugsweise eine Phrase bilden. Die Explosion hat im Juni 1996 während des Starts stattgefunden. Folglich lautet die endgültige Anfrage "ariane 5" rocket june 1996 explosion failure launch. Diese Anfrage liefert unter den ersten Treffern Bilder vom «teuersten Feuerwerk aller Zeiten» sowie die Antwort zu meinem Informationsbedürfnis, weitere Hintergrundinformationen und sogar den offiziellen Untersuchungsbericht. Offenbar war die Explosion auf einen simplen Rechenfehler zurückzuführen. Eine Zahl wurde zu gross und verursachte den Absturz eines Computersystems.


Ich habe die Informationen zu Java gefunden und habe mir einen Eindruck von der Insel verschaffen können. Jetzt brauche ich nur noch ein Flugticket. Ich möchte mit der Fluggesellschaft FreshAir fliegen und hätte am liebsten ein Ticket direkt von der Fluggesellschaft, denn die sind vermutlich die billigsten. Meine Anfrage bei OmniSearch lautet freshair ticket zürich zurich java indonesia. Ich finde zwar die gewünschte Fluggesellschaft, aber leider enthält meine Rangliste viele Einträge von Reisebüros, die ebenfalls die gesuchten Tickets anbieten. Wie verbessere ich eine solche Rangliste?

Irrelevante Dokumente in der Rangliste ignorieren!

Ziel einer Recherche mit Hilfe eines Suchdienstes im Internet ist es nicht, eine perfekte Rangliste zu erhalten. In der Regel tauchen einige irrelevante Dokumente in der Rangliste auf, und meistens kann man diese «schwarzen Schafe» problemlos und innert kürzester Zeit entlarven. Unangenehmer ist die umgekehrte Situation: Es gibt relevante Dokumente in der Kollektion, aber sie tauchen für eine bestimmte Anfrage nicht in der Rangliste auf. Der Benutzer kann gar nicht erkennen, dass er etwas verpasst hat!

Es gilt hier, einen guten Kompromiss im Konflikt Ausbeute gegen Präzision zu finden. Auf der einen Seite sollen möglichst alle relevanten Dokumente gefunden werden. Andererseits soll die Rangliste nicht übermässig mit irrelevanten Einträgen belastet werden.

In meinem Fall ist das Ignorieren der irrelevanten Dokumente denkbar einfach. Ich konzentriere mich ausschliesslich auf Dokumente, die vom Web-Server von FreshAir stammen. Die Dokumente erkenne ich anhand der Adresse, die mit www.freshair.com beginnt.

Oder noch besser: Ich befolge den vorhergehenden Suchtipp und füge den Suchbegriff server:www.freshair.com zur Anfrage hinzu. Damit mache ich Gebrauch von den Metadaten. In der Rangliste sollten nun die Dokumente vom Server der Fluggesellschaft weit oben erscheinen.


Meine Tochter soll für den Geschichtsunterricht einen Vortrag vorbereiten. Thema: die «Boston Tea Party», als ausgewanderte Amerikaner eine Schiffsladung Tee aus England in den Bostoner Hafen kippten, um gegen die Besteuerung durch das englische Mutterland zu protestieren. Ich helfe meiner Tochter beim Recherchieren. Unsere Anfrage bei OmniSearch lautet tea party, und wir erhalten alles - nur nicht das Gesuchte.

Dem System mitteilen, was man weiss!

Man stelle sich vor: Ein USA-Reisender betritt ein New Yorker Reisebüro mit der Frage: «Car?» Welche Antwort wird er wohl erhalten? Möchte er wissen, wo die Langstreckenbusse von New York City nach Seattle fahren? Versucht er ein Auto zu mieten? Oder möchte er sogar ein Auto kaufen? Oder sucht er nach Mitfahrgelegenheiten für die Reise nach Washington? Vielleicht interessiert er sich auch für ein Automobilmuseum? Man weiss es nicht.

Suchsysteme können keine Gedanken lesen! Je mehr Information die Benutzerin einem Suchdienst zukommen lässt, desto zutreffendere Antworten kann das System liefern.

Ungeschickt von uns, denn eigentlich haben wir oben bereits all unser Hintergrundwissen zum Thema geschildert. Jetzt müssen wir es aber dem Suchdienst auch mitteilen. Zum Beispiel mit der Anfrage "boston tea party" tea tax america britain "united kingdom" "united states".


Eine vor allem im Altertum beliebte Strategie, um beispielsweise ein Volk zu unterwerfen, ist unter dem Namen «divide et impera» bekannt. Zu Deutsch: «teile und herrsche». Zuerst teilt man das Volk in einzelne, rivalisierende Stämme. Anschliessend wird jeder Stamm einzeln unterworfen, denn die Widerstandskraft der einzelnen Stämme ist niemals so gross wie diejenige des vereinten Volkes.

So viel zur Bedeutung von «divide et impera». Ich möchte nun aber wissen, wer diesen Namen geprägt hat. OmniSearch liefert auf die Anfrage "divide et impera" an erster Stelle ein Dokument mit dem Titel «Schnelle Sortieralgorithmen unter der Lupe». Ich frage mich kurz, was dieses Dokument an erster Stelle zu suchen hat, und überspringe es dann. Doch weiter hinten finde ich auch nichts Relevantes. Enttäuscht gebe ich die Suche auf.

Bestrangiertes Dokument vollständig untersuchen!

Auch wenn Titel und Zusammenfassung etwas völlig Unpassendes versprechen, das bestrangierte Dokument liegt nicht ohne Grund in der «Pole Position». Bei guten Suchsystemen (und guten Anfragen) enthält das bestrangierte Dokument häufig relevante Information, obwohl das nicht auf den ersten Blick ersichtlich ist.

Das möchte ich sehen! Ich schaue das bestrangierte Dokument an. Wie erwartet werde ich mit unverständlichen Informatikthemen konfrontiert. Sogar Programmbeispiele kommen vor, die mir rein gar nichts sagen.

Doch tatsächlich - im Zusammenhang mit einem der Algorithmen fällt das Stichwort «divide et impera». Der Algorithmus heisst «Quicksort» und wendet ebenfalls das Prinzip an, indem er das Ausgangsproblem in immer kleinere und besser überschaubare Einzelprobleme zerlegt. Als Nebenbemerkung wird an dieser Stelle ausserdem darauf hingewiesen, dass der Ausdruck «divide et impera» vom römischen Feldherrn Julius Cäsar stammt.


Ich interessiere mich für die internationale Zusammenarbeit im Bereich Umweltschutz. Dazu suche ich nach einer möglichst vollständigen Übersicht über die bestehenden internationalen Abkommen auf diesem Gebiet. Die Anfrage internationale Zusammenarbeit Umweltschutz Abkommen Verträge bei NewsSeeker liefert bereits einige relevante Dokumente. Wie aber kann ich noch weitere Dokumente zum Thema finden?

Interaktive Techniken anwenden!

Die interaktiven Suchtechniken sind wichtig, wenn man einige relevante Dokumente gefunden hat und zusätzliche Dokumente finden möchte. Interaktive Techniken helfen häufig auch weiter, wenn man beim Recherchieren nicht mehr weiterkommt, weil sich zum Beispiel keine nützlichen Suchbegriffe mehr finden lassen.

Man soll sich unbedingt die schon gefundenen relevanten Dokumente anschauen und wichtige Begriffe identifizieren. Anschliessend lässt sich mit der Suchanfrage spielen - man kann neue Suchbegriffe hinzufügen oder vielleicht andere entfernen. Das lässt sich manuell erledigen. Man kann aber auch das Suchsystem arbeiten lassen. Vorausgesetzt, es existieren Funktionen für die Relevanzrückkoppelung oder für die Suche nach ähnlichen Dokumenten.

Zum Glück bietet NewsSeeker die praktische Relevanzrückkoppelung an. Die kann ich bei meinem Problem anwenden. Dazu markiere ich die gefundenen relevanten Dokumente und lasse anschliessend vom System die Relevanzrückkoppelung durchführen. Ich erhalte dann weitere relevante Dokumente. Meine ursprüngliche Anfrage wird um weitere nützliche Suchbegriffe erweitert. Neu wird nämlich auch nach Begriffen wie Nachhaltigkeit und Klimaveränderung oder nach Organisationen wie UNEP (United Nations Environment Programme) oder IISD (International Institute for Sustainable Development) gesucht.


Ist der Papst wohl auch im Web vertreten? Um das zu überprüfen, mache ich mich auf die Suche nach der offiziellen Web-Site des Vatikans. Dazu benutze ich OmniSearch mit der Anfrage homepage "home page" "web site" site vatican pope. Das Ergebnis ist enttäuschend. Es gibt so viele Webseiten, die den Papst oder den Vatikan erwähnen, dass ich keine Chance habe, ans Ziel zu kommen.

In Teilkollektionen suchen!

Viele Suchsysteme erlauben es, in Teilkollektionen zu suchen. Entweder durch eine vorgegebene Auswahl von Teilkollektionen (zum Beispiel die Kategorien in einem Katalogdienst) oder durch die Anwendung von Boole'schen Funktionen auf Metadaten. Die Suche in Teilkollektionen ist vor allem dann lohnenswert, wenn man mit einer Fülle von irrelevanten Dokumenten überschwemmt wird und sich diese Dokumente eindeutig charakterisieren lassen. Zum Beispiel aufgrund der Herkunft, der Sprache oder eines Datums. Aber es ist Vorsicht geboten. Mit Boole'schen Einschränkungen kann man relevante Dokumente ausschliessen, ohne es zu merken.

Ich könnte es in meinem Fall mit einer Einschränkung der Dokumentenkollektion auf die Webseiten innerhalb der Domäne des Vatikanstaates versuchen. Aber wie lautet die Länderkennung des Vatikans? Um das herauszufinden, bemühe ich ebenfalls OmniSearch. Die Anfrage "country codes" führt rasch zum Ziel - die gesuchte Kennung lautet «va».

Jetzt kann ich meine Suche entsprechend einschränken. Das mache ich mit der Anfrage +domain:va vatican homepage "home page" "web site" site pope. Siehe da! Es gibt tatsächlich einen offiziellen Web-Server, der sich dem Heiligen Stuhl widmet.


Ich möchte mich über die wichtigsten neuen medizinischen Methoden zur Krebsbehandlung informieren. Für die Recherche verwende ich NewsSeeker, denn ich gehe davon aus, dass die wichtigeren Methoden auch durch entsprechende Presseartikel einer breiten Öffentlichkeit vorgestellt wurden. Meine Anfrage lautet: Medizin medizinische Technologie Behandlung Therapie Krebs Leukämie Brustkrebs. Ich finde einige relevante Artikel, bin aber noch nicht ganz zufrieden. Also versuche ich es mit einer Relevanzrückkoppelung, allerdings ohne Erfolg. Ich denke, es müsste noch mehr Informationen zum Thema geben.

Anfragen in verschiedenen Sprachen formulieren!

Englisch hat im Internet traditionell einen grossen Vorsprung gegenüber anderen Sprachen, weil das Netz im amerikanischen Raum entstanden ist. Doch die übrigen Sprachen holen auf. Wer also mehrere Sprachen beherrscht, sollte seine Sprachkenntnisse auch bei der Informationssuche ausnützen. Andernfalls können Übersetzungshilfen benutzt werden. Hinzu kommt, dass manchmal Informationen über ein spezifisches Thema vor allem in einem bestimmten Sprachraum auftauchen. Offensichtliches Beispiel: Informationen über die deutsche Rechtschreibereform sind sicherlich vorwiegend in deutscher Sprache verfasst.

Für meine Frage ist Englisch sicher einen Versuch wert. Mit der übersetzten Anfrage medicine medical technologies therapy treatment breast cancer leukemia leukaemia lassen sich tatsächlich noch ein paar zusätzliche relevante Dokumente aufspüren.


Eine meiner Geschäftsreisen führt mich in die Hauptstadt Japans, Tokio. Ich möchte mich vorher mit den nötigsten Informationen eindecken und suche darum nach einem Stadtplan von Tokio. Am liebsten wäre mir ein kombinierter Stadtplan inklusive Streckennetz der U-Bahn. Ich denke, so etwas sollte sich im Internet einfach finden lassen. Ich wende mich an OmniSearch mit der Anfrage tokio city subway map. In der Rangliste erhalte ich Dutzende von Stadtplänen von New York, Boston, Chicago, London und vieler anderer Städte. Zu Tokio finde ich nichts.

Rechtschreibung und alternative Schreibweisen beachten!

Falls die Rangliste leer bleibt oder die gemeldeten Resultate keinen Sinn machen, sollte man zuerst die Anfrage sorgfältig überprüfen. Häufig sind Tippfehler oder andere Probleme mit der Rechtschreibung in der Anfrage die Ursache für eigenartige Phänomene. Ausserdem gibt es häufig alternative Schreibweisen für einen Begriff, so zum Beispiel unterscheiden sich viele Ausdrücke im Amerikanischen und im Britischen. Genauso existieren für zahlreiche Begriffe alte und neue deutsche Schreibungen.

Die Rechtschreibung ist auch in meinem Fall das Problem. Unterdessen habe ich nämlich herausgefunden, dass das Wort «Tokio» in Deutsch und Englisch unterschiedlich geschrieben wird. Mit der korrigierten Anfrage - tokyo city subway map - finde ich den gesuchten Stadtplan ohne weitere Schwierigkeiten.