Informationsbeschaffung im Internet

Informationsdienste

Um mit der Datenflut im Internet fertig zu werden, braucht es Hilfsmittel, die uns bei der Informationsbeschaffung zur Seite stehen. Nicht immer kennt man gerade die richtige Adresse einer Webseite, welche die gewünschte Information enthält; und zielloses Surfen ist in den wenigsten Fällen erfolgreich. Unter all den Rechnern im Internet gibt es Server, die ein Angebot speziell für die Informationsbeschaffung zur Verfügung stellen. Solche Werkzeuge für den Informationszugriff nennen wir Informationsdienste. Der Zugriff auf einen Informationsdienst erfolgt häufig in folgenden zwei Schritten:



1. Schritt: Ein Benutzer mit einem Informationsbedürfnis konsultiert den Informationsdienst, der sich typischerweise hinter einem Web-Server «versteckt». Als Antwort erhält der Benutzer einen oder mehrere Verweise auf Dokumente, die hoffentlich brauchbare Informationen bereithalten.

2. Schritt: Erst jetzt greift der Benutzer auf den tatsächlichen Inhalt der gefundenen Webseiten zu. Die Webseiten sind nicht beim Informationsdienst, sondern bei normalen Web-Servern gespeichert.

Ein Informationsdienst ist ein Informationssystem, das eine Dokumentenkollektion erschliesst. Mit Erschliessen von Dokumenten ist das Registrieren aufgrund von in den Dokumenten vorkommenden Begriffen (Wörter, Namen, Zahlen usw.) gemeint. Das Informationssystem ist das eigentliche Werkzeug, ein Softwaresystem, das die Funktionen für den Informationszugriff bereitstellt. Die Dokumentenkollektion steht unabhängig von einem Informationssystem zur Verfügung und liefert die Inhalte zum Informationsdienst.



Die klare Trennung zwischen dem Informationssystem und der damit erschlossenen Dokumentenkollektion ist wichtig! Ein Informationssystem ohne Kollektion ist wie ein Buch, in dem alle Seiten ausser dem Inhaltsverzeichnis und dem Stichwortverzeichnis entfernt wurden. Oder umgekehrt: Eine Kollektion ohne Werkzeug für den Zugriff ist wie eine grosse Bibliothek mit fünf Millionen Büchern auf einem riesigen Haufen, ohne jede Katalogisierung.

Dokumentenkollektionen

Eine Dokumentenkollektion ist eine Menge von Dokumenten (zum Beispiel Webseiten), die von einem Informationssystem erschlossen werden. Wir beschränken uns im Folgenden auf Textdokumente wie beispielsweise den Text der Schweizerischen Bundesverfassung oder das Bücherverzeichnis mit dem URL http://www.allbooks.com/overview/list.html. Grundsätzlich können Dokumente aber auch völlig anderer Natur sein: zum Beispiel eine digitalisierte Kopie von Edvard Munchs «Der Schrei» im GIF-Format oder das Lied «Aqualung» der Band Jethro Tull in einem Audio-Format.

Wir unterscheiden zwei Grundtypen von Dokumentenkollektionen: Eine horizontale Dokumentenkollektion versucht möglichst viele der im Internet zugänglichen Dokumente zu erschliessen und die verschiedenen Gebiete in der ganzen Breite abzudecken. Jedes nur denkbare Thema kann auftauchen - vom Programmcode eines vollständigen Betriebssystems bis zu Tipps für Sammler von Kinderüberraschungseiern.

Eine vertikale Dokumentenkollektion dagegen konzentriert sich auf Dokumente aus einem mehr oder weniger eng umrissenen Themenbereich, der in seiner ganzen Tiefe erschlossen werden soll.

Horizontale Dokumentenkollektionen decken typischerweise die oberste Schicht der frei zugänglichen Dokumente ab, seltener auch kostenpflichtige Dokumente. Demgegenüber können in vertikalen Dokumentenkollektionen durchaus auch Dokumente aus gezielt ausgewählten Web-Sites, speziellen Datenbanken oder aus einem durch einen Firewall-Rechner geschützten Intranet auftauchen.



Informationssysteme

Kombiniert man eine Dokumentenkollektion mit einem Informationssystem, so erhält man einen Informationsdienst, der Benutzerinnen beim Informationszugriff unterstützt. Wir behandeln die drei wichtigsten Typen von Informationssystemen:

Suchsysteme (auch Information-Retrieval-Systeme oder Suchmaschinen genannt) stellen Funktionen zur Dokumentensuche bereit. Die Anfrage einer Medizinerin könnte beispielsweise lauten: neue Methoden zur Behandlung der Sichelzellenanämie. Daraufhin liefert das Suchsystem eine Liste von Dokumenten, welche die gewünschte Information enthalten sollen.

Katalogsysteme kann man mit einem Branchentelefonbuch vergleichen. Die einzelnen Einträge sind in vorgegebene Kategorien eingeteilt. Die Kategorien sind häufig hierarchisch geordnet. In der Kategorie Medizin, in der Unterkategorie Anämie könnten Dokumente zur Sichelzellenanämie eingereiht sein.



Die Push-Systeme bieten einen anderen Service an. Während Benutzer von Such- oder Katalogsystemen bei jedem Informationsbedürfnis die Dokumente beim Informationssystem holen müssen (man spricht auch von «Pull-Systemen»), versorgen Push-Systeme ihre Benutzer aktiv und fortlaufend mit aktuellen Informationen. Für jeden Benutzer existiert ein so genanntes Profil. Das Profil beschreibt das Informationsbedürfnis eines Benutzers, so wie die Anfrage bei einem Suchsystem. Neu im Internet auftauchende Dokumente werden automatisch mit allen gespeicherten Profilen verglichen und bei genügend guter Übereinstimmung dem Benutzer zugestellt. Mittels eines Push-Systems könnte sich die Medizinerin laufend über neue Methoden zur Behandlung der Sichelzellenanämie orientieren lassen.