Informationsbeschaffung im Internet

Interaktive Suche im Beispiel

Gesucht wird nach statistischen Angaben, ob die Zahl der Heiraten in der Schweiz eher zu- oder abnimmt. NewsSeeker liefert auf die Anfrage Anzahl Heiraten Schweiz Statistik das folgende Dokument:

Weniger Heiraten und Geburten, Stagnation der Scheidungen
Gemäss Ergebnissen des Bundesamtes für Statistik (BFS) hat sich der Rückgang der Anzahl Eheschliessungen 1995 in der Schweiz fortgesetzt. Es wurden 4% weniger Trauungen verzeichnet als im Vorjahr. Die Scheidungszahlen sind erstmals in den 90er-Jahren gleich geblieben. Etwa 15 000 Ehepaare liessen sich scheiden. Abgenommen hat hingegen die Anzahl Geburten. Die Geburtenhäufigkeit sank von 1,49 auf 1,47 Kinder je Frau - ein neuer Tiefststand.

Das Dokument ist relevant für die Anfrage. Allerdings soll nun noch überprüft werden, ob weitere Dokumente jüngeren Datums zum Thema existieren. Das kann man von Hand erledigen, indem man das Dokument untersucht und geeignete Begriffe zur ursprünglichen Anfrage hinzufügt. Welches sind die für das vorliegende Dokument charakteristischen Begriffe? Zunächst fallen verwandte Begriffe wie Ehe, Eheschliessungen, Trauung auf. Ausserdem kann man schliessen, dass in ähnlichen Dokumenten häufig gleichzeitig über Scheidungszahlen und Geburtenhäufigkeiten informiert wird. Die neue Anfrage nach dieser manuellen Relevanzrückkoppelung könnte lauten: Anzahl Heiraten Schweiz Statistik Ehe Trauung Geburten Scheidungen.

Die automatisierte Suche nach ähnlichen Dokumenten funktioniert etwas anders. Es werden stur alle Begriffe (mit Ausnahme der Stoppwörter) aus dem Dokument extrahiert und zu einer neuen Anfrage zusammengestellt. Die neue Anfrage wird einen ähnlichen Effekt haben wie die von Hand zusammengestellte. Es werden weitere Dokumente gefunden, welche dieselben Begriffe verwenden wie im gegebenen Dokument.

Bei einer Relevanzrückkoppelung kann die Benutzerin dem Suchsystem mehr als ein relevantes Dokument vorgeben. Die einzelnen Dokumente werden indexiert. Daraufhin stellt das System die extrahierten Begriffe zu einer neuen Anfrage zusammen.