Informationsbeschaffung im Internet

Suche nach ähnlichen Dokumenten

Jemand kommt auf die Idee, ein vollständiges Dokument als Anfrage für einen Suchdienst zu verwenden. Was geschieht? Das Suchsystem geht wie immer vor. Zuerst indexiert es die Anfrage und extrahiert dabei die Suchbegriffe. Gestützt auf die Rangierungsprinzipien sucht das System dann nach Dokumenten, die bezüglich dieser Anfrage relevant sind, und stellt daraus die Rangliste zusammen. Zu den relevantesten Dokumenten gehören natürlich diejenigen, die dem ursprünglichen Dokument sehr ähnlich sind, weil sie dieselben Begriffe in vergleichbarer Häufigkeit enthalten.

Suchsysteme mit dieser Funktion erlauben es der Benutzerin also, ein bereits gefundenes Dokument als neue Anfrage an das System zu stellen. Bei langen Dokumenten werden nur die «wichtigen» Begriffe im Text als Suchbegriffe für die Anfrage verwendet. Wichtig sind gemäss der Rangierungsprinzipien beispielsweise solche Begriffe, die im Dokument häufig, ansonsten aber eher selten vorkommen.



Bei der Suche nach ähnlichen Dokumenten nützt man den Vorteil aus, dass Anfragen mit einer grossen Zahl von Suchbegriffen oft zu besseren Resultaten führen als Anfragen mit nur wenigen Suchbegriffen.