Relevanz eines Dokuments

Der Begriff der Relevanz ist schon oft vorgekommen, doch fehlt nach wie vor die konkrete Definition. Das soll nun nachgeholt werden: Ein Dokument heisst relevant, wenn es bei einer Informationssuche gefunden werden soll.

Drei unterschiedliche Arten von Relevanz müssen unterschieden werden: Subjektive Relevanz ist eine Beziehung zwischen einem Dokument und einem Informationsbedürfnis. Üblicherweise beurteilt eine Benutzerin die subjektive Relevanz eines Dokuments. Für die Informationssuche formuliert die Benutzerin ihr Informationsbedürfnis in einer Anfrage. Leider können die Suchbegriffe in einer Anfrage das Informationsbedürfnis nur selten perfekt repräsentieren. Die objektive Relevanz ist eine Beziehung zwischen einer Anfrage und einem Dokument. Die objektive Relevanz kann zum Beispiel von einer Gruppe unabhängiger Experten auf einem Gebiet bestimmt werden. Ein Suchsystem bestimmt eine dritte Art von Relevanz: Die geschätzte Relevanz ist ebenfalls eine Beziehung zwischen einer Anfrage und einem Dokument. Die Relevanz wird in diesem Fall nach bestimmten Regeln berechnet. Bei der Informationssuche kommt es häufig vor, dass die drei Arten der Relevanz nicht übereinstimmen.



Beispiel: Für einen Kurzvortrag sucht eine Schülerin nach einigen Eckdaten zum Vulkan Stromboli in Italien. Die Schülerin wählt einen Suchdienst - zum Beispiel OmniSearch - und stellt eine entsprechende Anfrage. OmniSearch liefert eine Liste mit Dokumenten, wovon drei herausstechen: Bei einem der Dokumente handelt es sich um die Werbung eines Reisebüros, das Ausflüge zum Vulkan organisiert. OmniSearch schätzt das Dokument als relevant zur Anfrage ein (geschätzte Relevanz), obwohl es für die Schülerin nicht relevant ist (keine subjektive Relevanz). Ein anderes Dokument liefert eine hundertseitige Abhandlung mit allen erdenklichen Details zum Vulkan. Eine unabhängige Expertenrunde würde ein solches Dokument sicherlich als relevant zur Anfrage erachten (objektive Relevanz). Doch der Schülerin ist es eindeutig zu ausführlich. Stattdessen wählt die Schülerin ein drittes Dokument, in dem auf einer halben Seite die wichtigsten Angaben zum Vulkan Stromboli zusammengefasst sind (subjektive Relevanz).

Unterschiede zwischen der subjektiven Relevanz und der von einem Suchsystem geschätzten Relevanz treten sehr häufig bei mehrdeutigen Begriffen auf. Beispiel: Für das Jubiläumsbuch eines Tennisclubs wird nach den Biografien von ehemaligen Grössen im Welttennis gesucht, etwa von Yannick Noah. Der Benutzer stellt die simple Anfrage Noah an OmniSearch. Kurz darauf antwortet OmniSearch mit einer Menge von Dokumenten. Viele davon behandeln den Tennisspieler. Viele andere befassen sich mit der Geschichte um Noahs Arche. Für den Benutzer sind die Arche-Noah-Dokumente nicht von Interesse, sie befriedigen sein Informationsbedürfnis nicht und sind folglich subjektiv nicht relevant. Trotzdem kann man dem Suchsystem nichts vorwerfen. Die Anfrage Noah steht zweifelsohne sowohl mit den Tennis-Dokumenten als auch mit den Arche-Noah-Dokumenten in Zusammenhang.