Informationsbeschaffung im Internet

Web Spamming

Immer wieder missbrauchen auch «böse Zeitgenossen» die Rangierungsprinzipien von Suchsystemen mit dem Ziel, eine bessere Rangierung der eigenen Webseiten zu erreichen.

Manche Seiten wiederholen ihre Schlüsselwörter hundert- oder gar tausendfach. Rangierungsprinzip 2 sorgt dafür, dass solche Seiten weit vorne in der Rangliste zu einer entsprechenden Anfrage erscheinen. Damit die Wiederholungen das Aussehen der Seite nicht beeinträchtigen, werden die Begriffe zum Beispiel in weisser Schrift auf weissem Hintergrund geschrieben.

Andere Seiten benützen Begriffe, nach welchen im Web zwar häufig gesucht wird, die aber nichts mit dem eigentlichen Inhalt der betreffenden Seite zu tun haben. So werden Benutzer in die Irre geführt.

Die meisten Betreiber von Suchsystemen versuchen, Techniken dieser Art - Web Spamming genannt - einen Riegel vorzuschieben. Spezielle Software soll den Missbrauch entdecken. Die Urheber werden anschliessend durch den Ausschluss ihrer Seiten aus dem Angebot des betreffenden Suchdienstes bestraft. Trotzdem bleiben viele Fälle von Web Spamming unentdeckt und liefern manchmal die Erklärung für eigenartige Resultate auf Suchanfragen.



Nach den praktischen Hinweisen kommen wir auf die Probleme der Internet-Anwender zurück ...



Im März 1866 wurde Johan Vaaler in Aurskog, Norwegen, geboren. Er machte einen Abschluss in Elektronik und Mathematik und war schon als junger Mann als Erfinder bekannt. 1899 erfand Vaaler die Büroklammer. Das Patent auf die Erfindung musste er in Deutschland anmelden, weil in Norwegen damals noch kein Patentrecht existierte.

Wie man sieht, habe ich den Erfinder der Büroklammer unterdessen gefunden. Meine ursprüngliche Anfrage bestand aus einem einzigen Begriff - Büroklammer. Das ist natürlich zu wenig. Das Suchsystem hat so fast keine Chance, eine vernünftige Antwort zu liefern. Nach kurzem Überlegen sind mir weitere Suchbegriffe eingefallen. Und mit der Anfrage Büroklammer Briefklammer erfand Erfinder Patent habe ich schliesslich die Antwort auf meine Frage gefunden.

Was nehme ich aus diesem Kapitel mit? Ich soll für meine Anfragen gute Suchbegriffe verwenden, die für das gesuchte Dokument möglichst charakteristisch sind. Dazu muss ich mich in das gesuchte Dokument eindenken. Welche typischen Begriffe könnten darin vorkommen? So konstruiere ich eine Art «Wunschdokument» als Anfrage.

Ausserdem merke ich mir die Rangierungsprinzipien. Vor allem die ersten drei sind wichtig. Deshalb benutze ich in meinen Anfragen Suchbegriffe, die im gewünschten Dokument häufig und in allen anderen Dokumenten selten vorkommen. Bei der Zusammenstellung der Suchbegriffe denke ich ausserdem daran, welche Synonyme es für einen Begriff geben könnte. Die Synonyme füge ich dann ebenfalls zur Anfrage hinzu.

Mein Problem war die «unendliche Geschichte». Auf meine Anfrage wurden Dokumente geliefert, die nichts mit Endes Buch zu tun haben. Also muss ich weitere charakteristische Suchbegriffe suchen. In diesem Fall ist das leicht - ich zähle einfach einige der Fabelwesen auf, die in der Märchenwelt von Phantasien leben: unendliche Geschichte Atreju Steinbeisser Fuchur. Damit gebe ich dem Suchsystem konkrete Hinweise, wonach ich genau suche.

Ich bin immer noch erfolglos auf der Suche nach der Liste mit allen Schweizer Bundesräten. Wie sieht das gewünschte Dokument aus? Es enthält natürlich alle Namen der Bundesräte. Für eine gute Anfrage benutze ich demnach einfach die Namen einiger Bundesräte, die mir einfallen: Gnägi Schlumpf Stich Ritschard Leuenberger Villiger Egli Metzler.

Die Anfrage führt problemlos zum Ziel. Ich habe hier von meinem Hintergrundwissen Gebrauch gemacht. Wer mit der schweizerischen Politik nicht vertraut ist, dürfte Mühe haben, mehrere Bundesräte mit Namen zu nennen.