Studie hat Google, MSN und Yahoo untersucht: Suchmaschinen haben ein Aktualitäts-Problem

Studie hat Google, MSN und Yahoo untersucht
Suchmaschinen haben ein Aktualitäts-Problem

Wohl jeder Internetnutzer hat es in seiner Suchmaschine schon einmal erlebt: Was zunächst im Trefferranking wie der Volltreffer mit exakt den gewünschten Begriffen aussieht, entpuppt sich nach einem Klick als absolute Niete. Die Seite hat mit der gewünschten Anfrage nichts zu tun und enthält noch nicht einmal die angefragten Suchbegriffe. Das Problem in vielen Fällen: Der Index der Suchmaschine ist veraltet und zeigt einen Stand der Seite an, der in Wahrheit im Internet gar nicht mehr verfügbar ist.

DÜSSELDORF. Bei der Suche nach aktuellen Ereignissen oder Nachrichten ist die Aktualität der Suchmaschinen ein kritischer Faktor: Letztlich können sie dem Benutzer natürlich nur die Dokumente anzeigen, die sie auch kennen. Von der Erstellung eines Dokuments bis zu dessen Aufnahme in die Suchmaschinen kann jedoch eine längere Zeit vergehen, mitunter einige Wochen.

Wie aktuell die verschiedenen Suchmaschinen ihren Index tatsächlich pflegen, wurde bisher nur unzureichend wissenschaftlich untersucht. Abhilfe schafft nun eine Studie der Abteilung Informationswissenschaft der Heinrich-Heine-Universität Düsseldorf. Für diese wurden 38 Websites ausgewählt, deren Inhalte täglich aktualisiert werden. Über einen Zeitraum von sechs Wochen wurde geprüft, ob die großen Suchmaschinen Google, Yahoo und MSN diese Seiten aktuell erfassen.

Das Ergebnis zeigt große Qualitätsunterschiede zwischen den Wettbewerbern auf: So lieferte Google im Durchschnitt eindeutig die aktuellsten Ergebnisse mit einer Quote von über 82% aktuellen bzw. einen Tag alten Seiten. Gleichzeitig leistete sich der Marktführer jedoch auch einige wenige Ausrutscher: Zwei Seiten im Test wurden trotz ihrer täglich wechselnden Inhalte über mehrere Wochen gar nicht neu indexiert.

Konkurrent MSN zeigte hier ein konstanteres Bild: Das durchschnittliche Alter der Seiten im Index der Microsoft-Suchmaschine lag mit 3,5 Tagen zwar über dem bei Google (3,1 Tage) - dafür schaffte es MSN aber als einzige der untersuchten Suchmaschinen, dass keine seiner 38 Webseiten im Test mit einem Stand von über 17 Tagen angezeigt wurden.

Yahoo schließlich lieferte von den drei Wettbewerbern die unaktuellsten und unzuverlässigsten Ergebnisse. Als problematisch erwiesen sich vor allem die gehäuft auftretenden plötzlichen Sprünge im Aktualisierungsintervall einzelner Seiten, die kein organisiertes Muster für die Auffrischung des Yahoo-Indexes erkennen ließen. Die von Yahoo angezeigten Seiten waren mit einem Durchschnittsalter von 9,8 Tagen deutlich älter als die entsprechenden Originale im Netz.

Das Fazit der Untersuchung lautet, dass alle Suchmaschinen weit entfernt von dem Ideal eines vollständig aktuellen Abbilds des WWW sind – manche mehr, manche weniger. Da die Untersuchung auf täglich aktualisierte Seiten beschränkt war, kann sie über die „Gesamtaktualität“ der Datenbestände nur Hypothesen aufstellen. Wenn sich allerdings schon bei den ständig aktualisierten Seiten die angesprochenen Probleme zeigen, so dürften diese bei weniger oft aktualisierten Seiten noch weit gravierender sein. Eine weitere Verbesserung von Seiten der Suchmaschinen ist also dringend zu wünschen.

Die vollständige Studie der Autoren Dirk Lewandowski, Henry Wahlig und Gunnar Meyer-Bautor erscheint Anfang 2006 in der renommierten Fachzeitschrift „Journal of Information Science“ (Vol. 32, 2). Eine Vorabversion des englischsprachigen Artikels ist bereits verfügbar unter » www.durchdenken.de.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%