Betreiber buhlen um die User
Tuning für Suchmaschinen im Netz

Das Internet wächst in jeder Sekunde. Mit einem Umfang von 550 Mrd. Webseiten hat sich das weltweite Datennetz zu einem schier unüberschaubaren Meer von Informationen entwickelt - und täglich kommen rund sieben Mill. Seiten hinzu.

dpa HAMBURG. Selbst moderne Suchmaschinen haben Mühe, den großen Reichtum an Wissen auch nur annähernd sinnvoll aufzubereiten. Neue, "intelligente" Recherchetechnologien sollen künftig helfen, mehr Übersicht in den Dschungel zu bringen.

Jeder Internet-Nutzer kennt die Situation: Er sucht nach einem ganz bestimmten Thema - und wird von einer Trefferliste mit Tausenden Einträgen konfrontiert. Während Kataloge wie Yahoo deshalb zahlreiche Redakteure beschäftigen, die die Inhalte von Websites im Internet täglich sichten und manuell nach Kategorien vorsortieren, soll diese Arbeit künftig in viel größerem Maßstab von "intelligenten Maschinen" erledigt werden.

"Wir können diesen Prozess mit hoher Zielgenauigkeit automatisch durchführen", sagt Christian Tölk, Technikchef der Firma TopicalNet. Das deutsch-amerikanische Bertelsmann-Joint-Venture hat eine neue, "intelligente" Technologie entwickelt, die herkömmlichen Katalogisierungsverfahren deutlich überlegen sein soll.

Das Unternehmen habe dafür bereits 300 000 so genannte Topics generiert, in denen Inhalte automatisch, ohne menschliche Mithilfe kategorisiert werden. Das Programm durchforstet Dokumente nicht nur stur nach Schlüsselbegriffen. Auch inhaltlich verwandte Begriffe wie etwa Champagner und Sekt kann das Programm in eine sinnvolle Verbindung bringen oder auch Stichworte wie Silberpfeil und Ferrari in die richtige Kategorie (Formel 1) sortieren.

Die menschliche Sprache ist so komplex und vielschichtig, dass sich schon viele Forscher und Programmierer bei dem Versuch, sie Maschinen beizubringen, die Zähne ausgebissen haben. Täglich kommen neue Wortschöpfungen hinzu, und aus unbekannten Menschen werden Prominente. TopicalNet soll deshalb auf ein hochkomplexes Netzwerk von insgesamt 1,5 Mill. zusammen getragenen Wörtern und Phrasen zurückgreifen. Auf der Suche nach neuen Wortzusammenhängen durchforstet eine spezielle Suchmaschine regelmäßig 40 Mill. Internetseiten, auf deren Basis das "Gedächtnis" des Programms trainiert wird.

Unter den reinen Suchmaschinen im Netz gibt es unterdessen ein Rennen um die ersten Plätze. Erst kürzlich zeichnete die Stiftung Warentest Google als beste Suchmaschine aus. Der Newcomer hatte die Großen im Markt geschlagen. Google sucht - wie auch Yahoo und Altavista - nach Begriffen. Anschließend sortiert die Maschine die Ergebnisliste aber noch danach, wie populär die Seiten sind: Ermittelt Google, dass viele Homepages auf die jeweilige Seite verweisen, kommt sie in der Trefferliste ganz nach oben.

Während TopicalNet für die Vermarktung seines Produkts als Zielmarkt Nummer eins die Datenbestände und Intranets von Unternehmen im Visier hat, stellt Vivisimo eine ähnliche Technologien bereits seit mehr als einem Jahr den weltweit 350 Mill. Nutzern im Internet zur Verfügung. Die Suchmaschine, die von Forschern der Carnegie Mellon University entwickelt wurde, erstellt ebenfalls automatisch Unterkategorien und präsentiert dem Nutzer selbst Hunderte von Treffern in einer überschaubaren und zumeist sinnvollen Übersicht.

Die Macher von Vivisimo sind überzeugt, dass in der automatischen Kategorisierung die Zukunft der Suchmaschinen steckt. Die Menschen bekämen immer mehr Informationen als sie wirklich suchten. Dank der Vorsortierung der Ergebnisse könne der Nutzer aber selbst auf Entdeckungsreise gehen und brauche sich über ausgeklügelte Suchkriterien keine Gedanken mehr zu machen.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%