Internet
Maschinen sollen das Internet lesen

Das US-Unternehmen BBN Technologies entwickelt im Auftrag des US-Verteidigungsministeriums ein Machinenlesesystem. Es soll automatisch Websites in verschiedenen Sprachen auswerten und die Informationen so aufbereiten, dass Geheimdienstmitarbeiter sie nutzen können.
  • 0

BERLIN. Wie praktisch wäre es, all die Wissensschätze im Netz zu heben, ohne jede Seite, von deren Existenz man nicht einmal weiß, besuchen zu müssen. Das hat sich auch die Defense Advanced Research Projects Agency (DARPA), die Forschungsagentur des US-Verteidigungsministeriums, gedacht und das Machine Reading Program ins Leben gerufen. Ziel ist ein System, das Websites durchsucht und ihre Inhalte so aufbereitet, dass andere Maschinen oder Menschen sie auswerten können.

Die ARPA hat das US-Unternehmen BBN Technologies damit beauftragt, eine solche Netzlesemaschine zu entwickeln. BBN will Techniken entwickeln, die "Beziehungen und Grundsätze direkt aus dem Text extrahieren" und dann "in formale Repräsentationen" übersetzen, die KI-Systeme lesen und verarbeiten können. Das Entwicklungsprogramm ist auf fünf Jahre angelegt.

Mit einem solchen Lesesystem möchte die DARPA automatisch die Aktivitäten von anderen Staaten und Organisationen überwachen. Die Idee ist, dass das Lesesystem Texte aus dem Web analysiert, die Informationen mit vorhandenen Datenbanken oder Ontologien, etwa über terroristische Gruppen, abgleicht und daraus ein Dossier für menschliche Analysten oder KI-Systeme anfertigt. Das System könne aber auch für zivile Zwecke eingesetzt werden, so BBN: In einer Zeit, da Bibliotheken über immer mehr digitale Inhalte verfügen, könnten Wissenschaftler es für umfangreiche historische Forschungen nutzen.

BBN verfügt bereits über Erfahrungen mit der Verarbeitung von natürlicher Sprache: Das Unternehmen hat ein System zur Archivierung von Fernsehprogrammen entwickelt. Das Broadcast Monitoring System zeichnet ausländische Fernsehsendungen auf. Dabei wird der gesprochene Text gleich in Schriftform gewandelt, indiziert und ins Englische übersetzt. So legt das System ein durchsuchbares Archiv mit Fernsehsendungen an.

Ein solches System könne "viele Risiken beseitigen, denen sich unser Militär gegenübersieht, zum Beispiel fehlendes Verständnis für lokale Sitten und Bräuche. Und es würde uns die Fähigkeit verleihen, die weltweiten technischen Entwicklungen ständig im Auge zu behalten", sagte Prem Natarajan, Bereichsleiter für Spracherkennung und -verarbeitung.

Kommentare zu " Internet: Maschinen sollen das Internet lesen"

Alle Kommentare

Dieser Beitrag kann nicht mehr kommentiert werden. Sie können wochentags von 8 bis 18 Uhr kommentieren, wenn Sie angemeldeter Handelsblatt-Online-Leser sind. Die Inhalte sind bis zu sieben Tage nach Erscheinen kommentierbar.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%