Forscher entwickeln Technologie zur automatischen Erkennung und Archivierung von Bildmotiven
Software erleichtert Bildkategorisierung

Mittels Inhaltsanalyse soll eine Software das Motiv eines Bildes automatisch erkennen und die Beschreibung in einer Datenbank ablegen.

hiz DÜSSELDORF. Eine neuartige Software zur Sortierung nach Bildkategorien kann Bilder automatisch anhand ihres Motivs indizieren. Üblicherweise lassen sich Fotos in Bilddatenbanken nur nach Stichworten kategorisieren und durchsuchen. Die Forscher von Xerox haben jetzt ein Verfahren vorgestellt, dass im Rahmen des LAVA Projektes entwickelt wurde. Damit soll die mühselige und zeitaufwendige Indexierung digitaler Bilder weitgehend automatisiert werden.

Millionen von Fotos schlummern in den weltweiten Bilddatenbanken, und täglich kommen Tausende hinzu. Dabei muss jedes einzelne von ihnen sorgfältig indiziert werden, damit es auffindbar und somit verwertbar bleibt. Allein für die Erfassung eines Bildes, so die Entwickler, benötigt ein Mensch rund zwei Minuten. In Bilddatenbanken großer Agenturen sind heute schon Millionen von Fotos gespeichert, mit steigender Tendenz seit der rasanten Verbreitung von Digitalkameras. Die Erfassung von Bildern ist allerdings nach wie vor eine mühevolle und sehr zeitaufwändige Handarbeit, da das Motiv beschrieben werden muss. Die Forscher des Xerox Research Centre Europe (XRCE) haben jetzt eine Software entwickelt, die nach eigenen Angaben in der Lage ist, das Motiv zu verstehen.

Das Programm erkennt verschiedenste Bildmotive, die anschließend entsprechend sortiert in Dokumentensysteme einfließen können. Der gesamte Vorgang dauert ungefähr zwei Sekunden pro Bild. Die Forscher schätzen, dass die Trefferquote der Software je nach Bildkategorie zwischen 80 und 99 Prozent liegt.

Die Funktionsweise besteht aus vier Schritten. Im ersten Schritt sucht die Software nach markanten Punkten und Elementen, den so genannten „Keypatches“. Dann werden die einzelnen Patches mit einem visuellen Wörterbuch verglichen. Daraus resultieren "visuelle Worte", die zentralen Elemente des einzelnen Bildes. Bei der Aufnahme eines Autos sind das beispielsweise Räder und Scheinwerfer. Im dritten Schritt zählt das Programm, wie häufig die einzelnen visuellen Worte erscheinen. Abschließend werden die so entstehenden Histogramme in vordefinierte Bildkategorien klassifiziert. Dabei ist die Auswertung nicht von ungewöhnlichen Blickwinkeln oder der Präsenz mehrerer Bildkategorien in einem einzelnen Bild abhängig. Selbst teilweise verdeckte Motivelemente sollen erkannt werden.

Derzeit arbeiten die Forscher an einer Vergrößerung des visuellen Wörterbuchs, um die Software zur Marktreife zu bringen. Für die Zukunft hat sich das Team am XRCE ehrgeizige Ziele gesetzt: Die Kategorisierungstechnologie soll für bewegte Bilder und damit für die Kategorisierung von Video-Material nutzbar gemacht werden.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%