Smart Semantics
Forscher entwickeln intelligente Suchtechnik

Experten des Fraunhofer-Instituts für Intelligente Analyse- und Informationssysteme haben eine intelligente Suchtechnologie entwickelt. „Smart Semantics“ soll dem Nutzer künftig aufwändiges Filtern seiner Suchergebnisse ersparen. Im Blick haben die Fraunhofer-Experten vor allem kleine und mittelständische Unternehmen.

HB DÜSSELDORF. Das Fraunhofer für Intelligente Analyse- und Informationssysteme IAIS erforscht und entwickelt innovative Systeme, um Daten zu analysieren und Informationen zu erschließen. Als jüngstes Ergebnis dieser Arbeit bringt das Fraunhofer IAIS jetzt Smart Semantics auf den Markt. Dabei handelt es sich um intelligente Softwarekomponenten, die die Bedeutung aus unstrukturierten Daten, etwa Webseiten oder Dokumenten, durch modellbasierte Inhaltsanalysen erschließen können.

Im Gegensatz zu stichwort- oder regelbasierten Verfahren, wie sie die bekannten Suchmaschinen im Internet nutzen, verwenden Smart Semantics lernende und mustererkennende Verfahren. Sie ersparen dem Nutzer somit aufwändiges Filtern seiner Suchergebnisse.

Smart Semantics basiert auf UIMA, einer von IBM initiierten und entwickelten Architektur zur Analyse unstrukturierter Daten. Das Fraunhofer IAIS entschied sich für die von IBM initierte Architektur aufgrund der Offenheit, der kostengünstigen Testmöglichkeiten sowie der Zuverlässigkeit des Frameworks.

Außerdem will das Institut die große Verbreitung von UIMA im Unternehmensumfeld nutzen, um seine Bausteine zur intelligenten Informationserschließung auch kleinen und mittelständischen Unternehmen verfügbar zu machen, die bisher die hohen Investitionskosten für semantische Technologien scheuten. „Gerade kleine und mittelständische Unternehmen konnten in der Vergangenheit aus Zeit- und Kostengründen nicht oder nur unzureichend Informationen aus unstrukturierten Daten berücksichtigen“, so Andreas Schäfer, Business Development Manager am Fraunhofer-Institut IAIS.

Verfügbar sind bereits drei Smart Semantic Komponenten: „Site-Classifier“, „Named-Entity-Recognizer“ sowie der „Keyword-Extractor“. Der Site-Classifier erlaubt die maschinelle Klassifikation ganzer Dokumente wie etwa Webseiten. Nach einer Trainingsphase sind auf diese Weise Projekt-, Mitarbeiter- oder Produktseiten automatisch als solche erkennbar und für die effizientere Suche nutzbar (etwa „Zeige alle Seiten, die den Begriff X enthalten und als Produktseite klassifiziert wurden“).

Der Named-Entity-Recognizer identifiziert benannte Entitäten wie Personen, Organisationen, Orte und ermöglicht dadurch die Filterung von Dokumenten (etwa „Zeige alle Seiten, die X und zusätzlich Personennamen enthalten“). Im Gegensatz zu herkömmlichen Verfahren erkennt die Smart Semantic-Komponente Bedeutungsunterschiede gleichlautender Begriffe, wie etwa die den Unterschied zwischen „Vogel“ als Tier und „Vogel“ als Personenname, indem der inhaltliche Kontext des Begriffs berücksichtigt wird.

Der Keyword-Extractor ist eine Komponente, die statistisch signifikante Wörter aus Dokumenten extrahiert und diese etwa für Tagclouds, für Wortvorschläge bei Suchanfragen oder als Zusatzinformationen in der Suchergebnisdarstellung bereitstellt.

Unternehmen können die Smart Semantics ab Herbst 2009 über IBM erwerben, weitere Komponenten sind bereits in Planung.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%