Neue Software-Programme helfen
Adress-Dubletten machen Netzfirmen zu schaffen

Schlecht geführte Adressdatenbanken kosten Zeit und Geld. Das alte Problem mit den Dubletten hat sich massiv verschärft, seit E-Mail und Online-Bestellung Einzug gehalten haben. Spezielle Software-Schnüffler sollten deshalb auch bei E-Business-Unternehmen die Datenbestände überwachen.

Es ist zum Haare raufen: Der Internet-Händler Buch.de hat im vergangenen Jahr Zahlungsausfälle von insgesamt rund 2,5 Prozent des Umsatzes von zwölf Millionen Euro hinnehmen müssen - für ein junges Unternehmen eine erhebliche Belastung. Ein großer Teil der Ausfälle ist auf Kunden zurückzuführen, die via Internet bestellen, aber die erhaltene Lieferung nicht bezahlen. Die landen zwar auf einer schwarzen Liste, doch die Betrüger versuchen es immer wieder - und sie haben ein leichtes Spiel. Schon ein Buchstabe reicht, um als neuer Kunde in der Adresskartei aufzutauchen. So wird aus "Erwin Mustermann" "Edwin Mustermann", die Adresse bleibt die gleiche.

Adress-Dubletten wie diese kosten Unternehmen viele Millionen Euro. Dubletten sind Datensätze, die mehrfach in ein und derselben Adresskartei vorkommen, letztlich aber zum gleichen Empfänger führen. Häufig unterscheiden sie sich nur durch einen Buchstaben oder eine Zahl.

Bei großen Direktmarketing-Versendern gehört die Jagd nach Dubletten längst zum Tagesgeschäft. Und es Agenturen haben sich auf den Abgleich kompletter Datenbanken als Dienstleistung für Firmen spezialisiert.

Doch auch die betroffenen kleineren Unternehmen wollen inzwischen professionell gegen den Adressmüll in ihren Adressdateien vorgehen. Bei Buch.de sollen laut Vorstand Albert Hirsch eine sorgfältigere Adressenpflege und eine speziellen Software Abhilfe schaffen. "Damit werden wir die Zahlungsausfälle deutlich reduzieren", sagt Hirsch.

"Eine mangelhaft gepflegte Adresskartei ist schlecht für das Image und kostet viel Geld", sagt Guido Alt, Gründer und Vorstand der Leonberger Firma Caatoosee, die Buch.de jetzt das System zur Adressenprüfung geliefert hat. Der schwäbische Software-Betrieb gehört zu einem halben Dutzend Unternehmen, die Systeme entwickeln, um Dubletten im Daten-Dschungel aufzuspüren.

Alt schätzt, dass "15 bis 20 Prozent aller gespeicherten Adressdaten fehlerhaft sind". Auf der Suche nach den Dubletten gehen die IT-Experten unterschiedliche Wege. Beim statistischen Verfahren wird die Adresse auf die Teile reduziert, die für eine Unterscheidung tatsächlich wichtig sind. "Damit konzentriert man sich auf den ?Fingerabdruck? der Adresse, seine typischen Merkmale", sagt Thomas Kamphusmann vom Fraunhofer für Software- und Systemtechnik-Institut in Dortmund. Dabei wird die Adresse in mehrere Bestandteile zerlegt, die verschieden gewichtet werden. Der Name hat dabei die größte Bedeutung. "Wo zwei dieser Fingerabdrücke sehr ähnlich sind, habe ich wahrscheinlich eine Dublette", sagt Kamphusmann.

Eine weitere Methode basiert auf der Grundlage neuronaler Technologie und wird "Muster-assoziativ" genannt. Dabei wird die Software "trainiert" und lernt von Anwendung zu Anwendung hinzu. Zunächst füttert man das Programm mit Tausenden sehr ähnlichen Adressen. Sie stellen das Muster dar, nach dem das System sucht. Der Dortmunder Wissenschaftler: "Der Trainingsaufwand ist zwar hoch, aber es lohnt sich."

Einen völlig neuen Ansatz für die Jagd nach Dubletten ermöglicht die so genannte "Fuzzy-Logic". Fuzzy Informatik aus Ludwigsburg, ein Spin-off der Daimler-Benz-Forschung, setzt dafür die Software "Fuzzy! Double" ein. Hier werden Adressen auf Ähnlichkeiten geprüft und so die Wahrscheinlichkeit von doppelten Adressen selbst in verschiedenen Regionen ermittelt. Das System nutzt unter anderem die Umzugsdaten der Deutschen, Schweizer und Österreichischen Post, um Personen ausfindig zu machen, die als "unbekannt verzogen" gelten. So wurden nach Fuzzy-Angaben bei der Volkszählung 2000 in der Schweiz rund vier Millionen Schweizer Franken Porto gespart. Das hat sogar Fuzzy-Vorstand Detlev K. Siech überrascht: "Es sind immer mehr Dubletten als erwartet."

Dubletten machen aber nicht nur Unternehmen Ärger, auch Verbraucher klagen über verstopfte Briefkästen und überquellende Mailboxen. Bei ihnen taucht das Problem in anderer Form auf: Wenn bei einem Internet-Nutzer ein und dieselbe Info-Mail mehrmals ankommt, kann sein Postfach überlaufen. Während er sich gegen Massenmailings im Briefkasten nur mit größerem Aufwand wehren kann, geht es im Internet leichter, einzelne Mails auszublenden: Der Empfänger wehrt sich, indem er den Absender auf eine so genannte "Spam-List" setzt. Solche E-Mail-Dienste bietet jeder große Internet-Provider seinen Kunden an. Wenn ein Absender auf der Spam-List steht, wandert dessen Post ungelesen in den Müll. Der Absender merkt zwar nichts davon, aber sein teuer aufgebauter oder eingekaufter Kontakt ist faktisch wertlos.

Sicher, den Ärger mit falschen Namensangaben gibt es schon lange. Doch der Druck, beim Versenden über den klassischen Postweg Dubletten durch die immensen Portokosten entsteht, fällt für Internet-Versender weg. Deshalb neigen die Unternehmen dazu, lieber zu viele als zu wenige Mails zu versenden. "Keiner hat das Personal, um für ein elektronisches Mailing alle Adressen vor ihrer Verwendung auf Richtigkeit zu prüfen", sagt Experte Kamphusmann. "Vor allem dann nicht, wenn verschiedene Adressdateien - eigene und von Adress-Händlern zugekaufte - gemischt werden." Was die Unternehmen dabei allerdings nicht beachten, ist der Imageschaden, den diese E-Mails langfristig anrichten.

"Beim Kunden entsteht ein negatives Image, wenn er zum gleichen Sachverhalt mehrfach angeschrieben wird", sagt Roland Pfeiffer, Geschäftsführer von Uniserv. Der Pforzheimer Dienstleister pflegt die Adresskarteien zahlreicher Unternehmen darunter Quelle, Neckermann, der ADAC und die Zürich Versicherung.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%