Open Source Software verbessert die Datenqualität

‘Talend Data Quality’ kombiniert Datenintegration, Data Profiling und Optimierung der Datenqualität zu einer einzigen quelloffenen Lösung, die sich teilweise sogar selbst korrigiert.

Die Lösung identifiziert Dubletten, fehlende Einträge in Datensätzen, fehlerhafte Daten oder unvollständige Adressen und korrigiert sie teilweise automatisch durch Abgleich mit Referenzdatenbanken. So können mit der neuen Open Source Software beispielsweise Spitznamen wie ‘Jo’ oder ‘Hannes’ dem Vornamen ‘Johannes’ zugeordnet werden, wenn zwei Datensätze ansonsten ähnliche Daten enthalten. Talend ist der erste Anbieter von Open Source Datenintegrationssoftware.

Talend Data Quality verfügt über vier zentrale Features: ‘Data Profiling’ misst Verbesserungen oder Verschlechterungen der Datenqualität in einem Unternehmen und stellt die Entwicklung im Zeitverlauf dar. ‘Data Identification’ zeigt die Datenqualität pro Datensatz an. ‘Data Cleansing’ säubert falsche, unvollständige oder inkonsistente Datensätze durch Abgleich mit anderen Datenbanken innerhalb des Unternehmens oder externen Quellen. ‘Data Enrichment’ schließlich reichert Datensätze mit zusätzlichen Daten an, die vom Verwendungszweck im Unternehmen abhängen – denkbar sind beispielsweise geografische Daten, Bonitätsdaten oder demografische Daten. Talend Data Quality wird ab September 2008 als Stand-Alone-Produkt oder als zusätzliches Feature der Talend Integration Suite verfügbar sein.

“So wie heute Informationssysteme miteinander vernetzt sind, verbreiten sich fehlerhafte Daten so schnell wie Viren”, veranschaulicht Bertrand Diard, CEO und Mitbegründer von Talend Open Data Solutions. “So haben inkonsistente Datensätze in der Vergangenheit oftmals dazu geführt, dass Briefe an Kunden verloren gingen oder mehrfach ausgesandt wurden. Dies verärgert Kunden, verschlechtert die Vertriebs-Chancen und die Produktivität in Unternehmen.”

Lesen Sie auch : Google übertrifft die Erwartungen im zweiten Quartal