Open Source Software verbessert die Datenqualität

Die Lösung identifiziert Dubletten, fehlende Einträge in Datensätzen, fehlerhafte Daten oder unvollständige Adressen und korrigiert sie teilweise automatisch durch Abgleich mit Referenzdatenbanken. So können mit der neuen Open Source Software beispielsweise Spitznamen wie ‘Jo’ oder ‘Hannes’ dem Vornamen ‘Johannes’ zugeordnet werden, wenn zwei Datensätze ansonsten ähnliche Daten enthalten. Talend ist der erste Anbieter von Open Source Datenintegrationssoftware.

Talend Data Quality verfügt über vier zentrale Features: ‘Data Profiling’ misst Verbesserungen oder Verschlechterungen der Datenqualität in einem Unternehmen und stellt die Entwicklung im Zeitverlauf dar. ‘Data Identification’ zeigt die Datenqualität pro Datensatz an. ‘Data Cleansing’ säubert falsche, unvollständige oder inkonsistente Datensätze durch Abgleich mit anderen Datenbanken innerhalb des Unternehmens oder externen Quellen. ‘Data Enrichment’ schließlich reichert Datensätze mit zusätzlichen Daten an, die vom Verwendungszweck im Unternehmen abhängen – denkbar sind beispielsweise geografische Daten, Bonitätsdaten oder demografische Daten. Talend Data Quality wird ab September 2008 als Stand-Alone-Produkt oder als zusätzliches Feature der Talend Integration Suite verfügbar sein.

“So wie heute Informationssysteme miteinander vernetzt sind, verbreiten sich fehlerhafte Daten so schnell wie Viren”, veranschaulicht Bertrand Diard, CEO und Mitbegründer von Talend Open Data Solutions. “So haben inkonsistente Datensätze in der Vergangenheit oftmals dazu geführt, dass Briefe an Kunden verloren gingen oder mehrfach ausgesandt wurden. Dies verärgert Kunden, verschlechtert die Vertriebs-Chancen und die Produktivität in Unternehmen.”

Silicon-Redaktion

Recent Posts

Kubernetes in Cloud-Umgebungen

Ein elementarer Bestandteil einer effektiven Cloud-Strategie ist nach erfolgter Implementierung die künftige Verwaltung des Dienstes.

16 Stunden ago

Aras erweitert seine PLM-Plattform

Die Neuerungen sollen den Digital Thread, die Low-Code-Entwicklung, die Visualisierung komplexer Baugruppen und das Lieferantenmanagement…

18 Stunden ago

Manufacturing-X: Zurückhaltung überwiegt

Eine Bitkom-Umfrage attestiert der Datenraum-Initiative des Bundes hohe Bekanntheit in der Industrie. Doch noch ist…

18 Stunden ago

Ransomware „Marke Eigenbau“

Ransomware-as-a-Service ist ein lukratives Geschäft und in den Händen professionell organisierter Gruppen. Jetzt können Kriminelle…

2 Tagen ago

Bad Bots: Risikofaktor mit hohen Folgekosten

Bad Bots richten nicht nur wirtschaftlichen Schaden an. Laut dem Bad Bot Report von Imperva…

3 Tagen ago

IT-Verantwortliche setzen auf KI-Hosting in Europa

Studie von OVHcloud verdeutlicht Stellenwert von Datenresidenz und Datensouveränität bei KI-Anwendungen.

4 Tagen ago