Rohdaten-Aufbereitung in der Cloud

Google stellt den Service Google Cloud Dataprep vor. Die Lösung soll Anwendern ein Tool für die Aufbereitung von Rohdaten über die Cloud bereitstellen. Als Nutzeroberfläche kommt bei Google Cloud Dataprep die Oberfläche von von Trifacta und dem Photon Compute Framework zum Einsatz. Cloud Dataprep ist zudem in Google Cloud Dataflow nativ integriert. Das ermöglicht eine serverlose, autoskalierende Ausführung verschiedener Datenaufbereitungsverfahren.

Der neue Google-Service ermöglicht es Daten-Analysten, in der Google Cloud Platform-Umgebung verschiedenartige Datasets für ein breites Spektrum an Downstream-Einsätzen, wie etwa Analytics und maschinelles Lernen, intuitiv zu erkunden und aufzubereiten. So können Anwender auch betriebliche Abläufe optimieren oder neue Möglichkeiten für Geschäftsmodelle erkunden.

Einige Anwender geben an, dass bei Daten-Analysen bis zu 80 Prozent des zeitlichen Aufwands auf die Vorbereitung der Daten verwendet werden, wie Fausto Ibarra, Director Product Management für Google Cloud Platform in einem Blog erklärt.

Das Feautre ‘Interactive Exploration’ mit Google Cloud Dataprep zeigt mögliche Ergebnisse an und führt den Nutzer über Vorschläge schneller zu Ergebnissen. (Bild: Trifacta)

“Immer mehr Unternehmen verlagern Analytics-Workloads in die Cloud”, kommentiert Adam Wilson, CEO bei Trifacta. Ein Ziel von Trifacta sei es gewesen, eine Self-Service-Lösung für alle, die mit Daten arbeiten, bereitzustellen. Durch die Kooperation mit Google können Anwender diese Datenaufbereitung mit wenigen Klicks aus der Google Cloud Platform beziehen.

Webinar

Digitalisierung fängt mit Software Defined Networking an

In diesem Webinar am 18. Oktober werden Ihnen die unterschiedlichen Wege, ein Software Defined Network aufzubauen, aus strategischer Sicht erklärt sowie die Vorteile der einzelnen Wege aufgezeigt. Außerdem erfahren Sie, welche Aspekte es bei der Auswahl von Technologien und Partnern zu beachten gilt und wie sich auf Grundlage eines SDN eine Vielzahl von Initiativen zur Digitalisierung schnell umsetzen lässt.

Unter dem Begriff Data Wrangling versteht der Hersteller den Prozess, Daten, die in ihren Ursprünglichen Formaten vorliegen für Analysen vorzubereiten. Dabei gibt es in dem Kernprodukt von Trifacta sechs Schritte der Datenvorbereitung: Entdecken, Strukturieren, Säubern, Anreichern, Validieren und Publizieren. Dann stehen noch weitere Verfahren wie etwa das Data-Blending, also das Mischen von verschiedenen Datensätzen, zur Verfügung, über die Anwender weitere Einsichten gewinnen können. So lassen sich beispielsweise Anomalien oder widersprüchliche Daten erkennen. Über eine KI-Lösung schlägt die Lösung Korrekturmaßnahmen vor.

Trifacta liefert unter anderem auch eine Daten-Integration für Hadoop. (Trifacta)

Die Trifacta-Lösung arbeitet mit Deep-Learning und Künstlicher Intelligenz, um dem Nutzer in jedem Schritt Vorschläge machen zu können. Die Trifacta-Lösungen Wrangler und Wrangler Enterprise richten sich vor allem an Datenanalysten ohne technischen Hintergrund und über eine Vorschau können Anwender stets die Ergebnisse ihre Aktionen vorhersehen.

Derzeit nutzen mehr als 4400 Unternehmen wie die Royal Bank of Scotland, Samsung, die Versicherung Zurich oder der Helpdesk-Spezialist Atlassin die Lösungen des jungen Unternehmens.

Martin Schindler

Martin Schindler schreibt nicht nur über die SAPs und IBMs dieser Welt, sondern hat auch eine Schwäche für ungewöhnliche und unterhaltsame Themen aus der Welt der IT.

Recent Posts

Bericht: Apple verschiebt Pläne für VR/AR-Headset

Die Entwicklung verzögert sich um mehrere Monate. Apple kämpft angeblich mit der Kamera und zu…

14 Stunden ago

Russische Behörden zerschlagen Ransomware-Gang REvil

Ermittler durchsuchen 25 Objekte und beschlagnahmen Computer, Kryptowährungen und Bargeld in Millionenhöhe. Ein Gericht in…

16 Stunden ago

Spezifikationen für PCIe 6.0 versprechen doppelte Bandbreite

Sie steigt bei 16 Lanes auf bis zu 128 GByte/s. Pro Lane sind bis zu…

4 Tagen ago

Windows 11: Jüngste Vorabversion aktualisiert Bedienoberfläche

Elemente wie Lautstärke und Helligkeit erhalten neue Flyouts im Design von Windows 11. Bei der…

4 Tagen ago

Apple beseitigt Zero-Day-Lücke in HomeKit

Der Fehler betrifft alle unterstützten iPhones und iPads. Die Schwachstelle in HomeKit ist Apple schon…

5 Tagen ago

Canalys: PC-Markt wächst 2021 um 15 Prozent

Es ist das größte Jahreswachstum seit 2012. Im vierten Quartal legt der Markt allerdings nur…

5 Tagen ago