Categories: Data

Rohdaten-Aufbereitung in der Cloud

Google stellt den Service Google Cloud Dataprep vor. Die Lösung soll Anwendern ein Tool für die Aufbereitung von Rohdaten über die Cloud bereitstellen. Als Nutzeroberfläche kommt bei Google Cloud Dataprep die Oberfläche von von Trifacta und dem Photon Compute Framework zum Einsatz. Cloud Dataprep ist zudem in Google Cloud Dataflow nativ integriert. Das ermöglicht eine serverlose, autoskalierende Ausführung verschiedener Datenaufbereitungsverfahren.

Der neue Google-Service ermöglicht es Daten-Analysten, in der Google Cloud Platform-Umgebung verschiedenartige Datasets für ein breites Spektrum an Downstream-Einsätzen, wie etwa Analytics und maschinelles Lernen, intuitiv zu erkunden und aufzubereiten. So können Anwender auch betriebliche Abläufe optimieren oder neue Möglichkeiten für Geschäftsmodelle erkunden.

Einige Anwender geben an, dass bei Daten-Analysen bis zu 80 Prozent des zeitlichen Aufwands auf die Vorbereitung der Daten verwendet werden, wie Fausto Ibarra, Director Product Management für Google Cloud Platform in einem Blog erklärt.

Das Feautre ‘Interactive Exploration’ mit Google Cloud Dataprep zeigt mögliche Ergebnisse an und führt den Nutzer über Vorschläge schneller zu Ergebnissen. (Bild: Trifacta)

“Immer mehr Unternehmen verlagern Analytics-Workloads in die Cloud”, kommentiert Adam Wilson, CEO bei Trifacta. Ein Ziel von Trifacta sei es gewesen, eine Self-Service-Lösung für alle, die mit Daten arbeiten, bereitzustellen. Durch die Kooperation mit Google können Anwender diese Datenaufbereitung mit wenigen Klicks aus der Google Cloud Platform beziehen.

Webinar

Digitalisierung fängt mit Software Defined Networking an

In diesem Webinar am 18. Oktober werden Ihnen die unterschiedlichen Wege, ein Software Defined Network aufzubauen, aus strategischer Sicht erklärt sowie die Vorteile der einzelnen Wege aufgezeigt. Außerdem erfahren Sie, welche Aspekte es bei der Auswahl von Technologien und Partnern zu beachten gilt und wie sich auf Grundlage eines SDN eine Vielzahl von Initiativen zur Digitalisierung schnell umsetzen lässt.

Unter dem Begriff Data Wrangling versteht der Hersteller den Prozess, Daten, die in ihren Ursprünglichen Formaten vorliegen für Analysen vorzubereiten. Dabei gibt es in dem Kernprodukt von Trifacta sechs Schritte der Datenvorbereitung: Entdecken, Strukturieren, Säubern, Anreichern, Validieren und Publizieren. Dann stehen noch weitere Verfahren wie etwa das Data-Blending, also das Mischen von verschiedenen Datensätzen, zur Verfügung, über die Anwender weitere Einsichten gewinnen können. So lassen sich beispielsweise Anomalien oder widersprüchliche Daten erkennen. Über eine KI-Lösung schlägt die Lösung Korrekturmaßnahmen vor.

Trifacta liefert unter anderem auch eine Daten-Integration für Hadoop. (Trifacta)

Die Trifacta-Lösung arbeitet mit Deep-Learning und Künstlicher Intelligenz, um dem Nutzer in jedem Schritt Vorschläge machen zu können. Die Trifacta-Lösungen Wrangler und Wrangler Enterprise richten sich vor allem an Datenanalysten ohne technischen Hintergrund und über eine Vorschau können Anwender stets die Ergebnisse ihre Aktionen vorhersehen.

Derzeit nutzen mehr als 4400 Unternehmen wie die Royal Bank of Scotland, Samsung, die Versicherung Zurich oder der Helpdesk-Spezialist Atlassin die Lösungen des jungen Unternehmens.

Redaktion

Recent Posts

Sicherheitsaspekte im Online-Gaming

Sowohl „just for fun“ als auch als ernster Liga-Wettkampf oder als Glücksspiel mit echtem Geld…

18 Minuten ago

Digitale Richterassistenten für Justiz Baden-Württemberg

KI soll Richter in der Sozialgerichtsbarkeit entlasten, indem die Aktenstrukturierung vereinfacht wird.

4 Stunden ago

Autonome KI Sales Agents unterstützen Vertrieb

Einstein Sales Development Rep (SDR) Agent und Einstein Sales Coach Agent von Salesforce werden ab…

19 Stunden ago

All-Flash-Rechenzentren senken Energiekonsum durch KI

KI und ihre riesigen Datenmengen stellen die ohnehin schon überlasteten Rechenzentren vor echte Herausforderungen, warnt…

3 Tagen ago

Digitaler Zwilling hilft Hofbieber zur Erreichung der Klimaziele

Die hessische Gemeinde plant, bis 2030 klimaneutral zu werden, indem sie einen Digitalen Zwilling von…

3 Tagen ago

Stromversorgung und Kühlung im KI-Rechenzentrum

Durch Künstliche Intelligenz verändert sich die Infrastruktur von Rechenzentren grundlegend, sagt Anton Chuchkov von Vertiv.

3 Tagen ago