Categories: Data

Rohdaten-Aufbereitung in der Cloud

Google stellt den Service Google Cloud Dataprep vor. Die Lösung soll Anwendern ein Tool für die Aufbereitung von Rohdaten über die Cloud bereitstellen. Als Nutzeroberfläche kommt bei Google Cloud Dataprep die Oberfläche von von Trifacta und dem Photon Compute Framework zum Einsatz. Cloud Dataprep ist zudem in Google Cloud Dataflow nativ integriert. Das ermöglicht eine serverlose, autoskalierende Ausführung verschiedener Datenaufbereitungsverfahren.

Der neue Google-Service ermöglicht es Daten-Analysten, in der Google Cloud Platform-Umgebung verschiedenartige Datasets für ein breites Spektrum an Downstream-Einsätzen, wie etwa Analytics und maschinelles Lernen, intuitiv zu erkunden und aufzubereiten. So können Anwender auch betriebliche Abläufe optimieren oder neue Möglichkeiten für Geschäftsmodelle erkunden.

Einige Anwender geben an, dass bei Daten-Analysen bis zu 80 Prozent des zeitlichen Aufwands auf die Vorbereitung der Daten verwendet werden, wie Fausto Ibarra, Director Product Management für Google Cloud Platform in einem Blog erklärt.

Das Feautre ‘Interactive Exploration’ mit Google Cloud Dataprep zeigt mögliche Ergebnisse an und führt den Nutzer über Vorschläge schneller zu Ergebnissen. (Bild: Trifacta)

“Immer mehr Unternehmen verlagern Analytics-Workloads in die Cloud”, kommentiert Adam Wilson, CEO bei Trifacta. Ein Ziel von Trifacta sei es gewesen, eine Self-Service-Lösung für alle, die mit Daten arbeiten, bereitzustellen. Durch die Kooperation mit Google können Anwender diese Datenaufbereitung mit wenigen Klicks aus der Google Cloud Platform beziehen.

Webinar

Digitalisierung fängt mit Software Defined Networking an

In diesem Webinar am 18. Oktober werden Ihnen die unterschiedlichen Wege, ein Software Defined Network aufzubauen, aus strategischer Sicht erklärt sowie die Vorteile der einzelnen Wege aufgezeigt. Außerdem erfahren Sie, welche Aspekte es bei der Auswahl von Technologien und Partnern zu beachten gilt und wie sich auf Grundlage eines SDN eine Vielzahl von Initiativen zur Digitalisierung schnell umsetzen lässt.

Unter dem Begriff Data Wrangling versteht der Hersteller den Prozess, Daten, die in ihren Ursprünglichen Formaten vorliegen für Analysen vorzubereiten. Dabei gibt es in dem Kernprodukt von Trifacta sechs Schritte der Datenvorbereitung: Entdecken, Strukturieren, Säubern, Anreichern, Validieren und Publizieren. Dann stehen noch weitere Verfahren wie etwa das Data-Blending, also das Mischen von verschiedenen Datensätzen, zur Verfügung, über die Anwender weitere Einsichten gewinnen können. So lassen sich beispielsweise Anomalien oder widersprüchliche Daten erkennen. Über eine KI-Lösung schlägt die Lösung Korrekturmaßnahmen vor.

Trifacta liefert unter anderem auch eine Daten-Integration für Hadoop. (Trifacta)

Die Trifacta-Lösung arbeitet mit Deep-Learning und Künstlicher Intelligenz, um dem Nutzer in jedem Schritt Vorschläge machen zu können. Die Trifacta-Lösungen Wrangler und Wrangler Enterprise richten sich vor allem an Datenanalysten ohne technischen Hintergrund und über eine Vorschau können Anwender stets die Ergebnisse ihre Aktionen vorhersehen.

Derzeit nutzen mehr als 4400 Unternehmen wie die Royal Bank of Scotland, Samsung, die Versicherung Zurich oder der Helpdesk-Spezialist Atlassin die Lösungen des jungen Unternehmens.

Redaktion

Recent Posts

“Deepfakes sind plattform- und branchenübergreifend hochkoordiniert”

"Betrüger umgehen Sicherheitsmaßnahmen, indem sie Schwachstellen in traditionellen Verifizierungssystemen nutzen", warnt Vyacheslav Zholudev von Sumsub…

8 Stunden ago

Deep-Learning-Tool spürt Tumorveränderungen schneller auf

Fraunhofer-Forschende haben eine KI-Lösung entwickelt, die herkömmliche Software-Analysen um den Faktor zehn verbessern könnte.

16 Stunden ago

Managed Services: Strategische Beratung bleibt Schwachstelle

Wie zufrieden sind Unternehmen mit ihren Dienstleistern? Antworten liefert das aktuelle „Professional User Rating: Managed…

2 Tagen ago

Cybersicherheitsrisiken von Quantencomputing

Verschlüsselte Daten, die künftig entschlüsselt werden könnten, Manipulation der Blockchain und quantenresistente Ransomware.

2 Tagen ago

Bosch forciert KI-Pläne

Bis Ende 2027 will das Technologieunternehmen gut 2,5 Milliarden Euro in Anwendung und Entwicklung von…

2 Tagen ago

Wenn die KI denkt wie wir

Forschende von Helmholtz Munich haben eine Künstliche Intelligenz entwickelt, die menschliches Verhalten erstaunlich präzise simuliert.

4 Tagen ago