Teradatas großer Schritt in Richtung Logical Data Warehouse

EnterpriseManagementSicherheitSoftware

Mit QueryGrid ermöglicht Teradata, eine SQL-Abfrage über mehrere Datenbanken und Data-Stores laufen zu lassen. Daneben zeigt der Anbieter auch Version 15 der Teradata Datenbank. Beide Technologien bringen neue Ansätze in das klassische Data Warehousing von Unternehmen.

querygrid-620x426Teradata stellt mit QueryGrid eine neue Technologie für das Data Warehousing vor. Parallel dazu zeigt Teradata auch die Version 15 der eigenen Datenbank-Lösung. Die Liefert jetzt Support für mehrere Scripting-Sprachen und JSON.

Die neue Technologie QueryGrid bietet hier auch einen neuen Ansatz. QueryGrid erlaubt es, SQL-basierte Abfragen über mehrere Datenbanken verschiedener Hersteller hinweg laufen zu lassen. Auch Hadoop unterstützt Teradata mit diesem Data-Access-Layer.

 

Fotogalerie: Teradata Universe 2013 in Kopenhagen

Klicken Sie auf eines der Bilder, um die Fotogalerie zu starten

 

Damit müssen die Daten nicht mehr in ein System geladen werden, bevor die Informationen prozessiert werden können. Die Analyse finden dann in den Datenbanken selbst statt. Damit können Nutzer für die jeweilige Aufgabe auch das beste System auswählen. Gleichzeitig können diese Abfragen von eine einzelnen System aus geschehen.

Das QueryGrid basiert auf der Unified Data Architecture (UDA). Diese Architektur liefert über Aster eine Lösung für Data Discovery und mit dem Support für Hadoop kann diese Lösung auch große und unstrukturierte Dantesätze abdecken, mit denen sich klassische relationale Datenbank schwer tun.

Teradata Unified Data Architecture in Aktion. Quelle: Terdadata
Teradata Unified Data Architecture in Aktion. Quelle: Terdadata

QueryGrid fügt nun noch eine weitere Schicht ein. Ein Execution Layer ermöglicht Abfragen in SQL, R, MapReduce oder Graph. Unterstützt werden derzeit neben verschiedenen Teradata-Lösungen auch Oracle und Hadoop. Support für weitere Datenbanken ist bereits geplant.

Anwender können damit zum Beispiel eine bestimmte Kundengruppe in Teradata ausmachen und dann eine ergänzende Abfrage über Hadoop in Facebook-Posts machen. Dann können über Graph die wichtigsten Nutzer identifiziert werden.

“Versuche von Anbietern, Server über Verbünde zu koordinieren, sind aus den verschiedensten Gründen gescheitert”, erklärt Hermann Wimmer, Vorstand International, Teradata. “Um Big Data wertschöpfend zu nutzen, sollten die Kunden eine Architektur schaffen, die es ermöglicht, analytische Prozesse über parallele Datenbanken statt über Serververbünde aufeinander abzustimmen. Teradata QueryGrid ist die bislang flexibelste Softwarelösung, die diese Aufgabe meistert.” Teradata lasse zudem die Nutzung verschiedener Dateisysteme und Engines im selben Workload zu.

Ari Zilka, CTO bei Hortonworks, kommentiert: “Mit der Integration von Hadoop und HCatalog mit Aster SQL-H hat Teradata Neuland betreten und seinen Kunden die Möglichkeit eröffnet, erweiterte Analyseverfahren unmittelbar auf große Datenmengen in Hadoop anzuwenden.” Teradata mache nun das so genannte “Push down Processing” auch für Hadoop verfügbar.

Parallel dazu stellt Teradata auch die Teradata Database 15 vor. Damit ermöglicht der Hersteller zusammen mit der QueryGrid-Funktionalität die Verschiebung von Daten in beide Richtungen sowie Push down-Verarbeitung zwischen open-source Hadoop, der Teradata Aster Database und weiteren Datenbanken. Anwender können Queries von der Teradata Database aus initiieren, um auf Teilmengen von Daten zuzugreifen, sie zu filtern und aus Hadoop, der Aster oder anderen Datenbank-Umgebungen zurück in die Teradata Database zu verschieben. Die Analyse kann sowohl Daten aus der Teradata Database als auch aus Hadoop einbeziehen.

Daneben unterstützt die neue Teradata Database 15 nun auch JSON (JavaScript Object Notation), eine Sprache, die häufig für die Machine-to-Machine-Kommunikation eingesetzt wird, um Sensoren anzubinden. Damit können Anwender auch große Datensätze aus Sensoren oder Maschinen analysieren. Neu in Teradata 15 ist auch der Support die Scripting-Sprachen Perl, Ruby, Python und die Statistik-Sprache R, sowie für die Analyse von dreidimensionalen Geo-und Zeit-basierten Daten. Daneben sorgt Teradata mit diese Update auch für mehr Stabilität und verbessert einige Management-Features.

Teradata listet die Unterschiede zwischen klassischem und logischem Data Warehouse. Quelle: Teradata
Teradata listet die Unterschiede zwischen klassischem und logischem Data Warehouse. Quelle: Teradata

Wie groß ist Ihr Wissen über Big Data? Machen Sie den Test mit 15 Fragen auf silicon.de!

Anklicken um die Biografie des Autors zu lesen  Anklicken um die Biografie des Autors zu verbergen