Nvidia: Rapids beschleunigt Datenanalyse und maschinelles Lernen

Auf der GPU Technology Conference in München hat Nvidia die quelloffenen Bibliotheken Rapids vorgestellt mit dem Versprechen, das Feld der Data Science voranzubringen. Sie sollen Nvidias CUDA-Plattform mit einer oder mehreren GPUs nutzen, um Datenanalyse und maschinelles Lernen zu beschleunigen.

CPU-Computing stößt an seine Grenzen, während sich die weltweite Datenmenge jährlich verdoppelt und das Mooresche Gesetz nicht mehr gilt, argumentiert Nvidia in einem Blogeintrag. Deshalb hätten sich wissenschaftliches Computing und Deep Learning der Nvidia-GPU-Beschleunigung zugewandt. Datenanalyse und maschinelles Lernen allerdings hätten sich die GPU-Leistung noch nicht systematisch erschließen können – was sich jetzt ändern soll. Rapids stelle erstmals eine robuste Plattform für GPU-beschleunigte Data Science bereit: Analyse, maschinelles Lernen und bald auch Datenvisualisierung.

Laut Nvidia zeigen erste Benchmarks eine 50-fache Beschleunigung im Vergleich zu Nur-CPU-Systemen, gemessen mit Rapids auf einem KI-System Nvidia DGX-2. Typische Trainingszeiten könnten demnach von Tagen auf Stunden oder von Stunden auf Minuten schrumpfen. Als eine praktische Anwendung führt Nvidia an, dass etwa Supermarktketten die optimale Lagermenge frischer Früchte für jeden Standort schätzen könnten. GPU-beschleunigte Analysen könnten Kreditinstitute frühzeitig auf das Risiko ausfallender Hypothekentilgungen aufmerksam machen.

Um die Voraussetzungen für Rapids zu schaffen, arbeiteten Nvidia-Ingenieure zwei Jahre lang mit Python-Entwicklern zusammen. Rapids baut auf Open-Source-Projekten einschließlich Apache Arrow, Pandas und Scikit-Learn auf. Es soll sich außerdem mit Apache Spark integrieren, dem von über tausend Organisationen eingesetzten Data-Science-Framework für Rechenzentren. Durch die quelloffenen Bibliotheken hofft der Hersteller außerdem auf weitere Fortschritte durch die Beiträge anderer Entwickler im Open-Source-Ökosystem.

Als Unterstützer von Rapids führt der Grafikspezialist, der sich zunehmend als KI-Pionier sieht, unter anderem Anaconda und Databricks an, das von den Spark-Schöpfern gegründete Unternehmen. Zu den Rapids-Partnern zählen außerdem Namen wie IBM, Hewlett Packard Enterprise und Oracle.

Die Open-Source-Bibliotheken stehen unter der Apache-Lizenz und auf Rapids.ai zum Download bereit. Container-Versionen von Rapids sollen in dieser Woche auf der NVIDIA GPU Cloud Container Registry folgen.

[mit Material von Andrew Brust, ZDNet.com]

E-Book

Die Cloud in kleinen Contact Centern: die Stunde der Wahrheit

Für viele Unternehmen ist noch immer unklar, welche Vorteile ein cloudbasiertes Contact Center bietet. Dieses E-Book von Genesys löst die Mythen rund um Cloud Contact Center auf.

Anja Schmoll-Trautmann

Anja Schmoll-Trautmann berichtet seit 2001 vorrangig für ZDNet.de über aktuelle Entwicklungen im Bereich Consumer Electronics, Mobile und Peripherie. Seit 2012 beschäftigt sie sich auch für silicon.de immer wieder mit Business-Hardware, Digitalisierung und Markttrends.

Recent Posts

Microsoft weitet Verteilung des 21H1-Updates für Windows 10 aus

Die Aktualisierung geht nun automatisch an Systeme mit Windows 10 Version 2004. Deren Versorgung mit…

14 Stunden ago

Intel schafft neue Geschäftsbereiche für Accelerated Computing und Software

CEO Pat Gelsinger konzentriert sich stärker auf High Performance Computing und Grafiktechnologien für Rechenzentren. Neu…

17 Stunden ago

Mit Customer Analytics zu erfolgreicher Kundenbindung – 3 Use Cases

Dass Daten heutzutage eine der wichtigsten Ressourcen für Unternehmen sind, ist unbestritten. Besonders viel Potenzial…

18 Stunden ago

EU-Kommission leitet neue Kartelluntersuchung gegen Google ein

Es geht um möglicherweise wettbewerbsfeindliches Verhalten im Bereich Online-Dienste. Google soll möglicherweise bestimmte Nutzerdaten Dritten…

19 Stunden ago

Forscher reduzieren Größe von Quantencomputern

Ein an der Universität Innsbruck entwickeltes System passt in ein herkömmliches Server-Rack. Es arbeitet auch…

2 Tagen ago

Nach Ransomware-Angriff: 700 GByte Daten des Speicheranbieters Adata

Die Daten sind nur vorübergehend öffentlich verfügbar. Der Filehoster Mega sperrt das zugehörige Konto. Hinter…

2 Tagen ago