KI-generierte synthetische Daten für Testautomatisierung

Daten und Datenschutz (Bild: Shutterstock/cybrain)

Laut einer Gartner-Prognose sollen in zwei Jahren 70 Prozent aller Daten synthetisch sein.

MOSTLY AI bringt eine Freemium-Version seiner Plattform für KMUs auf den Markt. Mit der Plattform lassen sich synthetische Daten erzeugen, die unter anderem die Testautomatisierung vereinfachen. Testingenieure können mit der kostenlosen Version der Plattform komplexe synthetische Datenstrukturen erstellen. Synthetische Daten werden nicht manuell, sondern von einem KI-Algorithmus generiert, der in der Lage ist, alle Eigenschaften des Originaldatensatzes zu erlernen. Für die Entwicklung von Softwareprodukten und Dienstleistungen sind im Vorfeld umfangreiche Testszenarien notwendig. Diese Daten unterliegen oftmals strengen Datenschutz-Richtlinien.  Skalierte synthetische Datensätze bieten einen Schutz der Kundendaten ohne das Risiko einer Re-Identifizierung. Sie sind 100 Prozent gesetzeskonform mit der Datenschutzgrundverordnung (DSGVO) und vergleichbaren Vorschriften.

Einsatz von Deep-Learning-Algorithmen

„Im Gegensatz zu realen Daten beruhen synthetische Daten nicht auf Messungen oder Datenerhebungen, sondern werden künstlich erzeugt. Dabei kommen meist statistische Modelle, regelbasierte Ansätze oder Deep-Learning-Algorithmen zum Einsatz“, erklärt Tobias Hann, CEO von Mostly AI. Gartner prophezeit synthetischen Daten eine fulminante Zukunft: Bereits in zwei bis drei Jahren sollen rund 70 Prozent aller verwendeten Daten synthetisch erzeugt sein. Synthetische Daten machen laut Hand  die Verwendung von Produktionsdaten oder manuell erstellten Dummy-Daten überflüssig“: „Abgesehen von den offensichtlichen Datenschutzproblemen, ist es eine enorme Zeitverschwendung, da ein großer Teil der Zeit eines durchschnittlichen Testers damit verbracht wird, auf Testdaten zu warten, sie zu suchen oder sie manuell zu erstellen”.