Kommendes Update für ChatGPT generiert Videos aus Text

OpenAI stellt offenbar in dieser Woche GPT-4 vor. Im Gegensatz zur aktuellen Version GPT-3.5 beherrscht die neue Version Multimodale Modelle. ChatGPT kann künftig wahrscheinlich auch Bilder und Musik ausgeben.

OpenAI arbeiten an einem Nachfolger von GPT-3.5 , der künstlichen Intelligenz von ChatGPT. GPT-4 soll bereits in dieser Woche enthüllt werden. Das hat Andreas Braun, CTO von Microsoft Deutschland, auf der Veranstaltung AI in FoKus – Digital Kickoff angekündigt. Demnach soll die künstliche Intelligenz künftig in der Lage sein, Text in Videos umzuwandeln.

“Wir werden nächste Woche GPT-4 vorstellen, da haben wir multimodale Modelle, die noch ganz andere Möglichkeiten bieten werden – zum Beispiel Videos”, wird Braun in einem Bericht von Heise.de zitiert.

GPT-4 erstellt auch Bilder und Musik

GPT – Generative Pre-trained Transformer – ist die von OpenAI entwickelte Sprachmodell-Architektur, die ChatGPT antreibt. GPT-3 beziehungsweise GPT-3.5 beschränken den Chatbot jedoch auf die Ausgabe von Text.

Da es sich bei GPT-4 um eine multimodale KI handeln soll, können Anwendungsfälle für ChatGPT künftig über Text hinausgehen. Holger Kenn, Director of Business Strategy bei Microsoft Deutschland, sagte dem Bericht zufolge, die KI könne Text künftig auch in Videos, Musik und Bilder übersetzen.

Ein Text-zu-Video-Generator ist allerdings kein völlig neues Konzept. Technikkonzerne wie die Facebook-Mutter Meta und Google arbeiten bereits an entsprechenden Modellen. Die Technologien für Make-A-Video von Meta sowie Imagen Video von Google befinden sich jedoch noch in einem Forschungsstadium. Für die Öffentlichkeit sind sie nicht zugänglich. OpenAI könnte sich somit mit GPT-4 in diesem Bereich als Marktführer etablieren.