Vom Rauschen zur Realität: Soras KI-Videoinnovation

Sora von OpenAI stellt eine fortschrittliche KI dar, die die physische Welt durch das Zusammenspiel eines GPT (Generative Pretrained Transformer) ähnlichen Transformermodells und eines Diffusionsverfahrens interpretiert. Das Transformermodell, eine Art von Deep Learning-Architektur, ermöglicht Sora, große Datenmengen effizient zu verarbeiten und zu analysieren. Diese Modelle nutzen sogenannte Selbst-Attention-Mechanismen, um Beziehungen zwischen verschiedenen Teilen eines Datensatzes zu erkennen und zu verstärken. Dadurch kann Sora komplexe Muster und Strukturen in Daten erkennen, was essenziell für das Verständnis und die Generierung von Inhalten ist.

Das Diffusionsverfahren ergänzt diese Fähigkeiten durch einen Prozess, der schrittweise zufälliges Rauschen in detaillierte Bilder oder Videos umwandelt. In den ersten Schritten generiert das Verfahren Bilder, die stark verrauscht sind und nur wenig erkennbare Strukturen aufweisen. Über zahlreiche Iterationen hinweg wird dieses Rauschen allmählich reduziert und durch relevante Bildinhalte ersetzt. Dieser Prozess ermöglicht es Sora, ultrarealistische Videos in HD-Auflösung zu generieren, die bis zu 60 Sekunden lang sind und eine außerordentliche Detailtiefe aufweisen.

Die Kombination dieser beiden Technologien ermöglicht es Sora, umfangreiches Weltwissen mit spezifischem Fachwissen (Domainwissen) zu verknüpfen. Das Ergebnis sind Videos, die sich durch eine bemerkenswerte Genauigkeit und Detailtreue auszeichnen. Sora kann somit nicht nur realistische Szenarien abbilden, sondern auch komplexe Konzepte und Situationen visuell darstellen, die ein tiefgehendes Verständnis der physikalischen Welt erfordern.

OpenAI schreibt anlässlich der Veröffentlichung: „Wir teilen unseren Forschungsfortschritt frühzeitig mit, um Feedback von Menschen außerhalb von OpenAI zu erhalten und um den Menschen ein Gefühl dafür zu geben, welche KI-Fähigkeiten am Horizont zu erwarten sind. Wir werden mehrere wichtige Sicherheitsschritte unternehmen, bevor diese Forschung in einem unserer Produkte verfügbar wird. Sora ist ein neues KI-Modell, das realistische und fantasievolle Szenen aus Textaufforderungen erstellen kann.“

Achim Weidner ist ein zertifizierter Social Media Manager (IHK) und Absolvent des Zertifizierungsprogramms (Certificate of Advanced Studies) „Rechtliche Aspekte der IT- und Internet-Compliance“ an der Carl von Ossietzky Universität Oldenburg. Dieses Programm ist angesiedelt in der Fakultät für Informatik, Wirtschafts- und Rechtswissenschaften und deckt folgende Bereiche ab: Datenschutz, Datensicherheit, Internetrecht sowie Computer- und Internetstrafrecht, ergänzt durch den Aspekt der technischen Datensicherheit.

Horizonterweiterung bei openHPI: Künstliche Intelligenz und maschinelles Lernen in der Praxis +++ Digitale Privatsphäre: Wie schütze ich meine persönlichen Daten im Netz? +++ Blick hinter den Hype: Aktuelle Entwicklungen rund um KI, Blockchain und IoT +++ ChatGPT: Was bedeutet generative KI für unsere Gesellschaft? +++ KI und Datenqualität – Perspektiven aus Data Science, Ethik, Normung und Recht +++ Blockchain: Hype oder Innovation? +++ Blockchain – Sicherheit auch ohne Trust Center +++ Datensicherheit im Netz – Einführung in die Informationssicherheit