KI-generierte Videos sind definitiv im Kommen! Journee entwickelte den Prototyp einer Echtzeit-AI-Kamera fürs Web und seine immersiven virtuellen Welten
Dass ChatGPT inzwischen aus Texten auch Videos generiert, war der Tagesschau im Februar 2024 eine Meldung wert – obwohl man es bis heute nicht testen kann. Etwa zur gleichen Zeit stellte das Berliner Technologie-Unternehmen Journee etwas Ähnliches vor, das man sogar testen soll: eine experimentelle KI-Linse, die eine Echtzeitverbindung zwischen der digitalen und der physischen Welt herstellt.
Die Anwendung nutzt die Webcam oder Screensharing zur Eingabe eines Video-Streams. Nutzer:innen definieren per Prompt, wie ihr Ausgangsbild aussehen soll, und eines von zwei KI-Modellen generiert ein entsprechendes neues Videobild nahezu in Echtzeit. Das macht großen Spaß!
Game Changer LCM-LoRA
Zugegeben waren sie damit nicht die ersten im Markt. Die KI-Plattform Krea.ai veröffentlichte beispielsweise schon Ende November ein ganz ähnliches Real-Time-Tool, denn seit Herbst 2023 ist eine neue Technologie dafür verfügbar. Es handelt sich um LCM-LoRA, kurz für Latent Consistency Model – Low-Rank Adaptation.
Dieser komplexe Algorithmus beschleunigt ein latentes Diffusionsmodell wie Stable Diffusion, indem es kleinere und schnellere Modelle herausbildet beziehungsweise »destilliert«, wie man das in der Fachsprache nennt. Dank des LCM-Lora-Moduls lassen sich also qualitativ hochwertige Bilder und Videos auf Basis von Textbeschreibungen, einfachen Scribbles oder anderen Bildern beinah in Echtzeit generieren.
Ob und wie gut Real-Time-Video-Generierung inzwischen funktioniert, wollte Journee Mitgründer Christian Mio Loclair im Herbst 2023 selbst ausprobieren: »Wir bewegen uns mit Journee an vorderster Front der technologischen Entwicklung und das soll so bleiben. Deshalb experimentieren wir permanent mit neuster Soft- und Hardware«, so Mio.