AI Update: Auf dem Weg zum Why
Michael Jonas kuratiert die neuesten Entwicklungen in der AI Welt – hypefrei, praxisnah und mit Blick auf die Metaebene.
Oktober 2024 war ein aufregender Monat für KI-Enthusiasten – wie eigentlich jeder Monat, denn die sind immer aufgeregt. Aber auch wenn uns die KI-Welt fasziniert, wollen wir immer auch einen Hype-freien Blick auf die Entwicklung werfen.
Über die Adobe MAX hat PAGE live vor Ort berichtet, aus den weiteren Veröffentlichungen des letzten Monats stechen für Kreative vier besonders heraus, die wir euch hier vorstellen.
Der Midjourney Image Editor
Fakten: Die Edit-Funktionen wie inpainting funktionieren jetzt mit jedem beliebigen hochgeladenen Bild und nicht mehr nur für Bilder die in Midjourney selbst generiert wurden. Eigentlich ein Hygienefaktor, denn in Adobe Firefly, Stable Diffusion und Co. lassen sich auch beliebige eigene Bilder hochladen und weiterbearbeiten. Für ausschließliche Midjourney-User aber ein großer Schritt. Noch größer ist aber die Einführung der neuen Retexture-Funktion als Midjourneys Pendant zu Structure Reference in Firefly und ControlNets wie Canny.
Relevant: Ob es für Kreative einen professionellen Use-Case gibt zwischen Adobe Firefly und ControlNets für SD und Flux ist zumindest fraglich. Durch das aufgeräumte User Interface für alte wie neue Funktionen auf einer visuellen Arbeitsfläche gestaltet sich das Arbeiten aber sehr viel schneller und komfortabler.
Ausprobieren: Midjourney hat den Image Editor kostenlos freigeschaltet, Retexture ist jedoch nur für Nutzer:innen verfügbar, die bereits mindestens 10.000 Bilder generiert haben oder mindestens 12 Monate zahlende Kund:innen sind.
2. Blendbox
Fakten: Blendbox vom Entwickler blockade labs geht einen ganz eigenen Weg im Interface Design: Eine geteilte Arbeitsfläche. Auf der linken Hälfte der Arbeitsfläche generiert man Bildelemente auf Ebenen. Auf der rechten Hälfte generiert sich von alleine eine perspektivisch stimmige Collage der Gestaltungselemente.
Relevant: Blendbox ist noch in der alpha-Version, daher fehlen manche Funktionen und die Bildqualität der KI-Modelle ist noch nicht gut genug. Das collagierende Gestalten in Ebenen mit Transparenzen steht vermutlich für praktisch alle Designer:innen ganz oben auf der Wunschliste für KI-Tools.
Ausprobieren: Es gibt keine kostenlosen Test-Accounts. Abonnement ab 10$/Monat, Credits (heißen hier „energy“) kann mensch aber auch ohne Abo kaufen ab 3,50 $
3. Superstudio von Kaiber
Fakten: Kaiber war eins der frühesten KI-Tools um Videos zu generieren. Nun kombiniert es mehrere heute bekannte Videomodelle mit Funktionen zur Bildgenerierung in einem Interface namens Superstudio. Kreative müssen also nicht mehr den ersten und/oder letzten Frame eines Videos in Flux generieren und dann in Runway, Kling oder Luma importieren sondern können alle Modelle im Superstudio direkt benutzen und kombinieren.
Relevant: Auf einem Projekt-Canvas können alle Arbeitsschritte Workflow-basiert verbunden werden. In einem großzügig und übersichtlich gestalteten Interface weit entfernt von den Spaghettihaufen komplexer Comfy UI Workflows.
Ausprobieren: Test-Account kostenlos hier
4. RecraftV3
Fakten: RecraftV3 (code name „red_panda“) wurde angekündigt als „revolutionäres Modell, das in der Sprache von Designern denkt“. State-of-the-art im Befolgen von Textprompts und der korrekten Darstellung menschlicher Anatomie. Das erste Modell der Welt, das lange Texte korrekt darstelt, in dem man Text setzen und über Kombinationen von Bild- und Textelementen komplexe Grafikdesigns generieren kann.
Relevant: Die vollmundige Ankündigung eines visuell überlegenen GenAI-Models würde ich nach den ersten 100 generierten Bildern eher nicht teilen. Wirklich herausragend sind aber zwei Eigenschaften. Das RecraftV3-Modell generiert neben PNGs und JPGs auch sauber Vektorformate wie SVGs und Lottie-Files. Und das Layouten der generierten Bilder auf einem visuellen canvas in den sog. Frames ist für Designer:innen tatsächlich völlig selbsterklärend und ein ganz neuer Arbeitsablauf der gestalterische Möglichkeiten bietet, die andere Tools einfach nicht leisten können indem sie primär auf Texteingabe von Prompts setzen.
Ausprobieren: Test-Account kostenlos hier
über diesen invite-Link auch gleich mit 200 free credits: https://www.recraft.ai/invite/BrBEKntTKt
Learnings: AI Entwicklung
Die aktuellen Veröffentlichungen haben eine gemeinsame Entwicklungsrichtung: Frei nach Simon Szineks Golden Circle (What>How>Why) gehen die KI-Tools und Anbieter erste Schritte vom „What“ zum „How“. Die benutzten KI-Modelle mit den Billionen Parametern, der nativen Pixelauflösung und der korrekten Anzahl Finger (a.k.a. das „What“) werden austauschbar. Die Interfaces der Tools die angenehm und effizient zu bedienende Workflows für Kreative (a.k.a. das „How“) werden wichtiger.
Mit dem Oktober 2024 sieht es so aus, als könnten Interfaces mit Arbeitsfläche und Canvas für Kreative die Lösung sein, die professionelle art/creative direction für KI-generierte Medien ermöglicht ohne sich gleich im Kabelsalat von Comfy UI zu verheddern. Und in den nächsten Monaten erfolgt dann vielleicht der nächste große Schritt — Fokus auf das „Why“.
Das könnte dich auch interessieren