PAGE online

AI Update: Auf dem Weg zum Why

Michael Jonas kuratiert die neuesten Entwicklungen in der AI Welt – hypefrei, praxisnah und mit Blick auf die Metaebene.

Nahaufnahme eines männlichen Models mit dramatischer Beleuchtung. Das Interface zeigt Optionen für Retusche und Export.Oktober 2024 war ein aufregender Monat für KI-Enthusiasten – wie eigentlich jeder Monat, denn die sind immer aufgeregt. Aber auch wenn uns die KI-Welt fasziniert, wollen wir immer auch einen Hype-freien Blick auf die Entwicklung werfen.

Über die Adobe MAX hat PAGE live vor Ort berichtet, aus den weiteren Veröffentlichungen des letzten Monats stechen für Kreative vier besonders heraus, die wir euch hier vorstellen.

Der Midjourney Image Editor

Fakten: Die Edit-Funktionen wie inpainting funktionieren jetzt mit jedem beliebigen hochgeladenen Bild und nicht mehr nur für Bilder die in Midjourney selbst generiert wurden. Eigentlich ein Hygienefaktor, denn in Adobe Firefly, Stable Diffusion und Co. lassen sich auch beliebige eigene Bilder hochladen und weiterbearbeiten. Für ausschließliche Midjourney-User aber ein großer Schritt. Noch größer ist aber die Einführung der neuen Retexture-Funktion als Midjourneys Pendant zu Structure Reference in Firefly und ControlNets wie Canny.

Relevant: Ob es für Kreative einen professionellen Use-Case gibt zwischen Adobe Firefly und ControlNets für SD und Flux ist zumindest fraglich. Durch das aufgeräumte User Interface für alte wie neue Funktionen auf einer visuellen Arbeitsfläche gestaltet sich das Arbeiten aber sehr viel schneller und komfortabler.

Ausprobieren: Midjourney hat den Image Editor kostenlos freigeschaltet, Retexture ist jedoch nur für Nutzer:innen verfügbar, die bereits mindestens 10.000 Bilder generiert haben oder mindestens 12 Monate zahlende Kund:innen sind.

oftware mit Porträtbildern eines männlichen Models in verschiedenen Licht- und Farbvarianten. Links wird ein Bild mit Rembrandt-Licht hervorgehoben. Eine Collage aus verschiedenen Porträts eines männlichen und weiblichen Models in unterschiedlichen Stilen und Lichtstimmungen.

2. Blendbox

Fakten: Blendbox vom Entwickler blockade labs geht einen ganz eigenen Weg im Interface Design: Eine geteilte Arbeitsfläche. Auf der linken Hälfte der Arbeitsfläche generiert man Bildelemente auf Ebenen. Auf der rechten Hälfte generiert sich von alleine eine perspektivisch stimmige Collage der Gestaltungselemente.

Relevant: Blendbox ist noch in der alpha-Version, daher fehlen manche Funktionen und die Bildqualität der KI-Modelle ist noch nicht gut genug. Das collagierende Gestalten in Ebenen mit Transparenzen steht vermutlich für praktisch alle Designer:innen ganz oben auf der Wunschliste für KI-Tools.

Ausprobieren: Es gibt keine kostenlosen Test-Accounts. Abonnement ab 10$/Monat, Credits (heißen hier „energy“) kann mensch aber auch ohne Abo kaufen ab 3,50 $

Benutzeroberfläche einer Software mit dem Namen "Blendbox". Links sind verschiedene Layer wie "Medieval Castle" und "Flower Meadow" aufgelistet. Rechts wird eine Vorschau des Ergebnisses gezeigt: eine mittelalterliche Burg auf einem schneebedeckten Berg. Blendbox-Schnittstelle, die einen roten futuristischen Motorradentwurf zeigt. Links ist eine Schicht namens "Rocket Engine" ausgewählt. Die rechte Vorschau zeigt ein fertig bearbeitetes Bild mit Raketenantrieb. Blendbox-Oberfläche mit einem Bild einer beleuchteten mittelalterlichen Burg und eines weißen Leuchtturms, umgeben von Schnee. Links wird die Schicht "Medieval Tower" angezeigt.

3. Superstudio von Kaiber

Fakten: Kaiber war eins der frühesten KI-Tools um Videos zu generieren. Nun kombiniert es mehrere heute bekannte Videomodelle mit Funktionen zur Bildgenerierung in einem Interface namens Superstudio. Kreative müssen also nicht mehr den ersten und/oder letzten Frame eines Videos in Flux generieren und dann in Runway, Kling oder Luma importieren sondern können alle Modelle im Superstudio direkt benutzen und kombinieren.

Relevant: Auf einem Projekt-Canvas können alle Arbeitsschritte Workflow-basiert verbunden werden. In einem großzügig und übersichtlich gestalteten Interface weit entfernt von den Spaghettihaufen komplexer Comfy UI Workflows.

Ausprobieren: Test-Account kostenlos hier

Software mit dem Namen "Superstudio Playground", die verschiedene kreative Vorlagen wie "Character Animation Playground" und "Logo Restyler Studio" zeigt. Superstudio-Interface mit einer Sammlung von Bildern, darunter Hände, die ein grünes Schild mit der Aufschrift "KAIBER Test November 2024" halten. Superstudio-Benutzeroberfläche mit verschiedenen kreativen Flows wie "Luma Video", "Runway Video" und "Flux Image". Im rechten Bereich wird ein Bild von Händen gezeigt, die ein Schild mit "KAIBER Test November 2024" halten.

4. RecraftV3

Fakten: RecraftV3 (code name „red_panda“) wurde angekündigt als „revolutionäres Modell, das in der Sprache von Designern denkt“. State-of-the-art im Befolgen von Textprompts und der korrekten Darstellung menschlicher Anatomie. Das erste Modell der Welt, das lange Texte korrekt darstelt, in dem man Text setzen und über Kombinationen von Bild- und Textelementen komplexe Grafikdesigns generieren kann.

Relevant: Die vollmundige Ankündigung eines visuell überlegenen GenAI-Models würde ich nach den ersten 100 generierten Bildern eher nicht teilen. Wirklich herausragend sind aber zwei Eigenschaften. Das RecraftV3-Modell generiert neben PNGs und JPGs auch sauber Vektorformate wie SVGs und Lottie-Files. Und das Layouten der generierten Bilder auf einem visuellen canvas in den sog. Frames ist für Designer:innen tatsächlich völlig selbsterklärend und ein ganz neuer Arbeitsablauf der gestalterische Möglichkeiten bietet, die andere Tools einfach nicht leisten können indem sie primär auf Texteingabe von Prompts setzen.

Ausprobieren: Test-Account kostenlos hier

über diesen invite-Link auch gleich mit 200 free credits: https://www.recraft.ai/invite/BrBEKntTKt

Interface eines Tools mit einem Bild von Händen, die ein grünes Schild mit "RECRAFT V3 TEST Nov. 2024" halten. Optionen zur Farbanpassung und Bildbearbeitung werden angezeigt. Screenshot eines Design-Tools mit einer Benutzeroberfläche zur Bildbearbeitung. Ein Bild zeigt Hände, die ein grünes Schild mit der Aufschrift „RECRAFT V3 TEST Nov. 2024“ in schwarzer Schrift halten. Links werden Werkzeuge zur Farbanpassung und Textbeschreibung angezeigt. Screenshot eines Design-Tools mit der Funktion „Create New“. Im Zentrum ein Bild mit Händen, die ein grünes Schild mit der schwarzen Aufschrift „RECRAFT V3 TEST Nov. 2024“ halten. Links sind Optionen wie „Image“, „Frame“ und „Mockup“ zu sehen.

Learnings: AI Entwicklung

Die aktuellen Veröffentlichungen haben eine gemeinsame Entwicklungsrichtung: Frei nach Simon Szineks Golden Circle (What>How>Why) gehen die KI-Tools und Anbieter erste Schritte vom „What“ zum „How“. Die benutzten KI-Modelle mit den Billionen Parametern, der nativen Pixelauflösung und der korrekten Anzahl Finger (a.k.a. das „What“) werden austauschbar. Die Interfaces der Tools die angenehm und effizient zu bedienende Workflows für Kreative (a.k.a. das „How“) werden wichtiger.

Mit dem Oktober 2024 sieht es so aus, als könnten Interfaces mit Arbeitsfläche und Canvas für Kreative die Lösung sein, die professionelle art/creative direction für KI-generierte Medien ermöglicht ohne sich gleich im Kabelsalat von Comfy UI zu verheddern. Und in den nächsten Monaten erfolgt dann vielleicht der nächste große Schritt — Fokus auf das „Why“.

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Das könnte dich auch interessieren