PAGE online

Bildgenerierung direkt in ChatGPT: Tschüss Prompt Engineering?

Am Mittwoch kündigte OpenAI DALL·E 3 an. Das neue Modell soll direkt in ChatGPT Pro integriert werden und mit natürlicher Sprache bedienbar sein. Die ersten Tests sehen vielversprechend aus.

KI generiertes Bild zum Prompt:
Prompt:An illustration of a human heart made of translucent glass, standing on a pedestal amidst a stormy sea. Rays of sunlight pierce the clouds, illuminating the heart, revealing a tiny universe within. The quote ‘Find the universe within you’ is etched in bold letters across the horizon. Bild: OpenAI

Nachdem es die letzten Monate eher still um DALL·E war, präsentierte OpenAI gestern die dritte Generation des Modells – und zwar nativ in ChatGPT integriert. Damit kombiniert das Unternehmen erstmals generative Sprach-KI und Bildgenerierung in einem Tool.

Noch ist das Modell – genannt DALL·E 3 – nur für wenige Tester:innen zugänglich, ab Oktober soll das Modell allerdings fest in ChatGPT Pro integriert, und künftig auch per API in eigene Anwendungen eingesetzt werden können.

KI generiertes Bild zum Prompt:
Prompt: An illustration of an avocado sitting in a therapist’s chair, saying ‘I just feel so empty inside’ with a pit-sized hole in its center. The therapist, a spoon, scribbles notes. Bild: OpenAI

Was kann DALL·E 3?

Kurz gesagt, vereint das Tool ChatGPTs Funktion, im Dialog und mit natürlicher Sprache Ideen und Texte weiterzuentwickeln, mit DALL·Es Bildgenerierung in dritter Generation. So können Nutzer:innen entweder selbst Bildbeschreibungen umsetzen, oder mithilfe von ChatGPT Prompts generieren lassen, ohne das Tool zu wechseln.

Eine Ansicht, die zeigt, wie sich verschiedene Paragraphen des Prompts auf das generierte Bild auswirkenBild: OpenAI

DALL·E 3 soll dabei auf Bildebene einige Fortschritte gegenüber den älteren Modellen gemacht haben – vor allem, was Hände, Buchstaben und Zahlen angeht. Spannend dabei ist, dass das Tool auf längere Bildbeschreibungen ausgelegt ist und – zumindest in den ersten Beispielen – eine hohe Detailtreue in den generierten Ergebnissen aufweist. Deutlich wird das an den Bildbeispielen, die OpenAI mit den zugehörigen Prompts auf einer eigenen Landingpage veröffentlichte.

Grenzen setzt das Unternehmen dabei nur für sexuell explizite Inhalte, bekannte Persönlichkeiten und bestimmte Künstler:innen. Künftig soll es für Kreative, die ihre Werke oder ihren Stil schützen wollen, aber auch eine Opt-Out-Funktion geben.

Bye, Bye, Prompt Engineering?

Erst in PAGE 09.23 berichteten wir über das Berufsbild Prompt Engineer. Die Voraussage der Expert:innen, die wir im Artikel befragten, scheint sich zu bewahrheiten: der Begriff Prompt Engineering wird in Zukunft kaum noch eine Rolle spielen. Vielmehr wird die Interaktion mit KI immer selbstverständlicher in unsere täglichen Aufgaben integriert.

So bietet DALL·E 3 jetzt auch Nutzer:innen ohne dezidiertes Design-Fachwissen und -Jargon die Möglichkeit, Ideen visuell umzusetzen. Einzigartig ist dabei die gewohnte ChatGPT-Funktion iterativ an einem Bild zu arbeiten, sich auf bereits Generiertes zu beziehen und sich anschließend konsistent verschiedene Formate, Medien und Kommunikationsmittel generieren zu lassen.

KI generiertes Bild zum Prompt:
Prompt: In front of a deep black backdrop, a figure of middle years, her Tongan skin rich and glowing, is captured mid-twirl, her curly hair flowing like a storm behind her. Her attire resembles a whirlwind of marble and porcelain fragments. Illuminated by the gleam of scattered porcelain shards, creating a dreamlike atmosphere, the dancer manages to appear fragmented, yet maintains a harmonious and fluid form. Bild: OpenAI

Deutlich wird das in einer Video-Demo von OpenAI, die »Larry den Igel« als Character, in Stickerform und als Gute-Nacht-Geschichte zum Leben erwachen lässt, ohne dass auch nur ein Wort zum Style oder zu spezifischen Bildelementen fällt.

Die neue ChatGPT Funktion ist allerdings nicht nur für Laien interessant, sondern wird sicher auch für Kreative neue Workflows eröffnen – erste Tester:innen munkeln, dass die Qualität der generierten Bilder sogar an Midjourney heranreicht. Wir sind gespannt.

ki generiertes Bild: A vintage travel poster for Venus in portrait orientation. The scene portrays the thick, yellowish clouds of Venus with a silhouette of a vintage rocket ship approaching. Mysterious shapes hint at mountains and valleys below the clouds. The bottom text reads, 'Explore Venus: Beauty Behind the Mist'. The color scheme consists of golds, yellows, and soft oranges, evoking a sense of wonder.
Prompt: A vintage travel poster for Venus in portrait orientation. The scene portrays the thick, yellowish clouds of Venus with a silhouette of a vintage rocket ship approaching. Mysterious shapes hint at mountains and valleys below the clouds. The bottom text reads, ‘Explore Venus: Beauty Behind the Mist’. The color scheme consists of golds, yellows, and soft oranges, evoking a sense of wonder. Bild: OpenAI
KI generiertes Bild zum Prompt:An antique botanical illustration drawn with fine lines and a touch of watercolour whimsy, depicting a strange lily crossed with a Venus flytrap, its petals poised as if ready to snap shut on any unsuspecting insects.
Prompt:An antique botanical illustration drawn with fine lines and a touch of watercolour whimsy, depicting a strange lily crossed with a Venus flytrap, its petals poised as if ready to snap shut on any unsuspecting insects. Bild: OpenAI

 

 

Produkt: PAGE 2022-06
PAGE 2022-06
Creative AI nutzen ++ How-To: Interaktive Graphic Novel ++ Risographie in Motion ++ Nachhaltige Etiketten gestalten ++ Typographisches Storytelling ++ Interview Erik Marinovich ++ EXTRA Agen-tur- und Projektmanagementsoftware

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Das könnte dich auch interessieren