PAGE online

Ausprobiert: Midjourney V6 Alphas neue Promptstruktur

Die neue Version des beliebten KI Tools verspricht akkuratere Bildkomposition und die genaue Umsetzung komplexer Prompts. Das müsst ihr wissen.

zwei sets aus je vier Bildern von Midjourney KI generiert.Alle Bilder zeigen eine ältere Frau im Wald mit einer roten Kapuze. links sind die Bilder wärmer beleuchtet und die Frau wirkt jünger. rechts schaut die Frau meistens nach oben rechts und wirkt älter und mysteriöser
Prompt: close up portrait photography of an old woman wearing a red hood. thick white curly hair, knowing smile and dark eyes. dark forest scenery and branches. woman off center looking to the right, forest in the background. moody light, nighttime, moonlight. dark color palette of red and blue tones // Unser Learning: Während V5.2 die Bildästhetik priorisiert und auch unserem Subjekt oft ein weniger sichtbares Alter angedeihen lässt, hat V6 exakt unsere Beschreibung aufgenommen. Sogar die später eingefügte Anweisung für die Blickrichtung ist in den meisten Bildern deutlich sichtbar und die Lichtstimmung entspricht eher den Anforderungen im Prompt.

Midjourney V6 Alpha ist da, und wir haben über die Feiertage für euch gestestet. Midjourney veröffentlichte die neue Alpha Version am 21. Dezember. Seitdem hat das Team bereits einige Verbesserungen im Hintergrund vorgenommen, die Nutzer:innen aber nicht einzeln verkündet werden.

Wer bereits bei Midjourney eingeloggt ist, gelangt im Nachrichtenfeld mit dem Befehl /Settings zu einem Dropdown-Menü, in dem sich die neue Variante anwählen lässt.

ein screenshot aus dem midjoureny interface, der das dropdownmenü mit den Einstellungen zeigt

Anders prompten für V6

Midjourney kündigte in einem Blogpost die verbesserten Funktionen des neuen Modells an. Im Fokus steht dabei V6 akkuratere Verarbeitung von komplexen Prompts. Midjourney hat dazu sogar einen Guide für die Zusammensetzung von Prompts herausgegeben, in denen man künftig auf umschreibende Worte verzichten soll, und genauere Angaben zu verschiedenen Bildfaktoren machen soll.

So beschreibt man für V6 zunächst den Stil oder eine Ära (Style) und das Subjekt selbst (Subject). Anschließend liefert man Midjourney Informationen zur Szenerie und Umgebung (Setting), der Bildkomposition und Anordnung von verschiedenen Bildebenen (Composition), Lichtstimmung oder Tageszeit (Lighting), und zum Schluss können zusätzliche Details eingegeben werden (Additional Info). Diese Faktoren können sollen durch Punkte voneinander abgetrennt und mit Kommata unterteilt werden.

midjourneys prompt Anleitung

Verbesserte Möglichkeiten zur Bildkomposition

Besonders beeindruckt hat bei unserem Test die Genauigkeit bei der Umsetzung der »Composition«. Während V5.2 bei komplexen Prompts oft nur das Subjekt akkurat umsetzt, lässt sich im V6 ganz genau beschreiben, wie das Subjekt im Bild steht und Bildinhalte lassen sich besser gewichten.

Zudem bringt V5.2 oftmals per Default schon eine bestimmte Ästhetik mit, V6 dagegen erzeugt nüchternere Ergebnisse. Wer verspielte Stile will, muss diese in V6 also ganz genau prompten, oder mit verschiedenen Zusatzbefehlen wie –crazy oder einem höheren Wert bei –stylize spielen, die Midjourney in den nächsten Wochen auf das neue Modell adaptieren wird. Aktuell sind nur begrenzte Parameter integriert. Neuere Features wie etwa /tune fehlen noch.

zwei sets aus je vier Bildern von Midjourney KI generiert. Alle Bilder zeigen eine fantasie-landschaft mit Drachen über grünen Hügeln. links haben die Bilder deutlich mehr Prosatöne und die Drachen sind kaum zu erkennen. rechts fliegen die Drachen im Hintergrund auf den Horizont zu
Prompt: oil pastell painting of a landscape with a horde of dragons flying over rolling green hills. majestic nature scenery with mountains and swamps. dragons in the distance, perspective from the bottom up, some plants in the foreground. dramatic lighting after a rainstorm. pink and yellow accents // Unser Learning: V5.2 stellt Drachen und Landschaft fast gleich gewichtet dar, nimmt aber die Perspektive aus dem Prompt gut auf. V6 dagegen setzt den Prompt akkurater um. Die Drachen sind im Hintergrund, und die Farbakzente übernehmen nicht das ganze Bild, sondern sind sparsamer eingesetzt.
zwei sets aus je vier Bildern von Midjourney KI generiert. Alle Bilder zeigen eine Qualle in einer versunkenen Stadt Links in der version 5.2 sind die färben deutlich stilisierter, rechts ist die Bildkomposition klarer.
Prompt: digital illustration of a jellyfish swimming through an abandoned underwater city. jellyfish in the center, city in the background. soft gradient light, distinct light streaks through the water. small fish swimming around and in the background // Unser Learning: Bei Fantasy-Szenen dichtet V5.2 oft ein dramatischeres Setting und unrealistischere Bildelemente hinzu. V6 bleibt auch hier nahe am Prompt und nimmt vor allem die Hinweise zur Komposition gut auf. Spannend ist auch, dass das Unterwasser-Setting bei 5.2 meistens verloren geht, während es bei V6 in jedem Bild deutlich durch Lichtstimmung, Farbigkeit und Tiefenschärfe zur Geltung kommt.

Genauere Abbildung von Texten mit Midjourney

Ein weiteres Feature des neuen Modells ist die verbesserte Textdarstellung. Textinhalte soll man im Subjektpart des Prompts mit Anführungszeichen kennzeichnen und zusätzlich den –style Befehl auf –style raw setzen. Das schränkt Midjourneys Spielraum zur Ästhetisierung und damit Verfremdung des Bildinhalts ein und hilft so dabei, ein genaueres Textergebnis zu erzielen.

Wir haben dafür einen bewusst komplizierten Prompt mit zusätzlicher Szenerie entworfen und konnten im Vergleich zur vorherigen Version 5.2 eine Verbesserung feststellen( –style raw verbessert das Ergebnis in beiden Versionen deutlich). Man kann meistens nicht nur »page mag« lesen, sondern auch die die Typografie ist wie gewünscht bold und kommt in verschiedensten Familien daher.

zwei sets aus je vier Bildern von Midjourney KI generiert. Alle Bilder zeigen die Worte page mag auf einem großen poster an einer Hausfassade. links sind die Worte meistens zum zu lesen. rechts dagegen kann man sie gut entziffern
Prompt: a poster saying “page mag” in big bold letters. the poster is hanging on a brick building wall. poster front and center, some art nouveau windows in the building facade in the background. daylight on a windy day. pedestrians pointing up at the poster –style raw // Unser Learning: Der zusätzliche Befehl –style raw verbessert bei beiden Modellversionen das Ergebnis. Allerdings sind bei V5.2. oft Buchstaben im Bild zu sehen, die nicht in unserem Prompt vorgegeben waren. Bei V6 ist das Ergebnis auch bei weitem noch nicht perfekt, oftmals aber schon gut zu lesen und richtig buchstabiert.
PDF-Download: PAGE 11.2023

/imagine: KI in Branding und Design ++ How-to: KI in der Bewegtbildproduktion ++ 3D-Typo für AR, VR und Leitsystem ++ Step by Step: Variable Fonts animieren ++ ++ KI-Tools im Designprozess ++ Employer Branding: Talente anziehen und halten ++ KI und Hochschule ++ ENGLISH SPECIAL Leanne Shapton ++ Warum KI nicht nur ein weiteres Werkzeug ist ++ KI in der Bildbranche

9,90 €
AGB

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Das könnte dich auch interessieren