Die neue Version des beliebten KI Tools verspricht akkuratere Bildkomposition und die genaue Umsetzung komplexer Prompts. Das müsst ihr wissen.
Prompt: close up portrait photography of an old woman wearing a red hood. thick white curly hair, knowing smile and dark eyes. dark forest scenery and branches. woman off center looking to the right, forest in the background. moody light, nighttime, moonlight. dark color palette of red and blue tones // Unser Learning: Während V5.2 die Bildästhetik priorisiert und auch unserem Subjekt oft ein weniger sichtbares Alter angedeihen lässt, hat V6 exakt unsere Beschreibung aufgenommen. Sogar die später eingefügte Anweisung für die Blickrichtung ist in den meisten Bildern deutlich sichtbar und die Lichtstimmung entspricht eher den Anforderungen im Prompt.
Midjourney V6 Alpha ist da, und wir haben über die Feiertage für euch gestestet. Midjourney veröffentlichte die neue Alpha Version am 21. Dezember. Seitdem hat das Team bereits einige Verbesserungen im Hintergrund vorgenommen, die Nutzer:innen aber nicht einzeln verkündet werden.
Wer bereits bei Midjourney eingeloggt ist, gelangt im Nachrichtenfeld mit dem Befehl /Settings zu einem Dropdown-Menü, in dem sich die neue Variante anwählen lässt.
Anders prompten für V6
Midjourney kündigte in einem Blogpost die verbesserten Funktionen des neuen Modells an. Im Fokus steht dabei V6 akkuratere Verarbeitung von komplexen Prompts.Midjourney hat dazu sogar einen Guide für die Zusammensetzung von Prompts herausgegeben, in denen man künftig auf umschreibende Worte verzichten soll, und genauere Angaben zu verschiedenen Bildfaktoren machen soll.
So beschreibt man für V6 zunächst den Stil oder eine Ära (Style) und das Subjekt selbst (Subject). Anschließend liefert man Midjourney Informationen zur Szenerie und Umgebung (Setting), der Bildkomposition und Anordnung von verschiedenen Bildebenen (Composition), Lichtstimmung oder Tageszeit (Lighting), und zum Schluss können zusätzliche Details eingegeben werden (Additional Info). Diese Faktoren können sollen durch Punkte voneinander abgetrennt und mit Kommata unterteilt werden.
Verbesserte Möglichkeiten zur Bildkomposition
Besonders beeindruckt hat bei unserem Test die Genauigkeit bei der Umsetzung der »Composition«. Während V5.2 bei komplexen Prompts oft nur das Subjekt akkurat umsetzt, lässt sich im V6 ganz genau beschreiben, wie das Subjekt im Bild steht und Bildinhalte lassen sich besser gewichten.
Zudem bringt V5.2 oftmals per Default schon eine bestimmte Ästhetik mit, V6 dagegen erzeugt nüchternere Ergebnisse. Wer verspielte Stile will, muss diese in V6 also ganz genau prompten, oder mit verschiedenen Zusatzbefehlen wie –crazy oder einem höheren Wert bei –stylize spielen, die Midjourney in den nächsten Wochen auf das neue Modell adaptieren wird. Aktuell sind nur begrenzte Parameter integriert. Neuere Features wie etwa /tune fehlen noch.
Prompt: oil pastell painting of a landscape with a horde of dragons flying over rolling green hills. majestic nature scenery with mountains and swamps. dragons in the distance, perspective from the bottom up, some plants in the foreground. dramatic lighting after a rainstorm. pink and yellow accents // Unser Learning: V5.2 stellt Drachen und Landschaft fast gleich gewichtet dar, nimmt aber die Perspektive aus dem Prompt gut auf. V6 dagegen setzt den Prompt akkurater um. Die Drachen sind im Hintergrund, und die Farbakzente übernehmen nicht das ganze Bild, sondern sind sparsamer eingesetzt.Prompt: digital illustration of a jellyfish swimming through an abandoned underwater city. jellyfish in the center, city in the background. soft gradient light, distinct light streaks through the water. small fish swimming around and in the background // Unser Learning: Bei Fantasy-Szenen dichtet V5.2 oft ein dramatischeres Setting und unrealistischere Bildelemente hinzu. V6 bleibt auch hier nahe am Prompt und nimmt vor allem die Hinweise zur Komposition gut auf. Spannend ist auch, dass das Unterwasser-Setting bei 5.2 meistens verloren geht, während es bei V6 in jedem Bild deutlich durch Lichtstimmung, Farbigkeit und Tiefenschärfe zur Geltung kommt.
Genauere Abbildung von Texten mit Midjourney
Ein weiteres Feature des neuen Modells ist die verbesserte Textdarstellung. Textinhalte soll man im Subjektpart des Prompts mit Anführungszeichen kennzeichnen und zusätzlich den –style Befehl auf –style raw setzen. Das schränkt Midjourneys Spielraum zur Ästhetisierung und damit Verfremdung des Bildinhalts ein und hilft so dabei, ein genaueres Textergebnis zu erzielen.
Wir haben dafür einen bewusst komplizierten Prompt mit zusätzlicher Szenerie entworfen und konnten im Vergleich zur vorherigen Version 5.2 eine Verbesserung feststellen( –style raw verbessert das Ergebnis in beiden Versionen deutlich). Man kann meistens nicht nur »page mag« lesen, sondern auch die die Typografie ist wie gewünscht bold und kommt in verschiedensten Familien daher.
Prompt: a poster saying “page mag” in big bold letters. the poster is hanging on a brick building wall. poster front and center, some art nouveau windows in the building facade in the background. daylight on a windy day. pedestrians pointing up at the poster –style raw // Unser Learning: Der zusätzliche Befehl –style raw verbessert bei beiden Modellversionen das Ergebnis. Allerdings sind bei V5.2. oft Buchstaben im Bild zu sehen, die nicht in unserem Prompt vorgegeben waren. Bei V6 ist das Ergebnis auch bei weitem noch nicht perfekt, oftmals aber schon gut zu lesen und richtig buchstabiert.
/imagine: KI in Branding und Design ++ How-to: KI in der Bewegtbildproduktion ++ 3D-Typo für AR, VR und Leitsystem ++ Step by Step: Variable Fonts animieren ++ ++ KI-Tools im Designprozess ++ Employer Branding: Talente anziehen und halten ++ KI und Hochschule ++ ENGLISH SPECIAL Leanne Shapton ++ Warum KI nicht nur ein weiteres Werkzeug ist ++ KI in der Bildbranche