PAGE online

/tune: Endlich konsistente Stile in Midjourney generieren?

Seit wenigen Tagen ist Midjourneys neuer Style Tuner verfügbar. Wir haben ihn für euch getestet und erklären, wie das Feature funktioniert.

Ein junges Mädchen in einem leuchten pinkfarbenen rock steht auf einer KlippeWer mit Midjourney arbeitet weiß, wie viel Arbeit es machen kann, verschiedene Bilder im selben Stil zu generieren. Die meisten Kreativen haben dafür bereits eigene Workarounds gefunden, doch Midjourneys neuestes Feature könnte die konsistente Bildgenerierung deutlich verbessern.

Gleichbleibender Bildstil mit Creative AI

Der Befehl /tune ist eine Möglichkeit, den Bildstil anhand eines bestimmten Prompts zu verfeinern und eine spezifische ID für den generierten Stil zu erzeugen, die auch im Prompt für andere Bilder verwendet werden kann.

Diesen Stil »erlernt« Midjourney über die wiederholte Auswahl zwischen zwei Stilrichtungen. Bis zu 128 solcher Stilpaare zur Auswahl kann Midjourney auf einen Schlag generieren, und die Auswahl der Nutzer:innen zu einer einzigen Stilvorgabe verschmelzen – etwa wie ein Lightroom Preset.

Step by Step Tutorial: Midjourney /tune benutzen

  1. Zunächst startet ihr wie gewohnt im Midjourney Discord und fügt dem Befehl /tune einen Startprompt hinzu. Dieser dient als Basis für den neuen Style Tuner und kann bereits sehr spezifisch werden. Wer allerdings nur eine Bildidee hat und nach Inspiration für einen Stil sucht, kann – wie wir im Test – einen einfachen Prompt verwenden.
  2. Im zweiten Schritt stellt ihr die Anzahl an Stilfragen ein. Wir sind mit 16 gestartet. Dabei gilt es zu beachten, dass Midjourney für das Erstellen eines neuen Style Tuners kräftig Fast Hours berechnet. Die Funktion sollte also mit Bedacht eingesetzt werden. Nach dem Start des Vorgangs braucht Midjourney etwa zwei Minuten, um die Varianten zu erstellen.Das Interface für die Einstellungen des Style Tuners in Midjourney zeigt Felder an, in denen man die Anzahl der Varianten und den Modus einstellen kann
  3. Midjourney präsentiert nun einen Link zu einem Webinterface, auf dem alle Varianten zu sehen sind. Per default wird eine Style Comparison angezeigt, in der jede Reihe zwei Stile (in Form der gewohnten vier Midjourney-Varianten) präsentiert, zwischen denen es zu entscheiden gilt. Je mehr dieser Stilfragen beantwortet werden, desto genauer kann Midjourney den finalen Stil ermitteln. Man sollte aber nur die Bilder anwählen, die auch wirklich zur Vision passen.
    Alternativ kann man sich die Stilpaare auch in einem vereinfachten Grid anzeigen lassen. Wir empfehlen aber die Style Comparison Ansicht, da dabei alle Facetten einer Variante deutlich werden, was das Endergebnis berechenbarer macht.

    zwei screenshots aus dem interface, links mit der Stilgegenüberstellung, rechts mit den Bildern im Grid
    Die beiden verschiedenen Auswahlmöglichkeiten im Style Tuner unterscheiden sich vor allem durch die Ansicht der generierten Stilfragen. Links sieht man zwei Stile im direkten Vergleich und mit je vier Bildern. Rechts im Grid-Modus lassen sich die Bilder besser im Überblick behalten, aber die verschiedenen Facetten einer Stilvariante sind schwerer abzuschätzen

  4. Ganz unten im Interface findet ihr einen von Midjourney generierten Text aus eurem Basisprompt und einer Style ID. Dieser lässt sich nun als Prompt mit /imagine im Midjourney Discord umsetzen, um das gewünschte Bild zu erzeugen.
  5. Wer weitere Bilder im selben oder ähnlichen Bildstil braucht, kann nun die Style-ID zu jedem beliebigen Prompt hinzufügen. Die Konsistenz der Ergebnisse schwankt allerdings immer noch leicht, je nachdem, wie genau man im Style Tuner war. Dieser lässt sich aber über den von Midjourney generierten Link immer wieder benutzen und nachjustieren. Unseren Style Tuner findet ihr unter diesem Link und unsere Ergebnisse sind mit den jeweiligen Style-IDs versehen. Viel Spaß beim ausprobieren!
drei Bilder im selben Bildstil, die sehr starke unterschiede zeigen
–style eo4uMpBPkuN Hier haben wir nur wenige der Stilfragen im Style Tuner beantwortet. Die Ergebnisse für die drei Testprompts sind noch sehr unterschiedlich, doch die Bandbreite an vorgeschlagenen Variationen ist interessant.
drei Bilder im selben Bildstil, die relativ starke unterschiede zeigen
–style mCTYtNxJ37  In diesem Versuch haben wir etwa die Hälfte der Stilfragen beantwortet. Dabei ist schon ein einheitlicher Stil über alle Prompts hinweg erkennbar, nur das Portrait fällt im Detailgrad heraus.
drei Bilder im selben Bildstil, die kaum unterschiede zeigen
–style ehZzSQtGy7z Im letzten Versuch haben wir fast alle Stilfragen beantwortet und nur diejenigen Bildpaare ausgelassen, die absolut gar nicht zum gewünschten Stil passten. Die Ergebnisse sind beeindruckend konsistent in Lichtstimmung und Stil.

 

Produkt: PAGE 2024-01
PAGE 2024-01
KI-Geschäftsmodelle für Kreative ++ Scrollytelling für Branding und Infotainment ++ Studie: Designfähigkeit in Unternehmen ++ Making-of: Die Metaversity im Siemens-Intranet ++ Kollaboration in Zeiten von KI ++ ENGLISH SPECIAL Studio Birthplace ++ Mara Recklies über KI in der Designforschung

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Das könnte dich auch interessieren