PAGE online

Stable Audio: Musik und Soundeffekte mit generative AI

Stability AI bringt ein neues Tool auf den Markt: Stable Audio generiert kostenlos Songs, Instrumentklänge und Soundeffekte aus Textprompts

die Startseite der stable ai websiteNach Bild, Video und Sprachgenerierung war es nur eine Frage der Zeit, bis sich Stability AI der Musik widmet. Das neue Tool Stable Audio ist in zwei Lizenzmodellen verfügbar und erlaubt die Komposition kurzer Songs mittels einer Textbeschreibung.

Kommerziell nutzbare Sounds generieren

Stable Audio funktioniert ganz ähnlich wie gängige KI-Tools. Ein schlichtes Interface mit einem Texteingabefeld ermöglicht die Interaktion mit Model. Pro Nutzer:innen können zusätzlich auch die Dauer des generierten Stücks definieren. Bis zu 90 Sekunden sind möglich, Nutzer:innen der Free-Variante generieren maximal 45 Sekunden.

Nach Start eines Generations-Vorgangs dauert es nur wenige Sekunden, bis man die ersten selbst beschriebenen Töne anhören und als mp3-Format downloaden kann.

ein gif aus den ladescreens für die zu generierenden audios

Pro Nutzer:innen steht zudem die Option als WAV-Download offen. Sie können monatlich bis zu 500 generierte Lieder, Soundeffekte und Töne für rund 12 Dollar pro Monat uneingeschränkt kommerziell nutzen. Free-User können maximal 20 Prompts im Monat eingeben und dürfen die Ergebnisse nur als Samples in eigenen, nichtkommerziellen Projekten einsetzen.

das interface der stable audio ki mit einem prompteingabefeld und einem wartescreen

Training des Modells

Das Musik-Tool basiert auf Stability-AI-Technik und einem Latent Diffusion Model, das – nach Zustimmung der Interpret:innen – mit Sounddaten und Metabeschreibungen von AudioSparx trainiert wurde. Über 800.000 Audio Files mit insgesamt rund 19.000 Stunden Dauer stecken hinter Stable Audio und ermöglichen so fast unendliche Möglichkeiten für den Output. Künftig plant Stability AI zusätzlich ein Modell, das mit Open Source Daten trainiert werden soll.

Wer sich im Detail für den Trainingsprozess und die Funktion des Modells interessiert, findet weitere Informationen dazu in einem Blogbeitrag des Stability-AI-Forschungs-Teams.

eine liste an Beispielen aus prompt und audiofile

Sound Prompting: So funktioniert´s

In der Handhabung ist das Modell ganz einfach und ein Guide unterstützt Einsteiger:innen bei der Formulierung ihrer Prompts. Detailtiefe, Angaben zu Tempo, Emotion und Instrumenten helfen dabei, ein genaueres Ergebnis zu erzeugen. Beispiele aus Prompt und Soundergebnis findet ihr auf der Stable Audio Website.

der quick guide von stable audio zeigt tipps to prompts, Lizenzen, Nutzung und generierungsoptionen

Bei ersten Tests haben wir festgestellt, dass kurze Prompts deutlich besser funktionieren. So lassen sich verschiedenste Sounds und Songs erzeugen, die oft schon ziemlich professionell klingen. Schwierigkeiten hat das Modell allerdings, wenn im Song ein Tempowechsel stattfinden soll, die musikalische Szenerie wechselt, oder Stimmen vorkommen.

Für Kreative ist es trotzdem schon jetzt einen Test wert, denn es könnte die langwierige Suche nach Stock-Sounds verkürzen und bei der Vermittlung zwischen Branddesigner:innen und Sounddienstleistern helfen. Was meint ihr – sollte PAGE einen eigenen Jingle haben?

Produkt: PAGE Edition 2024-03
PAGE Edition 2024-03
Co-Creation: Cases & Tipps ++ UX-Design-Trends 2025 ++ Emotion in Design & Branding ++ ENGLISH SPECIAL Nice and Serious ++ Weite, Wald & Wildnis ++ Empathie im UX Design ++ Making-of: Balkenschrift ++ Report: KI lernen ++ XR-Erlebnis »Goldbergs Traum« ++ Co-Creation: Cases & Tipps

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Das könnte dich auch interessieren