IMPULS 04|24

Living Captions: Emotionen in Untertiteln abbilden

07.05.2024 von Antje Dohmann | Lesezeit: ca. 6 Minuten

Ob in Filmen, Games, Messenger-Apps oder Spotify-Lyrics: Untertitel sind visuell in der Regel nichtssagend. Mit Phont könnte sich das bald ändern, die Anwendung verbindet KI-gestützte Sprachanalyse mit Typografie und erweckt Untertitel so zum Leben

Anfangs nutzte das Phont-Team emotionale Kategorien nach dem Rad des US-amerikanischen Psychologen Robert Plutchik. Die Regler unten beziehen sich auf gemessene Stimmeigenschaften. Inzwischen arbeiten sie mit einem parametrischen Ansatz, der mehr Nuancen und Kombinationen erlaubt.

Es war einer der letzten Abende, an dem Frederik Merkel sich mit seinen Kommiliton:innen in einer Bar treffen konnte. Dann kam die zweite Welle Corona und der Rest seines Masterstudiums Gutenberg Intermedia an der Hochschule Mainz verlief online. In dieser Runde, in der zahlreiche Akzente und Dialekte vertreten waren, fragte sich der Designer, wie dieses vielfältige Stimmengewirr wohl als Schrift aussehen würden.

Das Thema Synästhesie, also die Kopplung verschiedener Sinneskanäle, erschien Frederik Merkel als sinnvoller Brückenschlag zwischen gesprochener Sprache und Typografie. Das Thema seiner Masterarbeit »A Synaesthetic approach to phonetics in type« war damit gefunden, der Grundstein zur Anwendung Phont gelegt.

Übersicht zeigt die verschiedenen Attribute und wovon sie beeinflusst wird. — Eine Stimme wird von vielen verschiedenen Attributen beeinflusst – konstanten und temporären. Im Idealfall würden alle diese Attribute in die Gestaltung der Untertitel einfließen.

Impuls: Doing KI

Analyse: Radical AI Design | Interview: KI-Recht | Geschäftsmodell: Untertitel, die Emotionen zeigen | KI in Motion: Identity für kultur{}botschaft | Workflow: Art Direktion mit KI | Making-Of: Journee AI Lens | PAGE Umfrage: Doing KI

Die Idee: Untertitel so vielfältig wie die Sprache

»Text stellt Sprache dar, vermittelt aber oft nur Inhalte«, sagt Frederik Merkel, der auch ein echter Film-Nerd ist. »Bei der Umwandlung von gesprochener Sprache in Text gehen wichtige Informationen wie Emotionen, Landessprachen oder Stimmmerkmale verloren.« Mittels KI-basierter Sprachanalyse, so seine Idee, sollten Emotionen Einzug in Untertitel halten und diese so lebendig und vielfältig werden wie die Sprache selbst.

TEAM Frederik Merkel, Paul Leo Langendörfer, Marcello Eiermann und Katharina Gresch, Frankfurt am Main, https://phont.ai
PROJEKT Entwicklung der Software Phont zur typografischen Darstellung von Sprache
LÖSUNG Eine selbst entwickelte KI analysiert gesprochene Sprache auf Emotionen und setzt diese in eine entsprechende typografische Darstellung um. So werden Untertitel lebendig und inklusiv.
TOOLS Eigene KI-Entwicklung zur Speech Emotion Recognition, Software für Parametric Design, Whisper, ChatGPT, Glyphs, Notion, After Effects
ZEITRAUM Thesis: Anfang 2022, Projektstart: Juni 2023, Phont-Gründung: November 2023

So geht's weiter

KI zur sprachlichen Emotionserkennung
Typografische Interpretation: Laut ist gleich fett
Designparameter für Untertitel: Testen, testen, testen
Inklusion fördern: Individuelle Einstellungen
Die Zukunft: Von Streaming bis TikTok

Du möchtest weiterlesen?

PAGE+ Test jetzt **3 Monate für nur 14,90 Euro* testen**

3 Monate unbegrenzter Zugriff auf alle PAGE+ Inhalte
PAGE-Update-Newsletter
3 x PAGE Impuls
1 PAGE Magazin frei Haus und digital als E-Paper
Digitales Heftarchiv bis 2012
Zusätzlich mehr als 100 eDossiers zu Spezialthemen
Newsletter Daily und Weekly

Jetzt testen!

*) danach 129,00 € im Jahresabo - monatlich kündbar Alle Abo-Angebote im Überblick

Living Captions: Emotionen in Untertiteln abbilden

Impuls: Doing KI

Die Idee: Untertitel so vielfältig wie die Sprache

Schreibe einen Kommentar

Das könnte dich auch interessieren

Sonamu: Wie ein Baum zum Ausgangspunkt dieses Kimchi-Brandings wurde

Nutzbarkeit überzeugt: Radio im »Einfach-Modus«

Move On Up: Karl Anders rebranded tecRacer

Lintel Next: Geometrisch, warm – und von Alvar Aalto inspiriert

Impuls Barrierefreiheit: Design verpflichtet!

»Visual Inclusivity profits everyone, it’s never just about one community«

Weitere Artikel zu diesem Thema

Creative Coding: Mini-Roboter für den Schreibtisch

Diese umwerfende Identity lässt Musik sehen: Collins …

Rechtssicher? Was ihr beim Einsatz von KI-Tools …

Sonamu: Wie ein Baum zum Ausgangspunkt dieses …

Nutzbarkeit überzeugt: Radio im »Einfach-Modus«

Move On Up: Karl Anders rebranded tecRacer

Living Captions: Emotionen in Untertiteln abbilden

Impuls: Doing KI

Die Idee: Untertitel so vielfältig wie die Sprache

PAGE+ Test jetzt 3 Monate für nur 14,90 Euro* testen

Schreibe einen Kommentar

Das könnte dich auch interessieren

Sonamu: Wie ein Baum zum Ausgangspunkt dieses Kimchi-Brandings wurde

Nutzbarkeit überzeugt: Radio im »Einfach-Modus«

Move On Up: Karl Anders rebranded tecRacer

Lintel Next: Geometrisch, warm – und von Alvar Aalto inspiriert

Impuls Barrierefreiheit: Design verpflichtet!

»Visual Inclusivity profits everyone, it’s never just about one community«

Weitere Artikel zu diesem Thema

Creative Coding: Mini-Roboter für den Schreibtisch

Diese umwerfende Identity lässt Musik sehen: Collins …

Rechtssicher? Was ihr beim Einsatz von KI-Tools …

Sonamu: Wie ein Baum zum Ausgangspunkt dieses …

Nutzbarkeit überzeugt: Radio im »Einfach-Modus«

Move On Up: Karl Anders rebranded tecRacer

PAGE+ Test jetzt **3 Monate für nur 14,90 Euro* testen**