Gestohlene Stimmen? So bedroht KI einen ganzen Beruf

8 Min Lesezeit 8 min 20 Kommentare 20
Gestohlene Stimmen? So bedroht KI einen ganzen Beruf
No Ad to show

Synchronsprecher:innen haben einen ehrenwerten, kreativen Job. Aber wie in vielen Branchen stellen sie sich auch hier ängstlich die Frage: Wie lange noch, bis mir KI die Arbeit wegnimmt? Ich bin da innerlich zerrissen und sehe irgendwie beide Seiten der Medaille. In diesem Beitrag drösele ich Euch das Problem auf und verrate Euch auch, wie ich darüber denke.

Es ziehen düstere Wolken auf über der Zunft jener Menschen, die uns gekonnt unsere Filme aus dem Original in unsere Sprache übersetzen. Ja, in Deutschland schauen wir meistens – wie in vielen anderen Ländern auch – Serien und Filme, die in unserer eigenen Sprache synchronisiert sind. Viele andere Länder hingegen setzen auf Originale, in denen mit Untertiteln gearbeitet wird. In noch anderen Ländern wie Russland oder Polen wird oft einfach übers Original drübergequatscht – gerne auch mal nur eine Stimme für alle Rollen. 

No Ad to show

Synchronisierte Filme und Serien in Deutschland

Lange Rede, kurzer Sinn: In Deutschland läuft die Geschichte mit der Synchronisation auf absolut hohem Niveau. Das geht mitunter sogar so weit, dass die synchronisierten Fassungen zum Erfolg einer Serie beitragen. Bei "The Persuaders" beispielsweise, einer Serie, die in Deutschland als "Die Zwei" vor Jahrzehnten lief, war der Erfolg durch die witzige Synchro hierzulande sogar deutlich größer als im englischen Original. Auch Bud-Spencer- und Terence-Hill-Filme sind für ihre gelungene, lustige Synchronisation bekannt. 

Jetzt scheint aber ein Wendepunkt erreicht zu sein. Auch beim Film hält KI Einzug und logischerweise wird darüber nachgedacht, auch die Stimmen einfach durch künstliche Intelligenz zu ersetzen. Das ist kein rein deutsches Problem, aber zumindest regt sich hierzulande Widerstand. Mehrere Synchronsprecher:innen haben sich zusammengetan und protestieren nun dagegen, dass ihnen quasi die Stimmen geklaut werden. Schaut Euch dazu am besten folgenden Clip vom Verband Deutscher Sprecher:innen e.V. (VDS) an:

Über 300.000 Aufrufe hat dieses Video bekommen und fast tausend, oft höchst emotionale Kommentare eingesammelt. Auch dieses TikTok-Video mehrerer deutscher Synchron-Sprecher:innen ging viral. Daraus lässt sich schon ablesen, dass all diese Synchron-Schauspieler:innen ihre Arbeit mit sehr viel Herz erledigen – und viele Menschen mit ebenso viel Herz fordern, dass diese Stimmen auch zukünftig ihren Job nicht an eine KI verlieren. Vermutlich könnt Ihr Euch denken, dass auf diese Worte ein "aber" folgt.

No Ad to show

Das nahende Ende der Synchronsprecher:innen?

Und hier ist auch schon das fette "aber": Was, wenn eine KI eine Stimme eben doch so gut sprechen könnte, wie es das menschliche Original vermag? Aktuell ist das noch schwierig, wie Viaplay jüngst feststellen musste. Das Unternehmen wollte seine polnische Serie "Murderesses" in einer "Hybrid AI"-Übersetzung nach Deutschland bringen. Es gibt also ein paar Hauptdarsteller, die klassisch synchronisiert werden, während viele kleinere Rollen vom israelischen Start-up Deepdub übernommen wurden. Das ging so furchtbar schief, dass das ausstrahlende Magenta TV die Serie nach nur zwei Folgen vom Netz nahm

Aber nochmal zurück zu unserer Annahme von eben: Was, wenn eine KI eine menschliche Stimme eben doch perfekt umsetzen könnte? Wieso können wir ernsthaft glauben, dass eine synthetische Stimme so etwas wie Gefühle und Empathie eben nicht doch simulieren kann? Schaut Euch an, welche Quantensprünge generative KI in den letzten zwei Jahren hingelegt hat. Wenn eine synthetische Stimme heute also eher noch mäßig klingt, bedeutet das keineswegs, dass das auch in einem halben Jahr noch gilt. 

Die KI bringt die üblichen Vorteile mit: Die Arbeit wird schneller, zuverlässiger und natürlich auch viel günstiger erledigt. Aber die KI beherrscht auch einen Trick, den die menschlichen Pendants nicht drauf haben ...

Klingt Deadpool bald auf der ganzen Welt wie Ryan Reynolds?

Künstliche Intelligenz spricht nämlich zufällig einfach alle Sprachen der Welt. Das bringt mich zum nächsten Problem der deutschen Synchron-Riege: Was, wenn wir in Deutschland zwar gerne echte Stimmen hätten, uns aus den USA aber bereits eine perfekt synchronisierte KI-Fassung ins Haus schneit? Ryan Reynolds wird in Deutschland von Dennis Schmidt-Foß gesprochen, der zudem auch Chris Evans (Captain America) oder Michael C. Hall (Dexter) seine Stimme leiht. 

Wir sind natürlich an den Sound seiner Stimme gewöhnt, aber er klingt nun einmal anders als Ryan Reynolds. KI kann dafür sorgen, dass Ryan künftig weltweit mit seiner eigenen Stimme zu hören ist. Das ist etwas, was ein noch so begabter Künstler wie Schmidt-Foß nicht bieten kann.

No Ad to show

Eine KI-Stimme hat zudem noch weitere Vorteile: Oft wird nach dem Dreh festgestellt, dass eine Szene neu nachvertont werden muss. Als Beispiel kommt mir da direkt der Film "Fall" in den Sinn. Zwei Frauen hängen auf einem 600 Meter hohen Turm fest – und fluchen dort eifrig. Leider fiel das F-Wort so oft (30-mal), dass der Film das angepeilte PG-13-Rating nicht erhalten hätte. Diese Altersfreigabe ist aber wichtig, wenn möglichst viele Menschen den Film im Kino sehen sollen. 

Also wurde mittels der TrueSync-Technik des Unternehmens Flawless noch einmal Hand angelegt: Die Damen sagen jetzt sowas wie "freaking" statt "fuck" und dank moderner Technik ist das alles auch absolut lippensynchron und viel günstiger als kostspielige Nachdrehs am Original-Set. Seht – und hört – selbst: 

Am Ende spricht die Schauspielerin sogar Japanisch und Spanisch und all das absolut lippensynchron. Ehrlich gemeinte Frage: Habt Ihr das Gefühl, dass bei den Versionen in anderen Sprachen weniger Gefühl herüberkommt? Auf mich wirkt das zumindest alles schon ziemlich perfekt. 

Wir haben jetzt also sehr talentierte, hochprofessionelle, aber eben auch gut bezahlte Profis, die diese Filme synchronisieren auf der einen Seite. Gleichzeitig stehen KI-Tools bereit, die all das günstiger, schneller und in allen gewünschten Sprachen erledigen. Tools, die den Schauspieler oder die Schauspielerin überall weltweit mit einer Stimme sprechen lassen, und bei denen im Handumdrehen auch Nachvertonungen lippensynchron erledigt werden.

No Ad to show

Ganz ehrlich, Freunde: Da gehen mir langsam die Argumente aus, wieso künftig eben nicht die KI diesen Job machen sollte. Kann sein, dass da also eine Berufsgattung und eine Kunstform vor dem Aussterben steht. Das sind Schicksale und mitunter ist die Entwicklung existenzbedrohend. Aber seid ehrlich: Ihr seht in Euren Städten auch kaum noch Fassmacher oder Droschkenkutscher oder Laternenanzünder und lebt damit auch ganz gut, oder? 

Okay, eine Sache wäre da noch ...

Es fehlt hier noch ein wichtiger Aspekt, den wir nicht unterschlagen dürfen: Was ist es eigentlich den Unternehmen mit den gut trainierten Modellen wert, dass sie ebenjenen Modellen das Reden mithilfe echter Stimmen beibringen konnten? Dass Midjourney so wundervolle Bilder zaubern kann, liegt nun mal daran, dass die KI mit Millionen oder gar Milliarden Bildern gefüttert wurde. Ähnlich ist es bei der Stimme. Auch hier muss das Modell immer und immer wieder unzähligen Stimmen lauschen, um schließlich auch wie ein Mensch klingen zu können. 

Vielleicht habt Ihr ja von dem 2024 gestarteten großen Streik des Verbandes SAG-AFTRA (Screen Actors Guild – American Federation of Television and Radio Artists) in den USA gehört. Die Gewerkschaft betont die Notwendigkeit klarer Regelungen, um sicherzustellen, dass die Stimmen der Schauspieler:innen nicht ohne ihre Zustimmung und faire Entlohnung durch KI-Technologien verwendet werden. ​

Hier bin ich klar auf der Seite der Gewerkschaft. Es darf nicht sein, dass Synchronsprecher:innen für einen Tag gebucht und bezahlt werden, nur damit auf dieser Basis ein KI-Modell mit der Stimme trainiert – und dann bis zum jüngsten Tag weiter verwendet wird, ohne dass der Mensch mit dieser Stimme noch einen weiteren Cent sieht. 

Wir brauchen faire Lizenzmodelle, bei denen die Künstler:innen angemessen dafür honoriert werden, dass Ihre Stimmen im Film, in Serien, vor allem aber auch in der Werbung und in Computerspielen genutzt werden. 

No Ad to show

Mein persönliches Fazit

Lasst mich zum Ende kommen. Ich sagte ja eingangs, dass ich innerlich zerrissen bin. Daran hat sich auch im Laufe dieses Textes nichts geändert. Ich möchte nach wie vor, dass Voice Actors für ihre Kunst angemessen bezahlt werden. Das muss beinhalten, dass diese Leute anteilig dafür honoriert werden, dass Sprachmodelle mithilfe ihrer Stimmen trainiert wurden. Außerdem muss jedes Mal Geld fließen, wenn eine explizit einem Schauspieler oder einer Schauspielerin zuzuordnende Stimme in einem Computerspiel oder sonst wo zum Einsatz kommt. 

Aber ganz ehrlich: Ich hab ja die Vorteile der KI alle genannt. Wenn eine Computerstimme Emotionen ebenso transportieren kann wie ein Mensch – wie will man da verhindern, dass mehr und mehr Unternehmen in der Filmindustrie auf die praktischere, günstigere und schnellere KI-Technologie zurückgreifen? Für uns in Deutschland hätte das ja auch den Vorteil, dass wir ein Schauspieler-Leben lang immer derselben Stimme lauschen dürften. Wir müssten nicht damit leben, dass Lieutenant Columbo mehrmals eine neue deutsche Stimme erhielt, und auch Homer Simpson heute anders klingt als die Jahrzehnte zuvor. 

Machen wir uns nichts vor: Es wird hier schon in absehbarer Zeit viele Menschen erwischen, die uns mit ihrer Arbeit, ihrer Kunst viel Freude gemacht haben. Aber zur Wahrheit gehört, dass KI unsere kompletten Leben umkrempeln wird und uns da auch sehr viele Jobs flöten gehen. Glaubt mal, dass sich der Verfasser dieser Zeilen darüber im Klaren ist, dass das Damoklesschwert auch über ihm und dem Beruf des Tech-Redakteurs baumelt. Genau deswegen will ich ja auch von jedem von Euch, dass Ihr Euch lieber heute als morgen auf KI einlasst: Weil wir im Verbund mit künstlicher Intelligenz eher unsere Jobs sichern als durchs Tragen von Scheuklappen!

Lasst uns gerne in den Kommentaren darüber reden, wie Ihr der Sache gegenübersteht. Ist KI schon so weit, um zu übernehmen? Oder seid Ihr aus ethischen Gründen generell dagegen oder schaut einfach eh nur Filme im Original? 

No Ad to show
No Ad to show
MEHR ANZEIGEN

Kommentare

Kommentare

Beim Laden der Kommentare ist ein Fehler aufgetreten.

No Ad to show