Dass wir dank Photoshop unseren Augen nicht mehr trauen dürfen ist bekannt. Dank neuen Technologien dürfen wir demnächst auch unsren Ohren kein Vertrauen mehr schenken.
Dank Photoshop und ähnlicher Software kann man Bildern ja schon länger nicht mehr über den Weg trauen. Manipulierte Bilder findet man überall. Von offensichtlichen Montagen, über glattere Haut und schlankeren Beinen bis hin zu manipulierten Radar- und Luftaufnahmen, die militärische Anlagen zeigen, die gar nicht da sind.
Daran haben wir uns schon langsam gewöhnt und gehen mit entsprechender Vorsicht heran. Dank neuer Technologien blüht uns wohl in naher Zukunft ähnliches mit Sprachaufnahmen.
Sprecher wird synthetisiert
Auf der Adobe Max 2016 hat Adobe VoCo vorgestellt. Eine Software im Prototypen-Stadium, die Audio-Aufnahmen manipulieren kann. Adobe VoCO (Voice Conversion / Stimmen Konvertierung) analysiert und verarbeitet Aufnahmen einer Stimme. Diese können einfach aus einem Gespräch stammen.
Es müssen also nicht spezielle Aufnahmen sein, die z.B. bestimmte Worte oder Phrasen enthalten. Aber sie müssen recht lang sein, derzeit um die 20 Minuten.
Das Programm zerlegt die Aufnahme in Phoneme und versucht ein Modell des Sprechers zu erstellen. Nach der Analyse kann man die Aufnahme dann in verschiedener Weise manipulieren. Vom Umsortieren der gesprochenen Worte bis hin zu neuen Worten und Sätzen. Vieles ist möglich.
Dabei muss man nicht die entsprechenden Abschnitte finden, ausschneiden und umsortieren, sondern gibt einfach per Text ein, was gesagt werden soll. Sowohl die gesprochenen Worte in anderer Reihenfolge, als auch neue Worte und Phrasen.
Die Software synthetisiert dann diese Worte mit der Stimme des analysierten Sprechers.
Noch ist das System nicht perfekt, aber schon verdammt überzeugend. Ein wenig synthetisch klingt es noch. Aber die Entwicklung steht ja auch noch am Anfang.
Könnte vielfältig missbraucht werden
Die Folgen einer solchen Software sind weitreichend. Sollte die Software einen Stand erreichen, dass die synthetisierte Sprache nicht mehr vom Original unterschieden werden kann, eröffnen sich ganz neue Möglichkeiten. Sowohl nützliche als auch gefährliche.
Eine solche Technologie ließe sich für zahlreiche Zwecke missbrauchen. Angefangen von nervenden Voicemails, über gefälschte Politikerstatements bis hin zur Überwindung von Sicherheitssystemen.
Adobe ist sich dessen bewusst und sucht nach Möglichkeiten, die erzeugten Audio-Dateien entsprechend zu kennzeichnen. Zum Beispiel mit digitalen Wasserzeichen.
Falls VoCo tatsächlich erscheint, wird es sicherlich Teil der Creative Suite werden. Dann kann man seine Podcasts und Videokommentare besser editieren. Oder aber mehr oder weniger unterhaltsamen Unfug treiben.
Pingback: Adobe zeigt Photoshop für Sound – Technikberater Blog