„Wir haben bereits die Foto-Bearbeitung revolutioniert, nun wollen wir dasselbe für Audio Zeug machen“. Mit diesen Worten beendet Adobe-Entwickler Zeyu Jin seine Präsentation auf der Adobe Max Konferenz in San Diego, das das Publikum mit einer Mischung aus Begeisterung und Ehrfurcht zurücklässt. Es ist jenes Gefühl, dass man bekommt, wenn man zum ersten Mal eine neue Technologie sieht, von der man spürt, dass sie revolutionär sein könnte, deren Folgen man aber noch nicht so recht absehen kann.
Adobe hat gerade das Projekt VoCo vorgestellt, eine Software, die es ermöglichen soll, Sprachaufzeichnungen kinderleicht zu bearbeiten. Zeyu Jin hat dafür ein Sprach-Sample des US-Komikers Jordan Peele genommen, in dem er sagt: „Ich habe meine Hunde und meine Frau geküsst.“
Jin verändert die Aufnahme mit VoCo in einem Text-Editor. Er löscht einfach ein paar Worte raus, tippt ein paar neue Worte ein und am Ende hört man auf der Tonspur: „Ich habe Jordan 3 Mal geküsst“. Die Stimme klingt dabei gar nicht künstlich oder roboterhaft, auf den ersten „Blick“ ist sie tatsächlich nicht von der Originalstimme des Komikers zu unterscheiden.
Am besten ihr schaut euch die Präsentation selbst einmal an:
Man kann sich natürlich viele tolle Einsatzmöglichkeiten für eine solche Software vorstellen, etwa bei der Nachbearbeitung von Podcasts oder Audiobooks, wo man Fehler quasi auf Knopfdruck korrigieren könnte, ohne Sätze komplett neu einzusprechen.
Andererseits ist es auch ein wenig erschreckend, wie leicht es ist, mit so einer Software Sprachaufzeichnungen zu manipulieren. Laut Adobe soll ein 20-minütiges Sprach-Sample ausreichen, um Stimmen fast perfekt zu imitieren und sie beliebige Texte aussprechen zu lassen.
Natürlich ist es schon lange möglich, Audio und sogar Video Dateien nach Gutdünken zu manipulieren, wenn man über entsprechende Software und Know-How verfügt. Auch die Fotomontage hat ja nicht erst mit Photoshop begonnen. Aber je leichter die Technologie solche Manipulationen macht, umso mehr drohen die Grenzen zwischen Wahrheit und Fälschung zu verschwimmen und umso zugänglicher sind die Werkzeuge auch für Betrug und Propaganda.
Adobe ist sich dieser Risiken durchaus bewusst. Das Unternehmen arbeitet laut eigener Aussage an einer Art „akkustischem Wasserzeichen“, mit dem man Originalaufnahmen kennzeichnen und von Fälschungen unterscheiden kann. Wie effektiv das in der Praxis ist, wird wohl die Zukunft zeigen.
Nach der VoCo Präsentation springt das Versuchskaninchen Peele auf und ruft „Du bist eine Hexe!“ und später „Wenn diese Technologie in die falschen Hände gerät…“. Es ist wohl scherzhaft gemeint, aber ein Hauch ernsthafter Sorge scheint da durchaus mitzuschwingen.
Was haltet ihr von Adobes Projekt #VoCo? Macht ihr euch Sorgen um Betrug und Fälschungen? Sagt uns eure Meinung in den Kommentaren.
via SPON
Da ich persönlich nicht mit solchen spezialisten Tools arbeite, verbinde ich damit nur eine Hoffnung:
Das es als Store-App kommt und nicht mehr als klassische .exe-Programm.
Naja hoffen wir mal… Gezeigt wurde es auf nem mac…
Warum als Store App? Das muss ja nun wirklich nicht sein.
Manipulationen wird es ganz sicher geben
Ich weis noch nicht genau was ich davon halten soll… Auf der einen seite ist es wahnsinnig cool das das möglich ist und es würde sicher situationen geben in denen das sinnvoll und nützlich ist aber die gefahr das es für falsche Dinge genutzt wird ist schon sehr hoch. Ich frage mich auch wie so ein wasserzeichen aussehen soll. Denn es soll ja auch nicht stören wenn man es sinnvoll verwenden will…?
Man kann das Wasserzeichen auf Frequenzen legen ,die der Mensch nicht hören kann.
Warum nicht, schöne Zukunft, Photoshop everywhere. Wenn dann das gefakte Bild noch mit der gefakten Stimme verbunden werden kann, machen wir uns unsere heile Welt und schauen im dunklen Kämmerlein durch die virtuelle Brille. Was kümmert dann noch der asoziale Nachbar ?
Im Grunde finde ich es toll, jetzt kommt es drauf an, wie es genutzt wird.
Was nützt da ein Wasserzeichen, wenn man die manipulierte Audio-Datei nicht kopiert, sondern wieder auf herkömmliche Art und Weise aufnimmt. Solch eine Software öffnet dem geplanten Verbrechen Tür und Tor. Ein Anruf beim verhassten Mitmenschen, der 20 Minuten dauert, aufgenommen und schon kann ein ambitionierter Tonkünstler daraus dem Mitmenschen ziemlichen schaden zufügen.
Im Grunde genommen ein tolles Projekt, aber ………..
Eine sehr effektive Methode der Manipulation ist nach wie vor, Aussagen aus dem Kontext zu reißen. Dadurch wurde schon so mancher Rufmord durch die Presse begangen.
Das hier toppt noch mal das ganze.
Und noch jede Technik, die sich der menschliche Geist ersonnen hat, wurde auch mißbraucht.
„1984“ läst Grüßen…
Die Rechtspopulisten dieser Welt werden bestimmt gute Kunden sein…
Wer braucht so etwas im täglichen Leben?
Ich weiß nicht so recht was man davon halten soll… Mega coole sache, ABER…. Und dann kommen in mir die zweifel auf… Einfach sprachmemo von whatsapp als vorlage nutzen und schon kann man die Stimmen imitieren… Und dann wieder mit handy aufnehmen und schwups… Schon kann man sagen was man will… Mit der stimme einer dritten person….?
Die Presse braucht nur einmal die Stimme eines Politikers und anstelle der Einladung zu einem Interview senden sie dem Politiker ein paar fertige Alternativen, von denen er sich eine auswählen kann. Wenn er Glück hat. ?