Antworten auf deine Fragen:
Neues Thema erstellen

In der Entwicklung bei Adobe: VoCo

Gesprochenes in Audiodateien per Texteingabe ändern

So richtig lässt mich die Adobe MAX dann doch nicht los, schließlich gibt es in den Präsentationen der Veranstaltung noch mehr zu entdecken. Daher soll es nochmals weitergehen mit Inhalten, die auf der Adobe-Veranstaltung präsentiert wurden. Was das letzte CC-Update gebracht hat, wissen wir nun. Doch wie geht es weiter? Was darf künftig erwartet werden?

Das Unternehmen hat auf der Adobe MAX insgesamt elf „Sneaks“ vorgestellt, also sich in der Entwicklung befindliche Projekte, die möglicherweise auch irgendwann den Weg zu uns finden werden. Schauen wir uns diese einmal genauer an. Starten möchte ich hier mit „VoCo“:

Das Programm eignet sich zur einfachen Bearbeitung von Stimmaufnahmen. So können gesprochene Wörter per Texteingabe ganz einfach ausgetauscht werden. Im ganz unten stehenden Video erläutert der Vortragende auf der Adobe MAX das Vorgehen und die Möglichkeiten anhand des Beispielsatzes: „And I kissed my dogs and my wife.“

Die Audiodatei wird nun nach VoCo geladen, wo sowohl die Tonspur als auch die Transkription des Gesprochenen als Text angezeigt wird. Spielt man das Ganze ab, wird in beiden Bereichen live angezeigt, an welcher Stelle man sich gerade befindet.

voco_2.jpg

VoCo im Einsatz (das graue Fenster): Zu sehen ist sowohl die Tonspur als auch die vertextlichte Variante des Gesprochenen, die editiert werden kann (Bildquelle: Screenshot aus dem Video "VoCo" von der Adobe MAX 2016)

Problematisch an dem Beispielsatz ist nun, dass der Sprecher vielleicht doch lieber seine Frau küssen möchte, bevor er sich den Hunden zuwendet. Um dies zu gewährleisten, kann natürlich wie üblich das entsprechende, gesprochene Wort „wife“ aus der Waveform ausgeschnitten und an die Stelle der „dogs“ gesetzt werden.

Doch VoCo macht die Sache noch einfacher: Hier ist es möglich, den transkribierten Text zur Bearbeitung der Audiodatei zu nutzen. Bedeutet: Man markiert das geschriebene Wort „wife“ und tauscht es per Copy & Paste aus mit dem geschriebenen Wort „dogs“. Im Ergebnis sagt der Sprecher nun: „And I kissed my wife and my wife.“

Gut, das könnte nun auch zu Missverständnissen mit der Ehefrau führen. Wo sind die Hunde geblieben? Oder, um es mit den Worten des Präsentierenden zu sagen: „How can we let the dogs out?“ Ganz einfach, indem man das Wörtchen „dogs“ eintippt.

Bislang ist das kein wirkliches Hexenwerk, wird der Text doch ganz einfach nur den entsprechenden Zeitpunkten in der Waveform der Audiodatei zugeordnet (so vermute ich zumindest) und es werden bislang nur Abschnitte verwendet, die so als gesprochener Text in der Aufnahme sowieso vorhanden sind („wife“ und „dogs“). Bis dahin lässt sich das also auch mit der Waveform und üblichen Verfahren halbwegs gut bearbeiten.

Das wirkliche Highlight des Programms folgt jedoch noch: Man kann nämlich auch Texte einfügen, die so gar nicht gesagt wurden. Und so wird im Video dann auch der ursprüngliche Satz abgeändert in: „And I kissed Jordan and my wife.” Wie sich das dann anhört, hört ihr bei Minute 3:52. Das geht auch mit mehreren Worten: „And I kissed Jordan three times.“ (zu hören bei Minute 4:39).

Man könne gar noch längere Textabschnitte bearbeiten. Notwendig hierfür ist ein Audio-File des Sprechers mit typischerweise mindestens 20 Minuten Laufzeit, die das Programm nutzt, um die Charakteristik der Aussprache der Person zu analysieren und dann auf neue Worte anzuwenden. Geeignet ist VoCo damit vor allem für die nachträgliche Glättung von zum Beispiel Hörbüchern oder – das fiele mir jetzt noch ein – Video-Tutorials.

Hier die durchaus unterhaltsame Präsentation des Programms:

 

Wer sich bereits vorab über weitere Entwicklungen informieren möchte, der kann sich auf die klicken. Ansonsten habe ich aber anvisiert, die Dinge in kommenden News einmal nach und nach zu betrachten.

Euer Jens

Bildquelle Vorschau und Titel: Screenshot aus dem Video "VoCo" von der Adobe MAX 2016

 

In der Entwicklung bei Adobe: VoCo

Nedsch

Aktives Mitglied

Ganz interessant. Wobei diese amerikanischen Präsentationen ja schon leicht nervig sind. Das Publikum ist mir in der Regel etwas zu euphorisch. Na, andere Länder andere Sitten. In Deutschland würde vermutlich keiner eine Miene verziehen. Vor allem weil der Nutzen der Software ja sehr speziell ist. Wer braucht das schon außer Ton-Leuten?
 
Fälschung ist Fälschung. Für Hörbücher werden ausgebildete Sprecher verwendet, außer es handelt sich um sogenannte Autorenlesungen, bei denen Autoren i.a. entweder ihre Fähigkeiten überschätzen oder sich kein Produzent fand, der einen Sprecher bezahlen wollte.Dass Video-Tutorials meist von Leuten präsentiert werden, die weder die didaktischen noch die sprachliche Fähigkeiten besitzen, ist leider gängige Praxis. Das gilt nicht nur für YouTube-Selbstdarsteller, sondern auch für solche, die sich ihr Produkt bezahlen lassen. Doch scheinen Leute durch die 50x7x24 Fernsehstunden daran so gewöhnt zu sein, dass ihnen dies nicht mehr auffällt, hauptsächlich in jedem verhaspelten Satz kommen ein oder zwei denglische Wörter vor.
 
Bilder bitte hier hochladen und danach über das Bild-Icon (Direktlink vorher kopieren) platzieren.
Antworten auf deine Fragen:
Neues Thema erstellen

Willkommen auf PSD-Tutorials.de

In unseren Foren vernetzt du dich mit anderen Personen, um dich rund um die Themen Fotografie, Grafik, Gestaltung, Bildbearbeitung und 3D auszutauschen. Außerdem schalten wir für dich regelmäßig kostenlose Inhalte frei. Liebe Grüße senden dir die PSD-Gründer Stefan und Matthias Petri aus Waren an der Müritz. Hier erfährst du mehr über uns.

Stefan und Matthias Petri von PSD-Tutorials.de

Nächster neuer Gratisinhalt

03
Stunden
:
:
25
Minuten
:
:
19
Sekunden

Flatrate für Tutorials, Assets, Vorlagen

Zurzeit aktive Besucher

Statistik des Forums

Themen
118.565
Beiträge
1.538.067
Mitglieder
67.488
Neuestes Mitglied
Andrew56524
Oben