Text-to-speech versus echte voice over

Gepubliceerd op 22 maart 2022 om 09:00

Artificial Intelligence is niet meer weg te denken uit de moderne maatschappij en heeft vele toepassingen. Het is dan ook niet verrassend dat het ook de 'stemmenmarkt' is opgegaan. Tekst to Speech software claimt elke tekst om te kunnen zetten in een stem die volgens sommigen niet van een mens te onderscheiden is. Dus zou je voortaan een softwareprogramma jouw video of animatie moeten laten inspreken? Of is een echte, menselijke, voice over nog altijd te prefereren boven een kunstmatige stem? In deze blog ga ik dieper in op dit vraagstuk.

 

 

Wat kan een AI stem beter

 

Wanneer je gebruik maakt van een kunstmatige stem kun je vaak gebruik maken van de optie om meerdere talen af te nemen, wat van pas kan komen voor een internationaal georiënteerd bedrijf. Zo hoef je niet per taal op zoek naar een geschikte stemacteur, maar kun je alles in één programma regelen. Dat scheelt tijd. Je zult dan meestal wel per taal een andere stem moeten kiezen. Zelf spreek ik zowel Nederlandse als Engelse scripts in, maar met Frans, Duits, Chinees of Spaans kan ik je helaas niet van dienst zijn.

 

Ook kun je met een tekst to speech programma sneller een eindresultaat verwachten. Je hoeft niet via allerlei kanalen op zoek naar een geschikte voice over, over en weer contact te hebben over script, wensen en prijs, en vervolgens met wat pech ook nog eens feedback te geven om een revisie te krijgen. Je voert gewoon het script in en even later kun je het audiobestand downloaden. 

 

En ten slotte is een computerstem een stuk goedkoper dan een professionele voice over. Veel programma's bieden zelfs een gratis proefmaand aan. Maar ook wanneer je een abonnement neemt betaal je hoogstwaarschijnlijk maar een fractie van de prijs die je aan mij of één van mijn collega's had moeten betalen.

 

Je zult je inmiddels misschien afvragen waarom ik hier een kunstmatige concurrent aan het aanprijzen ben, en of je misschien eens zo'n programma moet proberen. Maar lees nog even mee, dan breng ik je op andere gedachten ;-)

 

Waarom een menselijke voice over beter is

 

Het inspreken van een tekst is niet alleen simpelweg het correct oplezen van de woorden en registeren waar een punt staat zodat er een korte stilte wordt ingelast. De menselijke stem heeft ontzettend veel nuances, en wij mensen zijn er perfect op afgesteld. We horen precies aan iemands klank, tempo en volume welke emotie er achter de woorden schuil gaat. En vaak is dat nou juist hetgeen wat je wilt bereiken met jouw script. Je wilt de luisteraar bijvoorbeeld overtuigen dat de stem enthousiast is over een product, trots is op een bedrijf, zich zorgen maakt of een grapje maakt. Je wilt aansluiten bij de doelgroep en dus een stem hebben waarin een kind, jongere, man, vrouw, senior, zakenvrouw of vader zich in herkent. 

Wanneer je een kunstmatige stem inzet zul je de luisteraar misschien wel (even) kunnen foppen, maar zodra er ook maar iets van emotie moet worden overgebracht prikt je publiek er feilloos doorheen. En gaat de boodschap verloren. 

 

Bovendien denkt een voice over met je mee over het script, geeft je verschillende tone of voice opnames om uit te kiezen, en begrijpt daadwerkelijk wat hij of zij aan het inspreken is. Bovendien kost het weliswaar wat tijd om met een stemacteur samen te werken, maar ik geniet vaak wel van dat contact en dat is volgens mij wederzijds. 

 

Een professionele voice over is de tijd en het geld dubbel en dwars waard voor alle producties waarin je wilt aansluiten bij de doelgroep die je voor ogen hebt. De dag dat een tekst to speech programma in een script de emotie kan herkennen én overbrengen is nog heel ver weg. En dus is het eigenlijk alleen nuttig wanneer je alleen een duidelijk opgelezen reeks woorden nodig hebt. Misschien dus toch maar niet zo'n programma kopen?