Préférences
What is Voice Synthesis - sound wave 3d render
What is Voice Synthesis - sound wave 3d render
Siobhan Colgan 107x107
Jan 4, 2025

Qu'est-ce que la synthèse vocale ?

Ever heard a voiceover on TikTok or YouTube and thought "Hmmmm.there's something not quite right with that"? Chances are the creator was using voice synthesis.

Avec l’essor de l’intelligence artificielle (IA), la synthèse vocale est l’un des nombreux moyens par lesquels le contenu est désormais créé par les ordinateurs.

Mais cette technologie existe déjà depuis un certain temps.

As far back as the 18th century, inventors were trying to create machines that could mimic real voices, using pipes and bellows to work their veritable magic.

Et tandis que le rêve de la parole artificielle a évolué au fil des siècles, ce n'est qu'au cours des dernières décennies que la synthèse vocale, ou synthèse vocale (TTS), a véritablement commencé à produire des voix off plus proches de celles des humains.

Ces dernières années, la traduction de la parole à la parole (SST) a également rejoint l'écurie des technologies de synthèse vocale, utilisant des logiciels numériques pour imiter la voix d'une personne réelle, y compris son accent, ses inflexions vocales et ses modèles de parole.

Cependant, à mesure que les voix off artificielles deviennent plus courantes dans le marketing et la création de contenu, les inquiétudes concernant leur impact négatif sur les moyens de subsistance des acteurs de la voix ainsi que sur les marques et les entreprises doivent être prises en compte.

Mais avant d’aborder ces questions, examinons d’abord les mécanismes qui sous-tendent la synthèse vocale.

 

La mécanique de la synthèse vocale

Souvent appelée clonage de voix ou synthèse vocale (TTS), la synthèse vocale est une méthode qui convertit le langage écrit en parole à l'aide de l'intelligence artificielle (IA) et de la technologie informatique.

Il entre dans la catégorie des médias synthétiques, un terme générique désignant tout type de média généré, manipulé ou modifié artificiellement, qu'il s'agisse de texte, de vidéo ou de voix.

Les médias synthétiques basés sur l'audio sont développés en utilisant des algorithmes ou des systèmes d'IA pour transformer le texte écrit en audio parlé à consonance humaine.

Les systèmes analysent une énorme base de données d'échantillons de voix enregistrés, apprenant à prédire différents tons, hauteurs et modèles de parole. À partir de là, un vocodeur transforme ces caractéristiques en une forme d'onde audio, et voilà ! la parole est créée.

La synthèse vocale moderne a été initialement développée pour aider les personnes souffrant de troubles de la parole et d’autres difficultés sensorielles, ou celles qui ont des difficultés à lire.

Pour les personnes atteintes de maladies comme la SLA ou la paralysie cérébrale, ces premiers systèmes de synthèse vocale leur ont permis de communiquer plus efficacement. L’objectif principal était donc d’améliorer la qualité de vie et de favoriser l’indépendance.

Cependant, de nos jours, vous avez autant de chances de trouver une voix artificielle sur un livre audio ou sur TikTok que sur un appareil de communication assistée.

 

Les défis éthiques de la synthèse vocale

Bien sûr, utiliser ce type de technologie pour créer du contenu, mettre en œuvre des stratégies marketing et développer des assistants domestiques intelligents (nous pensons à vous, Alexa et Siri) n'est pas fondamentalement mauvais.

But it can come with ethical challenges, not to mention a downslide in quality.

Par exemple, les acteurs de doublage qui octroient des licences pour leurs voix contre des frais fixes (ce qui est généralement la manière dont sont structurés la plupart des contrats de synthèse vocale) peuvent involontairement contribuer à être exclus des projets futurs.

Une fois leur voix clonée, les entreprises peuvent l’utiliser à plusieurs reprises dans des publicités, des livres audio, des jeux vidéo ou d’autres médias, évitant ainsi tout travail supplémentaire de la part du talent original.

Not only does this undermine the intellectual property rights of professional voice actors, but flooding the market with regurgitated audio-based synthetic media will undoubtedly lead to a slump in industry standards.

 

La nécessité d’une meilleure réglementation

Même si les artistes voix off retiennent leur voix pour l'utiliser, les entreprises peuvent toujours essayer de contourner ce problème.

Recently, Hollywood actor Scarlet Johansson threatened legal action against OpenAI for allegedly mimicking her voice on their latest AI system after she refused to license it to the company.

Pour beaucoup, l’incident a montré le besoin crucial d’un contrôle réglementé sur la manière dont les voix synthétisées sont utilisées.

In a media interview, a spokesperson for merged entertainment unions, TheScreen Actors Guild and American Federation of Television and Radio Artists (SAG-AFTRA) claimed:

Que vous soyez un artiste professionnel cherchant à protéger sa carrière ou un particulier souhaitant protéger les paroles qui vous sont attribuées, le besoin de protection fédérale est désormais présent.

 

L'impact négatif de la synthèse vocale sur les entreprises

Ce ne sont pas seulement les artistes voix off qui subissent le plus gros des conséquences de l’IA.

L’utilisation de la synthèse vocale dans les publicités, les vidéos et autres créations de contenu peut également avoir un impact négatif sur les entreprises.

 

Manque d'authenticité

Pour commencer, les voix synthétiques manquent souvent de la touche émotionnelle subtile qu’un doubleur humain peut apporter à un enregistrement.

This can make content, whether commercials or video game voiceovers, sound robotic and unrelatable, which in turn will create an emotional disconnect with audiences.

Si les marques persistent à utiliser des voix d’IA pour leur contenu marketing, elles risquent d’avoir du mal à établir une véritable confiance ou de véritables liens avec leur public cible.

 

Problèmes de qualité

Cela ne veut pas dire que la technologie TTS n'a pas beaucoup évolué au fil des décennies. Elle l'a fait.

Certes, les voix artificielles utilisées par les géants mondiaux de la marque comme Google et Amazon, bien que quelque peu génériques, sont bien loin du son électronique que beaucoup d’entre nous associent généralement à la parole synthétique.

Cependant, les petites marques et entreprises ne sont généralement pas sur le même terrain de jeu que Google lorsqu’elles choisissent la synthèse vocale et opter pour des choix moins chers peut les amener à faire face à des problèmes de qualité.

En fait, les voix d’IA courantes ont encore du mal à gérer les intonations artificielles, les mauvaises prononciations et à transmettre certaines formes d’esprit comme les plaisanteries et le sarcasme.

Cela peut rendre le contenu plat ou trop artificiel pour que le public puisse faire l’effort supplémentaire d’assimiler les informations relayées.

En réalité, avec autant de contenu authentique et de qualité à gagner, les auditeurs se désintéresseront tout simplement et cliqueront pour dire « Merci ! Suivant ! »

 

Dommage pour la perception de la marque

Le public moderne étant généralement conscient de ce qui est réel et de ce qui ne l'est pas, une voix synthétique mal rendue est assez simple à repérer.

Même si vous avez travaillé dur pour faire fonctionner une voix d'IA dans votre vidéo, la vérité est que cela a la réputation d'être bon marché et « peu exigeant ».

Les gens veulent du contenu engageant et agréable, avec une touche humaine.

Une voix qui manque de personnalité, d’emphase ou d’émotion peut laisser les auditeurs croire que le contenu lui-même est générique et de qualité inférieure, même si ce n’est pas le cas.

Cette perception ne nuira pas seulement à la réputation d’une entreprise, mais rendra également plus difficile pour la marque de se démarquer sur un marché encombré où l’authenticité est respectée et l’originalité récompensée.

 

 

Synthèse vocale et voie éthique à suivre

Cependant, tout n’est pas si sombre pour les acteurs de doublage, les marques et les entreprises qui doivent faire face à une nouvelle ère de médias générés par l’IA.

Il est certain que les médias synthétiques sont là pour rester et la synthèse vocale en fait partie. Mais il existe des moyens de la développer à l'avenir pour que les artistes vocaux et les marques en bénéficient également.

Cela rendra à son tour l’industrie plus éthique et durable.

 

  • Protection juridique des artistes vocaux

La première tâche des gouvernements et des organismes industriels doit être de mettre en place des protections juridiques pour les artistes voix off, garantissant une rémunération équitable et une utilisation éthique des technologies de clonage vocal.

Ces mesures réduiront non seulement le risque d’exploitation, mais créeront également un environnement plus sûr pour les artistes et les marques.

 

  • Accords de licence transparents

Ensuite, des contrats standards pour les acteurs de doublage qui accordent des licences à leurs sources de revenus doivent être créés, dans lesquels les conditions spécifiques de la manière et du lieu où la voix de l'individu peut être utilisée sont clairement définies.

Non seulement cela permettra aux talents vocaux de conserver le contrôle de leur propriété intellectuelle, mais cela aidera également les marques à éviter les obstacles juridiques associés à l'utilisation abusive de voix off sous licence.

 

  • Redevances et rémunérations basées sur l'utilisation

De plus, un système basé sur des redevances, similaire à celui utilisé par les musiciens pour collecter davantage d'argent grâce aux diffusions ou aux écoutes sur des plateformes telles que Spotify et Apple Music, pourrait être mis en œuvre pour les talents vocaux.

De cette façon, les artistes voix off peuvent être sûrs d’un revenu continu à chaque fois que leur voix est utilisée.

Les marques, quant à elles, n’auraient à débourser les fonds que pour l’utilisation réelle, ce qui rendrait l’ensemble du système équitable et évolutif.

 

  • Mélanger le meilleur des deux mondes

Enfin, de nouvelles approches doivent être trouvées pour combiner les atouts de la technologie TTS et du travail de voix off humaine.

Par exemple, une entreprise pourrait utiliser l’IA pour générer les premières versions de contenu, puis faire appel à de véritables comédiens pour peaufiner le rendu final. Cette collaboration donnerait à l’œuvre une touche émotionnelle et un son authentique.

Ce faisant, les entreprises allieraient l’efficacité de la technologie virtuelle à la qualité de la créativité humaine réelle.

 

Derniers mots

S’assurer que des normes et des mesures de protection claires sont en place dans l’industrie concernant une rémunération équitable, la transparence et le consentement clair des artistes vocaux sur la manière dont les voix sont utilisées ne peut qu’améliorer l’utilisation et l’efficacité de la technologie TTS.

Les talents de voix off seront sûrs de ne pas être privés d'une rémunération équitable, et les grandes marques comme les petites entreprises auront un accès égal à des voix off de haute qualité d'une manière qui encourage la confiance, la créativité et les pratiques éthiques.

L’IA fait partie de notre avenir. C’est un fait.

Mais les pratiques injustes et inappropriées en matière de mise en œuvre de la synthèse vocale (et d’autres médias synthétiques) dans les activités commerciales et créatives ne doivent pas être négligées.

* * * *

Si vous recherchez actuellement des voix humaines authentiques et de haute qualité, pourquoi ne pas explorer notre gamme haut de gamme d'acteurs professionnels primés ?

Contact us and we'll help manage your project, from sourcing experienced voice talent to providing transcription, translation, subtitling, video editing, and all other post-editing services you might need.

 

Poste un commentaire

0 Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués *

Obtenez une voix off PRO

en 3 étapes simples
1
Obtenez des propositions gratuites

Postez votre projet ou choisissez des doubleurs pour auditionner et vous envoyer des propositions.

2
Embaucher des talents

Engagez votre talent préféré, financez le projet et communiquez via le babillard.

3
Libérer le paiement

Approuvez l'enregistrement et versez votre paiement au talent lorsqu'il est satisfait.

Publier un projet

Ou parcourez les acteurs de la voix