En termes d'innovations technologiques, le traitement de la voix n'a pas fini de nous étonner.
La société américaine Voxonic produit un logiciel qui effectue le "post traitement" d'un flux audio pour lui donner l'apparence de la voix d'une autre personne. Il suffit d'un enregistrement de 15 minutes en studio de la voix cible pour pouvoir ensuite l'appliquer sur n'importe quel flux et lui donner les caractéristiques du locuteur choisi.
Les applications sont évidemment nombreuses et séduisantes.
Supposons qu'un chef d'entreprise doive s'adresser au personnel de sa filiale chinoise : il lui suffit de faire lire son discours par un chinois, puis de faire convertir l'enregistrement avec sa propre voix.
Le logiciel peut même travailler sans l'intervention d'un tiers : il est capable de générer le son par traduction directe depuis un texte ("text-to-speech"), cette solution étant toutefois un peu moins confortable. Il faut alors disposer de 20 à 40 heures d'enregistrement de la voix cible, en qualité studio, et le résultat n'est valable que pour une seule langue.
La technologie de Voxonic était conçue à l'origine pour aider au doublage des films dans diverses langues étrangères, mais elle s'est heurtée à la difficulté de gérer les cachets complémentaires des acteurs pour l'utilisation de leur voix "modèle". Ce qui donne une idée des risques sous-jacents de cette technologie : comment faire dire à quelqu'un ce qu'il n'a jamais dit...
Pour limiter les risques, Voxonic assure un contrôle total de sa technologie, et ne traite les voix qu'avec l'accord de toutes les parties.

Aucun commentaire:
Enregistrer un commentaire