Voix de synthèse
Générer les voix de synthèse
Cette opération génère tous les sons liés aux voix de synthèse de votre projet, ainsi que les fichiers liés au mouvement des lèvres. Les sons déjà générés ne seront pas recréés, et les sons précédemment générés devenus obsolètes seront supprimés à la fermeture de votre projet. Ainsi, tant que votre projet est ouvert, vous pouvez toujours faire marche arrière sur les textes que vous avez corrigés.
Si vous avez déjà renseigné un compte VTS dans le menu principal, il sera utilisé par défaut pour le débit des crédits. Sinon, vous devrez vous connecter à votre compte à chaque génération.
Une connection à Internet est requise pour réaliser cette opération.
Il est fortement conseillé de sauvegarder son projet avant ce processus. L'éditeur affichera d'ailleurs un message pour vous le rappeler.
Cette opération peut durer quelques minutes selon la quantité de texte à générer, mais elle peut à tout moment être arrêtée. Si vous annulez l'opération, les voix déjà générées seront tout de même incluses dans votre projet, et les crédits vous auront été débités en conséquence.
Cette opération doit être réalisée avant de générer votre simulation.
Partenaires des voix de synthèse
Lorsque vous choisissez la voix d'un personnage, vous pouvez voir des préfixes de 2 lettres (AC, RS, GS and GW) au début du nom de chaque voix. Ces préfixes sont utilisés pour reconnaître de quel fournisseur de voix de synthèse cette voix provient.
Voici la liste des partenaire de génération de voix de synthèse que nous utilisons dans VTS Editor :
- Google (GS et GW) : https://cloud.google.com/text-to-speech/
- GS est pour "Google Standard" et GW pour "Google WaveNet".
WaveNet est globalement de meilleure qualité (plus d'informations ici).
- GS est pour "Google Standard" et GW pour "Google WaveNet".
- Microsoft Azure (MS) : https://azure.microsoft.com
- IBM (IBM) : https://www.ibm.com/
- ElevenLabs (EL) : https://elevenlabs.io/
D'anciens fournisseurs Acapela et ReadSpeaker ne sont plus disponibles à la génération depuis le 1er janvier 2024.
Personnaliser la prononciation des voix Google
Pour le fournisseur de voix Google (préfixes GS et GW), il est possible d'utiliser des balises SSML pour ajouter des divers effets à la génération des voix de synthèse : faire une pause, épeler, accélérer, ralentir, etc.
Par exemple, le texte "<speak>J'hésite... <break time="3s"/>Non je ne sais vraiment pas.</speak>" sera prononcé avec une pause de 3 secondes après avoir prononcé "J'hésite...".
Les balises disponibles peuvent être retrouvée dans la documentation dédiée : documentation de Google SSML
Ces balises doivent être utilisées uniquement dans le champ de prononciation d'un texte (bouton de Reformulation situé à droite de chaque champ texte prononcé par un personnage), de manière à ne pas modifier le texte affiché dans les sous-titres du personnage.
- ${ child.title }