Voix de synthèse
Générer les voix de synthèse
Cette opération génère tous les sons liés aux voix de synthèse de votre projet, ainsi que les fichiers liés au mouvement des lèvres. Les sons déjà générés ne seront pas recréés, et les sons précédemment générés devenus obsolètes seront supprimés à la fermeture de votre projet. Ainsi, tant que votre projet est ouvert, vous pouvez toujours faire marche arrière sur les textes que vous avez corrigés.
Si vous avez déjà renseigné un compte VTS dans le menu principal, il sera utilisé par défaut pour le débit des crédits. Sinon, vous devrez vous connecter à votre compte à chaque génération.
Une connection à Internet est requise pour réaliser cette opération.
Il est fortement conseillé de sauvegarder son projet avant ce processus. L'éditeur affichera d'ailleurs un message pour vous le rappeler.
Cette opération peut durer quelques minutes selon la quantité de texte à générer, mais elle peut à tout moment être arrêtée. Si vous annulez l'opération, les voix déjà générées seront tout de même incluses dans votre projet, et les crédits vous auront été débités en conséquence.
Cette opération doit être réalisée avant de générer votre simulation.
Partenaires des voix de synthèse
Lorsque vous choisissez la voix d'un personnage, vous pouvez voir des préfixes de 2 lettres (AC, RS, GS and GW) au début du nom de chaque voix. Ces préfixes sont utilisés pour reconnaître de quel fournisseur de voix de synthèse cette voix provient.
Voici la liste des partenaire de génération de voix de synthèse que nous utilisons dans VTS Editor :
- Google (GS et GW) : https://cloud.google.com/text-to-speech/
- GS est pour "Google Standard" et GW pour "Google WaveNet".
WaveNet est globalement de meilleure qualité (plus d'informations ici).
- GS est pour "Google Standard" et GW pour "Google WaveNet".
- Acapela (AC) : https://www.acapela-group.com/
- ReadSpeaker (RS) : https://www.readspeaker.com/
- Microsoft Azure (MS) : https://azure.microsoft.com
- IBM (IBM) : https://www.ibm.com/
Personnaliser la prononciation des voix Google
Pour les voix de synthèse Google (préfixe GW et GS dans le menu déroulant des voix), il est possible d'utiliser des balises SSML pour ajouter des divers effets à la génération des voix de synthèse : faire une pause, épeler, accélérer, ralentir, etc.
Par exemple, le texte "<speak>J'hésite... <break time="3s"/>Non je ne sais vraiment pas.</speak>" sera prononcé avec une pause de 3 secondes après avoir prononcé "J'hésite...".
Retrouvez ici toute la documentation nécessaire pour prendre en main cette fonctionnalité : documentation de SSML.
Ces balises doivent être utilisées uniquement dans le champ de prononciation d'un texte (bouton de Reformulation situé à droite de chaque champ texte prononcé par un personnage), de manière à ne pas modifier le texte affiché dans les sous-titres du personnage.
Utiliser les tags Acapela
Pour les voix de synthèse Acapela (préfixées AC dans le menu déroulant des voix), il est possible d'utiliser des tags spécifiques à Acapela pour personnaliser les voix générées. Comme pour les balises SSML pour les voix Google, ces tags Acapela ne doivent être utilisés que pour la prononciation des texte, de manière à ne pas affecter les sous-titres affichés.
Le caractère anti-slash \ est utilisé pour encadrer un tag. Ainsi le générateur pourra reconnaitre que cette partie du texte en est un. Il est donc impossible d'utiliser ce caractère au sein même d'un tag. Si Acapela ne reconnait pas le tag inscrit, alors il est simplement ignoré (non lu).
Nom | Code |
Comportement |
Pause | \pau=1000\ |
Pause en milisecondes |
Phonétique | \prn=s a l y \ |
Texte en langage phonétique (pour plus d'informations, Exemples : |
Volume | \vol=100\ |
Volume global : 20 à 400 |
Vitesse | \spd=100\ |
Vitesse globale en pourcent : 20 à 400 (défaut : 200) |
Vitesse relative | \rspd=100\ |
Vitesse relative (à la vitesse globale) en pourcent : 50 % à 200 % |
Variation de voix | \vct=100\ |
Variation de la voix en pourcent : 70 % à 140 % |
Mode "Épellation" | \rms=1\ |
Lire caractère par caractère. =1 pour activer, =0 pour désactiver |
Mode "Mot à mot" | \rmw=1\ |
Lire mot par mot. =1 pour activer, =0 pour désactiver |
Il est aussi possible d'utiliser des expressions. Ce sont des mots clés utilisés par Acapela pour générer des sons bien particuliers. Ils sont détaillés dans cette documentation sur le site d'Acapela. Ces expressions ne fonctionnent pas encore parfaitement. Il est donc très fortement conseillé de les tester auparavant grâce au testeur d'Acapela.
- ${ child.title }