.:: S.I. VOX / Vocalyze ::.
Le processus de synthèse de la parole se décompose en différentes étapes :
SAMPA) Nous utilisons le logiciel Mbrola qui, à l'aide de la technique
d'OverLApping (recouvrement) des phonèmes génère un fichier son au
format standart wav.
Pour pouvoir passer la main à Mbrola , il nous faut générer un
fichier de phonème conforme à l'alphabet SAMPA et aux conventions
actuelles de synthèse vocale.
Pour synthétiser le mot bonjour, on utilise les phonèmes SAMPA suivant :
b o~ Z u R _Maintenant, on y applique un schéma intonatif standart (début de phrase). On obtient la suite de phonème suivante :
b 187 8 163 16 160o~ 123 14 148 29 149 44 151 49 148Z 88 11 139 25 137u 95 8 122 15 122R 163 8 109 16 108_ 130 En terme d'overlapping, on peut par exemple analyser la suite de prosodie du second phonème :
o~ : le phonème que l'on veut prononcer123 : on utilise 123 ms pour prononcer ce phonème 14 148 : durant 14% de la durée, on prononce ce phonème à la fréquence 148 Hz. 29 149 : entre 14% et 29% de la durée, on prononce ce phonème à la fréquence 149 Hz.Pour analyser le texte à lire et en extraire les différents syntagmes, on se base sur :
A partir de fichiers de règles écrit selon la syntaxe classique des expressions regulieres, on construit un arbre préfixe dans lequel sont stockées toutes les règles connues par le programme (actuellement environ 400 règles et 300 exceptions).
Il suffit maintenant de parcourir cet arbre (algorithme de parcours en profondeur standart) tout en lisant un syntagme pour en extraire sa représentation au format SAMPA
Pour traiter le cas ou l'on n'arrive pas à trouver dans l'arbre de règle adapté au syntagme courant, on intègre un mécanisme de backtracking permettant de récuperer la représentation phonétique la plus proche possible
Pour appliquer une intonation aux phonèmes que l'on à trouvé dans l'arbre, on utilise les courbes intonatives décrites dans le rapport ENST D76003 [1976].
On dispose ainsi de 4 niveaux d'intonation, et de 5 courbes prédéfinies :
Rapport ENST D76003 [1976] : Programme de transcription phonétique en langue française
Vous pouvez toujours lire l'article scientifique publié au sujet de Vocalyze en 2004 par hélène Collavizza et Jean Paul Stromboni ... [bientôt]
.:: Copyleft Sébastien Mosser [2005] ::.
Site hébergé par le département informatique de Polytech'Nice
Vocalyze est distribué selon les termes de la licence d'utilisation Mbrola