.:: S.I. VOX / Vocalyze ::.
Le processus de synthèse de la parole se décompose en différentes étapes :
SAMPA
) Nous utilisons le logiciel Mbrola
qui, à l'aide de la technique
d'OverLApping (recouvrement) des phonèmes génère un fichier son au
format standart wav
.
Pour pouvoir passer la main à Mbrola
, il nous faut générer un
fichier de phonème conforme à l'alphabet SAMPA
et aux conventions
actuelles de synthèse vocale.
Pour synthétiser le mot bonjour, on utilise les phonèmes SAMPA
suivant :
b o~ Z u R _
Maintenant, on y applique un schéma intonatif standart (début de phrase). On obtient la suite de phonème suivante :
b 187 8 163 16 160
o~ 123 14 148 29 149 44 151 49 148
Z 88 11 139 25 137
u 95 8 122 15 122
R 163 8 109 16 108
_ 130
En terme d'overlapping, on peut par exemple analyser la suite de prosodie du second phonème :
o~
: le phonème que l'on veut prononcer123
: on utilise 123
ms pour prononcer ce phonème 14 148
: durant 14%
de la durée, on prononce ce phonème à la fréquence 148
Hz. 29 149
: entre 14%
et 29%
de la durée, on prononce ce phonème à la fréquence 149
Hz.Pour analyser le texte à lire et en extraire les différents syntagmes, on se base sur :
A partir de fichiers de règles écrit selon la syntaxe classique des expressions regulieres, on construit un arbre préfixe dans lequel sont stockées toutes les règles connues par le programme (actuellement environ 400 règles et 300 exceptions).
Il suffit maintenant de parcourir cet arbre (algorithme de parcours en profondeur standart) tout en lisant un syntagme pour en extraire sa représentation au format SAMPA
Pour traiter le cas ou l'on n'arrive pas à trouver dans l'arbre de règle adapté au syntagme courant, on intègre un mécanisme de backtracking permettant de récuperer la représentation phonétique la plus proche possible
Pour appliquer une intonation aux phonèmes que l'on à trouvé dans l'arbre, on utilise les courbes intonatives décrites dans le rapport ENST D76003 [1976]
.
On dispose ainsi de 4 niveaux d'intonation, et de 5 courbes prédéfinies :
Rapport ENST D76003 [1976]
: Programme de transcription phonétique en langue française
Vous pouvez toujours lire l'article scientifique publié au sujet de Vocalyze
en 2004 par hélène Collavizza et Jean Paul Stromboni ... [bientôt]
.:: Copyleft Sébastien Mosser [2005] ::.
Site hébergé par le département informatique de Polytech'Nice
Vocalyze
est distribué selon les termes de la licence d'utilisation Mbrola