.:: S.I. VOX / Vocalyze ::.

.:: Principe de "Vocalyzation" ::.

Le processus de synthèse de la parole se décompose en différentes étapes :

  1. Analyze du texte à synthétiser syntagme par syntagme
  2. Transformation du texte brut en phonèmes (conventions SAMPA)
  3. Application d'un schéma intonatif (prosodie) sur la suite de phonèmes
  4. Synthèse du signal de la parole à partir des phonèmes

.:: Synthèse du signal de la parole ::.

Nous utilisons le logiciel Mbrola qui, à l'aide de la technique d'OverLApping (recouvrement) des phonèmes génère un fichier son au format standart wav.

Pour pouvoir passer la main à Mbrola , il nous faut générer un fichier de phonème conforme à l'alphabet SAMPA et aux conventions actuelles de synthèse vocale.

.:: Un petit exemple ::.

Pour synthétiser le mot bonjour, on utilise les phonèmes SAMPA suivant :

Maintenant, on y applique un schéma intonatif standart (début de phrase). On obtient la suite de phonème suivante :

En terme d'overlapping, on peut par exemple analyser la suite de prosodie du second phonème :

.:: Syntagmes => Phonèmes ::.

Pour analyser le texte à lire et en extraire les différents syntagmes, on se base sur :

  1. La ponctuation du texte
  2. Les conjonctions de coordinations
  3. Les conjonction de subordination
  4. ...

A partir de fichiers de règles écrit selon la syntaxe classique des expressions regulieres, on construit un arbre préfixe dans lequel sont stockées toutes les règles connues par le programme (actuellement environ 400 règles et 300 exceptions).

Il suffit maintenant de parcourir cet arbre (algorithme de parcours en profondeur standart) tout en lisant un syntagme pour en extraire sa représentation au format SAMPA

Pour traiter le cas ou l'on n'arrive pas à trouver dans l'arbre de règle adapté au syntagme courant, on intègre un mécanisme de backtracking permettant de récuperer la représentation phonétique la plus proche possible

.:: Schémas Intonatifs ::.

Pour appliquer une intonation aux phonèmes que l'on à trouvé dans l'arbre, on utilise les courbes intonatives décrites dans le rapport ENST D76003 [1976].

On dispose ainsi de 4 niveaux d'intonation, et de 5 courbes prédéfinies :

Rapport ENST D76003 [1976] : Programme de transcription phonétique en langue française

.:: Pour aller plus loin ::.

Vous pouvez toujours lire l'article scientifique publié au sujet de Vocalyze en 2004 par hélène Collavizza et Jean Paul Stromboni ... [bientôt]

.:: Copyleft Sébastien Mosser [2005] ::.

Site hébergé par le département informatique de Polytech'Nice

Vocalyze est distribué selon les termes de la licence d'utilisation Mbrola