SELFHTML/Aides à la navigation Feuilles de style CSS Propriétés CSS |
Contrôle du son pour sortie vocale | |
Généralités
sur le contrôle du son pour sortie vocale |
|
Grâce à ces commandes de feuilles de style qui font partie de la version 2.0 du standard du langage CSS, il est possible de transcrire du texte formaté en HTML pour la sortie vocale sur des systèmes audio. Les mentions de feuilles de style pour le contrôle du son permettent d'influer sur la voix du lecteur de multiples manières et de contrôler la mise en oeuvre de bruitages ou de passages musicaux.
Les possibilités présentées ici ne constituent pas seulement un espoir pour les non-voyants. elle sont aussi intéressantes pour les auteurs esthètes qui n'écrivent pas seulement des textes mais veulent aussi les formater exactement pour qu'ils soient lus. Avant tout en tant qu'indications pour les auteurs de pièces pour la scène et pour l'écoute, ces mentions de feuilles de style peuvent être très intéressantes.
La conversion technique par ordinateur de réglages acoustiques "pointus" de voix synthétiques est cependant loin d'être banale. "J'entends rien du tout" sera aussi pour cette raison encore longtemps l'expérience décevante lors de l'"écoute" des exemples de cette page, car les navigateurs répandus à ce jour sont purement orientés sur l'écran et ne possèdent aucun module de programme pour la restitution vocale. Il y a certes entre-temps des logiciels pour la restitution vocale de pages Web, pourtant même ces produits ne sont en règle générale pas encore suffisamment élaborés pour supporter les propriétés CSS présentées ici.
Un problème pour la restitution vocale est aussi la multiplicité des langues. Une voix synthétique qui est accordée pour l'"anglais" sera épouvantable à entendre pour la restitution d'un texte français. C'est pour cela qu'il est recommandé dans tous les cas de mentionner la langue dans les fichiers CSS qui contiennent les propriétés CSS pour la restitution vocale. Cela peut se faire par exemple à l'aide de l' attribut universel lang=
dans les différents éléments HTML ou globalement dans l'élément body
.
Vous pouvez mentionner pour un élément HTML ou pour un passage le volume avec lequel il doit être reproduit. La mention du volume est un ordre de grandeur relative par rapport au volume de base réglé par l'utilisateur.
<html><head><title>volume</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="volume:silent">Ce texte est lu avec le volume <b>silent</b></p> <p style="volume:x-loud">Ce texte est lu avec le volume <b>x-loud</b></p> <p style="volume:20">Ce texte est lu avec le volume <b>20</b></p> <p style="volume:100">Ce texte est lu avec le volume <b>100</b></p> </body></html> |
Avec volume:
vous pouvez spécifier l'ordre de grandeur du
volume. Des valeurs comprises entre 0 (très faible) et 100 (très fort) ou l'une des mentions suivantes sont permises:
silent
= coupure du son ou plutôt arrêt du son de la longueur du passage.
x-soft
= très faible, correspond à la valeur 0.
soft
= faible, correspond à la valeur 25.
medium
=moyen correspond à la valeur 50.
loud
= fort correspond à la valeur 75.
x-loud
= fort correspond à la valeur 100.
Vous pouvez spécifier comment un élément sera lu.
<html><head><title>speak</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="speak:normal">Le mot "épeler" est maintenant épelé:</p> <p style="speak:spell-out">épeler</p> </body></html> |
Avec speak:
vous pouvez influencer la lecture. Les données
suivantes sont permises:
none
= coupure du son sans pause dans le discours (l'élément est pour ainsi dire sauté).
normal
= normale, restitution dépendante de la langue.
spell-out
= restitution en épelant (approprié par exemple pour les abréviations).
Vous pouvez imposer une pause avant un élément.
<html><head><title>pause-before</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <h1>Texte avec des pauses</h1> <p style="pause-before:300ms">Texte précédé par une pause de 300ms</p> <p style="pause-before:600ms">Texte précédé par une pause de 600ms</p> <p style="pause-before:1s">Texte précédé par une pause de 1s</p> <p style="pause-before:2s">Texte précédé par une pause de 2s</p> </body></html> |
Avec pause-before:
vous pouvez imposer une pause précédant un élément. Une mention de temps en secondes (s) ou millièmes de secondes (ms) est permise. Vous pouvez également en alternative mentionner des valeurs en pourcentage. Ensuite la pause dépend de la vitesse de parole (également réglable).
Vous pouvez imposer une pause après un élément.
<html><head><title>pause-after</title> </head><body lang="de" bgcolor="#FFFFFF" text="#000000"> <h1>Texte avec des pauses</h1> <p style="pause-after:200ms">Texte suivi par une pause de 200ms</p> <p style="pause-after:400ms">Texte suivi par une pause de 400ms </p> <p style="pause-after:1s">Texte suivi par une pause de 1s</p> <p style="pause-after:3s">Texte suivi par une pause de 3s</p> <p>Texte de clôture</p> </body></html> |
Avec pause-after:
vous pouvez imposer une pause suivant un
élément. Une mention de temps en secondes (s) ou millièmes de secondes (ms) est permise. Vous pouvez également en alternative mentionner des valeurs en
pourcentage. Ensuite la pause dépend de la vitesse de parole (également réglable).
Vous pouvez délimiter un élément par une pause avant et une pause après.
<html><head><title>pause</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <h1>Texte avec des pauses</h1> <p style="pause:500ms">Texte précédé et suivi par une pause de 500ms</p> <p style="pause:1300ms">Texte précédé et suivi par une pause de 1300ms</p> <p style="pause:1s 2s">Texte précédé et suivi par une pause de 1s </p> <p>Texte de clôture</p> </body></html> |
Avec pause:
vous pouvez isoler un élément par une pause avant et après. Si vous mentionnez une valeur, elle signifie aussi bien la pause avant l'élément que la pause après. Vous pouvez également mentionner deux valeurs séparées par un espace. Alors la première valeur désigne la durée de la pause avant l'élément et la deuxième valeur la pause après. Une mention de temps en secondes (s) ou millièmes de secondes (ms) est permise. Vous pouvez également en alternative mentionner des valeurs en pourcentage; alors les pauses dépendent de la vitesse de parole (également réglable).
Vous pouvez introduire des éléments ou des passages par un signal de reconnaissance. Cela peut être par exemple un bruitage ou une mélodie.
<html><head><title>cue-before</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="cue-before:url(cue.wav)">Réjouissez-vous!</p> </body></html> |
Avec cue-before:url([nomfichier])
vous pouvez envoyer avant l'élément un signal de reconnaissance. Si le fichier se trouve dans un autre répertoire que le répertoire actuel, vous devez utiliser le nom de chemin ou l'adresse URL absolue comme [nomfichier]. Comme formats de fichiers son sont admis les fichiers WAV, AU ou AI.
Vous pouvez mettre fin à des éléments ou à des passages avec un signal de reconnaissance. Cela peut être par exemple un bruitage ou une mélodie.
<html><head><title>cue-after</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="cue-after:url(cue.wav)">Et maintenant suit un:</p> </body></html> |
Avec cue-after:url([nomfichier])
vous pouvez envoyer à la suite de l'élément un signal de reconnaissance. Si le fichier se trouve dans un autre répertoire que le répertoire actuel, vous devez utiliser le nom de chemin ou l'adresse URL absolue comme [nomfichier]. Comme formats de fichiers son sont admis les fichiers WAV, AU ou AI.
Vous pouvez émettre le même signal de reconnaissance avant et après un élément ou un passage, Cela peut être par exemple un bruitage ou une mélodie.
<html><head><title>cue</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="cue:url(cue.wav)">oh oh, qu'il est oh oh!</p> </body></html> |
Avec cue:url([nomfichier])
vous pouvez insérer un élément entre deux signaux de reconnaissance identiques. Si le fichier se trouve dans un autre répertoire que
le répertoire actuel, vous devez utiliser le nom de chemin ou l'adresse URL
absolue comme [nomfichier]. Comme formats de fichiers son sont admis les
fichiers WAV, AU ou AI.
Vous pouvez définir un son d'arrière plan pour un élément ou un passage qui sera répété aussi longtemps que dure la restitution de l'élément ou du passage. Cela peut être par exemple un bruitage ou une mélodie.
<html><head><title>play-during</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="play-during:url(play_during.mid) mix">Pendant que ce texte est lu, on entend en arrière-plan un Ragtime bien gai en tant que fichier MIDI. Pour que vous puissiez profoter du morceau complet, je devrais maintenant vous raconter une longue histoire. Mais je pense que même sans histoire, vous vous serez fait une opinion comme une musique de fond peut influer sur la restitution vocale d'un texte. Merci beaucoup pour votre attention!</p> </body></html> |
Avec play-during:url([nomfichier])
vous pouvez définir une musique de fond . Pour obtenir un véritable effet d'arrière plan, vous devez en outre noter derrière séparé par un espace le mot mix
. Si vous ne l'indiquez pas, le son d'arrière plan couvrira la restitution du contenu. Si le fichier se trouve dans un autre répertoire que le répertoire actuel, vous devez utiliser le nom de chemin ou l'adresse URL absolue comme [nomfichier]. Comme formats de fichiers son sont admis les fichiers WAV, AU ou AI.
Derrière la mention du fichier, vous pouvez encore noter une des mentions suivantes:
mix
= Au cas où l'élément parent a lui aussi une musique de fond, les deux sons seront mélangés.
repeat
= Si le fichier son est plus court que la lecture du texte de l'élément, la reproduction se répétera jusqu'à ce que le texte soit lu complètement.
auto
= Au cas où l'élément parent a lui aussi une musique de fond, celle-ci n'est pas rejouée mais continue de jouer.
À la place d'un fichier son, vous pouvez aussi ne mentionner tout simplement que none
. C'est indiqué quand l'élément parent joue une musique de fond. Pour la restitution vocale de l'élément actuel, vous pouvez alors interrompre la diffusion.
Si le système de reproduction vocale supporte le "son spatial" (au moins stéréophonique, si possible le Surround-Sound), vous pouvez déterminer la direction d'origine de la voix du lecteur.
<html><head><title>azimuth</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="azimuth:left-side">Cette voix-ci doit venir de la gauche.</p> <p style="azimuth:left-side behind">Cette voix-ci doit venir de l'arrière gauche.</p> <p style="azimuth:center">Cette voix-ci doit venir du milieu.</p> <p style="azimuth:right-side behind">Cette voix-ci doit venir de l'arrière droit.</p> <p style="azimuth:right-side">Cette voix-ci doit venir de la droite.</p> </body></html> |
Avec azimuth:
vous pouvez déterminer l'origine dans la pièce de la voix du lecteur pour un élément ou un passage. Vous pouvez pour cela noter soit une mention en degrés pour la direction voulue soit un mot clé autorisé. Les mentions en degrés ont des valeurs comprises entre 0 et 360 et doivent se terminer par la désignation de l'unité deg
(degree = degré),. Les mots clé suivants sont permis:
left-side
= tout à fait à gauche (correspond à 270deg).
left-side behind
= de tout à fait à gauche derrière (correspond à 270deg).
far-left
= plus loin à gauche (correspond à 300deg).
far-left behind
= de plus loin à gauche derrière (correspond à 240deg).
left
= à gauche (correspond à 320deg).
left behind
= à gauche derrière (correspond à 220deg).
center-left
= centre gauche (correspond à 340deg).
center-left behind
= centre gauche arrière (correspond à 200deg).
center
= centre (correspond à 0deg).
center behind
= centre arrière (correspond à 180deg).
center-right
= centre droit (correspond à 20deg).
center-right behind
= centre droit arrière (correspond à 160deg).
right
= droite (correspond à 40deg).
right behind
= droite derrière (correspond à 140deg).
far-left
= plus loin à droite (correspond à 60deg).
far-left behind
= plus loin à droite derrière (correspond à 120deg).
right-side
= tout à fait à droite (correspond à 90deg).
right behind
= tout à fait à droite derrière (correspond à 90deg).
Si vous travaillez avec des mentions en degrés, vous pouvez utiliser les
valeurs mentionnées comme valeurs indicatives pour la direction exacte
désirée. À la place du mot clé behind
vous pouvez également utiliser les mots clé leftwards
et rightwards
. Avec leftwards
vous orientez l'origine de la voix plus loin à gauche (20 degrés de moins), avec rightwards
plus loin à droite (20 degrés de plus).
Si le système de restitution du son supporte le son spatial (si possible le Surround-Sound), vous pouvez déterminer la direction d'origine de la voix du lecteur entre le haut et le bas.
<html><head><title>elevation</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="elevation:below">Cette voix doit venir d'en bas.</p> <p style="elevation:higher">Cette voix doit venir d'en haut.</p> </body></html> |
Avec elevation:
vous pouvez déterminer la direction d'origine de
la voix du lecteur verticalement. Pour cela vous pouvez noter soit une mention
en degrés pour la direction souhaitée soit un mot clé permis. Les mentions en degrés s'échelonnent entre -90 (de tout en bas) et 90 (à tout en haut) et doivent se terminer par la désignation de l'unité deg
(degree = degré) . Les mots clé suivants sont permis:
below
= d'en bas.
lower
= de plus loin vers le bas.
level
= du milieu.
above
= d'en haut.
higher
= de plus loin vers le haut.
Vous pouvez influencer le débit de la restitution parlée.
<html><head><title>speech-rate</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="speech-rate:fast">C'est un texte récité assez vite. Espérons que vous comprenez tout ce qui est dit, même si ce n'est pas important.</p> <p style="speech-rate:x-slow">Ceci est un texte récité trèèès lentement. Bonne nuit!</p> </body></html> |
Avec speech-rate:
vous pouvez déterminer le débit de parole. Les mentions suivantes sont permises:
x-slow
= très lentement.
slow
= lentement.
slower
= un peu plus lentement que normal.
medium
= normal.
faster
= un peu plus vite que normal.
fast
= rapide.
x-fast
= très rapide.
À la place des mots clé vous pouvez aussi mentionner des valeurs numériques. Une valeur numérique indique le nombre moyen de mots par minute. Essayez comme point de repère des valeurs autour de 100.
Vous pouvez influencer le genre de voix. Cela correspond à peu près à la modification des polices pour la représentation visuelle. Que la mention puisse être interprétée dépend outre du logiciel qui interprète, également des caractéristiques matérielles du système de reproduction vocale.
<html><head><title>voice-family</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="voice-family:female">Je suis la femme universelle. Mon cœur, c'est ma famille.</p> <p style="voice-family:male">Je suis l'homme universel. Mon cœur, c'est ma femme.</p> </body></html> |
Avec voice-family:
vous pouvez fixer le genre de la voix du lecteur. Les mentions génériques suivantes par exemple sont proposées par le consortium W3:
male
= voix d'homme.
female
= voix de femme.
child
= voix d'enfant.
En outre vous pouvez également noter des mentions spécifiques comme par exemple mafemme
. La voix correspondante doit être connue du système de reproduction vocale sous forme digitale.
Vous pouvez déterminer le timbre de la voix du lecteur.
<html><head><title>pitch</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="pitch:x-low">Cette voix vous parle le plus gravement possible. Ne vous laissez cependant pas impressionner.</p> <p style="pitch:x-high">Cette voix vous parle le plus haut possible. Mais c'est un castrat.</p> </body></html> |
Avec pitch:
vous pouvez fixer la fréquence de la voix. Une mention de la hauteur de voix moyenne en fréquence (en Hz pour Hertz ou kHz pour Kilohertz) est permise ou l'une des mentions suivantes:
x-low
= très grave.
low
= grave.
medium
=normale.
high
= aiguë.
x-high
= très aiguë.
Vous pouvez influencer la modulation de la voix.
<html><head><title>pitch-range</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="pitch-range:20">Ceci est un texte assez ennuyeux, c'est pourquoi il est lu par une voix assez monotone.</p> <p style="pitch-range:80">Bien que ceci soit aussi un texte assez ennuyeux, il est pourtant lu par une voix très énergique.</p> </body></html> |
Avec pitch-range:
vous pouvez déterminer la modulation de la voix. Une modulation normale correspond à une valeur de 50. Une valeur plus faible indique une voix monotone et pauvre en modulation, une valeur plus élevée à une voix animée riche en modulation.
Vous pouvez influencer l'emphase de la voix.
<html><head><title>stress</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="stress:10">J'ai tout mon temps.C'est pourquoi je suis aussi décontracté et que je parle avec une valeur "stress" qui n'est que de 10.</p> <p style="stress:90">Le temps passe trop vite. On n'arrive jamais à finir quelque chose. C'est terrible. C'est pourquoi aussi je parle d'une façon aussi énervée. Une valeur "stress" de 90 m'a été affectée, rendez vous compte!</p> </body></html> |
Avec stress:
vous pouvez fixer combien la voix est précipitée. Une valeur de 50 est normale. Une valeur plus élevée correspond à une voix précipitée excitée, une valeur plus basse une voix pleine de calme et d'assurance.
Vous pouvez influencer l'équilibre de la voix.
<html><head><title>richness</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="richness:85">Je suis riche. Je suis beau. C'est pour cette raison que je parle haut et clair avec une assurance de voix de 85.</p> <p style="richness:15">Je suis pauvre. Je suis laid. C'est pour cette raison que je parle avec une si petite voix. Son assurance n'a qu'une valeur de 15.</p> </body></html> |
Avec richness:
vous pouvez influencer l'assurance de la voix. La
valeur normale est de 50. Une valeur plus élevée indique une voix puissante et dominatrice, une valeur plus basse une voix faible et peu assurée.
Vous pouvez spécifier que dans un passage de texte, tous les signes de ponctuation comme les points, les virgules, les points d'exclamation etc. soient nommés explicitement, donc par exemple. "Ceci est une phrase - point".
<html><head><title>speak-punctuation</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p style="speak-punctuation:code">Écoutez donc! - Ou bien êtes-vous sourd? Ici - et ici seulement il y a quelque chose de plus à entendre: à savoir des signes de ponctuation bien choisis et nommés explicitement.</p> </body></html> |
Avec speak-punctuation:
vous influencer la lecture des signes de
ponctuation. Les données suivantes sont permises:
code
= citer la ponctuation.
none
= ne pas citer la ponctuation (réglage normal).
Vous pouvez spécifier sous quelle forme des nombres élevés par exemple 4256. doivent être lus.
<html><head><title>speak-numeral</title> </head><body lang="fr" bgcolor="#FFFFFF" text="#000000"> <p>Le téléphone de Charlotte est <b style="speak-numeral:digits">32168</b>.</p> <p>Dans sa profession, Charlotte a déjà gagné <b style="speak-numeral:continous">32168</b> Euros.</p> </body></html> |
Avec speak-numeral:
vous pouvez fixer comment des suites de
chiffres doivent être lues. Les mentions suivantes sont permises:
digits
= chiffre par chiffre, 456 donc par exemple "quatre cinq six".
continous
= comme nombre, 456 donc par exemple "quatre cent
cinquante six".
Fenêtre d'affichage | |
Mises en page pour modes d'impression | |
SELFHTML/Aides à la navigation Feuilles de style CSS Propriétés CSS |
© 2001 Stefan Münz / © 2003 Traduction Serge François, 13405@free.fr
selfhtml@fr.selfhtml.org