Le niveau nominal de travail et l'alignement d'une chaîne de prise de son, de diffusion ou de mastering :

Vers une évolution nécessaire...


Les niveaux en analogique :

L'usage et les normes définissent deux niveaux de base en analogique : le niveau nomimal et le niveau maximal

Les niveaux nominaux de sortie ligne, en France depuis 1950, ont été fixés à +12 dBu, alors que les autres organismes de radiodiffusion Européens ont adopté le niveau nominal de +6 dBu.

Le niveau nominal se définit comme un niveau normal de travail pour lequel les crêtes de la modulation sonore doivent atteindre, en évitant de le dépasser. On considère cette notion en régime dynamique de modulation.

Face aux nécessités de la prise de son et pour parer aux imprévus, la recommandation française (certainement issues des différentes consignes de l'ORTF et de Radio France, et pour le reste de l'Europe, issus des organisations nationales étrangères de radiodiffusion) définit une réserve avant surcharge de 10 dB au dessus du niveau nominal. Le niveau maximal recommandé pour les sorties lignes analogiques est donc de +22 dBu en France et de +16 dBu dans le reste de l'Europe.

Niveaux

En analogique, les indicateurs normalisés et rigoureusement définis (par le DIN 45406 entre autre) sont le vu-mètre et le crête-mètre (PPM). Ces deux indicateurs de niveau qui présentent des temps d'intégration différents en régime dynamique sont complémentaires et compte-tenu de l'erreur d'intégration du vu-mètre, le crête-mètre et le vu-mètre sont décalés de 8 dB en régime sinusoïdal permanent.

Ainsi en France, pour un niveau sinusoïdal permanent de +4 dBu au borne d'un vu-mètre on obtient une déviation de 0 dB VU et pour +4 dBu au borne d'un crête-mètre on obtient une déviation de -8 dB au crête-mètre.

SIFAM est une marque d'excellent vu-mètre, RTW construit d'excellents crêtes-mètre normalisés.


Les alignements de niveau de l'analogique vers le numérique :

L'enjeu est double :

- exploiter au mieux les performances du matériel de prise de son analogique et numérique, en harmonisant les niveaux maximuns de modulation et les dynamiques de fonctionnement des appareils.

- fournir à chaque étape suivante de la chaîne de traitement des sons, une modulation dont le niveau et la dynamique correspond à une réalité sonore, en relation étroite avec le niveau nominal choisi (niveau de travail des chaînes de production, qui n'est pas forcément le niveau optimal du matériel).

Avant de commencer tout travail d'enregistrement, une chaine de prise de son devra être alignée suivant des règles précises qui peuvent se résumer dans les 4 cas exemples ci-dessous.

Pour se faire, on définit un niveau d'alignement, destiné à l'ajustage du matériel.

Le niveau d'alignement est en général un signal d'un volume moyen correspondant à une onde sinusoïdale permamente, servant à faire correspondre au mieux chaque niveau de l'appareillage choisi, en ajustant leur sensibilité.d'entrée et leur niveau de sortie. Le niveau d'alignement est choisi pour pouvoir se lire facilement sur chaque type d'appareil de mesure (vu-mètre, crête-mètre analogique, indicateur numérique Full Scale en dBFS).

Afin d'ajuster correctement les niveaux entre les systèmes d'enregistrement, ce niveau d'alignement est de +4 dBu pour la France, plus agréable à lire sur les instruments de mesure comme le vu-mètre qu'un niveau nominal en régime sinusoïdal permanent.

Donc, le choix d'un niveau d'alignement (régime sinusoïdal permanent) est étroitement lié au choix d'un niveau nomimal (régime dynamique de modulation).

Pourquoi avoir écrit cette étude ?

Si tout était aussi simple, nous n'aurions pas besoin d'autre chose. Mais les extraordinaires possibilités en dynamique de la modulation numérique et la limite rapidement atteinte des niveaux maximuns de sortie d'appareil analogique, font en sorte que la situation optimale n'est pas forcément atteinte en pratiquant une procédure d'alignement habituelle.

La solution idéale serait de faire corresprondre parfaitement le niveau maximum de modulation analogique pour un taux de distorision encore admissible au niveau maximun de quantisation numérique; mais cela ne pourrait se faire qu'en laboratoire, et ne donnerait que des niveaux nominaux et alignement empiriques en pratique.

Le niveau maximum en analogique est déterminé quand la valeur de distorsion (ou saturation) en sortie d'un appareil devient inadmissible (plus de 2% pour les mixettes et consoles, plus de 5% pour les magnétophones analogiques). A titre d'exemple, nous trouvons des valeurs maximales faibles chez Enertec-Shlumberger (+18 dBu), des valeurs moyennes pour des petites mixettes dont le constructeur a pensé à l'autonomie énergétique (+20 dBu, M3i, MicroMix), des valeurs normales (+24 dBu AETA Mix2000) et des valeurs fortes pour des appareils ayant choisis la sécurité (+26 dBu Girardin, +28 ou + 30dB dBu Studer).

Notons aussi que cette valeur limite de modulation varira en fonction de la charge exercée sur l'étage de sortie par l'appareil qui lui sera relié. Donc de la marge sera toujours la bienvenue.

Le niveau maximun en numérique est le niveau maximal de quantisation : tous les bits sont à "1", il n'est plus possible d'exprimer d'autres valeurs chiffrées supérieures.

L'essentiel de nos exemples concerne le choix français d'un niveau nominal de sortie analogique de +12 dBu. Le niveau nominal européen différent de +6 dBu sera juste évoqué.

Nous allons voir quatre cas de figure fréquents à partir du standard français du niveau nominal à +12 dBu, lors d'une digitalisation : dans un studio d'enregistrement, en prise de son extérieure pour un tournage, en radiodiffusion.et télédiffusion et enfin lors des opérations de mastering.


1) Un exemple d'alignement en Studio :

Les consoles de studio sont capables d'avoir des niveaux de sortie très élevés en restant dans des tolérances acceptables de distorsion : + 28 dBu chez Studer par exemple. C'est pour des valeurs de sortie élevée, bien au dessus du niveau nominal de travail que le preneur de son trouve une sonorité qui lui plait, une bonne dynamique et un niveau de bruit de fond imperceptible.

La culture des écoles de prise de son anglaises force l'opérateur a poussé son matériel se studio dans ses derniers retranchements.

L'exemple choisi a été établi avec une console pouvant sortir un niveau de +28 dBu et des convertisseurs Studer D19 20 bits qui peuvent tolérés une surcharge de 2 dB ou de 6 dB avec le traitement Soft Clip.

Seront définis comme d'habitude le niveau d'alignement, le niveau nominal et le niveau maximum. Mais viennent s'ajouter deux autres notions : Le niveau fort (+18dbu) et la surcharge admissible des convertisseurs.

Le niveau fort correspond à des exigences artistiques dans des productions très dynamiques, les niveaux faibles restant à 20 db au dessus du bruit de fond.
Lors de mixage de film devant provoquer de fortes impressions auditives, une dynamique de 80dB doit être employée. Le niveau nominal ne peut suffire et doit être dépassé (exemple de coup de feu, de l'explosition). Certains ingénieur de mixage n'hésitent pas à provoquer une vraie saturation analogique momentanée afin d'augmenter les sensations de puissance et de densité énergétique du son. Se situer à -4 dBFS (ce qui dans notre cas provoque un niveau de sortie analogique de +18dBu) est une sage résolution.

En prise de son de musique classique, demandant également une large dynamique, le niveau fort est aussi une notion que l'on rencontre, même si l'instant enregistré peut durer assez longtemps. L'enregistrement numérique le permet. Le tout est de s'assurer qu'un mastering ou qu'une diffusion soit correctement réalisé en fonction de ces exigences de dynamique
.
La surcharge des convertisseurs AD est parfois possible. Elle tend à retarder le niveau de la saturation numérique. Comme sur un magnétophone analogique, le niveau maximal va être tassé, sans pour autant avoir une saturation audible désagréable.

La réserve avant surcharge est donc augmentée, et le dépassement accidentel du niveaux forts peut être de 10 db (en fonction des performances du traitement Soft Clip des convertisseurs AD).
Les accidents de dépassement de niveau ne sont pas prévisibles en prise de son. Autant sur le plan analogique, la surcharge momenanée (surtout en impulsion) est admissible, autant sur le plan numérique elle provoque une terrible dégradation du son, rendant le résultat inexploitable. Les outils de limitation rapide en amont des convertisseurs (Soft Clip, voir la zone verte du disgramme ci-dessous) permettent de gagner 2 à 6 dB au dessus du niveau maximun calibré à 0dBFS après alignement. Certe, dans cette zone verte il y a une déformation de la dynamique, par une compression pentue/limitation utltra-rapide, mais le résultat demeurera exploitatble.

La différence entre un limiteur de sortie de console et un Soft Clip :

Alors qu'un limiteur de sortie de console intervient à partir du niveau nominal, son seuil étant réglé à +12dBu (O dB au crête-mètre PPM RTW), le limiteur Soft Clip présente un seuil d'action bien plus élevé à -2, -3 ou -4 dB en dessous du niveau maximal comme une sorte de dernier recours.

Le limiteur de sortie de console est plus un outil de post-production ou de diffusion, car il est utilisé pour ramener les niveaux forts au niveau nominal de travail, en vue de la réalisation d'un "Prêt à diffuser".

Le Soft Clip est un limiteur de prise de son, tolérant la surcharge; le niveau définitif du rusch étant déterminé ultérieurement en post-prod.

Niveaux studio

Le réglage de la sensibilité des convertisseurs D19 est très simple et très évoquateur de nouvelle exigence de l'enregistrement numérique en vue de l'exploitation au mieux de la dynamique des consoles : Il se fait avec une graduation directe du niveau maximum. Grâce à sa graduation, on fait correspondre le niveau maximun de sortie de la console en dBu (niveau nominal + réserve) au 0 dBFS des convertisseurs :

Sensibilité du D19

Sur cette exemple, Le 0 dBFS du convertisseur sera atteint pour un niveau maximum de +21 dBu à la sortie de la console (voir la norme en broadcast). Bien sûr, on aligne le niveau sans tenir compte de tout recours au système Soft Clip.

La pratique simplifiée américaine : "Calibration" et "Headroom" :

Bien plus simplement, l'alignement appelé "calibration" aux états-unis se fait de la manière suivante :

L'Operating level :

La plus part des consoles, comme chez nous, sont alignés sur 0 dB VU pour +4 dBu de sortie analogique, niveau appelé "Operating level". En risquant d'introduire un risque de confusion avec la notion différente europenne, on ne cache pas qu'il est aussi appelé "Nominal level" dans ce contexte.

Le "Headroom" :

Ce n'est pas la même notion que la réserve, qui chez nous présente un caractère de sécurité. Le headroom est tout simplement "la dynamique qui reste à utiliser". Traditionnellement fixé à 12 dB ou 18 dB, la valeur de 18 dB de headroom est la plus rencontrée en studio d'enregistrement.

Donc le 0 dBFS du convertisseur sera réglé à +22 dBu analogique en sortie de console : +4 dBm (operating level) + 18 dB (headroom).

Les notions de niveau nominaux à +12dBu ou +6 dBu, les notions de niveau fort disparaissent complètement du langage employé. Nous avons pris comme exemple la "calibration" recommandée des interfaces "888" de Digidesign pour Protools (réglage d'usine).

Conclusion :

A l'opposé de ce principe d'alignement et d'enregistrement rencontré dans les studio d'enregistrement de musique, le cas suivant demande un plus grand respect de la dynamique, et sera peut-être le point de départ de l'évolution d'une normalisation dépassées.


2) Un exemple d'alignement dans un environnement extérieur au studio pour un tournage :

Les exemples suivant concernent les tournage de film, de documentaire, voir de reportage journalistique.

Sont exposés deux cas d'école, un cas avec un enregistreur 20 bits avec alignement à -20 dBFS, et un cas avec un enregistreur 16 bits avec un alignement à -18 dBFS.

Attention, en général il n'y a pas de traitement de surcharge des convertisseurs comme dans le cas précédent du studio d'enregistrement. Le niveau maximal de sortie ligne d'une console ou d'une mixette doit être de +24 dBu dans le cas de l'enregistrement 20 bits, et de +22 dBu pour le cas d'un enregistrement en 16 bits.

Note 1 : au cas où la réserve des préamplis ou celle de l'étage de mélange n'est pas suffisante, on augmentera le volume de la sortie "master" de la mixette ou de la console sur la roulante de 2 à 4 dB dans un deuxième temps après l'alignement sur le +20 dBFS. Cette pratique se fait couramment au moment de la prise de son, afin de donner plus de réserve en amount

Note 2 : si la console ou la mixette ne peut pas sortir +24 dBu en ligne, un autre alignement devra être choisi. La sensibilité de l'enregistreur 20 bits devra être augmentée en conséquence. Il serait alors préférable de choisir une mixette ou une console dont ses indicateurs sont alignés au standart Européen (niveau nominal de + 6dBu, avec un niveau maximal de +16 dBu pour un enregistreur 16bits ou de +18dBu pour un enregistreur 20 bits ou plus). Sur ce dernier point, lire les remarques des constructeurs de consoles en conclusion.

Note 3 : notons que l'alignement à -20 dBFS est conseillé par Sony pour l'emploi des caméras numériques Digital Betacam et autres comparables. Un onglet est d'ailleurs gravé sur la graduation du crête-mètre Full Scale à cristaux liquide.

Note 4 : j'ai même vu des cas où l'on aligne à -22 dBFS, pour un signal analogique d'alignement fournissant +4 dBu. En l'état actuel de l'étalonnage des vu-mètres et crètes-mètres des consoles, est-ce bien raisonnable ? Que devient alors le 0 dBFS à comparer avec le niveau maximal de sortie des mixette ?

NiveauxDivers/NiveauTournage.jpg en tournage

Conclusion :

Je pense sincèrement que c'est dans les cas rencontrés dans ce deuxième chapitre (alignement dans un environnement extérieur au studio pour un tournage) que l'évolution vers d'autres référenciel d'alignement a le plus de chance de se faire (voir la remarques des constructeurs sur ce point dans le sujet du forum attaché à ce dossier).

Le monde du studio d'enregistrement ne changera pas de si tôt, car le principe du niveau maximum atteint et du tassement volontaire de la dynamique par tout phénomène de surcharge donne un style, une sonorité particulière et appréciée à la musique.

Quant au troisième cas, celui de la radiodiffusion et de la télédiffusion, l'évolution est encore moins envisageable.


3) Niveaux recommandés pour l'alignement en radiodiffusion et en télédiffusion :


Dans ce chapitre, à l'inverse des situations précédentes, la dynamique recherchée de la diffusion d'un programme est assez limitée, volontairement afin de rendre compatible le contenu sonore des modulations de tout genre (parole, musique, ambiance) avec la reproduction d'une grande variété de récepteur. Autant pour la radiodiffusion que pour le télédiffusion, l'Union Européenne de Radiodiffusion recommande un alignement spécial, où pour la France le niveau nominal est de +12 dBu et pour le reste de l'Europe le niveau nominal est de +6 dBu :

Pour la France suivant l'UER :

Niveaux UER

Pour le reste de l'Europe suivant l'UER :

Tableau 2 à faire...

La recommandation de l'UER est plus ou moins mise en pratique. La lecture des cahiers des charges de quelques diffuseurs français et allemands fait ressortir des légères adaptations dans les points suivants :

A) Annexe technique de France 2, décembre 2003

Ce sont les spécifications sonores d'un document pour le "prêt à diffuser" (PAD) que doivent avoir les enregistrements d'émission ou de film, sortis de l'étape finale de mixage. Les niveaux sonores doivent respecter les valeurs suivantes :

- Le niveau d'alignement : 18 dBFS (-9 dB sur un crête-mètre PPM DIN 45406 10ms)
- Le niveau maximum permis des crêtes de modulation : 9 dB au dessus du niveau d'alignement, c'est à dire -9 dBFS

Sur la dynamique du son (recommandation FIMM/DIFFUSEUR ou CST-TV audio 1 2000), les 30 dB de dynamique sont un maximun à ne pas dépasser; voir l'exemple suivant pour la diffusion de la parole :

France 2

Remarque 1 : Notez que les spécifications n'évoquent plus la notion de niveau nominal. On parle d'un niveau d'alignement, d'un niveau maximun, d'une dynamique de 9 dB pour la parole et d'une dynamique maximale de 30 dB pour le reste des modulations.

Remarque 2 : Il n'y a plus le même écart de niveau entre le crête-mètre et le vu-mètre qui est normalement de 8 dB en régime sinusoïdale permanent, suivant les recommandations de l'UER. L'alignement choisi semble se pratiquer de la manière suivante à la lecture des recommendations :

0 dB vu = -9 dB crête-mètre RTW = -18 dBFS


B) Consigne de préparation du matériel de diffusion pour ARTE :

Ce sont des normes de mai 2003, valides jusqu'en décembre 2004.

Sur l'alignement : On notera le niveau de référence (alignement) qui en France correspond à +4 dBu pour -18 dBFS et en Allemagne à - 3dBu pour -18 dBFS. Par rapport aux recommandations de l'UER, la France est à +4dBu au lieu de +3 dBu. L'Allemagne est conforme. Voir le tableau suivant :

Arte 1

Sur la modulation du programme : La nouveauté est la tolérance de crête à +3 dB au dessus du niveau maximal, c'est à dire à -6 dBFS. Voir le tableau suivant :

Arte 2

Autre différence : les dynamiques sont plus grandes pour l'ensemble du signal et pour la parole dans le programme

Le programme


C) Spécification PAD de M6 (Métropole télévision) :

Je n'ai relevé que peu de renseignements :

- Le niveau d'alignement est de -18 dBFS à 1 kHz.
- Le niveau d'enregistrement peak ne dépassera pas -10 dBFS

Notez que le "niveau d'enregistrement peak" doit être à -10 dBFS. Cela ne suit pas la recommandation de l'UER, mais cela ressemble à la pratique d'un studio d'enregistrement évoquée au chapitre 1.

Il est dit également : Des réajustements devront être effectués à la lecture du programme chaque fois que les signaux seront incompatibles avec les caractéristiques techniques de la télédiffusion française en vigueur (valeur crête audio, sous-modulation ou trop forte dynamique).

En conclusion :

N'oublions pas l'ultime intervention du compresseur/limiteur d'antenne qui intervient à la suite de cet alignement avec ses exigences de limitation encore plus redoutable. La dynamique se trouve encore diminuée. Cela rejoint pratiquement le principe du mastering rencontrée dans l'édition du CD et du DVD.


4) Niveau recommandé lors des opérations de Mastering :

Le mastering est l'étape nécessaire pour faire sortir convenablement de l'univers du studio de production, les enregistrements aboutis. Qu'il soit sur CD ou DVD, les niveaux et la dynamique sont modifiés afin d'assurer la reproduction correcte dans tous les cas de figure rencontrée par le public. Compromis et moyenne seront de règle en fonction des styles de programme.


A) Pour le CD :

La course commerciale à la plus forte densité sonore entraine une volonté de tassement de la dynamique : compresseur, limiteur, générateur de distorition harmonique sont utilsés à cette fin lors de cette utilme étape. Essayons d'y voir plus clair.

Partons de la normalisation évoquée au chapitre 1, concernant le studio d'enregistrement : un niveau d'alignement de -18 dBFS, un niveau nominal de -10 dBFS, un niveau fort de -4 dBFS et un niveau maximal de 0 dBFS sur une échelle numérique.

Le travail de mastering va consister à augmenter le niveau en fonction du style de musique et de la nécessité d'une importante dynamique ou pas :

- en musique classique, on augmentera en moyenne de 4 dB : cela ramène le niveau le plus fort au 0 dBFS
- en jazz, on augmentera de 7 dB : cela ramène le niveau fort au 0 dBFS après une légère limitation
- en variété, on augmentera de 10 db : cela ramène le niveau nominal au 0 dBFS, après compression et limitation

Parfois la simple normalisation du niveau suffit, s'il n'y a pas de crête à couper ou de dynamique excessive à réduire. Dans le cas où il existe une dynamique à réduire, on utilise un compresseur. Dans le cas où il n'existe que des crêtes à couper, on utilise un limiteur, souvent prédictif (il abaisse le gain quelques millisecondes avant que la crête de moduclation ne surgisse, grâce à une prélecture ou à un délai de retard avant le traitement définitif).

Correspondance de ces valeurs numériques avec le niveau de la sortie analogique d'une platine CD de radiodiffusion :

Les platines CD de studio Studer D730, D731 et D732 ont leur niveau maximum de sortie à +15 dBu, réglé en usine, pour un niveau numérique de 0 dBFS sur le CD.

Il s'agit d'un compromis d'alignement pour les trois types de mastering évoqués précédemment :

- En mastering de musique classique :

le niveau d'alignement analogique de +4 dBu devient -18 dBFS en numérique au studio de mixage, puis de -14 dBFS sur le CD après mastering. A la sortie de la platine CD D730 il sera de + 1 dBu (au lieu de +4 dBu à l'origine).

- En mastering de variété :

le niveau d'alignement analogique de +4 dBu devient -18 dBFS en numérique au studio de mixage, puis de -8 dBFS sur le CD après masering. A la sortie de la platine CD D730 il sera de + 7 dBu (au lieu de +4 dBu à l'origine).

- En mastering de jazz : Le cas idéal

le niveau d'alignement analogique de +4 dBu devient -18 dBFS en numérique au studio de mixage, puis de -11 dBFS sur le CD après masering. A la sortie de la platine CD D730 il sera de + 4 dBu (comme à l'origine).

Dernière note : le fait que le CD soit un support où les échantillons sonore ne sont définis que seulement sur 16 bits, fait accepter par quasiment tout le monde cette réduction de dynamique par la compression ou par la limitation. Quelques maisons de disque essayent de donner à leur CD une dynamique réelle en diminuant les effets du mastering. Mais leur disque n'ont pas de succés commercial. Maintenant, qu'en est-il d'un support plus performant dont la résolution peut être de 24 bits ?


B) Pour le DVD-vidéo :

Les pratiques ne sont pas encore bien établies. Mais à l'écoute de différentes productions, il est clair que les effets destructeurs du mastering sont beaucoup moins présents. On se contente en général de normaliser le mixage final, c'est à dire d'amener le niveau le plus fort au 0 dBFS, sans compression, ni limitation.


Conclusion générale :

Les premiers cas de figure de cet exposé correspondent à des situations connues et rencontrées en production. Beaucoup d'autres hypothèses peuvent être envisagées, selon les pratiques étrangères, les habitudes de production internes aux sociétés et les performances du matériel face aux recommandations des constructeurs.

Les derniers cas cités correspondent aux exigences des diffuseurs et des maisons de disque, dictés par les résultats commerciaux, et de ce fait ne sont pas prêts d'évoluer, même avec l'apparition progressive et lente de la radiodiffusion et de la télédiffusion numérique. Seul le DVD et ses produits concurrents donnent encore l'espoir de connaitre un plus grand respect de la dynamique dans la reproduction sonore, et d'en faire participer l'auditeur.

Mais pour conclure, revenons sur les situations rencontrées en production, pour lesquelles les normes anciennes d'alignement employées aujourdhui paraissent dépassées, voire absurdes. Pour se faire, je laisse la parole aux constructeurs et techniciens de maintenance (voir plus bas), qui peuvent nous orienter sur des choix différents plus performants.

Philippe Labroue


Citations issus du forum Perchamn sur le sujet "Les niveaux d'alignement" et sur la volonté de modification des pratiques et coutumes :

Extrait 1

Extrait 2

Extrait 3



Bibliographie :

"Le livre des techniques du son", édition 3/tome 2 chez Dunod, et édition 1/tome 2 chez Eyrolles : "Introduction à la technologie audiofréquence" par Jacques Van Den Driessche et François Ragenard

"Son et enregistrement" de Francis Rumsey et Tim McCormick, Eyrolles
"Son analogique et numérique" de Jean Rouchousse, Dujarric

Digidesign Protools 888/24 "installation guide"
Studer D19 MicAD, "Operating Instruction"
Studer D732 "Operating Instruction", Compact Disc Player

"Annexe technique de France 2, décembre 2003", CST
"Spécification PAD de M6 (Métropole télévision)", CST
"Consigne de préparation du matériel de diffusion pour ARTE", CST

Deutsche Welle (La voix de l'Allemagne) : Quality Parameters of Audio Signals

Pour étendre le sujet à la reproduction du son en salle de cinéma, voir les articles publiés sur le site de la CST.


Photos Sarl Studio Labroue, 2005, www.labroue.com, labroue@club-internet.fr