Technique d’enregistrement de chœurs: une perspective historique

Paul McGlashan, ingénieur du son, Nouvelle Zélande

Les cent dernières années ont été marquées par d’énormes changements dans les techniques et la technologie d’enregistrement sonore, avec des périodes d’innovation dans tous les aspects et toutes les étapes de la production musicale – de l’ingénierie de l’enregistrement et de la post-production à la distribution de la musique, de la distribution auprès du grand public à la technologie. L’enregistrement d’ensembles de musique acoustique tels que les chœurs et les orchestres s’inscrit dans ce paysage et, bien que les approches traditionnelles d’enregistrement soient encore prédominantes aujourd’hui, le décor est planté pour une nouvelle ère basée sur des techniques d’enregistrement et de production immersives qui deviennent de plus en plus courantes dans les industries de la vidéo, de la musique et des jeux.

L’approche traditionnelle de la captation d’un concert de chœur ou d’orchestre repose généralement sur les qualités acoustiques du lieu pour obtenir un son équilibré et un sentiment de réalisme. Idéalement, le lieu est choisi en fonction du style de musique et de la taille de l’ensemble. L’ingénieur du son choisira une configuration et un positionnement appropriés des microphones afin de capter l’équilibre global de l’ensemble et un rapport satisfaisant entre le son direct et le son réverbéré. Le choix du microphone (par exemple, omnidirectionnel ou directionnel) et de son positionnement dépendent également de facteurs tels que le niveau de bruit ambiant dans le lieu (climatisation, bruits de circulation, oiseaux, météo), l’effectif de l’ensemble et la présence de solistes et d’instruments.

Bien qu’il existe une grande variété de configurations de microphones, la configuration typique pour un chœur a capella est en général basée sur une paire de microphones stéréo appariés pour capturer l’espace sonore global, éventuellement complétée par des microphones d’appoint pour les différentes voix du chœur et les solistes (en fonction de l’acoustique du lieu et de la qualité des chanteurs solistes). La technique de microphone stéréo utilisée est généralement une paire de micros espacés ou quasi-coïncidents (par exemple, des micros omnidirectionnels en Small AB, ou des microphones directionnels en ORTF ou NOS), qui peuvent être soutenus par des microphones omnidirectionnels ou largement cardioïdes pour les grands chœurs. Ces choix permettent généralement d’obtenir la meilleure sensation d’enveloppement et d’espace. Les microphones d’appoint sont aménagés de sorte à garantir que l’équilibre général et le positionnement des solistes dans l’espace sonore soient aussi authentiques que possible. Les microphones sont raccordés à un enregistreur audio, idéalement via une chaîne d’enregistrement minimaliste de haute qualité, et l’enregistrement est ensuite post-produit (montage, mixage, numérisation). En dehors de l’édition et du mixage, la manipulation du son enregistré (par exemple, l’égalisation, la compression) est généralement réduite au minimum voire pas utilisée du tout. Toutefois, une réverbération supplémentaire peut être ajoutée pendant la postproduction pour lier l’ensemble de la représentation et améliorer la sensation d’enveloppement (sentiment d’être entouré de son).

Figure 1 – Surround microphone configuration based on Decca Tree

Aujourd’hui, les enregistrements stéréo sont toujours le moyen prédominant pour enregistrer les chœurs. Les techniques et considérations en matière de microphones utilisés pour les enregistrements de chœurs ou d’orchestres n’ont pas fondamentalement changé depuis les débuts de l’enregistrement stéréo, au milieu des années 1950, lorsque l’introduction de la bande magnétique a entraîné une grande innovation dans l’enregistrement stéréo.

Le passage de la bande magnétique au numérique, dans les années 1970, a permis d’améliorer encore la qualité audio et d’innover dans l’enregistrement et la lecture du son surround. De nouvelles techniques de microphones ambiophoniques ont permis de capter le son de l’avant, mais aussi des côtés et de l’arrière, dans le but d’obtenir une perspective à 360 degrés. Ces techniques d’enregistrement ont été associées à des formats de lecture tels que le Quadrophonic dans les années 1970 et le Dolby 5.1 et le DTS dans les années 1980 et 1990. Le but de l’ambiophonie était de produire une sensation d’enveloppement plus convaincante que celle que l’on pouvait obtenir avec la stéréo. Cependant, à l’instar de la stéréo où l’espace sonore est perçu comme étant devant l’auditeur, le surround n’a réussi que partiellement à produire une expérience à 360 degrés, car l’impression était toujours celle d’un espace sonore largement bidimensionnel ou horizontal. 

Figure 2 – Neumann KU-100 Dummy Head

Les techniques binaurales ont encore progressé dans les années 1970 avec l’utilisation d’une tête humaine factice ayant des microphones placés dans les oreilles pour simuler la façon dont les êtres humains perçoivent le son. Notre capacité à localiser le son provient du fait que le son arrive à nos oreilles à des moments et à des niveaux légèrement différents. Ce décalage binauriculaire est largement régi par la forme de nos têtes, la distance entre les oreilles, leur taille et leur forme. Le résultat est un espace sonore tridimensionnel précis, l’auditeur étant au centre et le son n’apparaissant pas seulement à gauche et à droite (comme avec la stéréo traditionnelle) mais aussi en dessous, au-dessus et derrière. Il est préférable d’écouter les enregistrements binauraux avec un casque et, selon la position de la tête artificielle, ils peuvent donner l’impression étrange d’ “être là”, présent dans la pièce avec les interprètes. Jusqu’à présent, le binaural reste une niche dans le monde de l’enregistrement musical et, bien qu’il ait été utilisé à bon escient par certains artistes contemporains, il n’a pas été si populaire pour les enregistrements de chœurs et d’orchestres (cf. Critique de “Surround the World”). Toutefois, cette situation est en train de changer, à mesure que les casques deviennent de plus en plus le principal moyen d’écouter de la musique et avec la tendance croissante aux enregistrements spatiaux, outre l’apparition d’une technologie binaurale à bas prix.

Figure 3 – SoundField Ambisonic Microphone

L’ambisonie, technique développée dans les années 1970, permet de capturer une impression tridimensionnelle à l’aide d’un dispositif tétraédrique de quatre microphones situés en un seul point de l’espace. C’est une approche d’enregistrement surround populaire à la fois pour la musique et pour les films. Une des propriétés intéressantes de cette technique est que les enregistrements peuvent être manipulés en post-production. Diverses configurations de microphones peuvent être utilisées en décodant de différentes manières les signaux des quatre microphones. Cette technique est idéale pour reproduire le paysage sonore d’une foule ou d’une ville, bien que pour en profiter pleinement sur des haut-parleurs, il faille être assis dans la “zone idéale” (“sweet spot”). En format binaural pour une écoute au casque, l’ambisonie offre des expériences immersives très convaincantes. L’ambisonie a également été un acteur de niche dans le monde de l’enregistrement d’ensembles acoustiques – l’une des raisons principales étant que, bien que cette technique puisse fournir un paysage sonore réaliste, le manque de réponse en basses fréquences des microphones directionnels utilisés signifie que le sentiment d’enveloppement n’est pas aussi convaincant que les techniques stéréo et surround qui utilisent des microphones omnidirectionnels.

Figure 4 – Conventional 5.1 surround speaker setup (without LFE)

Comme en stéréo, enregistrer et mixer un chœur pour un son ambiophonique implique normalement de déplacer les microphones principaux gauche et droit vers les haut-parleurs gauche et droit afin de construire l’avant de la scène sonore. Un microphone principal central (si utilisé) est déplacé vers le haut-parleur central et les microphones à l’arrière sont déplacés vers les surrounds gauche et droit, en cet ordre. Les niveaux de mixage sont alors ajustés afin d’atteindre la balance appropriée gauche-droite et avant-arrière. Les surrounds gauche et droit donnent un son diffus mais réverbérant, et apportent une sensation d’enveloppement en simulant les retours de son de la salle provenant de derrière l’auditeur. Les microphones mobiles sont déplacés selon les besoins, généralement entre la gauche et la droite de la scène sonore frontale — mais ils pourraient aussi être déplacés vers les côtés ou les surrounds pour des effets plus intéressants, par exemple les solistes dans la galerie, les parties latérales de la salle. La réverbération artificielle peut être requise pour mêler les solistes au son de la scène sonore et une réverbération ambiophonique peut être ajoutée comme adhérant général et afin d’augmenter la sensation d’espace. Il n’y a pas de doute que l’ambiophonie peut amener une amélioration par rapport au stéréo en ce qui a trait au réalisme et à la sensation d’enveloppement. Néanmoins, en raison de la dépendance de l’ambiophonie à des systèmes de haut-parleurs multi-canaux assez coûteux, sa popularité est limitée, les coûts de production supplémentaires étant difficilement justifiables.

Aujourd’hui, le but de l’enveloppement a progressé au-delà des ambitions originales du son ambiophonique et a mené à une nouvelle ère audio immersive tridimensionnelle. Même si les formats ambiophoniques créent une scène sonore qui enveloppe l’auditeur, le son arrive tout de même à ses oreilles dans le plan horizontal, à l’aide de haut-parleurs positionnés devant, aux côtés et derrière lui. Ces formats ambiophoniques ignorent le fait qu’en situation réelle, une grande partie du son vient également à vous par le haut, par exemple le plafond et les retours de son des balcons. C’est cette dimension additionnelle de hauteur qui est le secret des formats de sons immersifs contemporains, tel que Dolby Atmos, DTS :X et Auro-3D, qui ajoutent des haut-parleurs supplémentaires situés au-dessus de l’auditeur, afin de fournir l’information de la hauteur. Le son binaural est lui aussi devenu plus généralisé avec la popularité grandissante des casques d’écoute et la capacité des formats sonores immersifs permettant de réduire un enregistrement multicanal à une version binaurale pour une écoute immersive au casque. Cela a permis à des formats immersifs (Dolby Atmos en particulier) d’aller au-delà de la contrainte des haut-parleurs de cinéma et de salon, vers des dispositifs de lecture personnels ayant accès à des plateformes de streaming, comme Apple Music, Amazon Music et Tidal, qui offrent de plus en plus de contenu immersif.

Figure 5 – Dolby Atmos Production Suite

Les avancées récentes dans les formats ont ouvert un nouveau monde de possibilités pour la production de musique et la création d’expériences basées sur l’acoustique visuelle. Non seulement, il est possible de déplacer les microphones de manière traditionnelle en deux dimensions, mais avec les haut-parleurs additionnels en hauteur, le mixeur sonore a un espace tridimensionnel permettant des mixages beaucoup plus ouverts et moins encombrés. Il est maintenant possible d’aller plus loin que les techniques panoramiques basées sur les canaux en utilisant les “objets”. Les approches basées sur les objets vous permettent d’attribuer vos microphones (et les autres sources sonores) à un objet et de le positionner n’importe où dans un espace virtuel de 360 degrés autour de l’auditeur. L’automatisation des déplacements permet à ces objets d’être déplacés indépendamment à l’intérieur de la scène sonore et permet un trajet déterminé pour le déplacement d’un objet autour de l’auditeur — excellent pour les effets sonores de film (avions qui volent au-dessus de votre tête ou flèches qui sifflent près de vos oreilles).

Les formats immersifs basés sur les objets ouvrent la porte à de nouvelles perspectives pour les enregistrements de chœur. Imaginez chaque membre d’un chœur ayant son propre microphone et en post-production, étant capable de manipuler chaque chanteur en tant qu’objet indépendant — les plaçant à des positions différentes autour de l’auditeur. Il serait possible de créer des expériences d’écoute complètement différentes et des effets musicaux. Une occasion peut-être pour le traitement innovant d’œuvres chorales, tel que le “Leonardo Dreams of his Flying Machine” d’Eric Whitacre.

Figure 6 – Apple Music App with Dolby Atmos

Il est encore tôt pour la musique immersive et bien qu’il y existe une quantité grandissante de contenu immersif, la majorité de ce contenu consiste en remix d’enregistrements stéréo. En conséquence, il n’y a que très peu d’exemples de performances chorales ou orchestrales qui aient été spécifiquement enregistrées avec l’idée d’en faire un format immersif. Cela dit, un très bon exemple de Decca’s Immersive Experience est disponible sur Apple Music, dont une merveilleuse interprétation de l’introduction de Dies Irae du Requiem de Verdi. Interprétée par le London Philharmonic Choir and Orchestra, la sensation d’”être là” au centre de l’orchestre et du chœur est relativement convaincante — il en résulte un engagement beaucoup plus intime avec la représentation, que vous n’auriez pas avec une version typiquement stéréo. Pour entendre la différence, vous aurez bien sûr besoin de l’écouter à l’aide d’un dispositif capable de rendre le format Dolby Atmos — aisément fait à l’aide d’un casque d’écoute branché sur un iPhone d’Apple en vous assurant que le paramètre “Dolby Atmos” de votre application de musique est réglé sur “Toujours activé”.

Alors que l’enregistrement et la lecture stéréo vont continuer à être la base des enregistrements acoustiques dans le futur proche, le son immersif a donné naissance à une nouvelle ère d’innovation. Les formats immersifs basés sur les objets, tels que Dolby Atmos, vont permettre une conception sonore innovante et de nouvelles perspectives pour l’auditeur de musique — capable de faire l’expérience du ressenti en concert, par exemple, ou de celui d’un membre de l’ensemble, d’une section du chœur, du chef de chœur ou d’un membre du public. Les possibilités sont infinies ! En fin de compte, cependant, l’audio immersive n’est toujours rien qu’une simulation de la réalité, et si je suis convaincu que si cette expérience d’écoute a toute sa place, il n’y a rien de mieux que de faire partie d’un vrai concert – comme membre du chœur chantant ou comme membre du public. Je me rappelle encore vivement m’être trouvé il y a environ 20 ans dans la section ténor du Requiem de Verdi, debout derrière le groupe des percussions de l’orchestre, et être submergé par le coup viscéral que m’a donné l’onde de choc des deux grosses caisses quand elles ont frappé ces coups massifs dans l’introduction. Cela, vraiment, c’est ce qu’on peut appeler “être là”!

 

PAUL MCGLASHAN est propriétaire et ingénieur du son chez Classic Sound, une boutique et société d’enregistrement située sur l’île de la Grande Barrière à Auckland (Nouvelle-Zélande), qui se spécialise dans l’enregistrement et la post-production de musique classique et acoustique. Au cours des 20 dernières années, Paul a réalisé des enregistrements d’ensembles orchestraux et choraux pour la plupart des orchestres, ensembles de musique de chambre et chœurs importants en Nouvelle-Zélande, souvent en collaboration avec Atoll records. Tôt dans sa carrière, Paul a acquis de l’expérience avec une panoplie de représentations classiques locales et à l’international, pendant un stage à temps partiel à Radio New Zealand Concert. Paul a aussi été responsable de l’enregistrement et du mixage de la musique pour la cérémonie d’ouverture de la Coupe du Monde de Rugby en 2011, télédiffusée à travers le monde. Paul a obtenu des diplômes de maîtrise avec distinction en Sciences de l’informatique et en Creative and Performing Arts de l’université d’Auckland. Il est aussi musicien (chant) de formation classique et a fait partie pendant 20 ans du célèbre chœur de chambre Viva Voce, avant de partir vivre à la Grande Barrière en 2016.

 

Traduit de l’anglais par Charline Bompart et Amélie Bergeron, relu par Jean Payon