Acousmodules

SpatStruments

The Guide!

Spatialization

Effects

Sampling

Synthesis

Utilities

Win32/Linux

MIDI/Controllers

Resources

+

S P A T S T R U M E N T S   e t   M I X A G E   F O U

La douzième édition du Mixage Fou, que je supporte ardemment depuis nombre d'années, s'annonce particulièrement intéressante par les catégories qu'elle propose, notamment celle qui est nommée "Open Channels".
En effet, s'il y a une chose que les Acousmodules défendent depuis leur création il y a vingt ans c'est l'ouverture de l'espace sonore. Un dispositif de production des sons par haut-parleurs ne constitue pas seulement un cadre normalisé nécessaire à la reproduction de contenus, il peut aussi représenter un élément à part entière d'une création et constituer par lui-même une source de diversité précieuse.
Une autre chose est que le son est un phénomène complexe (ça on le sait) et sa matière, sa forme ET son espace peuvent former un tout, pour la perception aussi bien que pour la réalisation (ça on l'oublie souvent...). Façonner les sons conjointement avec leur espace (plutôt que les spatialiser ultérieurement) est la raison d'être majeure de ces outils.

La mini série des SpatStruments s'intègre particulièrement bien au propos du Mixage Fou, qui, je le rappelle, n'est pas un concours mais permet tout de même de gagner des prix et d'entendre sa création diffusée en public. C'est en tout cas l'occasion d'en profiter pour essayer, pour oser des choses que l'on aurait peut être plus de difficulté à aborder dans un autre cadre. C'est notamment le cas pour les formats spatiaux, qui sont encore trop souvent ignorés dans les formations comme dans les appels d'œuvres.

Les SpatStruments ne font pas de "spatialisation", ils permettent de créer et de transformer des sons avec leur espace, dans le format de son choix.
Par rapport à l'ensemble des Acousmodules, ils sont optimisés pour des formats de réalisation que l'on peut qualifier de petits à moyens, tout en conservant l'ouverture qui leur est commune.
Chacun d'eux rassemble des fonctions déjà présentes dans les autres plugins, mais dont l'association et la liaison étroite avec des contrôles gestuels plus ou moins originaux en fait des instruments complets, chacun explorant d'une manière différente et complémentaire les relations que l'on peut créer entre le son et son espace.

Sept plugins sont actuellement disponibles, les deux autres devraient l'être début octobre, laissant donc encore pas mal de temps pour les explorer tous avant la date finale du 12 novembre...
Toutes les informations nécessaires à leur utilisation ainsi que les téléchargements se trouvent sur la page qui leur est dédiée.
Les rubriques concernant l'installation et la compatibilité avec les hôtes et leur configuration sont particulièrement importantes... 

générateurs

SpatStrument SM24 : échantillonneur + synthétiseur + spatial modeleur et animateur à partir de contrôleurs MPE

1-8I / 24O
(2)

contrôleur MPE

multicanal et multi-stéréo

SpatStrument PL32 : player d'échantillons mono et multicanaux avec contrôle gestuel "3D"

24-32O

clavier avec Poly AT, contrôleur
3D

multicanal et multi-stéréo

 

SpatStrument GR24 : dislocateur, brasseur, vaporisateur de son sur 24 points d'espace avec sampleur de gestes

1I / 24-32O
(2)

Pad XY(Z)

multicanal

 

SpatStrument AL24 : animation de boucles spatiales en synthèse et en échantillonnage

8I / 24-32O

contrôleur
3D

multicanal et multi-stéréo

transformateurs

SpatStrument FX24/32 : multi-effet multiphonique avec Pitch/Frequency Shifting + Delay + Filtre + Reverb

32I / 24-32O

surface de contrôle

multicanal uniquement

SpatStrument C24 : convertisseur créatif de formats spatiaux et transformateur de masses multiphoniques

24I / 24-64O

(pads)

multicanal uniquement

SpatStrument VB32: explorateur spatial en 6DOF pour la VR et le Binaural (et l'octophonie)

32I / 8-2O

contrôleur 6DOF

multicanal uniquement

utilitaire

SpatStrument T24 : multi-outil rassemblant un générateur de signaux de test, un afficheur des crêtes d'amplitudes, un analyseur de spectre, un réglage de gains, un bass manageur, un routeur et un enregistreur, tout ça bien-sûr en multicanal jusqu'à 24 points totalement libres ;-)

24 I/O

-

multicanal uniquement

divers

 

SpatStruments MiniTools Collection : MiniAdd, MiniBinoct, MiniDeco, MiniDyn, MiniFade, MiniFoll, MiniFreeze, MiniGest, MiniKeys, MiniLine, MiniMeta, MiniMID, MiniMix, MiniMon, MiniMorph, MiniMove, MiniPass, MiniPatch, MiniPatt, MiniPick, MiniPitch, MiniRev, MiniRoom, MiniRoute, MiniSamp, MiniScale, MiniShaper, MiniSpat, MiniSplit, MiniView, MiniVol ...

multicanal uniquement


Vous trouverez sur cette page des informations complémentaires, ainsi que des tutoriels et des vidéos spécifiques pendant toute la durée du Mixage Fou.

Première information : il existe une version spéciale du SpatStrument PL32 qui inclue la banque de sons du Mixage Fou 12 ! La section TouchPlayer de ce plugin comportant 25 lecteurs monophoniques, il était trop tentant de l'utiliser pour placer les 5 phrases en 25 langues dans 5 Presets ;-)
- téléchargez le SpatStrument PL32 special MF12 au format VST3 pour Windows (pour MacOS télécharger le plugin seul en AU)  
- installez le plugin et ses presets, ouvrez le dans, au hasard, Reaper, et jouez avec la banque !
- bon, lisez peut-être tout de même le Guide d'utilisateur et les instructions avant...
- vous pouvez aussi télécharger le projet Reaper (pour Windows) configuré avec les SpatStruments T24, C24 et FX24/32 (plus d'information à ce sujet bientôt).

 

 


 

blog spécial Mixage Fou + SpatStruments

 

des réflexions - de la technique - de la pratique

 

des réflexions

-----------------------------     Open Channels ?     ------------------------------

Le Mixage Fou offre cette année un éventail de catégories très exaustif, parmi lesquelles une qui peut poser question. Et c'est très bien.

"Open Channels" ne signifie pas forcément que la disposition spatiale des points haut-parlants doit être "ouverte" ou "libre", mais que celle-ci n'est pas déterminée par un procédé technique, comme le sont par exemple le codage ambisonique et l'Object Based Audio du Dolby Atmos.
Qu'il s'agisse d'un "7.1" classique ou d'un mur de 18 enceintes, chacun-e peut donc choisir ici une configuration spatiale en fonction de ses préférences et de ses intérêts.

On peut tout faire ?
Sur le plan des espaces haut-parlants, la catégorie "Ambisonic" est  basée sur une répartition de type sphérique, plus ou moins complète et détaillée, et la catégorie "Dolby Atmos" s'inscrit idéalement dans la partie supérieure d'un cube, celui-ci étant aussi souvent assimilé à une sphère pour des raisons pratiques. Dans les deux cas, donc, rien qui ne puisse être représenté par les points multiples de la catégorie "Open Channels", où l'on va d'ailleurs retrouver les formats "surround" et "immersifs" traditionnels comme l'Auro-3D, le 22.2 et les différents "beds Atmos" comme le 7.1.4, sans oublier tout de même le cercle octophonique cher aux musiques électroacoustiques. Les avantages de ces deux méthodes résident par contre dans leur mode de distribution et de diffusion (voir plus bas les conversions).
Il est néanmoins important de ne pas confondre le format spatial (le type de disposition spatiale et la création conçue pour lui) et le formatage des moyens de distribution ou de diffusion (encodage, format de fichier, outils logiciels etc.) : on peut tout à fait faire une création pour dôme sans utiliser le codage ambisonique ou créer en 9.1.6 sans passer par le procédé Dolby Atmos !
Mais avec l'Open Channels, on peut aussi envisager d'autres choses...

 

 

-----------------------------     Any Position ?     ------------------------------

Vraiment ?
Il y a déjà de quoi mixer follement avec les dispositions plus ou moins normalisées du dôme, de l'Auro-3D, du "9.1.6" et même de la quadriphonie, mais on peut également explorer des territoires moins balisés, tels ceux que l'on peut trouver dans certains domaines du "spectacle vivant" ou des installations.
Sans aller jusque là, pouvoir simplement penser que l'on puisse créer quelque-chose en suivant d'autres géométries que celle de la boîte vide peut ouvrir sur des modes d'expression et des situations d'écoute alternatifs très féconds... Lignes, écrans, quadrillages et autres empilements, tout est théoriquement envisageable.

DeltaP ligne octophonique

Hervé Birolini In Grid

Jean Voguet Cranelab


Un cas souvent oublié : l'acousmonium
Un cas intéressant et assez répandu est celui des ensembles de haut-parleurs qui sont traditionnellement associés à la diffusion d'œuvres acousmatiques (les acousmoniums). Cette approche a été initialement développée dans les années 70 sur la problématique de la diffusion publique des compositions stéréophoniques, mais depuis ce modèle s'est étendu aux compositions multiphoniques, tout en conservant certaines caractéristiques originales comme le multicouche.
Qu'est-ce donc ?
Essentiellement la possibilité de jouer avec la distance de production, et pas seulement avec des images de distance, un relief réel et pas seulement une image de relief : il y a du plus proche et du plus lointain, vraiment, ce n'est pas compliqué mais ça change tout ! Et comme on peut faire de très bons acousmoniums avec une vingtaine de points, pourquoi se priver de composer pour eux ?

la structure de base par paires

la double couronne généralement pratiquée par Motus

une disposition classique en éventail

un concert de Pierre Henry


Un cas souvent ignoré : le maillage volumétrique

La distribution haut-parlante multicouche s'effectue le plus souvent sur le plan horizontal, mais certains acousmoniums peuvent déployer ce principe également dans la hauteur. On n'est alors plus très loin de conceptions maillées tri-dimensionnelles comme par exemple celles du système 4DSound ou de l'Acousmonef.
Un "maillage 3D" par rapport à un dôme ou un à format cinéma, c'est un peu comme un piano avec toutes les notes par rapport à un autre auquel il manquerait les touches noires. Si si...
Avec 18 points (9 x 2) on dispose déjà de quoi obtenir un système à deux niveaux d'élévation tout à fait intéressant.

l'acousmonium du Birmingham ElectroAcoustic Sound Theater

le Monom à Berlin en "4DSound" 48 canaux

l'Acousmonef en 80.4


Et les auditeurs ?
Mais si "Any position", c'est bien-sûr celle des points haut-parlants, des enceintes, cela peut être aussi celle des auditeurs...
À la différence des espaces egocentrés conçus pour l'écoute privée domestique ou pour le spectacle audio-visuel traditionnel, et qui ont produit tous nos formats depuis la stéréophonie jusqu'à l'ambisonique et l'Atmos, il est possible de considérer un ensemble haut-parlant non pas comme le moyen de reproduire une image d'espace qui soit identique pour tous, mais pour produire un espace original où chaque auditeur va bénéficier d'un point d'ouïe différent, comme dans la "vraie vie"...
C'est le domaine privilégié des installations et de beaucoup de dispositifs muséaux, et c'est aussi la différence que l'on trouve dans le domaine du jeu vidéo et la "réalité virtuelle" entre la 3DOF (on est au centre de l'espace où l'on peut pivoter sur soi-même) et la 6DOF (on se déplace librement dans l'espace).

 

C'est le type de spatialité qui est privilégié dans toute la série des Acousmodules, et qui fait d'ailleurs qu'ils sont souvent plus difficiles à configurer pour des espaces plus simples... Mais sur ce plan là, avec leur choix entre les modes Périphonique et Volumétrique, les SpatStruments sont à peu près aussi à l'aise avec les deux conceptions.
 

Penser en familles pour y voir plus clair
Avant de choisir un format spatial on peut bien-sûr se documenter, et contempler les interminables listes de 5.1, 6.1, 7.1, 8.1 etc. que nombre de logiciels se sentent obligé d'étaler...
On peut considérer qu'il ne s'agit finalement que de variations de la résolution d'un type unique de format spatial, dont les nuances, si elles sont bien réelles, ne sont pas forcément essentielles. C'est exactement ce qu'a fait Dolby avec l'Atmos, et c'est ce qu'induit d'une manière différente le fonctionnement du codage ambisonique. Le paysage des formats spatiaux devient alors un peu plus lisible, il permet de les relativiser et de s'appercevoir qu'il en existe d'autres qui eux sont bien différents...
On peut distinguer quatre familles principales - cinéma, (hémi)sphérique, acousmonium et réseaux maillés - auxquelles il faudrait bien-sûr ajouter l'indispensable famille "autres".
On peut alors assez facilement se rendre compte de laquelle on se sent le-la plus proche, et y choisir le membre qui nous convient le mieux.
Les SpatStruments permettent de créer des sons pouvant s'inscrire dans toutes ces familles et leurs variations pouvant être définies par un ensemble de points/canaux jusqu'à 24.
Par exemple :

dans la famille cinéma : l' "Atmos" 9.1.6 (vue dessus)

dans la famille sphérique : le dôme 24 (vue dessus)

dans famille "acousmonium" : les paires 2D 16

dans la famille maillage 3D : l'holophonique 24

etc...

 

-----------------------------     mais alors ?     ------------------------------

Considérer que l'on peut jouer avec les dispositions haut-parlantes comme on peut jouer avec les sons pose tout de même deux questions importantes : comment le faire et comment le faire entendre ?

Comment faire ?
La première est commune à toute réalisation multiphonique : elle concerne les outils de production et les conditions pour pouvoir les utiliser efficacement.
En ce qui concerne les outils logiciels, c'est aujourd'hui l'abondance, tant quantitative que qualitative, à laquelle contribue modestement la série des Acousmodules... Et même si depuis quelques années, grâce à des éditeurs comme IEM et SPARTA, la technique ambisonique est enfin devenue accessible, conviviale et performante, l'approche multipoint bénéficie toujours de la plus grande compatibilité et diversité. Mais attention, cela ne veut pas dire pour autant que tous permettent une approche ouverte de la création sono-spatiale, les formats cinéma sont quelques-fois les seuls qui soient disponibles...

En ce qui concerne les conditions matérielles, c'est évidemment une autre affaire, puisque, idéalement, il faut pouvoir entendre ce que l'on produit ! Mais s'il est toujours bon d'être exigeant, il faut aussi savoir la placer (l'exigeance) au bon endroit. On ne demande pas la même chose à un couple stéréophonique qu'à un ensemble de 16 enceintes.
Mais surtout le nombre de points haut-parlants disponibles ne détermine pas forcément celui de la composition, et on peut fort bien travailler avec un dispositif comportant moins de points que ceux qui définissent le format de réalisation. 


Jusqu'où descendre ?

Le problème qui se pose donc le plus souvent pour la personne qui crée est du type "je n'ai pas assez d'enceintes" ou "je n'ai pas assez de place pour les disposer" (d'accord, c'est aussi souvent "je n'ai pas assez d'argent"...).
En réponse on peut déja appliquer ici la simple règle de la division par deux : écouter un mixage octophonique en quadriphonie ou un "11.1.8" sur un "5.1.4" est techniquement aisé (quelle que soit la technique utilisée) et esthétiquement surmontable. Avec le dôme ou l'acousmonium on peut même aller plus loin grâce à la prédominance de leur forme sur leur contenu (voir les adaptations).
Par exemple :

 

formats cinéma "3D"

dômes

acousmoniums

maillages

optimum

22.2

12/8/4 ou 10/8/5/1 (24)

8 paires (16)

12 x 2 (24)

raisonnable

9.1.6 (16) ou 5.1.4 (9)

5/3/1 (9)

4 paires (8)

9 x 2 (18)

minimum

cube (8)

4/1 (5)

quadri (4)

carré + centre x 2 (10)

Moralité : avec une dizaine d'enceintes on peut tout faire et (presque) tout entendre !


Jusqu'où monter ?
L'avantage avec le codage ambisonique c'est que l'on peut réaliser un mixage en "haute résolution" (en ordre 7 par exemple) tout en ayant à sa disposition qu'un dispositif d'écoute minimum, car on ne considère que la forme du champ spatial, pas comment il est rendu.
Il en va de même en OBA/Atmos puisque la représentation paramétrique de l'espace qu'il utilise pour les "objets" est indépendante de la résolution. Évidemment, dans les deux cas, on ne peut vraiment entendre précisément que ce que l'équipement présent est capable de produire, mais au moins on est sûr que ce qui est créé pourra être rendu de la meilleure manière possible si l'occasion se présente.
Contrairement à ce qui est souvent écrit, le même principe peut s'appliquer aux espces multipoints : comme pour les pixels en photographie numérique, il suffit pour cela que la réalisation se fasse avec un nombre de points/canaux suffisamment élevé (et heureusement on peut se contenter de beaucoup moins !).
Pour utiliser des chiffres "ronds", disons que 32 à 64 points pour un espace à trois dimensions est déjà tout à fait efficace. C'est ce qui correspond en ambisonique aux ordres 5 à 7, et c'est aussi ce qui représente les valeurs les plus élevées des rendus Atmos pour l'espace domestique et au cinéma. C'est une des raisons pour laquelle la plupart des Acousmodules sont disponibles en versions 64 et 36 canaux.
Il est alors facile d'effectuer selon les besoins un sous-échantillonnage spatial pour faire correspondre l'espace composé avec le système de monitoring. Là, un simple plugin peut faire l'affaire, et le GRM-Tools SpaceMaster (gratuit) est d'ailleurs fait pour cela.

 

production

conversion/rendu/adaptation

audition/diffusion

ambisonique

ordre 7 ou plus

décodage vers multipoints, en ordre 7 ou moins

tout système périphonique + binaural

Atmos

OBA

rendu vers multipoints

équipement compatible Atmos + binaural

multipoints

32 à 64 canaux ?

réduction de la résolution

studio uniquement ou systèmes spécifiques

Donc, entre jusqu'où monter et jusqu'où descendre, c'est à chacun-e de trouver son compromis, et les SpatStruments constituent pour moi une moyenne tout à fait équilibrée et réaliste.


Comment faire entendre ?
Comment diffuser des contenus sur des dispositifs haut-parlants variés et souvent incontrôlés, voir incontrôlables ?
En stéréophonie on le fait constamment depuis 60 ans, pour le meilleur comme pour le pire... et le milieu acousmatique y a répondu jadis à sa manière avec le principe de la diffusion sur acousmonium. 
Les techniques ambisoniques et OBA apportent aujourd'hui des réponses qui sont assez efficaces pour conserver une partie de l'impression "immersive" à travers des configurations d'écoute différentes mais à peu près prévisibles, car elles nécessitent des composants particuliers pour le décodage et le rendu. Cette contrainte est le garant de leur efficacité.
On pourrait penser alors qu'un mixage réalisé dans un format "Open Channels" un peu spécifique est impossible à diffuser.
Mais quelle ressemblance existe-t'il finalement entre l'écoute d'une bande son Atmos en salle de cinéma et ce qui sort d'une enceinte du genre Echo Studio d'Amazon ?
Et en ce qui concerne la binauralisation, il existe tellement de variables dans les procédés pour l'obtenir et pour son audition que partir d'une sphère ou de n'importe quoi de plus ésotérique ne constitue pas une si grande différence.
À moins de chercher à obtenir une identité parfaite entre la création originale et sa diffusion, ce qui est tout à fait possible dans le cadre d'un spectacle ou d'une installation, une certaine souplesse s'avère dans la plupart des cas nécessaire.
Peut-être convient-il alors de choisir des formats "opens" qui ne le soient pas trop ?

une ligne octophonique traduite en "Atmos" 9.1.6 : elle est courbe et les points sont irrégulièrement espacés, mais la logique de l'écriture sonore et l'impression globale devraient être conservés.

un cube octophonique dans un dôme : sa partie haute est comprimée, mais si le dôme descend assez bas (ce qui n'est pas toujours le cas...) le rendu de l'image 3D devrait être ssez comparable.


Des lieux ouverts ?

Cette question risque bien de se présenter lors de la traditionnelle remise des prix du Mixage Fou...

Il est aisé de comprendre la nécessité pour la diffusion de médias ou pour l'industrie du cinéma de limiter le type d'espace à une ou deux familles, et de disposer de moyens parfaitement normalisés pour transmettre les contenus.
Mais pour des lieux destinés à la création musicale et au spectacle sonore on pourrait s'attendre à ce que l'ouverture soit au contraire de mise, au moins pour les plus petits d'entre eux ? Car du côté des salles de spectacle de moyenne et grande jauge, c'est actuellement une belle cacophonie de procédés propriétaires et incompatibles, souvent basés sur un équipement matériel ad-hoc (L-Isa, D&B, Meyer, Amadeus, Adamson, Nexo, APG...).

Il existe quelques lieux, prestigieux comme l'Espace de projection de l'IRCAM à Paris (ça tombe bien), moins connus comme le Spatial Sound Institute à Budapest, ou beaucoup plus confidentiels comme mon Acousmonef dans le Puy-de-dôme, qui peuvent assurer la diffusion d'un grand nombre de formats différents, au moins théoriquement...
À l'IRCAM c'est possible grâce à la virtualisation en WFS permise par les 264 enceintes disposées sur le pourtour de la salle (plus les 75 en élévation), au SSI grâce au système holophonique 4DSound, et dans l'Acousmonef grâce à l'organisation haut-parlante volumétrique (voir la liste des formats des pièces qui peuvent être diffusées dans le cadre de l'Acousmathèque des Sons dans l'air).  
Le prochain système volumétrique de la Satosphère à Montréal pourrait être sur ce plan particulièrement intéressant (dôme plus piliers), sans oublier bien-sûr que certains acousmoniums peuvent aussi présenter des dispositions qui soient adaptées à une certaine diversité.

La difficulté aujourd'hui n'est donc pas le traitement logiciel de l'espace, mais on l'a compris, les choix qui président à la mise en place d'un dispositf haut-parlant. Alors, qui de la poule ou de l'œuf, des créateurs ou des salles, vont susciter les futurs évolutions ? Peut-être que les créateurs de Mixages Fous peuvent donner une petite impulsion supplémentaire ?

 

des réflexions - de la technique - de la pratique

 

de la technique

-----------------------------     les canaux     ------------------------------

Dans les trois catégories haut-parlantes (Open channels, Ambisonic et Dolby Atmos) on utilise de multiples canaux pour représenter les données ou les signaux permettant la reproduction de contenus. En stéréophonie et en binaural on en utilise généralement deux...
Il est important de bien comprendre ce qu'ils représentent dans chacun de ces cas, et de ne pas oublier que les outils de production doivent toujours supporter le nombre de canaux nécessaires à la gestion des sons et/ou des espaces.
Avec des logiciels comme Reaper, Ardour ou Usine Hollyhock ça ne pose pas de problème, mais avec d'autres cela peut constituer une limite draconienne !

 

production

transmission

monitoring et diffusion

Open Channels
canaux.jpg

a. les canaux associés aux points qui définissent un espace haut-parlant (le système d'écoute) ou un format spatial
b. le format des objets audio
(1 = mono, 2 = stéréo, 6, 8, 32...)

les canaux du fichier audio multicanal résultant du mixage/rendu
(il nécessite d'être accompagné de la description du format spatial, son type et sa résolution)

les canaux qui sont associés aux points haut-parlants, qui doivent correspondre ou être adaptés à ceux du fichier multicanal

Ambisonic
canaux2.jpg

le nombre qui définit l'ordre du codage utilisé pour représenter plus ou moins précisément le champ spatial des sons
(o1 = 4 canaux, o2 = 9, o3 = 16... o7 = 64)

les canaux du fichier audio codé résultant du mixage/rendu
(ils représentent l'ordre du codage et potentiellement la précision de la diffusion)

les canaux qui sont associés aux points haut-parlants, la définition de leur position angulaire devant être spécifiée dans l'outil de décodage

Atmos (OBA)
canaux3.jpg

a. le format des objets audio, souvent 1 ou 2 + bed (Atmos = 10 canaux)
b. le nombre total de canaux de production (Atmos = 128)

les canaux du fichier ADM (le nombre total d'objets simultanés multiplié par leur format, en Atmos celui-ci est limité à 128) ou du fichier de diffusion encodé, variable selon les techniques de réduction appliquées

les canaux qui sont associés aux points haut-parlants, en fonction desquels sont spatialisés les objets audio selon les données temporelles et spatiales qui leur sont attachées

Note : comme toutes les techniques multiphoniques utilisent des canaux pour représenter, transmettre et diffuser leurs contenus, le terme de "multicanal" peut s'appliquer à tous. Je préfère donc éviter de parler de "format multicanal" à propos de l'Open channels et utiliser à la place celle de "formats multipoints" qui est cohérente par rapport à cette approche de l'espace échantillonné, sachant l'ambiguité qui peut également s'appliquer à ce terme...

La série des SpatStruments traite en général des sons et des espaces qui peuvent comporter jusqu'à 24 canaux. Certains comme le SpatStrument PL32 et les FX24/32 peuvent aller jusqu'à 32, et la section MassPlayer du PL32 peut lire des fichiers possédant 18 canaux.
24 canaux c'est parfait pour le format 22.2, et plus qu'il n'en faut pour la plupart des installations domestiques (et même des studios) équipées en Atmos (11.1.8). Cela convient également pour un grand nombre de dômes, et il n'y a que pour les espaces maillés tridimensionnels où cela peut être un peu juste : définir des points à l'intérieur de l'espace nécessite forcément des canaux en plus...
Mais même dans ce cas on peut déjà constituer un maillage à deux niveaux de 9 ou de 12 points très efficace, et il reste toujours la quantité des autres Acousmodules qui eux traitent 64 canaux ou plus ;-)

 

------------------     les conversions entre catégories...     --------------------

C'est le passage obligé pour l'ambisonique (décodage) et l'Atmos (rendu) qui permet de convertir leurs espaces de représentation abstraits en points haut-parlants concrets, lors de l'écoute durant le travail comme lors de la diffusion.

On peut aussi, dans l'autre sens, convertir un espace basé sur des points dans le format ambisonique (c'est ce que l'on fait toujours lors de la conversion A vers B des captations microphoniques) et en OBA / Atmos.

Les SpatStruments fonctionnent d'une manière native pour une production multipoints de la catégorie Open Channels, mais ils sont aussi tout à fait appropriés pour les autres catégories, y compris le binaural après conversion.

Ceci est particulièrement intéressant pour l'Atmos, car le principe même du mixage OBA contraint à ne pouvoir pratiquement faire que de la panoramisation sur des sons mono/stéréo : les placer, régler leur étendue et les déplacer. Ça peut être parfaitement adapté en post-production cinématographique mais c'est tout de même un peu limité pour une production sonore plus originale.
Si on veut des effets un peu plus complexes, il faut remplir le bed, qui en Atmos se limite à un format multicanal 7.1.2, ou faire de "faux beds" en 9.1.6 ou plus en utilisant des collections d'objets. C'est de cette manière que fonctionnent aujourd'hui tous les plugins qui affichent un support "Atmos" pour des effets ou des instruments (et ça fonctionne bien), et c'est donc aussi ce que l'on peut faire avec les SpatStruments.

Vous pouvez regarder les courtes vidéos que j'avais réalisé à propos du SpatStrument SM24. Elles sont applicables à tous les plugins :

Listen in binaural
Convert in ambisonics
Convert in Atmos objects

Techniquement le principe est simple : il s'agit de convertir les positions des points/canaux originaux selon le système de coordonnées approprié.
Si la conversion n'introduit pas de distorsion (attention aux ordres faibles en ambisonique !) tout le travail interne sur l'espace est conservé, les positions et les étendues des sons comme leurs animations, en tout cas en fonction des caractéristiques du format final : quelle que soit la manière de l'obtenir, un 5.1 reste un 5.1 !
Quelques logiciels comme Panoramix de l'IRCAM et le Spat Revolution de Flux excellent dans ce travail de conversions croisées, mais les SpatStruments étant des plugins, il est plus simple et plus économique d'utiliser d'autres plugins, directement placés à la suite dans l'hôte ainsi qu'il est montré dans les vidéos précédentes.
L'article SpatStruments et Mixage Fou : les conversions entre catégories en détaille la méthode.

La seule contrainte est que, comme les espaces des trois autres catégories sont obligatoirement de type périphonique, il faut que l'espace défini dans les SpatStruments soit également de ce type. Aussi, pour que la conversion soit la plus fiable possible, il vaut mieux disposer initialement d'une résolution élevée, c'est là où les autres Acousmodules avec leurs 64 canaux possèdent un certain avantage...

Dans l'archive SpatStruments Configuration Files vous trouverez trois fichiers de configuration sur 24 points, en dôme et en sphère, qui sont adaptés pour l'ambisonique et le binaural :

                  

et d'autres pour l'Atmos en 7.1.4, en 9.1.6 et en 11.1.8 :

     

 

 

entrée

outil

sortie fichier

multipoints vers ambisonique

dôme 24, configuration A ou B

IEM MultiEncoder (gratuit)

multicanal en ordre 5
(36 canaux) ou plus

multipoints vers Atmos

9.1.6 ou 11.1.8

fonctions intégrées dans Nuendo, Studio One, Logic Pro, Protools Studio et Resolve Studio, ou plugin Fiedler Audio Dolby Atmos Composer Essential, ou Dolby Renderer (Mac ou 2ème ordinateur)

ADM Atmos

multipoints vers binaural

dôme 24 A
ou sphère 24

SPARTA Binauralizer ou
GRM-Tools Space VR (gratuits)

stéréo

Binauralizer : les points ne peuvent être placés que sur la surface de la sphère

SpaceVR : les points peuvent être distribués dans tout l'espace

Si l'espace initial est multicouche, en 2D ou en 3D, il convient de transformer d'abord les points intérieurs en points fantômes, ce qui nous amène à ...

 

-----------------------------     ... et les adaptations     ------------------------------

Cette fois-ci on reste à l'intérieur d'un type de représentation spatiale, d'une catégorie MF, mais alors que dans les conversions on essayait de conserver la nature et la forme de l'espace, ici on change ses caractéristiques pour pouvoir s'adapter à des configurations matérielles diverses ou à des contraintes de transmission.
C'est là un atout important de la diffusion de contenus codés en ambisonique, et c'est la raison d'être des techniques Object Based Audio comme le Dolby Atmos : le procédé de représentation spatiale intègre ses propres possibilités d'adaptation pour des dispositifs haut-parlants variés (détail souvent oublié : à conditions tout de même qu'ils entrent dans la structure spatiale autorisée...).

Les adaptations sont un peu comme les transcriptions en musique, elles sous-entendent que l'on peut opérer un changement plus ou moins important dans la nature de ce qui a été composé. En fonction de l'écriture et des sons, certaines passent mieux que d'autres.
Cela concerne au minimum un changement de résolution, mais ça peut aller jusqu'à devoir supprimer une dimension ou même deux.
Pour passer de l'image immersive d'un dôme ou d'un mixage Atmos au petit cadre de la stéréophonie, choses que ces deux procédés appliquent plus ou moins automatiquement, il faut sacrifier d'abord l'élévation (3D vers 2D) puis l'encerclement (2D vers 1D). Si ces dimensions n'étaient là que "pour faire joli", ce n'est pas forcément grave, mais si elles étaient porteuses de sens et d'expression spécifiques le résultat peut devenir insipide, même s'il ne lui manque rien en terme de spectre et de dynamique.

Avec les espaces multipoints ce n'est pas spécialement plus difficile à faire, mais en l'absence d'un formatage standardisé ça ne peut généralement être réalisé qu'en amont de la distribution, et de main d'Homme !
Bien que jugée obsolète, car coûteuse en heures à payer et compliquée en raison des contenus multiples à distribuer (pour une production commerciale), cette méthode est néanmoins ma préférée car elle permet d'optimiser les procédés, d'opérer des choix qui sont guidés par le propos artistique et par l'écoute plutôt que par un algorithme, et de décider si ces compromis sont ou non acceptables.

Down ou Up-scaling ?
La réduction de résolution, ou de dimension, ne pose en général pas de problème technique et s'effectue simplement en mixant les points manquants vers les points adjacents. C'est exactement ce que l'on fait lorsqu'on regarde un film en stéréophonie, où le canal central est répartit sur les voies gauche et droite. C'est supportable. Évidemment, plus la différence entre la résolution initiale et finale est importante, plus on risque de voir apparaître des approximations dues aux méthodes (lois) de panoramique utilisées, qui peuvent aboutir à de légères variations dans l'équilibre des intensités des sons mixés.

22.2 > 17.1 > 9.1.6 > Auro 9.1 > 7.1 > 5.1 > stéréo : OK (quoi que...), mais le contraire ?

Vouloir augmenter la résolution, ou pire ajouter une dimension, est beaucoup plus complexe, et discutable.
Mais d'ailleurs pourquoi vouloir tranformer une stéréophonie en 5.1 ? Un 5.1 en "immersif" ? Il y a ici quelque-chose qui s'apparente à la colorisation de films anciens, et j'ai le souvenir d'un Stalker de Tarkowski remixé en 5.1 sur DVD dont je ne me suis jamais remis... Mais les algorithmes ont fait des progrès (voir NuGen Halo UpMix), et le goût des re-mixeurs peut-être aussi ?
Il reste que pour une production d'aujourd'hui, à moins d'être attaché à un format spécifique, si on vise la compatibilité avec une famille spatiale (cinéma, dôme, acousmonium, maillage...) il est de loin préférable, comme en photographie, de réaliser avec une définition spatiale la plus élevée possible pour pouvoir ensuite la réduire selon les besoins.

Concrètement
Le SpatStrument C24 permet d'ajuster finement les adaptations, mais pas forcément facilement... (tutoriel à venir).
On pourra lui préférer le GRM-Tools SpaceMaster (gratuit) pour sa simplicité de configuration et (grâce au DBAP) sa fiabilité avec les dispositions spatiales irrégulières. Les logiciels SpatGRIS, Panoramix ou Spat Revolution sont plus lourds mais bien-sûr aussi tout à fait appropriés. 

...

 

des réflexions - de la technique - de la pratique

 

de la pratique

D'abord une (très longue) vidéo qui aborde en première partie la question de la configuration matérielle, puis la mise en place d'un projet de création dans Reaper en fonction du choix de type et de format spatial, jusqu'à la réalisation des conversions pour les exportations dans les différentes catégories à la fin.
Bref, tout ce qui est abordé dans cette page est ainsi illustré par la pratique en quasi direct, et cette page fournit des éléments de réflexion et de documentation supplémentaires pour aider à comprendre ce qui s'y déroule et pourquoi...

0’20 les SpatStruments
3’30 le projet
4’40 une première alternative
6’15 les trois boîtes
9’05 les autres mondes
12’10 la stratégie du choix

16’15 un équipement pour entendre les sons-espaces
23’30 la configuration du système d’écoute
28’ premières conversions
37’55 enfin !
39’50 des "canaux"
41’25 spatialisation vs spatialité

45’30 1. le PL32
55’10 (un peu de ménage)
56’30 d’autres gestes
59’ et un peu "d’effets" avec le FX24/32
1h05’ capture du geste et enregistrement d’objets
1h08 2. le SM24
1h15’20 3. le GR24
1h24’30 4. le AL24
1h29’45 matière spatiale ?

1h31’30 après la récolte…
1h34’30 composer le temps et l’espace
1h42’15 et on continue !
1h55 des objets sonores complets
1h56’15 "one more thing"

2h01’30 un certain Mixage Fou
2h03’25 quelques explications (encore…)

2h11’45 les exportations
2h12’30 1. en binaural
2h13'30 2. l'Open Channels en dôme 24
2h14'45 3. ambisonique
2h17'10 4. Auro-3D 9.1
2h17"50 5. acousmoniums
2h20"50 6. Dolby Atmos
2h22'40 on quitte Reaper (mais pas pour longtemps...)

2h29'45 en guise de conclusion