Mathieu Guillaume a écrit:Bonjour à tous,
Tout d'abord, je tiens à féliciter les contributeurs de ce forum pour le niveau des interventions, qui est remarquable. Je tiens aussi à dire que je partage les mêmes attentes que vous en ce qui concerne la haute fidélité, qui doit aussi passer par la haute fidélité du rendu spatial.
Je ne pensais pas que mon rapport de DEA aurait un jour une telle audience

. Je vais essayer de répondre aux questions qui ont été posées. Si j'en oublie, je pense qu'il serait peut-être aussi souhaitable de prendre un nouveau départ dans un autre thread.
Dans un mail perso que j'ai reçu de GBo, celui-ci me demande si la pentaphonie introduite par Cabasse au début des années 80, et si la méthode d'enregistrement/reproduction de Philippe Muller "Direct Sound Recording" peuvent prétendre se réclamer du principe de Huygens. Je ne vais pas trop me mouiller pour la réponse : je dirais oui et non.
Oui, dans les deux cas, car il s'agit de deux cas particuliers d'holophonie (la position des microphones au moment de la prise de sons et des enceintes au moment de la restitution sont identiques) pour N = 5. En revanche, les résultats que nous pouvons espérer par cette discrétisation un peu
"barbare" de la surface de restitution ne seront pas miraculeux. Je vais essayer de donner quelques éléments de réponse disséminés dans la suite de ce message.
Pour commencer, je ne pense pas que ces deux procédés doivent être présentés comme des extensions de la stéréophonie. Pour moi, il existe une différence fondamentale : la stéréophonie n'est pas de l'holophonie. La prise de son s'effectue (normalement) par un couple de micros et si besoin par des microphones d'appoint. Ces microphones ne sont pas placés du tout là où se situeront les enceintes au moment de la restitution. Les procédés sur lesquels s'appuie le rendu stéréophonique tirent leur origine dans la psychoacoustique (différences de temps et d'intensité). Ces notions peuvent se généraliser pour le multicanal au sens dolby and co. Il existe des méthodes de prise de sons dédiées pour ces formats telles que celles présentées dans ce document
http://www.microphone-data.com/pdfs/MMAD.pdf, qui utilisent les mêmes concepts psychoacoustiques.
Revenons maintenant aux deux types d'holophonie précédents. Les deux approches visent toutes les deux à améliorer le rendu spatial par rapport à la stéréo. Je ne vais pas me permettre de les critiquer, car le juge final reste nos oreilles, et que je n'ai pas eu l'occasion d'écouter ces deux dispositifs. En revanche, j'ai déjà assisté à des démonstrations de Wave Field Synthesis (WFS). Pour ceux d'entre vous qui sont curieux, il se pourrait qu'il y ait des démonstrations à la porchaine convention AES qui se déroule à Paris
http://www.aes.org/events/120/. Sinon, il doit y en avoir une annuelle au cours des portes ouvertes de l'IRCAM. De plus, plusieurs musées ont déjà fait appel à des installations WFS pour des expositions. Pour la comparaison des deux dispositifs d'holophonie ci-dessus, j'essaierais donc d'utiliser uniquement des arguments scientifiques.
La chose fondamentale qui les différencie est la position des microphones : pour la DSR, le concepteur a choisi de privilégier l'avant de la scène, tandis que pour la pentaphonie, on se rapporche plutôt d'une distribution circulaire quasi-uniforme, ne privilégiant a priori aucune direction. Dans les deux cas, ces deux réseaux de microphones (même si N=5, c'est suffisant pour parler de réseau) souffrent du défaut connu en WFS sous le nom d'aliasing spatial. Pour essayer d'appréhender cette notion, nous pouvons dire qu'il y a du repliement spatial lorsque des sources différentes génèrent une réponse identique sur le réseau de microphones. Voici une liste d'exemples dans lesquels il y a de l'aliasing :
Pour une antenne de microphones linéaire d'axe (Oz), toutes les sources situées sur un cercle de rayon R à une côte z génèrent la même réponse sur le réseau de microphones. Ainsi, l'antenne est incapable de localiser les sources dans le plan horizontal (Oxy). Il s'agit donc d'un très mauvais choix pour de la prise de son. Heureusement, ce n'est pas le cas dans les deux exemples ci-dessus.
Pour la pentaphonie et le DSR, deux sources situées de manière symétriques par rapport au plan de l'antenne, l'une en dessous, et l'autre au-dessus, génèrent aussi la même réponse sur l'antenne. Il y a donc aussi de l'aliasing pour ces deux procédés. Cet exemple d'aliasing est le plus simple. Il y a des moyens scientifiques plus costauds pour mieux le caractériser, mais ça prendrait presque une thèse pour l'expliquer
.
Nous avons abordé le problème de l'aliasing au moment de la prise de son. Nous allons maintenant envisager le problème dual qui survient au moment de la restitution. Encore une fois, le raisonnement que je vais donner est poussé à l'extrême, mais c'est pour faire passer l'idée. Si nous supposons qu'une seule source était présente dans l'enregistrement initial, sur la scène (devant), le dispositif synthétise quant à lui 5 sources différentes dans les deux cas :
Dans le cas du DSR, les 5 sources utilisées sont situées devant, cela ne détruit donc pas la localisation d'une telle source. L'effet spatial est correctement reproduit
En revanche, dans le cas de la pentaphonie, 3 enceintes sont situées devant et deux derrière. Au moment de la reproduction, nous allons donc avoir l'impression qu'il y a des sources à l'avant, mais aussi à l'arrière, ce qui est dans ce cas préjudiciable au confort d'écoute (échos potentiels), et ce qui traduit la difficulté d'effectuer une bonne prise de son pour ce format. C'est à mon avis pour ça que les dispositifs basés sur la pentaphonie et antérieurement la quadriphonie (dans les années 60 il me semble) ont été des échecs, et que nous nous sommes limités à la stéréo.
Le DSR n'est pas pour autant exempt de tout défaut, car si nous souhaitons enregistrer des sources situées à l'arrière de la scène, elles nous seront quand même reproduites en face de nous par le dispositif de restitution. Dans ce cas, l'argument "c'est ce qui se passe devant qui est intéressant, pas derrière" se justifie dans la majorité des cas.
Que se serait-il passé dans le cas théorique (intégrale de Kirchhoff) ? Les sources secondaires situées sur la moitié avant de la sphère auraient servi à synthétiser la source initiale, tandis que les sources situées sur la deuxième moitié de la sphère auraient servi à émettre un champ sonore en opposition de phase par rapport au premier, de sorte que le champ global émis à l'extérieur de la sphère soit nul. Ainsi, les 5 sources du DSR ont un effet "positif" dans ce cas, tandis que les deux sources arrière du pentaphonique ne serviraient, selon Kirchhoff, qu'à annuler le front d'onde primaire. Dans la pratique, avec deux sources, non seulement ce n'est pas suffisant, mais cela empire les choses en ajoutant de l'écho car le front d'onde réémis par ces sources est entendu par l'auditeur. Je ne sais pas si c'est clair
Pour conclure, nous voyons poindre la nécessité d'un traitement des prises de sons, afin de filtrer le signal sonore provenant d'une direction donnée pour pallier les inconvénients de la pentaphonie au moment de la restitution, ce qui n'est pas fait naturellement en branchant la sortie des microphones directement dans les enceintes. Cet effet se fait clairement ressentir lorsque N est petit, ce qui n'est pas le cas de l'expérience du rideau acoustique effectuée à l'IRCAM. Dans ce cas, les sources sont en nombre suffisant pour qu'elles n'apparaissent pas comme dissociées pour l'auditeur : elles fusionnent et délivrent un message cohérent. Quel est le critère qui permet de savoir si les sources du réseau d'enceintes vont être perçues comme une seule source, ou bien plusieurs sources distinctes ??? Il s'agit de l'espacement des enceintes. Plus il est petit, meilleur cela sera, d'où un nombre rapidement croissant de haut-parleurs dans les installations de type WFS ou celles basées sur les harmoniques sphériques. Plus spécifiquement, le critère physique pertinent est la longueur d'onde : pour les basses fréquences, la longueur d'onde est de l'ordre du mètre, les sources fusionnent généralement assez bien car l'espacement des enceintes peut être inférieur à la longueur d'onde. En revanche, ce n'est plus le cas aux hautes fréquences où la longueur d'onde est de l'ordre du centimètre ou de la dizaine de centimètres : les enceintes sont alors perçues comme distinctes. Pour caricaturer, l'effet ressenti est qu'on arrive à localiser clairement une contrebasse de manière unique, alors que nous ressentons autant de violons et de flûtes qu'il n'y a d'enceintes au moment de la reproduction. Ces remarques ne s'appliquent qu'à l'holophonie, et non la stéréophonie.
Assez pour ce soir, je suis épuisé