gailuron a écrit:Pio2001 a écrit:La différence entre 16 et 24 bits ne concerne pas les détails, la profondeur, la largeur ou la dynamique musicale. Cela concerne un "pchiit" sonore très faible, présent en 16 bits, et absent en 24 bits. C'est tout !
"pchiit" sonore que l'on peut éliminer par
oversampling et
noise shaping au moment de la conversion numérique->analogique.
Non, c'est trop tard. Dans un fichier 16 bits, le pchit sonore est inscrit dans les données et fait légitimement partie du signal à reproduire. C'est à l'étape d'avant, lors de la réduction de 24 à 16 bits, qu'on applique le noise shaping pour éviter d'inscrire définitivement le bruit dans les données.
Fichier source : 24 bits 96 kHz.
Réduction vers un fichier à 44.1 kHz : étape 1, on applique d'abord un filtre passe-bas qui coupe les fréquences supérieures à 22050 Hz, mais toujours sur un fichier 96 kHz. On garde le maximum de bande passante jusqu'à 20000 Hz, puis on diminue progressivement pour atteindre 0 à 22050 Hz. Ce filtre n'a pas de pente régulière. Sa pente accélère de plus en plus pour atteindre zéro (moins l'infini, en décibels) à 22050 Hz.
Ce filtre est appelé anti-alias, ou anti-repliement, mais ce n'est ni plus ni moins qu'un passe-bas très raide.
Etape 2 : une fois toutes les fréquences élevées retirées, on calcule les nouveaux échantillons pour générer le fichier 44.1 kHz 24 bits.
Réduction de 24 à 16 bits : on peut arrondir les valeurs. L'erreur d'arrondi génère un bruit de -96 dB qui suit le signal enregistré. Il est nul si toutes les valeurs sont nulles, de sorte qu'on ne l'entend pas dans un silence numérique.
Mais on peut faire mieux : on ajoute d'abord un signal haute fréquence bruité très faible à l'original 24 bits, et on arrondit ensuite. C'est le
dither. Il a pour effet de provoquer des erreurs d'arrondi beaucoup plus fréquentes et instables, de sorte que le bruit qui en résulte se retrouve toujours très haut en fréquence, même quand le signal original est basse fréquence. Il est plus élevé que -96 dB, mais se retrouve dans une bande de fréquence où notre oreille est peu sensible.
Enfin, on peut choisir un dither arrangé spécialement pour rejeter un maximum de bruit très haut en fréquence, là où c'est inaudible pour nous. C'est le
noise shaping.
Résultat : on a un fichier 44.1 kHz 16 bits avec des sons basses fréquences nettement en-dessous de -96 dB.
A présent vient la conversion en analogique.
On suréchantillonne x2, x4... x256 si on veut, en insérant des zéros entre les échantillons existants. On obtient un signal discontinu, "en peigne". Cela aurait pour effet, si on lisait les données à cette étape, de cloner le spectre du signal dans les ultrasons, après 22050 Hz.
Puis on applique un passe-bas (appelé anti-alias) à ces données, le même que quand on a fait la réduction de 96 à 44.1. Il coupe tout ce qui dépasse de 22050 Hz, donc retire les "alias" qu'on a créé dans les ultrasons. Il a pour effet de "boucher les trous" entre les échantillons, là où on a mis des zéros. On se retrouve avec un flux 88.2, 176.4 ou davantage, de kHz, contenant juste le signal de notre fichier 44100 Hz, mais avec les valeurs intermédiaires supplémentaires interpolées entre les échantillons. La façon dont un simple passe-bas peut boucher les trous entre les échantillons est presque magique. Et c'est plus précis qu'une moyenne.
A ce moment, on convertit en analogique de la seule façon qu'on sait faire : en escaliers. La présence d'escaliers déforme la bande passante dans la dernière octave. Donc par exemple pour un suréchantillonnage x4, on est à 176.4 kHz, et donc les fréquences de 44 à 88 kHz sont théoriquement distordues par les marches d'escalier. Sauf qu'il n'y en avait pas puisque notre anti-alias a tout enlevé au-delà de 22050 Hz.
Les marches d'escalier elles-mêmes sont tout de même présentes sous forme d'harmoniques ultrasonores. On les retire avec un autre passe-bas, analogique cette fois, qui retire progressivement tout ce qui se trouve au-dessus de 22 kHz, et qui commence à bien atténuer à partir de 40 kHz. C'est beaucoup plus simple à faire en analogique que si on voulait travailler dans l'étroite zone entre 20 k et 22 k.
Résultat : on a un signal analogique sans marches d'escalier, tout-à-fait lisse, qui est la réplique de l'original, mais coupé brutalement en fréquence entre 20 kHz et 22 kHz, avec un bruit haute fréquence de l'ordre de -80 à -90 dB au-delà de 16 kHz (c'est un ordre de grandeur, tout dépend du noise shaping utilisé, si même il y en a eu), et une dynamique de plus de 100 dB dans les fréquences musicales (s'il y a eu un original 24 bits contenant une telle dynamique, et s'il y a eu dither).