Modérateurs: Staff Univers Casques, Staff Haute-Fidélité, Staff Juridique • Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 10 invités

Discussions sur le matériel Haute-Fidélité

FAQ sur le codage PCM

Message » 27 Juin 2006 20:07

GBo a écrit:Il y aurait plutot moins de pré-écho en pratique qu'en théorie, mais de toutes façons il y n'a aucune preuve que ce pré-écho soit réellement audible, c'est juste une des pistes qui peut expliquer pourquoi le SACD ou le DVD-A est meilleur que le CD.


Si il y a un pré-écho ajouté à la reconstruction du signal c'est que le signal échantillonné ne remplissait pas la condition de shannon (cas typique du signal impulsionnel par exemple).

GBo a écrit:Pour ta 2ième question, il faut se souvenir que l'échantillonnage à Fs nécessite un signal à bande limitée à Fs/2 (pour la musique, le signal a été filtré), le ramollissement éventuel des pentes de transitoires en musique n'est pas du au principe de l'echantillonnage proprement dit mais au choix de Fs/2. Les concepteurs du CD ont estimé que filtrer à 20 KHz n'était pas dommageable à l'écoute humaine de la musique.


En fait le problème c'est que pour monter jusqu'à 20khz, il ensuite faut filtrer avec un filtre de pente très raide puisqu'à 22,05Khz, il faut avoir 96db d'atténuation pour respecter la condition de shannon pour un signal quantifié (atténuation > pas de quantification).

C'est ce filtrage qui est responsable du pré-écho et, amha, le "problème" du cd est là, pas à la reconstruction :wink:
Robinet
 
Messages: 1378
Inscription: 09 Jan 2001 2:00
Localisation: Verrières (91)

Annonce

Message par Google » 27 Juin 2006 20:07

Publicite

 
Encart supprimé pour les membres HCFR

Message » 27 Juin 2006 20:52

Robinet a écrit:
GBo a écrit:Il y aurait plutot moins de pré-écho en pratique qu'en théorie, mais de toutes façons il y n'a aucune preuve que ce pré-écho soit réellement audible, c'est juste une des pistes qui peut expliquer pourquoi le SACD ou le DVD-A est meilleur que le CD.

Si il y a un pré-écho ajouté à la reconstruction du signal c'est que le signal échantillonné ne remplissait pas la condition de shannon (cas typique du signal impulsionnel par exemple). [...]

Salut Robinet. C'est ce que je me disais aussi tant que je jouais avec des pseudo-dirac et autres pseudo-steps, jusqu'à ce que fasse l'expérience décrite sur ce post:
http://www.homecinema-fr.com/forum/view ... #168850345

Je reprends:
- Je suis parti d'un sample de triangle (l'instrument) enregistré en WAV 24/96 (voir images du haut, spectrogramme / waveform)
- Je l'ai sous-échantillonné à 44.1 Khz sous Sound-Forge, en ayant pris soin d'appliquer le filtre anti-repliement proposé par ce soft, éliminant tout ce qui se trouve au dessus de 22.05 Khz.
Mon triangle resamplé à Fs = 44.1 Khz respecte donc Shannon.
- Je l'ai ensuite suréchantillonné à 96 KHz, toujours sous Sound-Forge, ce qui correspond à ce que ferait un étage d'upsampling de lecteur CD dont le DAC tourne à 96 KHz.
=> on voit très bien le pré-écho (voir images du bas, spectrogramme / waveform):

Image

En zoomant sur la waveform (je n'ai pas représenté ce zoom), on reconnait encore mieux la forme caractéristique d'un sinc à 22.05 Khz qui n'en finit plus de commencer.

cdlt,
GBo
GBo
 
Messages: 3377
Inscription: 03 Avr 2002 2:00
Localisation: RP 78
  • offline

Message » 27 Juin 2006 23:13

C'est curieux.

3 questions:
- les artefacts constatés sont liés au downsampling ou l'upsampling?
- Avec un taux d'up/downsampling entier (96 -> 48Khz par exemple), quel serait le résultat?
(le passage de 44,1Khz à 96Khz et réciproquement n'est pas quelque chose d'évident)
- et, pour finir, la plus importante, quelle est la méthode utilisée par soundforge pour faire sa conversion?

Sinon je me permet juste faire remarquer que le "truc" de shannon-nyquist sur le fait de pouvoir reconstituer un signal si son échantillonnage respect la condition du même nom était un théorème et donc prouvé mathématiquement.

C'est pour cela que je penche plutôt un problème de calcul ou d'implémentation que de principe.
edit: surtout vu la tête du spectre.
Robinet
 
Messages: 1378
Inscription: 09 Jan 2001 2:00
Localisation: Verrières (91)

Message » 27 Juin 2006 23:16

edit bis: est-ce que tu as vérifié que ce n'était pas un effet de bord en ajoutant du padding + fenêtrage.

edit ter: oui je sais je suis chiant :mdr:
Robinet
 
Messages: 1378
Inscription: 09 Jan 2001 2:00
Localisation: Verrières (91)

Message » 28 Juin 2006 0:03

Robinet a écrit:- les artefacts constatés sont liés au downsampling ou l'upsampling?


Ni l'un ni l'autre, cela vient du passe-bas. Et ce ne sont pas des artefacts.
L'oscillation observée (pré ou post echo) est due au fait que l'on retire les fréquences les plus élevées. Si on prend un papier et un crayon, et qu'on se tape l'intégration de la transformée de Fourier soi-même, cela tombe sous le sens.
Un signal sans pré ni post echo EST un signal comportant des très hautes fréquences. Les couper revient à introduire une oscillation.

Plus la pente du filtre est raide, plus l'oscillation est longue. Plus la pente du filtre est douce, plus le signal peut avoir l'air propre. L'oscillation étant limitée au voisinage immédiat de la transitoire.

Quand on numérise, on commence par un filtre passe-bas, qui introduit une oscillation.
Quand on suréchantillonne, on fait aussi du passe bas, donc oscillation.
Quand on sous-échantillonne, idem.

Enfin, on peut appliquer un passe-bas FIR, sans déphasage. C'est du numérique, et c'est ce qui est employé dans les DACs. Il introduit du pré-echo.
Et on peut aussi appliquer un passe bas IIR. C'est du numérique, c'est du temps réel (les FIR on une toute petite latence), et cela ressemble furieusement à de l'analogique. Cela déphase de la même façon. Par contre, toute l'oscillation est après la transitoire. Pas de pré-echo. Seulement du post-echo.
Pio2001
 
Messages: 5911
Inscription: 07 Oct 2003 12:50
Localisation: Neuville-sur-Saône
  • offline

Message » 28 Juin 2006 8:54

@ robinet: je pense que les filtrages de Sound forge sont des brickwalls numériques FIR à phase linéaire, comme ce qui est utilisé dans un downsampling de studio d'enregistrement lors de la constitution d'un CD à partir d'un master de plus haute résolution, et comme ce qui est utilisé dans un lecteur CD qui upsample. Je tenterais de le vérifier par une manip dans les jours qui viennent, pas trop le temps d'ici dimanche. Si j'ai raison sur cette hypothèse (peu de chance que ce soit autre chose...), cette manip doit être considérée sérieusement puisqu'elle serait alors représentative de ce qui passe lorsqu'on lit un CD (au niveau du signal après upsampling attaquant le DAC à 96KHz).
Coté théorie, je n'ai jamais dit que cette expérience contredisait le principe de la reconstruction de shannon-whittaker, mais celui-ci repose sur des signaux à bande limitée, là clé du "problème" est à chercher par là AMHA, comme le suggère pio.

cdlt,
GBo

Edit: Au fait Robinet que reproches-tu à mon spectrogramme - qui est parfaitement cohérent avec le waveform lorsque je le zoome - ??? (spectrogramme fréquence vs temps à base de STFT, fait sous matlab, je le précise)
GBo
 
Messages: 3377
Inscription: 03 Avr 2002 2:00
Localisation: RP 78
  • offline

Message » 30 Juin 2006 13:53

Je pense avoir compris ta manip, Gbo.
Juste un détail, si c'était pour tester le filtre passe-bas pourquoi avoir fait du resampling?

Si tu as encore le sample, je veux bien le sample pour faire joujou avec.
J'aimerai bien essayer de rajouter un fenêtrage ou du padding pour vérifier qu'il y a pas des problèmes d'effet de bord.

Pio2001 a écrit:Ni l'un ni l'autre, cela vient du passe-bas. Et ce ne sont pas des artefacts.
L'oscillation observée (pré ou post echo) est due au fait que l'on retire les fréquences les plus élevées. Si on prend un papier et un crayon, et qu'on se tape l'intégration de la transformée de Fourier soi-même, cela tombe sous le sens.
Un signal sans pré ni post echo EST un signal comportant des très hautes fréquences. Les couper revient à introduire une oscillation.


Je suis bien d'accord avec ta dernière phrase. Il suffit d'imaginer une impulsion filtrée (=réponse impulsionnelle du filtre) pour s'en convaincre. Avec passe-bas idéal de fréquence basse, les oscillations seront trèèèèèeeeess longues.

D'ailleurs, ça rejoints ce que je disait avant :wink:
C'est ce filtrage [le filtrage passe bas qui précéde le CAN) qui est responsable du pré-écho et, amha, le "problème" du cd est là, pas à la reconstruction.


[quote=Gbo]Edit: Au fait Robinet que reproches-tu à mon spectrogramme - qui est parfaitement cohérent avec le waveform lorsque je le zoome - ??? (spectrogramme fréquence vs temps à base de STFT, fait sous matlab, je le précise)[/quote]

Je trouve bizare c'est tout :mdr:
Tu saurais mettre juste la transformé de fourrier du signal?
Robinet
 
Messages: 1378
Inscription: 09 Jan 2001 2:00
Localisation: Verrières (91)

Message » 01 Juil 2006 8:27

Robinet,
Je suis parti du sample 24/96 de triangle dispo sur cette page:
http://64.41.69.21/technical/sample_rates/index.htm
Le mieux c'est en effet que tu refasses l'expérience que j'ai décrite avec d'autres outils. :wink:

Robinet a écrit:Je trouve bizare c'est tout :mdr:
Tu saurais mettre juste la transformé de fourrier du signal?

NB: dans "STFT", il y a "FT" :idee:

cdlt,
GBo
GBo
 
Messages: 3377
Inscription: 03 Avr 2002 2:00
Localisation: RP 78
  • offline

Message » 20 Déc 2006 22:39

Petit up pour répondre par l'exemple non pas à une question, mais à une affirmation - erronée - selon laquelle avec du PCM 16 bit on ne pourrait pas exploiter une dynamique supérieure à 50 dB (lu sur HCFR sur un autre thread, mais aussi sur le forum delphi encore plus récemment).

Voici un petit extrait musical (libre de droit) trouvé sur le net :
http://64.41.69.21/technical/reference/ ... 1644ds.wav
Source:
http://64.41.69.21/technical/sample_rates/index.htm

C'est le format du CD, ni plus ni moins, soit du 16 bit à 44,1 KHz (ou "16/44.1" en abrégé).

Comme je suis aventureux, j'ai tenté ma chance de voir ce qu'il pouvait rester de ce son lorsque je diminue artificiellement le volume non pas de 50 dB mesdames, non pas de 60 dB messieurs, mais de 70 dB!
Voici donc ce même extrait musical sur un CD qui serait enregistré 70 dB trop bas (avec dithering):
http://gbotet.club.fr/guitar-sax_1644-70d.wav

=> On n'entend rien, et inutile de monter le son car -70 dB est un saut énorme! (certains seront surpris de savoir qu'en environnement domestique, à -40 dB il faut vraiment déjà tendre l'oreille ou monter le son de sa chaîne pour percevoir quelque chose..).

Quoiqu'il en soit, voici ce que ça donne en réamplifiant le WAV précédent de 70 dB, tous les défauts (dus au très faible nombre de bits qui restent pour encoder la musique) sont donc amplifiés, comme si on avait monté le son de son préampli de 70 dB pour ce CD bizarre où le max est à -70 dB FS:
http://gbotet.club.fr/guitar-sax_1644-70d+70.wav

=> C'est bruité certes, mais cela reste reconnaissable. Et ne pas oublier qu'à volume normal chez soi, on n'entend même pas les détails enregistrés à ce niveau...

cdlt,
GBo
GBo
 
Messages: 3377
Inscription: 03 Avr 2002 2:00
Localisation: RP 78
  • offline

Message » 21 Déc 2006 17:24

Voici l'article de Stéréo et Image de Juillet/Août 2006 signé Jacques Vallienne (ex- Prestige Audio Vidéo si je ne m'abuse) qui est à l'origine de cette rumeur selon laquelle les CD ne pourraient pas dépasser 50 dB de dynamique:

http://www.bouddha.ch/Hifi/quelques%20n ... 20base.htm

"[...]Il y a 20 ans, aux débuts du CD, le niveau de bruit était tel que l'on ne pouvait espérer dépasser 45 dB de dynamique utile avec ce support. Les ingénieurs du son s'en souviennent : il fallait une compression de dynamique assez violente pour « faire entrer » un signal audio sur un CD. Aujourd'hui, les progrès technologiques ont amélioré les choses, mais la dynamique utile du CD reste encore bien inférieure aux 84 dB espérés (un signal audio sur CD avec 50 dB de dynamique est considéré, en studio, comme exceptionnel). "

Une autre erreur dans cet article est d'affirmer que les informations musicales du CD sont codées sur 14 bits seulement (d'où le chiffre - faux - de 84 dB théorique déjà cité...), alors qu'elles sont codées sur 16 bits bien sûr (sauf sur CD "HDCD" lu dans un lecteur non HDCD dans lequel le bit de plus faible poids est vu comme du bruit blanc).
La phrase exacte de Stéréo & Image vaut son pesant d'or: "[...]l'audio, donc le signal utile, n'est codée que sur 14 bits avec le CD. Les deux bits supplémentaires sont utilisés pour autre chose que des informations musicales (ce sont des bits « d'identification »)." :o

Le plus triste est qu'il suffit d'avoir un PC avec CD-ROM, d'un software permettant de visualiser la valeur des samples issus d'un CD audio du commerce et la curiosité de vérifier, ce qui aurait évité la publication de telles coquilles (qu'on n'a pas fini de retrouver dans les discussions).
Pour info le test à -70 dB publié hier soir ici m'a pris 20 minutes rédaction comprise!

A signaler aussi que l'affirmation selon laquelle dans un lecteur CD, "après conversion en analogique, le signal doit être filtré de façon très efficace, au-delà de 22 kHz, [...] filtrage [qui] entraîne, par la force des choses, un déphasage assez significatif", traduit la méconnaissance de l'auteur de l'architecture des lecteurs avec oversampling (et upsampling plus récemment), dont le but principal depuis de nombreuses années est justement de relacher les contraintes sur le filtrage analogique en aval du convertisseur, afin d'éviter tout déphasage significatif dans les aigüs...

:cry:
GBo
 
Messages: 3377
Inscription: 03 Avr 2002 2:00
Localisation: RP 78
  • offline

Message » 21 Déc 2006 21:08

Propre net et sans bavures. Du GBo quoi 8)
kobtar_bale
 
Messages: 327
Inscription: 09 Fév 2006 17:29
  • offline

Message » 01 Aoû 2007 19:22

Pour alimenter ce sujet très intéressant, je met un lien vers une page intéressante, sur laquelle je suis tombé par hasard. C'est en japonais, mais il n'est pas utile de le lire (je ne sais pas faire sans Babel Fish, d'ailleurs). Les photographies sont assez éloquentes et se sont elles qui ont un intérêt!


http://www.page.sannet.ne.jp/komamura/Impulse.htm

Ce que j'en saisi :

Les captures d'écran montre une succession de sigaux impulsionnels pris à la sortie de deux appareils numériques, un lecteur de minidisc et un lecteur de CD.

Ce qui est intéressant, ce sont les captures d'écran 2, 3 et 4. Elles sont réalisés sur le même appareil, un lecteur de compact disc Sony CDP-XA30ES, mais le filtre numérique de ce lecteur est à chaque fois sur une position différente.

La première capture d'écran correspond à un filtre à coupure raide (juste au-dessus de la bande audio), la seconde à un filtre plus "lâche", qui coupe avec une pente plus douce au-dessus de la bande audio.

La plus intéressante est la troisième ; c'est la première fois que je vois une impulsion de cette forme. Il n'y a pas le pré-écho dont on parle plus haut. Elle correspond à un filtre numérique qui, d'après le manuel du lecteur en question, est sensé émuler un filtre analogique de type Butterworth du 7ème ordre. Cette émulation s'accompagne d'une rotation de phase dans le haut du spectre. Le degré de cette rotation peut être de trois valeurs différentes, qui définissent trois sous-positions de ce filtre. Suivant l'importance de la rotation de phase, la forme de la réponse diffèrerait légèrement. (Voir l'image jointe, extraite du dit manuel).

Ceci me rappelle une déclaration d'Edmund Meitner(le fondateur de la firme Emm Labs) au sujet de la mise au point d'un convertisseur, je crois qu'il était appelé IDAT, qui "surveillait" le signal. Si un transitoire était détecté, il passait d'un mode de filtrage à un autre. Ce type de convertisseur permettait ainsi d'éviter le pré-écho ; il n'y avait plus d'oscillations qu'après l'impulsion.

Est-ce que nos spécialistes du numérique en ont entendu parlé ? Qu'est-ce que cela vous inspire et comment expliqueriez-vous ce mode de filtrage numérique ?
Fichiers joints
Réponses impulsionnelles filtre numérique Sony CXD9595Q positions 3.jpg
Réponses impulsionnelles filtre numérique Sony CXD9595Q positions 3.jpg (10.54 Kio) Vu 1204 fois
Ce n'est pas se donner que de donner ce qu'on voudrait être (Patrick Drevet).
Sage nicht immer, was du weisst, aber wisse immer was du sagst (Matthias Claudius).
Avatar de l’utilisateur
Scytales
Staff Haute-Fidélité
Staff Haute-Fidélité
 
Messages: 10079
Inscription: 31 Mar 2002 2:00

Message » 01 Aoû 2007 23:31

Cela colle tout-à-fait au comportement mathématique idéal de ces filtres.

Avec une coupure brusque on a des oscillations à la fréquence de coupure.
Avec une coupure progressive, on a des oscillations plus rapidement amorties.

Avec un filtre en temps réel, où l'impulsion est transmise en premier, on a rotation de phase, tandis qu'un filtre à phase linéaire présente un délai d'établissement, et du pré-écho à la fréquence de coupure.

Il ne s'agit pas d'effets collatéraux, ou de défauts de conceptions, ce sont les représentations exactes, sur un graphe temporel, des filtres choisis. Pour autant que l'on peut voir, ils sont parfaits.

Ce qui est intéressant est d'émuler ces trois filtres sur des fichiers wavs, à différentes fréquences de coupure, afin de les écouter.
C'est ainsi que personnellement, je ne fais aucune différence entre un filtre brutal, un filtre progressif, et le signal original, dès une fréquence de coupure de 14 kHz ! Alors à 22 kHz, la fréquence de coupure du CD je n'en parle même pas.

La capacité à faire la différence dépend de l'acuité auditive de l'auditeur dans les hautes fréquences. Elle est généralement situé deux ou trois kilohertz en-dessous de la plus haute fréquence audible.
Par exemple, j'entends jusqu'à 16 kHz, mais sur de la musique, je ne perçois la disparition de hautes fréquences que lorsqu'on coupe à 13 kHz.

Cela dépend aussi des extraits musicaux. Sur Hydrogenaudio, il y a quelques temps, un extrait musical a été posté sur lequel les auditeurs pouvaient obtenir d'excellents résultats en ABX entre la version pleine bande passante et la version avec les hautes fréquences filtrées. Cet extrait comportait en fait une haute fréquence vers 16 ou 17 kHz qui était bien distincte, et dont la disparition était facilement audible dès que le filtre était abaissé à 16 kHz.
Pio2001
 
Messages: 5911
Inscription: 07 Oct 2003 12:50
Localisation: Neuville-sur-Saône
  • offline

Message » 02 Aoû 2007 13:02

Salut Scytales
Oui l'article de Meitner contient des choses intéressantes, même s'il y a à boire et à manger (le passage philosophico-comique sur le PCM pas bon pour la santé, ça c'est pas terrible, surtout avec l'argumentaire fallacieux qui est servi).
C'est vers la fin de l'interview qu'il mentionne l'existence d'un DAC appelé "IDAT" qui contient un filtre interpolateur spécial, adaptatif, qui bascule d'un FIR brickwall habituel* à un filtre à interpolation linéaire lorsque le message musical à convertir contient un transitoire.

On n'a pas les détails techniques pour juger de tout ça, en encore moins la possibilité d'écouter l'appareil (et l'appareil avec et sans cette fonctionnalité activée), mais je vois au moins 3 soucis à cette approche telle que succintement décrite :
- à partir de quels critères décrête t'on qu'on à faire à un transitoire? (fiabilité du mécanisme)
- comment assure t'on une transition douce entre le filtre habituel et l'autre, sans artefacts ? je suis presque certain qu'il y a des signaux entre deux eaux qui peuvent trahir la présence de ce mécanisme
- le filtre linéaire (d'ordre 1 donc) est un choix sûrement facile à implémenter, mais il a plein d'inconvénients, artefacts fréquentiels notamment. Il n'y a que l'interpolation l'ordre 0 (hold) qui soit pire.

Le choix de Sony est différent : proposer plusieurs filtres fixes (non adaptatifs), avec plus ou moins de pré-écho. Le filtre 3A que tu montres est en effet une émulation numérique d'un filtre que l'on pourrait réaliser en analogique, ça ne pose pas de problèmes.
L'avantage du butterworth d'ordre élevé, par rapport à d'autres filtres ayant été pensés à l'ère analogique, c'est qu'il est à la fois très pentu dans sa partie filtrante (moins qu'un brickwall numérique cependant) et très plat dans sa partie passante. L'inconvénient, tu l'as donné, c'est la rotation de phase, problème que n'a pas un brickwall numérique classique (mais qui lui a le pré-écho, si tant est que ce soit un problème).

Tout est donc une question de choix, veut-on privilégier une propreté en fréquence et en phase ? => filtre brickwall numérique classique?
Veut-on annihiler ce phénomène de pré-écho (qui n'est pas un problème d'implémentation mais constitutif de la théorie) => filtrage analogique classique ou émulation numérique de filtre analogiques (dits "causaux", car ils n'anticipent pas sur le signal, contrairement à un FIR à kernel symétrique).
A signaler qu'on ne SAIT PAS monter une manip on se débarrasserait juste du pré-écho d'un filtre sans autre impact, pour comparer avec et sans pré-écho, car on change ses caractéristiques également en fréquence et phase, tout est lié. Difficile alors de conclure si le pré-écho (centré sur 22.05 KHz ...) est audible ou pas en tant que tel.

L'oreille est le juge au final pour orienter ce choix, là je n'ai pas la possibilité de commenter pour ma part, mes lecteurs actuels étant à oversampling classique.

--

Hello Pio2001,
Une manip à base de WAV, ok, mais ces WAV sont lus sur une carte son ou sur une platine CD, lesquels contiennent DEJA un filtre de reconstruction comme tu le sais (répartis entre filtre numérique/DAC/filtre analogique), lequel appose sa marque (pré-écho ou pas notamment).
Ca doit fausser le test à mon avis, qu'en penses-tu ?
Pour bien faire c'est le filtre de l'appareil qu'il faut manipuler, pas le fichier.
Ou alors pour s'approcher de cette manip idéale, il faut travailler avec des fichiers 16/44.1 suréchantillonnés en 24/192, lus en 24/192 natif, en simulant diverses façon d'interpoler lors des opérations off-line du suréchantillonnage.

cdlt,
GBo

(*) pour les lecteurs découvrant ce sujet, j'ai tenté d'expliquer le pourquoi et comment du suréchantillonnage sur ce thread :
http://www.homecinema-fr.com/forum/view ... t=29842033
GBo
 
Messages: 3377
Inscription: 03 Avr 2002 2:00
Localisation: RP 78
  • offline

Message » 02 Aoû 2007 13:36

Pendant quelques temps, dCS proposait un filtre "expérimental" avec ce genre de caractéristique.
Je n'ai pas noté une différence audible.
D'ailleurs ils ne l'ont pas gardé dans les "versions" suivantes
nidsee
 
Messages: 2148
Inscription: 24 Déc 2006 20:42
Localisation: Terre
  • offline


Retourner vers Discussions Générales

 
  • Articles en relation
    Dernier message