Lexique
Ampli
Enceintes
Subwoofer
Egalisers
Cables
Dolby Prologic
Dolby Digital
DTS
Dolby EX
SDDS
Mpeg audio
MLP
THX
HDCD
Intro vidéo
Télévision
Rétroprojecteur
LCD
Tritube
DMD
Plasma
Projo Laser
Ecrans
VHS
Laserdisc
DVD
Nicam
DVHS
Télécommandes
Closed Caption
Canapés
Show Laser
Lumière bleu

La vidéo - Principes
Désentrelacement
 
 

(C) Bastien Cluzet ( texte), Antonio de Magalhaes (schémas). Reproduction et diffusion de tout ou partie interdite sans autorisation des auteurs.

Le traitement vidéo et le désentrelacement :
la clé de l'image home-cinéma

La qualité du traitement vidéo et notamment du désentrelacement est fondamentale dans le rendu d'une image home-cinéma. Et plus encore aujourd'hui avec la généralisation des diffuseurs numériques, et l'arrivée de la TVHD ! Sans prétendre être exhaustif sur le sujet, très vaste et parfois très complexe, voici quelques notions pratiques mais essentielles, qui nous permettrons au passage de tordre le coup à certaines idées reçues… et parfois tenaces !

Le désentrelacement détient une part cruciale dans les différents traitements (décodage, filtrage, réduction de bruit, degamma, conversion analogique/ numérique…) de mise en forme du signal vidéo réalisés entre la source (le lecteur de DVD) et le diffuseur (vidéoprojecteur, TV plasma, etc …). Si, lors du visionnage d'un film ou d'une émission TV, vous percevez des défauts de types effets d'escaliers, lignes brisées (aliasing), effets de peigne, saccades, manque de fluidité, le tout surtout et pendant les mouvements rapides de caméra ou les travellings, il s'agit à coup sûr d'un mauvais désentrelacement. Mais pourquoi faut-il désentrelacer l'image vidéo ? C'est ce que nous allons essayer d'expliquer …

Du progressif sinon rien !

Pour des raisons historiques liées à la limitation de la bande passante disponible, le signal vidéo est, dans la très grande majorité des cas, stocké, transmis et diffusé sous forme " entrelacée ". Qu'est ce que cela veut dire ? Prenons le cas du format numérique PAL (norme ITU-R 601), celui de nos DVD ou de la télévision par satellite. La résolution est 720 x 576 pixels, ce qui signifie que chaque image contient 576 lignes, et chaque ligne 720 pixels. De cette " grille de pixels " qui constitue l'image, on ne va d'abord transmettre, diffuser et afficher que les lignes " impaires " (1, 3, 5, 7… jusqu'à 575) On obtient ainsi une " trame " (les américains disent " field ") de résolution exactement moitié de l'image d'origine ( 288 lignes). Puis, l'image suivante, on va transmettre les lignes " paires " (2, 4, 6 ,…576), et ainsi de suite. C'est cette succession de trames impaires et paires, réalisée pour le PAL 50 fois par seconde (fréquence trame 50 Hz), imbriquées comme les dents d'un peigne, qu'on appelle vidéo " entrelacée ", ou encore, en PAL : le 576i. Ce mode d'affichage de la vidéo s'avère bien adapté aux écrans et téléviseurs cathodiques, dont le spot va reproduire fidèlement le balayage de chaque trame paire et impaire, la persistance rétinienne faisant le reste. Il s'avère par contre totalement impropre aux diffuseurs numériques, quels qu'ils soient (écrans plasmas et LCD, vidéoprojecteurs LCD ou DLP…) qui, par principe même, affichent l'image par adressage et en une seule passe : il n'y a aucun balayage. Autrement dit, le signal vidéo entrelacé doit être systématiquement converti sous une forme dite " non entrelacée " ( on dit aussi " progressif "), puis mis à l'échelle (" scaling ") à la résolution native du diffuseur considéré. Tous les diffuseurs digitaux utilisent un signal progressif et intègrent un dispositif de désentrelacement et de mise à l'échelle. L'opération qui consiste à convertir la vidéo entrelacée en vidéo progressive s'appelle le " désentrelacement ". Cette opération peut être réalisée au niveau du diffuseur (projecteur, écran plasma ou LCD…) ou de la source (lecteur de DVD notamment) . Quel est le mieux ? Difficile de donner un avis tranché et définitif … Lorsque le désentrelacement est réalisé au niveau de la source, dans le domaine digital, il donne parfois de meilleurs résultats que lorsqu'il est réalisé au niveau du diffuseur, après conversion numérique/ analogique : il faudra donc tester, au cas par cas, la configuration qui donnera qualitativement le meilleur résultat.

Film, ou Vidéo ?

Il existe fondamentalement deux types de signaux vidéo : les images issues originellement de films, comme ceux qu'on trouve sur DVD, qu'on appellera " Film ", et les images issues d'émissions TV, de séquences sportives, de concert, qu'on appellera génériquement " Vidéo ". Ces deux types de signaux font appels à des techniques de désentrelacement très différentes mais peuvent se retrouver mixer séquentiellement au cours d'un même programme : la principale difficulté du désentrelaceur va être de détecter en temps réel la nature même du signal, pour enclencher le bon mode, le bon algorithme : s'il se trompe, il va apparaître des défauts (artefacts) notamment dans les parties en mouvement. Il y a donc aussi deux types d'algorithmes de désentrelacement : le " Mode Vidéo " et le " Mode Film ". Le Mode Vidéo se décompose lui aussi en deux types : le désentrelacement " Intra-trame " (Intrafield) et le désentrelacement " Inter-trame " (Interfield). Examinons successivement ces différents modes…

Le Mode Film : 2:2 et 3:2 pull-down

Commençons par le mode " Film ", c'est le plus simple. Il s'agit de désentrelacer un signal vidéo dont l'origine est une source film (cinéma) à 24 images/seconde (ou 24 fps). Pour comprendre le mécanisme, il faut revenir à la manière dont on a convertit ce film en vidéo : la fabrication du télécinéma. Là encore, il a deux types de télécinéma : le PAL, et le NTSC. Ces deux formats différent, entre autres, par leur fréquence trame : 50 Hz pour le PAL, et 60 Hz (59.94 Hz pour être précis) pour le NTSC. Pour le PAL, c'est assez simple : chaque image du film va être capturée (scannée) deux fois : une fois pour fabriquer la trame impaire, une autre fois pour la trame paire. Ce mécanisme s'appelle le " 2:2 pull-down ". Pour obtenir une cadence image qui soit multiple de celle d'origine, on va devoir aussi légèrement accélérer (4%) la cadence du film, qui va passer de 24 à 25 Hz (ce qui 1/ raccourci légèrement le film par rapport à sa version cinéma et 2/ augmente la tonalité de la bande son, ce que les puristes n'apprécient guère). Si l'on appelle A, B, C… les images du film d'origine, on va obtenir une succession de trames entrelacées 1 et 2 et correspondantes à chaque image A, B,C … : A1A2B1B2C1C2D1D2 … Le désentrelacement va consister à appairer les trames correspondant à chaque image film d'origine, puis à doubler la fréquence d'affichage des trames progressives ainsi constituées, pour pouvoir respecter la cadence : A1A2 -> A, B1B2 -> B … puis on affiche AABBCC… On réalise ainsi un " télécinéma inverse " (on parle aussi de " reverse 2 :2 pull-down "). S'il n'y a pas d'erreur - si le désentrelaceur est bon- le résultat est parfait. Si, par contre, le désentrelaceur appaire deux trames provenant de deux images différentes (A2B1, B2C1 …) il y aura apparition de défauts (artefacts) notamment aux endroits où il y a eu mouvement entre les images A et B. Pour ne pas se tromper, le désentrelaceur utilise en général des repères (flags) présents dans le flux MPEG-2 et posés lors de la fabrication du télécinéma, et qui lui indique à quelle image appartient chaque trame.

Pour le NTSC, c'est un peu plus compliqué : car convertir 24 images/secondes en 60 trames entrelacées /seconde n'est pas très évident a priori. Voici la méthode : la première image est scannée trois fois, pour pouvoir fabriquer 3 trames (impaire, paire, impaire), la seconde deux fois (paire, impaire), la troisième 3 fois, et ainsi de suite : A1A2A3B1B2C1C2C3D1D2 … De cette façon, 4 images film donne 10 trames entrelacées … et au final, 24 images film sont converties en 60 trames vidéo entrelacées : CQFD ! Ce mécanisme, c'est le fameux " 3:2 pull down ". La conversion en progressif va consister à appairer, de la même manière qu'en PAL, les trames appartenant à la même image …ce qui va forcement conduire à éliminer, une image sur deux, la troisième trame en trop : A1A2 donne A ( on élimine A3), B1B2-> B, C1C2-> C (on élimine C3), etc … Puis, là encore pour respecter la cadence, on va répéter et afficher 3 fois la trame progressive A ainsi créée, deux fois la trame B, trois fois la trame C, soit : AAABBCCCDD…pour obtenir à l'affichage 60 images progressives par seconde : c'est le " reverse 3:2 pull-down ". Là encore, le résultat est parfait … si le désentrelaceur appaire convenablement les trames, se verrouille sur la bonne cadence, et détecte bien la nature de la source ( Film ou Vidéo), ce qui est la source d'erreur la plus fréquente.

Désentrelacement vidéo intra-trame : le " bob "

Le désentrelacement des sources Vidéo (émissions TV, sport, concerts…) est bien plus complexe. Capturées par une caméra vidéo de télévision, les trames entrelacées sont totalement indépendantes temporellement et ne peuvent être appairées telles quelles, sans créer de violents artefacts dans les zones en mouvement à l'image. La méthode la plus simple consiste à dupliquer les lignes d'origines de la trame paire ou impaire, pour remplir les lignes manquantes et donc créer une image progressive : cette méthode ne génère pas d'artefacts, mais n'augmente pas la résolution entrelacée d'origine (288 lignes pour le PAL) : l'image obtenue risque de sembler floue et de manquer de piqué. Une seconde méthode consiste à interpoler verticalement les lignes et pixels manquants en utilisant les pixels d'origine. Cette interpolation peut-être linéaire, ou faire appel (pour les matheux) à des fonctions plus complexes (comme les B-Spline). Mais là encore, on n'augmente pas la résolution. Tous ces algorithmes de désentrelacement vidéo " intra-trame " (on ne s'intéresse qu'à la trame en cours, pas à la précédente, ni à la suivante) s'appellent communément dans toute l'industrie vidéo le " bob ".

Désentrelacement vidéo inter-trame : le " weave "

La seule façon d'augmenter la résolution, c'est d'utiliser les informations contenues non pas dans la trame en cours, mais dans le ou les trames précédentes ou suivantes : c'est le désentrelacement " inter-trame ". Une solution - brutale mais efficace- consiste à appairer sans traitement particulier deux trames entrelacées successives : la résolution est maximale mais, s'il y a eu mouvement entre les deux trames, peut générer de violents artefacts ! Cette méthode de désentrelacement est appelée " weave ". On trouve aussi parfois la dénomination " weave " pour désigner le désentrelacement des sources films (inverse 2 :2 et 3 :2 pull-down) : cette méthode d'appairage de trames ne génère alors évidemment pas d'artefacts… puisque les trames qui sont appairées proviennent de la même image d'origine.

Désentrelacement vidéo inter-trame à adaptation de mouvement

En pratique, la plupart des désentrelaceurs réalisent une sorte de " mix " de bob et de weave : en mémorisant plusieurs trames ( typiquement 4 ) , ils examinent quelles sont les parties de l'image qui sont restées fixes et quelles sont les parties qui sont en mouvement. Si, d'une trame à une autre, l'image reste fixe, le désentrelaceur appaire simplement les trames (weave) et la résolution - la définition- est alors maximale. Si tout, ou seulement certaines parties, sont en mouvement, il réalise alors un désentrelacement de type bob. Ce type de désentrelacement vidéo est appelé à " adaptation de mouvement " ( Motion Adaptative Deinterlacing). Il peut être réalisé en comparant deux trames successives ( on l'appelle " per-field ") ou mieux, en effectuant une comparaison " pixel par pixel " ( per-pixel). L'interpolation peut-être verticale, mais le résultat sera bien sûr supérieur si elle est " directionnelle ", comme le fait le DCDi.

Désentrelacement vidéo inter-trame à compensation de mouvement : le top du top !

En mémorisant plusieurs trames et en examinant les zones en mouvement dans l'image, on peut parvenir à " anticiper " à la fois sur le sens et sur la direction des déplacements : le désentrelaceur calcule cette fois des vecteurs de déplacement pour optimiser l'emplacement des pixels manquants dans les trames suivantes. On appelle cette méthode le " désentrelacement à compensation de mouvement " (Motion Compensated Deinterlacing). Ce type de désentrelacement en quelque sorte " prédictif " requiert une grande puissance de calcul et constitue le top du top dans le domaine. Mais il est, pour l'instant, encore réservé aux applications professionnelles et n'est pas encore appliqué sur des produits grand public … mais il le sera dans doute un jour ! Une application indirecte et très prometteuse de ces algorithmes est la " réduction de bruit à compensation de mouvement " avec filtrage maximal dans les zones fixes et pas de filtrage dans les zones en mouvement, ce qui s'avère particulièrement utile pour les téléviseurs plasmas et LCD.

Ce qu'il faut retenir, c'est que les différentes méthodes de désentrelacement par télécinéma inverse, ou à adaptation de mouvement intra-trame avec interpolation directionnelle, existent depuis une dizaine d'année déjà et donnent globalement satisfaction sur les sources traditionnelles en 480i/576i. Mais que, hélas, encore bien peu de désentrelaceurs savent efficacement traiter la Haute Définition en 1080i … qui constitue pourtant l'avenir proche de la vidéo, et du home-cinéma ! Toutefois, l'arrivée puis la généralisation de diffuseurs " full HD " (de résolution native 1920x1080 pixels) et incorporant des circuits de désentrelacement sachant véritablement traiter la HD en 1080i est inévitable … et indispensable ! A suivre…

Bastien Cluzet

Faroudja et le DCDi

Que signifie véritablement le logo " DCDi by Faroudja ", apposé sur un diffuseur ? C'est un terme générique qui veut dire que l'appareil en question réalise à la fois le désentrelacement à adaptation de mouvement " par pixel ", le 2:2 et 3:2 pull-down pour les sources films avec fonction " bad edit " ( verrouillage sur la cadence en cas de non détection des flags), qu'il met donc en oeuvre le DCDi proprement dit pour les sources vidéo, et qu'il réalise aussi un certain nombre de traitements complémentaires pour améliorer l'image, comme notamment le Cross Color Supression ( élimination des résidus de chroma dans le signal de luminance) et la correction du Chroma Bug lors de la conversion 4 :2 :0 -> 4 :2 :2 de certains décodeurs MPEG2). Maintes fois primé, DCDi est toutefois une technologie vieillissante. Inventeur du 3-2 pull-down (le brevet date de 1989), de la détection du mode Film et du premier doubleur de lignes ( désentrelaceur) commercial - le fameux LD-100- qui coûtait à l'époque plus de 50000$ (!), Faroudja a hélas maintes fois changé de mains ces dernières années et se retrouve aujourd'hui rattrapé par de nombreux compétiteurs comme PixelWorks, Silicon Image et surtout HQV Realta et VXP Gennum, ces deux derniers réalisant le désentrelacement à adaptation de mouvement et l'interpolation directionnelle y compris sur les sources 1080i …ce que ne sait pas faire Faroudja ! Pourtant, le DCDi (Directionnal Correlational Deinterlacing) de Faroudja demeure un algorithme de désentrelacement vidéo intra-trame très performant : en effet, là où la plupart des algorithmes de type " bob " vont se contenter d'interpoler verticalement (à 90 °) pour créer le pixel manquant, DCDi va examiner le groupe de pixels au dessus et en dessous de la ligne manquante, et va essayer de déterminer dans quelle " direction " il sera le plus judicieux de créer le pixel manquant. L'interpolation n'est donc plus systématiquement verticale, mais directionnelle (d'où l'acronyme). Cette méthode permet d'adoucir les contours sans trop entraîner de perte de résolution, et peut aussi être utilisée en tant que filtrage intra-trame pour le désentrelacement vidéo à adaptation de mouvement. Ce qu'il est très important de retenir, c'est que DCDi ne s'applique qu'aux sources d'origine Vidéo, et jamais aux sources Film (nous avons vu que, dans le cas des sources Film, ce sont les mécanismes de type " pull-down " qui sont mis en œuvre). Et que, d'autre part, DCDi ne sait pas - encore- traiter les sources vidéo HD en 1080i : il s'applique uniquement aux sources SD ( Standard Definition) en 480i (NTSC) et 576i ( PAL).

DROITS D'AUTEUR
Le texte et les schémas présentés sont protégées par le droit d'auteur et ne doivent en aucun cas être publiées sur un site internet ni diffusées sur un support papier, quelqu'il soit, sans l'autorisation de son auteur. Conformément au Code de la Propriété Intellectuelle, seules sont autorisées les "copies ou reproductions strictement réservées à l'usage privé du copiste et non destinées à une utilisation collective" (art L122-5). Toute représentation ou reproduction intégrale ou partielle, faite sans consentement de l'auteur, est illicite (art L122-4) et constituera une contrefaçon sanctionnée par les articles L 335-2 et suivants du Code de la Propriété Intellectuelle.

Copyright © 1999-2005 homecinema-fr.com - Tous drois réservés - Infos légales | Contact