dimanche 23 octobre 2011

Les formats vidéo, comment ça marche?


Une des plus grande difficulté pour les débutants sont les formats vidéo disponibles sur le marché et surtout comment comprendre la HD à 1080i, le 720p ou encore les pixels carrés ou rectangulaires.

1. La vidéo c'est quoi ?

Pour bien comprendre les formats vidéo, il faut avant tout connaître ce qui existe sur le marché. Actuellement, il existe 2 formats de diffusion qui sont le PAL (europe) et le NTSC (Etats-Unis et Japon). La différence entre les 2 provient surtout de leur fréquence électrique, en effet le PAL fonctionne sur une fréquence de 50 Hz (réseau électrique) et le NTSC lui aura une fréquence de 60 Hz. Ainsi en Europe on aura 25 images par seconde et aux States 30 images par secondes car c'est la fréquence électrique qui détermine le nombre d'image.
Aujourd'hui il existe aussi les format haute définition HD.

Ensuite, il existe le mode entrelacé (le fameux i de 1080i) qui travaille avec des trames paires et impaires, et le mode progressif ( le P du 720p) qui ne gère qu'une seule trame.

Voici la liste des différentes vitesses du marché :

- 24 p : vitesse de défilement du film cinéma en mode progressif (24 i/s)
- 25 p : vitesse du Pal en mode progressif
- 30 p : vitesse du NTSC en mode progressif
- 50 i : vitesse standard du Pal ce qui représente 50 demi image par seconde donc 25 images par seconde en mode entrelacé ( le i de Interlace en anglais).
- 60 i : même principe mais pour las américains.
- 50 p : mode progressif du Pal pour améliorer la fluidité des images pour les ralentis.
- 60 p : idem mais le NTSC.

Liste des différentes définitions du marché :

- 1080p : haute définition en HD avec un format de 1920x1080 pixels carrés avec une priorité de trame aucune.
- 1080i : haute définition en entrelacé avec un format de 1440x1080 pixels rectangulaires (1,33)  priorité de trame supérieur / impaire.
- 720p : 1280x720 pixels carrés.
- 576p ou 480p : 720x576 pixels rectangulaires (1,0667) pour le PAL et 720x480 pixels rectangulaires pour le NTSC. ce sont les formats standard de vidéo en SD pour le mode progressif.
- 576i ou 480i : même rapport hauteur sur largeur que précédemment mais en entrelacé, vidéo standard SD avec une priorité de trame inférieure / paire.


Notre problème c'est que les diffuseurs TV, les sites web, le DVD ou le Blue-Ray utilisent tous des formats qui peuvent être différents, les caméras possèdent chacune leur format suivant la marque, de plus il y a aussi les formats de compression qui changent suivant le constructeur.


Canal+ diffuse ses images en 1080i dégradé donc du 1440x1080 entrelacé à 50 Hz.

TDF émet depuis juin 2011 en 1920x1080 pour la TNT HD.

You tube lui utilise le format 1280x720p et depuis peu le 1080p avec le nouveau format WebM et son codec VP8 (petite précision toutes les vidéo au format H264 ont été transcodées pour ce nouveau format).

Le Blue-Ray c'est du 1920x1080p pour la 2D.

Les camescopes Sony fournissent un signal 1440x1080i pour le HDV (format qui possède un GOP long difficile à garder pour le montage destructeur du fait de sa compression).

Les appareils photos comme Canon eux fournissent une image 1980x1080p avec une compression H264 (l'un des meilleur format de compression actuel, utilisé par le Blue-Ray).



2. Travailler avec Photoshop :

Lorsque l'on travaille pour la création graphique avec des formats aux pixels carrés on n'a pas de problème (1920X1080p par exemple), car Photoshop travaille en pixel carré par défaut.

Les problèmes surviennent lorsque l'on monte avec HDV, dans lequel on doit inséré des graphique qui viennent de Photoshop. Dans ce cas voici les formats d'image a adopter dans Photoshop :
  • 1920x1080 pour de la HD réel
  • 1270x720 pour ce format HD 
  • 768x576 pour du SD Pal au format 4/3
  • 1024x576 pour du SD Pal au format 16/9
Si vous respectez ces tailles d'image, lors de l'import dans FCP X, le logiciel de montage les mettra au bon format d'image correspondant à votre montage.

3. Les formats de compression :
Actuellement les formats les plus utilisés sont :
- le H264 ou Mpeg4 pour las appareils de photo comme le 5d mark II ou la GoPro.
- le AVCH pour les caméscopes  de différentes marques (Sony, Panasonic).
- le DVCPRO
- le HDV
- le DV
Une des normes de compression est le système Mpeg.

Comment fonctionne une compression ?

Il faut savoir qu'une image est décomposée en zone de 8 pixels sur 8 pixels que l'on appelle Block,  Ceux-ci peuvent varier suivant le type de compression notamment le Mpeg4. 

On travaille à partir de ces blocks pour étudier l'image et ainsi en réduire son poids sans trop détériorer l'image.
On va travailler avec une compression spatiale pour les images fixe et une compression temporelle pour les images animées.


Le format HDV ou XDCAM utilise une compression constitué de GOP fixe ( Group Of Pictures) constitué de 12 images pour le PAL et 15 pour le NTSC. 
C'est à dire que toutes les 12 images on a une image complète que l'on appelle images de références I et P. Partant du principe que d'une image à l'autre il y a peu de changement au niveau des blocks, donc on ne codera que les blocks qui changent (B et P) d'une image sur l'autre.

Le H264 lui utilisera une compression spatiale et temporelle avec un GOP à structure variable.

Le AVCintra de Panasonic utilise seulement une compression spatiales, sans GOP donc réelle image toutes les images, conséquence des fichiers très lourd mais éditable dans un logiciel de montage sans perte de qualité.


H264 : La compression vidéo en haute qualité :

Ceux qui font du montage vidéo le savent bien : une heure de vidéo non compressée en 720 x 576 points monopolise quelque 71 Go d'espace disque. C'est beaucoup... mais ce n'est rien comparé à une heure de vidéo en haute définition : en 1 920 x 1 080 points, il faut compter plus de 350 Go ! Un volume de données trop élevé pour être stocké sur un support optique actuel, et impossible à transférer en temps réel, ni par le réseau hertzien, ni même par ADSL : le débit nécessaire à un tel transfert serait d'environ 800 Mbit/s ! C'est là qu'intervient la compression vidéo...
 
Pour des images en 720 x 576 points, le MPeg2 fait très bien l'affaire. Il autorise le stockage d'un film - et de ses bonus - sur les quelque 8,5 Go d'un DVD-vidéo et, pour la télévision numérique, il permet de réduire le débit à 8 Mbit/s, et même à 1 Mbit/s, selon le programme. Mais, avec l'avènement de la haute définition, et malgré l'apparition de supports optiques plus spacieux (Blu-Ray et HD-DVD), le Mpeg2 ne suffit plus. Il faut un format qui compresse plus fortement les données vidéo tout en préservant les bénéfices de la haute définition. Et c'est le H.264, développé par les organismes de normalisation Iso/MPeg et UIT (Union internationale des télécommunications), qui a été retenu par les industriels. Il permet, à qualité égale, d'obtenir un débit deux fois inférieur à celui du MPeg2 et, à débit égal, d'atteindre une qualité d'image bien supérieure à celle d'une vidéo en MPeg4-Part2 (qui est au coeur des formats DivX, XviD et WMV).
 
Les principes d'encodage du H.264, également connu sous les appellations MPeg4-Part10 ou MPeg4/AVC (pour Advanced Video Coding ), ne diffère pas fondamentalement de ceux du MPeg2 ou du MPeg4-Part2 dont il est dérivé. Il s'agit toujours d'effectuer la compression en partant d'un groupe d'images (Gop) de taille variable, composé d'une « image de référence » (appelée I pour intra) intégralement codée, et de plusieurs « images relatives » (appelées P pour prédictive, ou B pour bidirectionnelle) dont seules les variations entre images sont conservées. Par rapport au MPeg2 et au MPeg4, le H.264 ajoute aux images I, P et B, deux types d'images intermédiaires, SI et SP, calculées et intercalées dans le flux, notamment pour fluidifier la transmission de la vidéo sur les canaux à débit variable (ceux du réseau Internet, notamment).
 Source : 01net


L'AVCH frère jumeau du H264 pour les camescopes :

L'AVCHD exploite l'algorithme MPEG-4 H264 (ou MPEG-4 AVC). En raison d’une compression très élevée, ce format exige pour le décryptage une puissance de calcul importante. Sans un logiciel de montage avec accélération matérielle, le montage est laborieux.
Avantages : définition allant jusqu’à 1920x1080, plusieurs possibilités de stockage.
Inconvénients : la conversion (décompression) entraîne une perte importante de qualité de l'image, l’ajout d’effets complexe ou en 3D provoque souvent des dégradations de l’image, la fluidité de l'image dans les mouvements de caméra est critiquable, une mémoire vive importante est nécessaire pour gérer les groupes d'images (GOP), de nombreuses marques utilisent des formats propriétaires (Sony, JVC, Panasonic, Samsung, Sanyo, Toshiba) d'où un problème d'incompatibilité avec certains logiciels de montage vidéo.
Le format AVCHD est encapsulé dans le conteneur M2TS (Mpeg-2 TS), lequel contient différents répertoires.

4. Conclusion :

Aujourd'hui de nombreux formats sont acceptés par les logiciel de montage : le HDV, l'AVCHD etc... Mais ils demandent des ressources processeurs importants pour pouvoir reconstituer l'image du fait de la constitution des GOP et de plus lors de rajout d'effet ou de correction couleur, on dégrade l'image. Voir le format Proress 422 et les rushes proxy ou optimisés.
Ainsi pour avoir une lecture temps réel avec FCP X il sera conseillé de travaillé en Proress 422 pour du montage et en Proress Proxy pour du prémontage et par la suite on reliera les données au fichier Proress 422 pour l'exportation de notre film. Voir les rushes proxy ou optimisés.  

Comment créer une couche alpha sous FCPX avec le format d'Apple le Proress 444.
 

Autres pages :

7 commentaires:

  1. Bonjour,
    J’apprécie beaucoup ton travail sur ce site, qui m'a permit de comprendre beaucoup de choses. C'est grâce à toi que j'ai pu comprendre le fonctionnement des alphas transition.
    Par contre je me pose une question sur le format des pixels d'une PMW-EX1 en 50i. Je ne suis pas certains que les pixels soient rectangulaires, puisque nous avons une autre fonction qui permet de tourner en HDV (1440x1080) .
    Peux-tu me confirmer tes dires concernant la SONY-PMW-EX1 ?
    Merci d'avance et un très grand merci pour ton travail exemplaire sur ce site.

    Michel.

    RépondreSupprimer
  2. Bonjour Michel, le format de pixel dépend du format de tournage, si tu tournes en hdv le format sera rectangulaire car format 1,33 et en full HD 1920x1080 tu auras des pixels carrés. Voilà en gros.

    RépondreSupprimer
  3. bonjour, j'ai besoin d'aide en ce qui concerne une sortie vidéo. j'ai filmé un mariage avec un camescope sony 740, AVCHD , en 50P 1920 1080. j'ai effectué un montage vidéo avec final cut pro x en proress 422 je crois. j'ai réalisé deux projets: 1 d'une durée de 55 minutes et le second de 3h30. je souhaite graver ses projets sur des supports dvd qui seront lu sur des lecteurs de dvd de salon. aussi pourriez-vous s'il vous plait me guidée, dois je les graver directement sur dvd comme le propose fcpx dans l'onglet "partage"? dois je les convertir en mpeg 4 par exemple en exportant à l'aide quicktime? Mon 'objectif est double: minimiser la perte de qualité d'image de ma vidéo et surtout qu'il soit aussi lisible sur tout type de télé car tout le monde ne dispose de télé full HD led. Je vous en supplie extirpée moi de cette situation, je ne sais pas comment faire!
    Merci à tout le monde et surtout à toutes les personnes qui ont conçu ce site!

    RépondreSupprimer
  4. Bonjour Claire, je me suis permis de mettre ta question dans le Forum avec ma réponse dont voici le lien : http://www.wmaker.net/videoeffects/forum/Technique-DVD_m149657.html

    RépondreSupprimer
  5. Bonjour Fred,

    J'ai besoin d'un éclaircissement. A quoi sert la mire de barre à 1khz pour le montage ! Doit-on fixer tous les niveaux des pistes audio à cette valeur ? C'est quoi 1Khz à 0dBu -18dBFs ? Que les le principe du calibrage audio pour un PAD ? Merci d'avance

    RépondreSupprimer
  6. Le principe d'un mille Hertz est d'étalonner toute la chaine audio pour qu'au final l'ingé son du tournage, le monteur et le mixeur est la même référence du niveau du son. Ce qui se fait plus aujourd'hui car les DSLRs ne le font pas.... mais sur les caméra pros on a toujours cette fonction. L'ingénieur du son enregistre un signal à 0dB sur la caméra ensuite en montage le monteur calibre sa table son et son recordeur avec ce signal à 0dB pour étalonner la référence et enfin idem pour celui qui va mixer. Donc dans le cas d'un PAD il te faudra mettre une mire de barre couleur (pour l'étalonnage image) et un 1000 Hz pour les niveaux de référence du son.

    RépondreSupprimer
  7. Et pour finir un peu de théorie :
    http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=4&ved=0CD8QFjAD&url=http%3A%2F%2Fwww.pfast.fr%2FIMG%2Fpdf%2FniveauxAudioCicmHd3d.pdf&ei=4Ks4UIavOeHG0QX1_YBw&usg=AFQjCNEp-cSr7ong0UljSIeVjFOgXkOlEw&sig2=txTVeCJBLwmSqPJ1f__k_A

    RépondreSupprimer