Les cadences d’images

Quand il s’agit de la postproduction, vous devez souvent vous demander pourquoi les techniciens vidéos se compliquent autant la vie. Prenez les fréquences d’image (ou cadences) : 23,98 – 24 – 25 – 29,97 – 30 images par secondes. Quel est l’intérêt d’en utiliser autant ? Je n’ose même pas vous dire que le but originel était de se simplifier la vie. On ne peut pas dire que ce fut réussi…

Encore une fois, pour tenter d’y voir un peu plus clair, le plus simple est de reprendre les choses par la chronologie.

Aux premiers temps du cinéma

buster_keaton_cameramanLes toutes premières caméras étaient à manivelle. Celle-ci servait à faire défiler la pellicule (et aussi à commander l’ouverture/fermeture du diaphragme). Le nombre d’images enregistrées par seconde variait donc selon la vitesse avec laquelle le cameraman tournait la manivelle.

La plupart du temps, les opérateurs se calaient sur environ 16-18 images par secondes. La projection pouvait aussi être à vitesse variable.

Au fur et à mesure des années et de la sophistication des caméras, on a pu augmenter cette cadence afin de rendre les mouvements plus fluides. On arrivait à 20-22 images par secondes.

Globalement, cela n’avait pas trop d’impact sur la reproduction des mouvements tant que les films étaient muets.

Les problèmes sont arrivés en même temps que le son. Il fallait absolument que la vitesse de défilement soit la plus stable possible pour garder la synchronisation avec le son. Il a donc fallu poser un standard, et ce fut 24 images par secondes, qui est un bon compromis entre la fluidité du mouvement et le métrage de pellicule utilisé.

De nos jours, on utilise toujours cette cadence comme référence en cinéma.

singin-in-the-rain

Cela dit, dans Singin’ in the Rain, on voit comment le parlant a posé d’autres problèmes que les histoires de cadences d’image… et c’est bien plus drôle !

Les débuts de la télévision

Pour la conception des premières télévisions, il a fallu trouver une solution technique pour fixer une cadence d’images stable. L’électronique étant encore balbutiante, on a décidé de d’utiliser de la fréquence du courant électrique comme “métronome”. En Europe cette fréquence est de 50 Hz, c’est-à-dire 50 alternances par secondes (pour les détails techniques, c’est par là). C’est pourquoi on diffuse la télévision à 25 images par secondes.

Le problème des 30 images par secondes

Aux États-Unis, la fréquence du courant électrique est de 60 Hz. Il a semblé logique de diffuser la télévisions à 30 images par secondes. Malheureusement, cela générait un problème (qui n’existe pas à 25 images par secondes) : les signaux audio et vidéo pouvaient interférer l’un avec l’autre, ou pour le dire plus simplement, se brouiller. La solution a consisté à réduire un tout petit peu la fréquence d’image, à 29,97 images par seconde.

Le timecode Drop-Frame et Non-Drop-Frame

Le problème du 29,97, c’est que ce n’est pas un chiffre rond. Donc, si on compte les images une à une, on se retrouve avec un petit écart par rapport au temps écoulé. S’il y a une heure de vidéo à 29,97 images par secondes, on a 107 892 images, soit traduit en timecode : 00:59:56:12. En effet, pour le timecode, on ne peut compter qu’avec un nombre d’images par seconde qui soit rond sinon, il est impossible de savoir quand on doit passer à la seconde suivante.

Pour compenser cet écart, on a décidé de passer quelques images au comptage du timecode. En effet, les deux premières images de chaque minute (à l’exception des multiples de 10) sont sautées. On passe de 00:00:59:29 (dernière image de la première à minute) à 00:01:00:02 (première image de la deuxième minute). Cela permet de garder un synchronisme entre le timecode et la durée réelle de la vidéo. Cette méthode s’appelle le Drop-Frame. Celle consistant à ne pas sauter d’image est logiquement le Non-Drop-Frame.

En soit, ça n’a pas beaucoup d’importance, mais il faut faire attention quand on livre un programme. Certaines chaînes peuvent demander du Drop-Frame et d’autres du Non-Drop-Frame.

Du cinéma à la télévision

Un autre problème se pose quand on passe du cinéma à la télévision. En effet, comment diffuser un film tourné à 24 images quand on utilise 25 ou 29,97 images par seconde ?

En Europe, tout simplement, on change la vitesse de défilement. On lit les images du film à 25 images par seconde au lieu de 24. Cela a pour effet d’accélérer un tout petit peu le film, mais rien qui ne soit sensible pour le téléspectateur. Évidemment, le son est lui aussi diffusé un brin plus vite et devient un petit peu plus aigu. On doit donc légèrement compenser cette effet (appelé pitch) en rendant le son un tout petit peu plus grave avant la diffusion. Cette opération est désormais un simple calcul assez rapide à faire, mais il ne faut pas l’oublier. C’est l’une des raisons qui pousse les mixeurs à prévoir un mix spécifique pour la télévision en plus du mix cinéma.

Aux États-Unis (et Japon), on ne peut pas utiliser cette astuce, car l’écart entre 24 et 29,97 images par seconde est trop grand. On a utilise alors un Pull-Down 3:2.

Pour cela, on utilise le fait que l’image de télévision soit entrelacée. La première image du film est découpée en deux trames pour former la première image vidéo (qui donc a strictement le même rendu que celle du film).

On fait de même avec la deuxième image.

La troisième image vidéo est obtenue est mélangeant la deuxième et la troisième image du film.

Ce schéma tente de rendre cela plus explicite :

3-2-pulldownCe qu’il faut retenir au final, c’est que l’on répète une trame (soit la moitié d’une image) toutes les trois images de vidéo. Cela permet de garder la même durée que le film à 24 images par seconde, mais diffusé à 30 images par secondes. On n’a donc pas à modifier le son. L’inconvénient c’est qu’une image sur trois dans la vidéo est composée d’un mélange de deux images du film, donc on perd un peu de précision, surtout dans les mouvements rapides.

Vous noterez qu’on obtient alors un film à 30 images par secondes, or le but était de le diffuser à 29,97. L’écart est si faible entre les deux qu’on se contente de passer la vidéo à 29,97 images par seconde, sans autre modification.

Le 23,98

Pour information, il existe aussi le 23,98 qui est une simple diffusion d’un film tourné à 24 images par secondes à 23,98. C’est utilisé sur les DVD NTSC américains, par exemple. Cela permet de ne pas avoir à mélanger des images et donc de garder la meilleure qualité possible, tout en étant compatible avec le NTSC 29,97 de la télévision. C’est pourquoi de nombreuses caméras vidéos qui disent tourner à 24 images par secondes tournent en fait à 23,98.

Le transcodage

Le transcodage consiste à changer la cadence d’une vidéo, pour la passer de 29,97 à 25 images par secondes, par exemple. On est obligés de mélanger des images, un peu comme dans le Pulldown 3:2, sauf que souvent cela se voit plus (car 24 et 30 sont tous deux des multiples de 6 et ça tombe plus souvent en face qu’entre 29,97 et 25 par exemple).
De nombreux logiciels font ces transcodages, mais il faut garder en tête que seules les solutions matérielles (transcodeur de régie, comme le Terrannex) permettent d’obtenir un rendu acceptable et professionnel. Les transcodages logiciels (par Avid MediaComposer, Final Cut, ou même des logiciels dédiés) donnent un résultat bien moins précis.

teranexPour revenir au Pulldown 3:2, il est très simple de le retirer facilement pour revenir aux 24 images par secondes d’origine, ce qui n’est pas possible dans les autres cas de transcodage.

Le HFR

On commence à tourner, et à diffuser, de plus en plus en HFR (High Frame Rate), c’est-à-dire à 48 ou 60 images par secondes. On y gagne beaucoup en précision, mais beaucoup trouvent que c’est trop et que ça donne un effet “vidéo” même au cinéma. Personnellement, j’aime beaucoup ce gain de précision, bien que cela nécessite en effet d’habituer son œil à voir des images si rapidement, qui semblent étranges la première fois.

Article actualisé le 19 novembre 2015

Pour marque-pages : Permaliens.

Un Commentaire

  1. C’est très intéressant.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.