Lire le nom des fichiers vidéos d'origine douteuse

Introduction

On trouve souvent des fichiers vidéos d'origine douteuse. Pour les séries télévisées, le nom du fichier est très codifié. Afin de mieux les dénoncer à la MPAA, il est utile de bien comprendre tout ce que ça veut dire.

Différentes versions de la même émission peuvent avoir un montage légèrement différent, en particulier s'il y a des coupures pour des pubs, c'est important par exemple pour la correspondance avec les sous-titres.

Voici quelques exemples pris au hasard sur le web; examinons les différents éléments.

Homeland S03E10 HDTV x264-ASAP [eztv]

Homeland.S03E10.720p.HDTV.x264-IMMERSE[rartv]

Silk.S01E01.DVDRip.XviD-HAGGiS.avi

Le titre et le numéro d'épisode

Pas grand chose à dire, le sens est évident. Parfois, le nom comporte l'année de début de diffusion de la série ou le pays, ne serait-ce que pour distinguer « Doctor Who (1963) » de « Doctor Who (2005) » et « Life on Mars (UK) » de « Life on Mars (US) ».

L'origine de la vidéo

HDTV
L'émission a été enregistrée à la télévision numérique (pas forcément HD).
DVDRip
L'émission a été copiée depuis un DVD.
BDRip
L'émission a été copiée depuis un Blu-ray.
WEBRip / WEB-DL
L'émission a été récupérée depuis une diffusion sur le web (a priori, web-dl veut dire que la vidéo a été capturée sous forme de fichier pendant le téléchargement et webrip qu'elle a été capturée sous forme de vidéo pendant la lecture ; donc webrip risque d'avoir une moins bonne qualité, en particulier des saccades)

La résolution

La résolution de la vidéo est exprimée par un nombre, suivi par la lettre p, qui exprime le nombre de pixels de hauteur de la vidéo ; la largeur se déduit par proportionnalité si on connaît le format. Par exemple, pour une émission en 16/9, 720p veut dire 1280×720 ; en pratique ça peut être moins si des bandes noires (« letterbox ») ont été enlevées.

(Le p veut dire progressif, par opposition à i pour entrelacé, un mode réputé améliorer le rendu sur les vieux écrans cathodiques et que les informaticiens voient s'éteindre avec soulagement.)

720p
C'est la résolution dite « HD-ready », 1280×720 en 16/9. Les épisodes distribués dans cette résolution sont souvent encodés avec une qualité d'image très élevé et du son 5.1, ce qui donne un fichier assez gros.
1080p
C'est la résolution dite « Full-HD », 1920×1080 en 16/9.
480p
C'est la résolution normale de la télé numérique NTSC (en PAL, c'est 576). Attention, la résolution horizontale est un peu plus compliquée à calculer que dans le cas HD car les pixels ne sont pas carrés.
BDRip
Si la résolution n'est pas précisée, les rips de Blu-ray sont souvent en 720p ou en 1080p.
DVDRip / HDTV
Si la résolution n'est pas précisée, les rips de télé pas HD et de DVD sont en général approximativement en 640×360 avec les vieux codecs ou 720×404 avec les codecs récents ; parfois 512×384 pour les émissions en 4/3.

Le codec vidéo

Un encodeur transforme la vidéo en une suite d'octets qu'on peut stocker dans un fichier ; un décodeur transforme cette suite d'octets en vidéo : l'ensemble formé par l'encodeur et le décodeur s'appelle un codec. Quand une normalisation a eu lieu et qu'il existe plusieurs encodeurs et plusieurs décodeurs qui peuvent marcher ensemble, le codec désigne en général le langage qu'ils ont en commun qui est utilisé pour coder le fichier.

Le travail du décodeur est relativement simple et sans subtilité. Le travail de l'encodeur est plus complexe : il faut trouver quelles parties de l'image ressemblent à des bouts des images précédentes, savoir ce qu'on peut dégrader sans que ça se voie trop (si un personnage est en train de mettre un chapeau, on peut flouter ses cheveux mais il vaut mieux éviter de flouter son visage) et coder ça de la manière la plus concise possible. C'est similaire à la littérature : il faut du talent pour décrire un paysage de manière concise mais vivante, il ne faut pas beaucoup de talent pour lire la description et la comprendre.

Les codecs les plus récents sont plus efficaces : ils donnent une meilleure qualité d'image pour un fichier plus petit. En contrepartie, les appareils les plus vieux ne sauront pas les utiliser. Par exemple, un netbook de 2008-2009 ne sera pas toujours assez puissant pour décoder du H.264 720p en temps réel.

H.264
C'est le codec des Blu-ray et de la télévision haute définition, mais il est aussi utilisé dans beaucoup d'autres applications.
x264
C'est le meilleur encodeur disponible pour H.264. En général, les vidéos encodées avec x264 sont avec un réglage très efficace : des fichiers petits pour une très bonne qualité d'image.
MPEG-4 (part 2)
C'était le codec le plus fréquent il y a quelques années pour les fichiers d'origine douteuse. Il n'a jamais été largement utilisé dans des applications hors de l'informatique.
XviD
C'est un bon encodeur (et décodeur) pour du MPEG-4, le plus utilisé pour les vidéos d'origine douteuse jusqu'aux alentours de 2011.
DivX
C'est l'ancêtre commercial de XviD.
MPEG-2
C'est le codec utilisé par les DVD et pour la télévision numérique pas HD.

La disposition des canaux audio

stéréo
Deux canaux audio, un pour le haut parleur de gauche et un pour celui de droite. C'est le plus fréquent.
5.1 (« surround »)
Six canaux audio : avant gauche, avant droite, avant centre, arrière gauche, arrière droite et caisson de basses. Si on n'a pas les cinq hauts parleurs et le caisson de basses, c'est automatiquement converti en stéréo et on a juste gaspillé de la place dans le fichier.

Le codec audio

C'est important pour la musique, mais pour de la vidéo, en général la place prise par le son est négligeable, donc c'est rarement précisé.

MP3
Un des plus anciens codecs, avec une qualité assez médiocre même à fort débit.
AC3
Le codec utilisé pour les DVD, parfois aussi utilisé pour les fichiers de haute qualité, en particulier ceux en 5.1.
AAC
Un codec industriel très largement utilisé, dont la qualité est très variable selon les versions.
Vorbis
Un codec communautaire, au top à son époque mais qui commence à accuser son âge.
FLAC
Un codec communautaire sans pertes, pour la très haute qualité.

Le format de fichier

C'est le système utilisé pour combiner la vidéo, l'audio et éventuellement différents autres trucs en un seul fichier. Ça n'a pas grande importance pratique, à part la compatibilité avec certains appareils.

Il est en général possible de convertir rapidement d'un format à un autre sans aucune dégradation de l'image ou du son.

AVI
Un des plus vieux formats, conçu par Microsoft, mais toujours très utilisé. Très médiocre, il ne permet de stocker des codecs modernes qu'au prix de bidouilles de plus en plus cauchemardesques.
MP4
Un format conçu par un consortium industriel, basé sur le QuickTime d'Apple. Comme tous les formats industriels, il est criblé de limitations idiotes pour rester compatibles avec les économies de bouts de chandelle et les bugs des appareils qui l'utilisent. Mais comme beaucoup d'appareils et de logiciels savent le lire depuis longtemps, il est largement utilsé.
Matroska (MKV)
Un format conçu par des bidouilleurs, assez propre et capable de contenir à peu près tout, y compris des sous-titres avec effets spéciaux (très utilisés dans le fansub d'animation japonaise).
Ogg Media (OGM)
Un format conçu par des bidouilleurs, qui a connu une courte heure de gloire mais a largement été éclipsé par Matroska.

L'équipe d'encodage

C'est le nom des gens qui ont enregistré l'épisode et produit le fichier. Ils ne font pas tous exactement les mêmes choix : laisser ou pas le générique de fin, le résumé des épisodes précédents, plus ou moins de noir aux coupures de pub, normaliser le volume sonore, etc. En général, ça ne change pas grand chose pour le spectateur, mais c'est une information utile pour choisir le bon fichier de sous-titres.

Exemples : 2HD, ASAP, BTN, BiA, CLERKS, EVOLVE, FEVER, FQM, FoV, HAGGiS, IMMERSE, KILLERS, LOL, NoTV, SAiNTS, TLA, TRONDi, XII, mSD.

L'équipe de diffusion

Ce sont les gens qui ont mis le fichier là où il a été ensuite trouvé. Ça n'a en général aucune importance.

Exemples : VTV, eztv, rartv, tvu.org.

Les accidents de diffusion

Les indications comme « REPACK », « PROPER », « RETORRENT » signifient que ce fichier est là pour remplacer une précédente version défectueuse (son décalé, image endommagée, pub laissée, etc.).