QC Sous-titres

ChatGPT peut-il relire vos sous-titres ?

Vous avez sûrement déjà essayé. Coller un fichier de sous-titres dans ChatGPT, demander de « vérifier les erreurs » et croiser les doigts. Voici pourquoi ça ne marche pas vraiment — et à quoi ressemble un vrai QC sous-titres.

Gary Sztajnman

Gary Sztajnman

Auteur

24 mars 20267 min de lecture

En bref

  • Les LLMs ne voient que du texte. Ils n'ont aucune notion de timing, de vitesse de lecture ou de synchronisation vidéo.
  • Comparer une traduction à l'original est un travail complexe que les chatbots gèrent mal.
  • Le résultat est un pavé de texte ou une réécriture complète — rien d'applicable cue par cue.
  • Aucune mémoire de votre glossaire, de vos règles de traduction ou de vos corrections passées.

Ce que ChatGPT voit vraiment quand vous collez des sous-titres

Quand vous copiez-collez un fichier SRT ou VTT dans un chatbot, il reçoit un bloc de texte avec quelques timecodes éparpillés. C'est tout. Il ne sait pas ce qui se passe à l'écran. Il ne sait pas qui parle. Il n'entend pas l'audio. Il n'a aucune idée si le sous-titre #47 apparaît pendant un dialogue rapide ou un lent panoramique.

Résultat : toute une catégorie de problèmes de qualité — ceux qui comptent vraiment en sous-titrage professionnel — lui sont complètement invisibles :

  • Caractères par seconde (CPS) — le spectateur a-t-il le temps de lire ?
  • Écart entre les cues — les sous-titres se chevauchent-ils ou sont-ils trop rapprochés ?
  • Durée minimale et maximale — un cue clignote-t-il en 200ms ou reste-t-il 15 secondes ?
  • Longueur et nombre de lignes — le sous-titre va-t-il déborder ou s'empiler sur trois lignes ?
  • Synchronisation avec la parole — le sous-titre apparaît-il quand la personne commence réellement à parler ?

Les vérifications techniques qu'il ne peut pas faire

Le QC professionnel suit des règles strictes et mesurables. Voici ce qu'un chatbot ne peut absolument pas vérifier :

Vitesse de lecture (CPS)

Max 25 caractères/seconde

Si un sous-titre contient 50 caractères et ne s'affiche que 1,5 seconde, il est illisible. Un LLM n'a aucune notion de durée d'affichage — il voit du texte, pas du temps.

Longueur de ligne

Max 42 caractères par ligne

Les lignes trop longues sont tronquées ou provoquent un retour à la ligne disgracieux selon le lecteur. Un chatbot peut compter les caractères, certes — mais il ne signalera pas ça spontanément, et même quand on lui demande, il se trompe souvent.

Durée des cues

Entre 700ms et 7 secondes

Un sous-titre de 300ms est invisible. Un qui reste 12 secondes semble cassé. Les LLMs peuvent théoriquement calculer des timecodes, mais en pratique ils sont peu fiables et ne signaleront pas systématiquement chaque violation dans un fichier de 2 000 cues.

Écart entre les cues

Minimum 80ms entre les sous-titres

Quand deux cues sont trop rapprochés, ça crée un saut visuel à l'écran. Cela nécessite de comparer chaque paire de timecodes adjacents — le genre de vérification systématique et répétitive qui demande un parser, pas un modèle de langage.

La relecture de traduction, c'est plus compliqué qu'il n'y paraît

C'est là que ça devient tentant. Vous avez un fichier de sous-titres en français et l'original en anglais. Vous collez les deux dans ChatGPT et demandez : « Y a-t-il des erreurs de traduction ? » La réponse semblera confiante. Elle sera peut-être partiellement juste. Mais elle ratera beaucoup de choses.

Le QC de traduction ne se résume pas à vérifier si les mots correspondent. C'est vérifier si le sens, le ton et le registre passent — dans les contraintes de timing et d'espace du sous-titrage. C'est une compétence très spécifique, et les LLMs ne sont pas bons là-dessus. Voici ce qui dérape :

  • Erreurs de traduction subtiles mais plausibles — le LLM ne repérera pas une erreur si la phrase est grammaticalement correcte dans la langue cible
  • Glissements de ton et de registre — formel vs informel, jargon technique vs langage courant. Le chatbot ne connaît pas la voix de votre projet.
  • Conformité au glossaire — si votre client exige « sous-titrage » plutôt que « sous-titres » ou insiste sur une terminologie précise, le LLM n'en sait rien
  • Contexte des cues environnants — un pronom dans le cue #84 peut renvoyer à quelque chose dit au cue #79. Les LLMs peinent avec ce type de référence longue distance dans les fichiers de sous-titres.

Même les traducteurs professionnels utilisent des outils TAO et des bases terminologiques pour la relecture. Un prompt dans un chat ne remplace pas ce workflow.

Le problème du résultat : rien d'applicable concrètement

Admettons que ChatGPT trouve des problèmes. Qu'est-ce que vous obtenez ? Un paragraphe disant que « le cue 34 pourrait être amélioré » ou une réécriture complète de votre fichier. Ni l'un ni l'autre n'est utilisable dans un vrai workflow.

L'écart entre « voici quelques suggestions » et « voici votre fichier corrigé, prêt à livrer » est énorme. En sous-titrage professionnel, il faut des diagnostics par cue avec des corrections en un clic — pas une conversation.

Ce qu'un chatbot vous donne

Ce que Hello8 vous donne

Un paragraphe disant « certains cues sont peut-être trop rapides à lire »

Valeur CPS exacte par cue, signalée comme erreur ou avertissement avec niveaux de sévérité

Une réécriture complète de votre fichier (bon courage pour comparer)

Des suggestions par cue que vous pouvez accepter ou refuser individuellement

Des conseils génériques comme « envisagez de raccourcir la ligne 47 »

Nombre de caractères, nombre de lignes et métriques de durée précis pour chaque cue

Aucun moyen de relancer les mêmes vérifications après vos modifications

Re-validation en temps réel pendant l'édition — corrigez un cue et voyez l'erreur disparaître

Aucun contexte projet, aucune mémoire

À chaque nouvelle conversation, le LLM repart de zéro. Il ne sait rien de votre projet, de votre client ou de votre travail passé. En QC sous-titres, le contexte est primordial :

  • Pas de glossaire — il ne sait pas que votre client utilise « closed captions » plutôt que « sous-titres pour sourds et malentendants », ou que « rendering » doit toujours être traduit par « rendu » dans ce projet
  • Pas de mémoire de traduction — si vous avez déjà validé une traduction pour une expression récurrente, le chatbot ne le sait pas. Il pourrait suggérer une traduction différente à chaque fois.
  • Pas d'historique de versions — il ne peut pas vous dire ce qui a changé entre la v2 et la v3 de votre fichier, ou si une correction appliquée hier a été annulée
  • Pas de règles client — CPS maximum, longueur de ligne préférée, termes interdits, charte maison. Tout ça vit dans votre tête ou un tableur, pas dans ChatGPT.

Quand les LLMs sont vraiment utiles pour les sous-titres

Je ne dis pas que les chatbots sont inutiles. Ils ont leur place — juste pas comme outil de QC. Voici où ils peuvent vraiment aider :

Brainstorming de traductions délicates

Bloqué sur une expression idiomatique intraduisible ? Les chatbots proposent des alternatives créatives correctes. Mais n'acceptez pas aveuglément la première suggestion.

Vérifications grammaticales ponctuelles

Si vous voulez un deuxième avis sur la grammaire ou l'orthographe d'un seul cue, coller dans un chatbot peut fonctionner. Mais c'est de la relecture, pas du QC.

Génération de modèles

Besoin d'un template pour des consignes de sous-titrage ou un brouillon de charte ? Les LLMs sont bons pour générer du texte structuré que vous pouvez ensuite affiner.

Ce sont des assistants d'écriture, pas des outils de QC. La nuance compte.

À quoi ressemble un vrai QC sous-titres

Le QC sous-titres est un processus structuré basé sur des règles. Il nécessite un outil capable de parser les timecodes, d'appliquer des seuils configurables et de donner des résultats exploitables. Voici ce que Hello8 fait différemment :

Analyse par cue

Chaque cue est vérifié selon vos règles : CPS, longueur de ligne, durée, écart, nombre de lignes. Vous voyez exactement quels cues posent problème et pourquoi.

Sévérité erreur vs avertissement

Tous les problèmes ne se valent pas. Un cue à 26 CPS est un avertissement. Un cue à 40 CPS est une erreur. Hello8 distingue les deux pour que vous puissiez prioriser.

Corrections en un clic

Un problème repéré ? Corrigez-le sur place. Pas de copier-coller entre outils, pas de comparaison manuelle, pas de doute sur ce qui a changé. Cliquez, corrigez, avancez.

Contexte projet intégré

Glossaires, règles de traduction, terminologie préférée — tout vit dans votre projet, pas dans votre mémoire. Chaque QC utilise la même base de référence.

Questions fréquentes

ChatGPT peut-il vérifier le timing des sous-titres ?

Non. ChatGPT et les autres LLMs traitent uniquement du texte. Ils ne peuvent pas vérifier si les sous-titres sont synchronisés avec l'audio, si la vitesse de lecture est appropriée, ou si les durées des cues respectent les plages acceptables. Ces vérifications nécessitent l'analyse de timecodes et leur comparaison avec des seuils mesurables.

Puis-je utiliser Claude ou Gemini pour relire des sous-titres à la place de ChatGPT ?

Les mêmes limitations s'appliquent à tous les LLMs actuels. Claude, Gemini et ChatGPT sont tous des modèles de langage — ils excellent en génération et analyse de texte mais ne peuvent pas effectuer de vérifications structurelles comme la validation CPS, la détection d'écarts ou la vérification de timing.

Qu'est-ce que le CPS en sous-titrage ?

CPS signifie Caractères Par Seconde. C'est la mesure de la vitesse à laquelle un spectateur doit lire un sous-titre. Le maximum standard de l'industrie est d'environ 25 CPS. Des valeurs plus élevées signifient que le sous-titre est affiché trop brièvement pour une lecture confortable.

L'IA peut-elle remplacer le QC humain des sous-titres ?

Les outils de QC basés sur l'IA (comme ceux de Hello8) peuvent automatiser les vérifications techniques : vitesse de lecture, longueur de ligne, durée et validation des écarts. Mais le jugement éditorial — si une traduction capture le bon ton, si un retour à la ligne tombe à une pause naturelle — bénéficie encore de la relecture humaine. La meilleure approche combine vérifications automatisées et supervision humaine.

Quelles vérifications le QC professionnel des sous-titres doit-il inclure ?

Au minimum : caractères par seconde (CPS), longueur maximale de ligne, nombre maximal de lignes par cue, durée minimale et maximale des cues, écart minimal entre les cues et vérification orthographique. Pour les sous-titres traduits, ajoutez la conformité au glossaire, la précision de la traduction et la cohérence avec la terminologie approuvée.

Comment Hello8 gère-t-il le contrôle qualité des sous-titres ?

Hello8 exécute une analyse automatisée par cue selon des seuils configurables (CPS, longueur de ligne, durée, écarts). Les problèmes sont signalés avec un niveau de sévérité erreur ou avertissement. Vous pouvez corriger les problèmes directement dans l'éditeur en un clic, et le QC se re-valide en temps réel pendant vos modifications.

Prêt pour un vrai QC sous-titres ?

Arrêtez de coller vos fichiers dans des chatbots. Obtenez une analyse par cue, des règles configurables et des corrections en un clic.