← Tous les transcripts

Claude édite mes vidéos de bout en bout — tutoriel complet

URL : https://youtu.be/Aw3BkmhYu4I

Langue originale : anglais, traduit en français

Format : Tutoriel/démo technique


Édition vidéo automatique avec Claude — Partie 1

Ce qu'on va construire

Claude édite mes vidéos de bout en bout. Je dépose un fichier brut : il coupe les erreurs et les silences, ajoute des motion graphics, des éléments dynamiques, des sous-titres. Même sans expérience en code ou en montage, le résultat est immédiatement professionnel — tout se passe en langage naturel.

Exemple concret : un clip brut de 50 secondes est passé à 27 secondes propres, avec motion graphics et timeline éditable dans le dashboard Hyperframes.


La stack technique

Ancien workflow (manuel)

Nouveau workflow (automatisé)

Video Use et Hyperframes ont chacun leur repo GitHub. Claude Code lit ces repos et en extrait les skills nécessaires pour construire le pipeline.

Variante possible : remplacer l'enregistrement manuel par un avatar HeyGen — dans ce cas, le fichier est parfait d'entrée et l'étape de trimming disparaît. Pour YouTube, l'enregistrement reste manuel pour garder l'authenticité.


Remotion vs Hyperframes

Video Use inclut Remotion pour les animations. C'est capable, mais Hyperframes produit un résultat plus sophistiqué et plus engageant grâce à son rendu HTML. Les deux font le même travail (animer + rendre), mais Hyperframes est préféré ici.

Point critique commun aux deux : la synchronisation transcript/timecodes. Chaque animation doit être calée exactement au mot prononcé — c'est intégré dans le pipeline.


Installation — Démarrage

Option A — Repo étudiant

Récupérer l'URL du Hyperframe Student Kit (disponible dans la communauté School gratuite) et le donner à Claude Code : Clone this repo. Set up this project for me.

Option B — Repos GitHub directs

Copier les deux URLs dans Claude Code :

Prompt de démarrage :

"Je configure ce projet comme mon studio d'édition vidéo. Regarde ces deux repos GitHub et intègre les skills et informations importantes. L'objectif : je dépose un fichier vidéo brut, tu l'édites, tu supprimes les filler words, et tu ajoutes les motion graphics. Pipeline complet."

Claude Code explore les repos, tire les fichiers nécessaires et configure le projet.

Interface : Claude Desktop App vs VS Code

Les deux travaillent dans le même dossier — c'est une question de confort.


Étape 1 — Trimming avec Video Use

Référencer le fichier

Dans le chat Claude Code, taper @ pour afficher tous les fichiers du projet et sélectionner le fichier vidéo brut.

Prompt d'édition

"Utilise l'outil Video Use pour éditer cette vidéo. Analyse-la, supprime les filler words, les silences et les retakes. Ensuite on utilisera Hyperframes pour les motion graphics. Pour l'instant, ta première tâche c'est juste de couper les erreurs et les filler words."

Ce que Claude Code fait

Réponse simple pour valider : "Yep, rends ça le plus percutant possible."


Transcription — Choix de l'outil

Trois options disponibles dans Video Use pour transcrire :

OutilCoûtNotes
OpenAI Whisper APIPayantDéfaut Hyperframes
Whisper localGratuitInstallable automatiquement par Claude Code
ElevenLabs APIPayantDéfaut Video Use — meilleur pour détecter les bons moments de coupe

Pour utiliser ElevenLabs :

Ne jamais coller la clé API directement dans le chat — elle resterait dans l'historique de conversation.

Dans VS Code : cliquer sur .env et coller la clé directement. Dans le Desktop App : demander à Claude Code de créer le .env et y insérer la clé.


Résultat du trimming

Le clip de 50 secondes est passé à 32 secondes (édité.mp4). Claude Code retourne le chemin du fichier pour le retrouver dans l'explorateur.

Ce que le pipeline a détecté et coupé :

Les coupes sont snappées aux limites des mots avec 50 ms de marge.


Principe à garder en tête

Aucun système ne sera parfait dès le départ. Il faut l'entraîner à ton style, comme apprendre à un enfant à faire du vélo : tenir le guidon au début, corriger la trajectoire, ajuster — jusqu'à ce que ça tourne seul. Les itérations sur les skills et les prompts permettent d'affiner le pipeline au fil du temps.

Transcript et précision des timestamps

Une fois l'édition terminée, Claude génère aussi le transcript. Dans le dossier du projet (video-projects/edit-demo/assets/), on trouve l'MP4 édité et un fichier JSON avec le transcript complet — mot par mot, avec les timestamps précis. Exemple : un mot commence à 1.599 secondes, un autre à 11.199 secondes. Cette précision est essentielle pour synchroniser les motion graphics au discours exact.

Premier passage : diriger le style à la voix

Parce qu'on n'a pas encore de style établi, il faut guider Claude manuellement sur ce premier passage. L'approche : utiliser un outil de dictée vocale (lien en description) pour décrire ce qu'on veut, scène par scène.

Exemple de brief vocal donné directement à Claude :

Instruction clé : tout doit être synchronisé à la seconde exacte où le mot déclencheur est prononcé.

Mode plan (Plan Mode) : valider avant de coder

Avant de lancer la génération, on passe en plan mode. Claude analyse le transcript, comprend les demandes, et présente un plan détaillé :

On peut commenter directement sur n'importe quel élément du plan. On valide ou on itère avant que Claude commence à coder le HTML — ce qui évite de gaspiller des tokens et du temps.

Révision du plan : ajouter une scène finale

Exemple de révision ajoutée à la volée : dans les 5 dernières secondes, passer la facecam en crop vertical avec bords arrondis et ombre portée, la déplacer sur la moitié droite, et afficher "Thanks for watching" sur la moitié gauche, sur fond dark mode.

La révision se fait en langage naturel, Claude refait un plan, on approuve, et seulement là il code.

Première itération : feedback et corrections

Le rendu initial est déjà synchronisé correctement. Quelques problèmes visuels à corriger :

Ces retours sont donnés en texte naturel, Claude implémente, on re-preview.

L'éditeur timeline : corrections rapides sans repasser par Claude

L'interface dispose d'un éditeur de timeline visuel. On peut déplacer, raccourcir ou supprimer des beats directement dans l'UI. Ces changements se reflètent dans le code, et Claude Code les prend en compte automatiquement. Pour les micro-ajustements de timing, c'est beaucoup plus rapide que de reprompt.

Deuxième itération : résultat

Les animations arrivent au bon moment. Exemple notable : sur le beat "couper les erreurs", Claude a généré des cartes qui virent au rouge, puis un curseur-ciseau traverse et les coupe — sans que cela ait été demandé explicitement. Juste "montre une animation qui ressemble à de l'édition vidéo" et il a interprété ça.

Quand le résultat est bon, on demande le render final. Il atterrit dans le dossier du projet, prêt à être uploadé.

Structure du projet dans VS Code


video-projects/
└── edit-demo/
    ├── assets/          ← clips sources, transcripts JSON
    ├── compositions/    ← fichiers HTML des beats (les animations)
    ├── components/      ← composants réutilisables
    └── renders/         ← renders finaux + screenshots de vérification

Astuce importante : Claude prend des screenshots des scènes pour vérifier lui-même que le rendu est correct. S'il remarque que ça ne va pas, il le signale avant de rendre. C'est un pattern à intégrer dans les instructions système.

La vraie puissance : les projets comme données d'entraînement

La logique à long terme : chaque vidéo produite devient une référence de style. Si on fait 5 leçons, on peut demander à Claude de générer un fichier lesson-design-philosophy.md. Ensuite, pour toute nouvelle leçon, Claude utilise ce fichier automatiquement — sans qu'on ait à re-décrire le style.

C'est là qu'on atteint le niveau "drop in raw file, get a finished video". Les YouTube Shorts automatisés suivent la même logique : on itère jusqu'à ce que le style soit établi, puis le pipeline tourne tout seul.

Coût en tokens

Ce workflow complet (édition + 4 beats de motion graphics + 2 itérations) a coûté environ 238 000 tokens. Pas négligeable. Conséquence directe : plus le brief est précis dès le départ, moins on itère à l'aveugle, moins on brûle de tokens inutilement. Le mode plan est là pour ça.