Claude édite mes vidéos de bout en bout — tutoriel complet

URL : https://youtu.be/Aw3BkmhYu4I

Langue originale : anglais, traduit en français

Format : Tutoriel/démo technique

Édition vidéo automatique avec Claude — Partie 1

Ce qu'on va construire

Claude édite mes vidéos de bout en bout. Je dépose un fichier brut : il coupe les erreurs et les silences, ajoute des motion graphics, des éléments dynamiques, des sous-titres. Même sans expérience en code ou en montage, le résultat est immédiatement professionnel — tout se passe en langage naturel.

Exemple concret : un clip brut de 50 secondes est passé à 27 secondes propres, avec motion graphics et timeline éditable dans le dashboard Hyperframes.

La stack technique

Ancien workflow (manuel)

Fichier brut (enregistrement)
Montage manuel dans Adobe Premiere Pro (coupes, retakes)
Animations manuelles
Rendu manuel

Nouveau workflow (automatisé)

Video Use — outil de trimming et d'édition automatique
Hyperframes — motion graphics et rendu (HTML-based)
Claude Code — orchestrateur central qui connecte tous les outils

Video Use et Hyperframes ont chacun leur repo GitHub. Claude Code lit ces repos et en extrait les skills nécessaires pour construire le pipeline.

Variante possible : remplacer l'enregistrement manuel par un avatar HeyGen — dans ce cas, le fichier est parfait d'entrée et l'étape de trimming disparaît. Pour YouTube, l'enregistrement reste manuel pour garder l'authenticité.

Remotion vs Hyperframes

Video Use inclut Remotion pour les animations. C'est capable, mais Hyperframes produit un résultat plus sophistiqué et plus engageant grâce à son rendu HTML. Les deux font le même travail (animer + rendre), mais Hyperframes est préféré ici.

Point critique commun aux deux : la synchronisation transcript/timecodes. Chaque animation doit être calée exactement au mot prononcé — c'est intégré dans le pipeline.

Installation — Démarrage

Option A — Repo étudiant

Récupérer l'URL du Hyperframe Student Kit (disponible dans la communauté School gratuite) et le donner à Claude Code : Clone this repo. Set up this project for me.

Option B — Repos GitHub directs

Copier les deux URLs dans Claude Code :

Repo Hyperframes
Repo Video Use

Prompt de démarrage :

"Je configure ce projet comme mon studio d'édition vidéo. Regarde ces deux repos GitHub et intègre les skills et informations importantes. L'objectif : je dépose un fichier vidéo brut, tu l'édites, tu supprimes les filler words, et tu ajoutes les motion graphics. Pipeline complet."

Claude Code explore les repos, tire les fichiers nécessaires et configure le projet.

Interface : Claude Desktop App vs VS Code

VS Code : visibilité complète sur les fichiers du projet (assets, projets, tout le dossier)
Claude Desktop App : interface moins intimidante, mais pas de visibilité fichiers sur la gauche (seulement la liste des projets)

Les deux travaillent dans le même dossier — c'est une question de confort.

Étape 1 — Trimming avec Video Use

Référencer le fichier

Dans le chat Claude Code, taper @ pour afficher tous les fichiers du projet et sélectionner le fichier vidéo brut.

Prompt d'édition

"Utilise l'outil Video Use pour éditer cette vidéo. Analyse-la, supprime les filler words, les silences et les retakes. Ensuite on utilisera Hyperframes pour les motion graphics. Pour l'instant, ta première tâche c'est juste de couper les erreurs et les filler words."

Ce que Claude Code fait

Transcription de la vidéo
Identification des retakes et faux départs avec timecodes
Proposition des coupes (ce qu'il garde, ce qu'il coupe)
Demande de validation sur les cas ambigus (ex : "trailing so à 42'20 — je le laisse ou je coupe ?")
Génération du fichier édité

Réponse simple pour valider : "Yep, rends ça le plus percutant possible."

Transcription — Choix de l'outil

Trois options disponibles dans Video Use pour transcrire :

Outil	Coût	Notes
OpenAI Whisper API	Payant	Défaut Hyperframes
Whisper local	Gratuit	Installable automatiquement par Claude Code
ElevenLabs API	Payant	Défaut Video Use — meilleur pour détecter les bons moments de coupe

Pour utiliser ElevenLabs :

Aller sur ElevenLabs → Developers → API Keys → créer une clé
Ajouter la clé dans le fichier .env du projet Claude Code

Ne jamais coller la clé API directement dans le chat — elle resterait dans l'historique de conversation.

Dans VS Code : cliquer sur .env et coller la clé directement. Dans le Desktop App : demander à Claude Code de créer le .env et y insérer la clé.

Résultat du trimming

Le clip de 50 secondes est passé à 32 secondes (édité.mp4). Claude Code retourne le chemin du fichier pour le retrouver dans l'explorateur.

Ce que le pipeline a détecté et coupé :

Deux moments de retake clairement identifiés
Un faux départ (début de phrase, pause, reprise)
Un bégaiement

Les coupes sont snappées aux limites des mots avec 50 ms de marge.

Principe à garder en tête

Aucun système ne sera parfait dès le départ. Il faut l'entraîner à ton style, comme apprendre à un enfant à faire du vélo : tenir le guidon au début, corriger la trajectoire, ajuster — jusqu'à ce que ça tourne seul. Les itérations sur les skills et les prompts permettent d'affiner le pipeline au fil du temps.

Transcript et précision des timestamps

Une fois l'édition terminée, Claude génère aussi le transcript. Dans le dossier du projet (video-projects/edit-demo/assets/), on trouve l'MP4 édité et un fichier JSON avec le transcript complet — mot par mot, avec les timestamps précis. Exemple : un mot commence à 1.599 secondes, un autre à 11.199 secondes. Cette précision est essentielle pour synchroniser les motion graphics au discours exact.

Premier passage : diriger le style à la voix

Parce qu'on n'a pas encore de style établi, il faut guider Claude manuellement sur ce premier passage. L'approche : utiliser un outil de dictée vocale (lien en description) pour décrire ce qu'on veut, scène par scène.

Exemple de brief vocal donné directement à Claude :

Au début, quand je dis "c'est la vidéo exemple qu'on édite en direct" — faire apparaître une carte style liquid glass iOS 26 sur la moitié gauche de l'écran, avec les mots qui arrivent en karaoke, comme un titre de vidéo.
Quand je parle des erreurs qui seront coupées — ajouter une carte en bas avec le texte "les erreurs seront coupées" et une animation sur la droite qui montre visuellement ce que "couper" veut dire.
Quand je parle du pipeline VideoUse (fichier brut → édition → motion graphics) — animer ça sur une carte liquid glass : montrer littéralement un fichier brut qui se fait éditer et enrichir de motion graphics.
Quand je parle de Hyperframes comme alternative — montrer une version différente des motion graphics, couleur ou style différent, cartes des deux côtés de l'écran.

Instruction clé : tout doit être synchronisé à la seconde exacte où le mot déclencheur est prononcé.

Mode plan (Plan Mode) : valider avant de coder

Avant de lancer la génération, on passe en plan mode. Claude analyse le transcript, comprend les demandes, et présente un plan détaillé :

4 beats Hyperframes (scènes) : intro glow teal, orange, violet, graphite
Direction esthétique iOS 26 liquid glass premium UI sur fond légèrement assombri
Timeline des beats avec les mots-ancres : 0-5s, 5-12s, 12-20s, etc.
Pour chaque beat : position de la carte, couleur, texte, timing d'entrée

On peut commenter directement sur n'importe quel élément du plan. On valide ou on itère avant que Claude commence à coder le HTML — ce qui évite de gaspiller des tokens et du temps.

Révision du plan : ajouter une scène finale

Exemple de révision ajoutée à la volée : dans les 5 dernières secondes, passer la facecam en crop vertical avec bords arrondis et ombre portée, la déplacer sur la moitié droite, et afficher "Thanks for watching" sur la moitié gauche, sur fond dark mode.

La révision se fait en langage naturel, Claude refait un plan, on approuve, et seulement là il code.

Première itération : feedback et corrections

Le rendu initial est déjà synchronisé correctement. Quelques problèmes visuels à corriger :

La carte liquid glass couvre un peu le visage — à réduire et recadrer à droite.
Un pattern de grille s'affiche sur toute la vidéo — à supprimer complètement.
La scène finale : le crop n'est pas centré, il faut rogner les deux côtés (gauche ET droite) pour garder le centre, avec bords arrondis.

Ces retours sont donnés en texte naturel, Claude implémente, on re-preview.

L'éditeur timeline : corrections rapides sans repasser par Claude

L'interface dispose d'un éditeur de timeline visuel. On peut déplacer, raccourcir ou supprimer des beats directement dans l'UI. Ces changements se reflètent dans le code, et Claude Code les prend en compte automatiquement. Pour les micro-ajustements de timing, c'est beaucoup plus rapide que de reprompt.

Deuxième itération : résultat

Les animations arrivent au bon moment. Exemple notable : sur le beat "couper les erreurs", Claude a généré des cartes qui virent au rouge, puis un curseur-ciseau traverse et les coupe — sans que cela ait été demandé explicitement. Juste "montre une animation qui ressemble à de l'édition vidéo" et il a interprété ça.

Quand le résultat est bon, on demande le render final. Il atterrit dans le dossier du projet, prêt à être uploadé.

Structure du projet dans VS Code


video-projects/
└── edit-demo/
    ├── assets/          ← clips sources, transcripts JSON
    ├── compositions/    ← fichiers HTML des beats (les animations)
    ├── components/      ← composants réutilisables
    └── renders/         ← renders finaux + screenshots de vérification

Astuce importante : Claude prend des screenshots des scènes pour vérifier lui-même que le rendu est correct. S'il remarque que ça ne va pas, il le signale avant de rendre. C'est un pattern à intégrer dans les instructions système.

La vraie puissance : les projets comme données d'entraînement

La logique à long terme : chaque vidéo produite devient une référence de style. Si on fait 5 leçons, on peut demander à Claude de générer un fichier lesson-design-philosophy.md. Ensuite, pour toute nouvelle leçon, Claude utilise ce fichier automatiquement — sans qu'on ait à re-décrire le style.

C'est là qu'on atteint le niveau "drop in raw file, get a finished video". Les YouTube Shorts automatisés suivent la même logique : on itère jusqu'à ce que le style soit établi, puis le pipeline tourne tout seul.

Coût en tokens

Ce workflow complet (édition + 4 beats de motion graphics + 2 itérations) a coûté environ 238 000 tokens. Pas négligeable. Conséquence directe : plus le brief est précis dès le départ, moins on itère à l'aveugle, moins on brûle de tokens inutilement. Le mode plan est là pour ça.