Comment transformer une image en vidéo ?

La start-up Stability AI dévoile deux outils innovants pour transformer des images fixes en vidéos immersives grâce à l’intelligence artificielle. Une révolution pour la création visuelle.

La révolution de l’image animée ne viendra peut-être pas d’Hollywood. Stability AI, acteur central de l’intelligence artificielle générative, poursuit sa marche en avant, en silence mais avec détermination. Deux nouveaux modèles, Stable Virtual Camera et Stable Video Diffusion, ouvrent un pan supplémentaire de ce que l’on pourrait appeler l’esthétique générative. Avec eux, une simple image devient matière mouvante.

A LIRE AUSSI
Maya : quand l’IA vocale dépasse la fiction

Stable Virtual Camera : quand l’image prend de la profondeur

Stable Virtual Camera n’est pas un gadget, c’est une brique technologique. Elle convertit une ou plusieurs images fixes — jusqu’à 32 — en vidéos 3D. Pas avec des reconstructions géométriques complexes comme on en voyait dans les laboratoires de vision par ordinateur, mais avec une diffusion multi-vues. Le résultat ? Des vidéos cohérentes, des perspectives crédibles, et cette sensation troublante d’immersion.

Caméra libre, pensée fluide
Le modèle propose 14 trajectoires prédéfinies :

  • Rotation à 360°
  • Lemniscate (cette courbe en huit qui n’en finit jamais)
  • Spirale
  • Zooms avant et arrière
  • Pans latéraux et verticaux

Et surtout, une capacité à générer jusqu’à 1 000 frames sans trahir la structure de l’image. C’est long, c’est stable, et surtout, c’est sans couture.

Format libre
Autre force : l’absence de format imposé. Carré, vertical, horizontal, ou même personnalisé — sans devoir réentraîner le modèle. Une souplesse rare.

Mode d’emploi (presque) grand public
Pour les curieux et les bidouilleurs, tout est là :

bashCopierModifiergit clone --recursive https://github.com/Stability-AI/stable-virtual-camera  
pip install -e .

On lance l’interface Gradio (conviviale) ou la CLI (plus rustique), on charge les images, on choisit la trajectoire de la caméra, on exporte en MP4. Et le tour est joué.

Mais l’humain reste dur à saisir
Le modèle n’est pas sans limites. Les humains, les animaux, ou des textures instables comme l’eau mettent en difficulté les algorithmes. Des artefacts peuvent surgir, notamment lors de passages à travers des objets flous ou ambigus. Le réalisme reste encore, parfois, une promesse.

Stable Video Diffusion : l’instantané animé

Deuxième brique, deuxième usage. Stable Video Diffusion fait court, rapide, efficace. Une image fixe, et en moins de deux minutes, une vidéo de 2 à 5 secondes surgit. Idéal pour les créateurs en quête de contenus à fort impact visuel, sans passer par la case montage.

Deux modèles, deux vitesses

  • 14 ou 25 frames
  • Framerate modulable : de 3 à 30 images par seconde
  • Résolution : jusqu’à 576 x 1024 pixels
  • Traitement : < 2 minutes

Utilisation minimaliste, mais efficace
Une image bien cadrée, un modèle à télécharger via Hugging Face, et une pincée de code Python :

pythonCopierModifierfrom diffusers import StableVideoDiffusionPipeline  
pipe = StableVideoDiffusionPipeline.from_pretrained("stabilityai/stable-video-diffusion-img2vid-xt")  
image = load_image("path_to_image.jpg").resize((1024, 576))  
frames = pipe(image).frames  
export_to_video(frames, "output_video.mp4", fps=7)

Et voilà une vidéo exportable en MP4 ou WebP.

Deux outils, deux philosophies

FonctionnalitéStable Virtual CameraStable Video Diffusion
Type de vidéoLongue (jusqu’à 1 000 frames)Courte (2 à 5 secondes)
Mouvements de caméraComplexes, prédéfinisSimples (zoom, pan)
Nombre d’images en entrée1 à 321 seule
FormatsFlexiblesFixes
Usages typiquesImmersion, narration visuelleCréation rapide

Des promesses concrètes

Les cas d’usage ne manquent pas.

  • Cinéma et animation : générer rapidement des plans complexes.
  • Marketing : créer du contenu sur mesure, et surtout en format vertical.
  • Jeux vidéo : arrière-plans dynamiques, cinématiques générées à la volée.
  • Art numérique : offrir une nouvelle matière à sculpter pour les artistes.

Une start-up qui rebondit

2024 n’a pas été une promenade de santé pour Stability AI. Départ du CEO, vague de licenciements. Et pourtant : la start-uop a levé 80 millions de dollars, publié deux modèles d’envergure, et montré qu’elle a su transformer la tourmente en relance.


Partagez votre avis