Aller au contenu
IATendancesGenAISoravidéo

Sora fait son cinéma !

Sora, l'OVNI d'OpenAI, va révolutionner l'industrie audiovisuelle ! Découvrez comment ce modèle text-to-video promet un potentiel créatif infini en repoussant les limites de l'imagination.

Sora, le nouvel Hollywood du 21ème siècle

Sora, l'OVNI d’OpenAI s'annonce comme la plus grande évolution audiovisuelle de notre génération. À l'instar d'une star hollywoodienne, son arrivée tardive au grand public attise fantasmes ... et certaines inquiétudes.

Sora, tu sauras

Ce choix sémantique n'est pas anodin. Le nom Sora trouve en effet son inspiration au pays du soleil levant. Et en nippon, l'idéogramme 空 (そら), traduit à la fois la vastitude et la liberté. Selon le contexte, il suggère un potentiel créatif sans borne, un espace infini où l'imagination peut s'exprimer librement sans aucune contrainte. Faut-il y voir une métaphore qui reflète l'ambition d'OpenAI d'ouvrir des horizons illimités dans la génération de contenu vidéo ? Elémentaire mon cher Watson ! Après l'industrie musicale qui a pris un coup dans l'aile avec l'arrivée de Suno.ai, c'est au tour de l'industrie audiovisuelle de balbutier face au génie des premiers extraits diffusés.

La prouesse de ce nouveau modèle marque l'entrée dans une ère où le text-to-video ne relève plus de la science-fiction. Cette avancée, aussi spectaculaire soit-elle, garde pourtant ses portes bien closes, esquissant par bribes de communications ultra-léchées un futur dont la concrétisation est attendue avec impatience.

La vidéo ultra réaliste d'une balade à Tokyo fabriquée par Sora et postée le 15 février 2024 par le compte X d'Open AI dépasse en quelques jours les 90 millions de vues.

Les défis de la génération de vidéo : une complexité inédite

Du Kinétographe et Kinétoscope inventés en 1891 par Edison & Dickson à l'invention du cinéma par les Frères Lumière en 1895, le cinéma a connu des génies de l'illusion, à l'instar de Georges Méliès, considéré comme le pionnier des trucages au cinéma. La course aux effets spéciaux n'a eu de limites que l'imagination des réalisateurs : l'utilisation du stop motion (un temps que les moins de 20 ans ne peuvent pas connaître !) que l'on retrouve dans de nombreux films du réalisateur Michel Gondry, les pépites d'innovations visuelles de George Lucas, Spielberg ou encore James Cameron et Peter Jackson, tels Star Wars, Jurassic Park, Avatar ou la trilogie du Seigneur des anneaux. La valeur ajoutée de ces génies de l'illusion résidait certainement dans l'élaboration d'un storyboard léché et poétique, où l'œil du spectateur n'a pas le temps de comprendre la magie derrière son écran.

Le Voyage dans la lune de Georges Méliès - 1902

La transformation de vidéos en une séquence logique et cohérente de chiffres représente un défi de taille, découlant de la nature complexe de la vidéo elle-même — un médium qui, contrairement à une image statique, exige une continuité et une logique dans l'enchaînement des images pour narrer une histoire, même en l'absence de son. Deux gros plans consécutifs ou l'utilisation d'un champ/contre-champ ne respectant pas la règle des 180° étaient des jargons réservés jusqu'alors à la logique des artistes de la réalisation. L'industrie cinématographique se voyait loin d'être mise à mal.

Sora : la révolution audiovisuelle par OpenAI

Selon les révélations d'OpenAI, Sora incarne un "diffusion transformer", une architecture qui combine les principes des modèles de diffusion et des transformers. Ces derniers, au cœur du succès de GPT, permettent de comprendre les liens logiques entre les éléments d'un ensemble. Pour Sora, cette approche est adaptée au domaine visuel, où les images de vidéos sont décomposées en patchs, permettant ainsi de tisser un fil narratif visuel cohérent.

Questionnée par le Wall Street Journal sur les sources de données pour l'entraînement du modèle, la directrice technique d'OpenAI, Mira Murati, garde ses réponses imprécises. Sans confirmer l'usage de vidéos issues de YouTube, Facebook ou Instagram, elle révèle cependant que certains contenus de Shutterstock ont été intégrés, fruit d'un partenariat entre les deux sociétés. Actuellement, Sora peut produire des vidéos en 720p d'une vingtaine de secondes en quelques minutes seulement. Les ingénieurs se concentrent maintenant sur l'amélioration de l'efficacité du processus tout en réduisant les coûts associés.

Démonstration impressionnante de Sora en vidéo - Chaîne Youtube du Nouvel Obs'

Une avancée sous le signe de la transparence et de la responsabilité

Dans un monde où les frontières entre réalité et virtualité s'amincissent, l'accessibilité d'outils sophistiqués comme Sora en pleine période électorale aux États-Unis soulève des préoccupations majeures. Face à l'ingéniosité croissante des acteurs malveillants qui manipulent les technologies d'intelligence artificielle pour produire de fausses informations et des deepfakes, des mesures rigoureuses s'imposent. À l'instar de DALL-E, il semble impératif d'interdire la création de vidéos mettant en scène des personnalités publiques. En réponse, OpenAI prévoit d'apposer des filigranes et d'intégrer des métadonnées signalant clairement l'origine artificielle des contenus vidéo.

Malgré ces gardes-fous, le scepticisme persiste, alimenté par des scandales récents tels que celui des images de Taylor Swift. Mira Murati promet une version améliorée de Sora pour une arrivée sur le marché en fin d'année. Un gain de temps pour continuer des tests rigoureux et pour ajouter une nouvelle dimension sonore, renforçant ainsi l'authenticité et la sécurité de cet outil tant attendu.

La chanteuse américaine Taylor Swift a vu son identité usurpée dans des fausses vidéos à caractère pornographique générées par intelligence artificielle. Image BFM TV

Conclusion : un futur rempli de prouesses et de prudence

Sora d'OpenAI s'inscrit dans la lignée des innovations qui ont le potentiel de transformer radicalement notre manière de créer et d'interagir avec le contenu vidéo. Toutefois, cette promesse s'accompagne d'une reconnaissance des défis techniques et éthiques à surmonter. Dans cet équilibre délicat entre innovation et responsabilité, Sora se profile non seulement comme une prouesse technologique, mais aussi comme un témoignage de la complexité inhérente à l'avancée de l'IA dans notre société.

Dernier