Gemini Omni apporte le montage vidéo conversationnel avec un réalisme basé sur les lois de la physique

6 juin 2026 by jules

Google a dévoilé Gemini Omni, un modèle multimodal qui combine les capacités de raisonnement de Gemini avec la génération de contenu. Sa grande nouveauté : la création vidéo native et le montage conversationnel. Conçu pour comprendre les images, l’audio, la vidéo et le texte, Omni peut produire des vidéos de haute qualité basées sur des connaissances du monde réel. Les utilisateurs peuvent ensuite modifier les scènes avec de simples instructions en langage naturel, tout en conservant la cohérence des personnages, des décors et même une physique crédible.

La première version, baptisée Gemini Omni Flash, commence à être déployée aujourd’hui pour les abonnés Google AI Plus, Pro et Ultra via l’application Gemini et Google Flow. Elle sera aussi disponible gratuitement cette semaine sur YouTube Shorts et l’application YouTube Create. Des API destinées aux développeurs et aux entreprises arriveront dans les prochaines semaines. Google prévoit également d’ajouter d’autres formats de sortie, comme les images et l’audio.

Omni permet de modifier une vidéo étape par étape simplement en discutant avec l’IA. Les créateurs peuvent changer des actions, ajouter des personnages ou des objets, transformer des scènes entières sans casser la continuité de la vidéo originale. Il est possible d’affiner le résultat au fil des échanges : modifier l’environnement, l’angle de caméra, le style visuel ou encore les petits détails. Parmi les exemples donnés par Google : transformer une sculpture en bulles ou convertir un miroir en surface liquide ondulante, avec des modifications qui s’accumulent naturellement.

Au-delà du photoréalisme, Omni est capable de “raisonner” sur ce qui doit se produire dans une scène grâce à une meilleure compréhension des lois physiques comme la gravité, l’énergie cinétique ou la dynamique des fluides. Le modèle s’appuie aussi sur des connaissances en histoire, science et culture. Cela permet de créer aussi bien des réactions en chaîne complexes que des séquences éducatives ou des animations en pâte à modeler expliquant des concepts comme le repliement des protéines.

Le système accepte plusieurs types de références pour guider la création : texte, images, vidéos et même audio vocal. Les utilisateurs peuvent partir d’un croquis, d’une photo ou d’une vidéo existante, appliquer des styles, des effets de mouvement ou mélanger plusieurs références pour obtenir le rendu souhaité.

Google introduit également une fonction “Avatars”, qui permettra de générer des vidéos ressemblant et parlant comme l’utilisateur grâce à sa propre voix. Les fonctions avancées d’édition audio et vocale sont encore en phase de test. Toutes les vidéos générées par Omni intégreront un filigrane invisible SynthID et pourront être vérifiées via l’application Gemini, Gemini dans Chrome et Google Search, dans le cadre des mesures de transparence sur les contenus générés par IA.

Ce lancement s’inscrit dans la continuité des outils de génération et d’édition d’images propulsés par Gemini lancés l’année dernière, utilisés notamment pour restaurer des photos, créer à partir de croquis ou visualiser des idées à grande échelle. Avec Omni, Google étend désormais cette approche multimodale à la vidéo en combinant contrôle conversationnel et génération basée sur les connaissances.

About jules

Jules Carrilo est un rédacteur web qui s'occupe principalement de lifestyle, technologie, voyage, d'économie et droits des consommateurs, d'alimentation naturelle et de bien-être holistique. Diplômé en journalisme, il a obtenu un master en édition.

Elles ont marqué le monde de la mode. 25 icônes de style des 100 dernières années

Pourquoi une femme devient-elle une icône de style ? Qu’est-ce qui fait que certaines personnes marquent durablement le monde de la mode et créent des looks qui, des décennies plus tard, sont encore des classiques ou ont un caractère emblématique ? Audrey Hepburn, par exemple, a rendu la « petite robe noire » acceptable comme […]

Comment conserver les châtaignes : 5 façons de les avoir à disposition toute l’année

Les châtaignes sont l’un des fruits les plus appréciés de l’automne, riches en propriétés et très polyvalents, et sont les protagonistes de nombreuses recettes sucrées et salées issues de la tradition paysanne. Malheureusement, la période de disponibilité des châtaignes est très limitée : il n’est possible d’acheter et de consommer ces fruits que quelques mois […]

Quelle est la différence entre les plantes succulentes, les cactus et les plantes grasses ?

Précisons tout d’abord que le terme « plantes succulentes » est une expression informelle et non reconnue en botanique. Utilisé pour désigner des plantes dodues et épineuses, c’est un nom générique qui est d’ailleurs étymologiquement inexact, puisque ces plantes sont riches en eau et non en graisse. L’utilisation de ce terme a peut-être été influencée par le […]

Votre visage, reflet de votre santé. Du front à la bouche, les signes à surveiller

À l’instar d’autres parties du corps, le visage peut également nous révéler des informations importantes sur la santé de notre organisme. Voici les signes à surveiller. Tout comme d’autres parties du corps, le visage peut également nous révéler des informations importantes sur la santé générale de notre organisme. Voici les signes à surveiller.

Conclave: comment fonctionne la fumée blanche ?

Chaque fois que l’Église doit choisir un nouveau Pape, le regard du monde entier se tourne vers le ciel du Vatican, au-dessus de la Chapelle Sixtine, à la recherche d’un signe visible mais chargé de mystère : la fumée. Noire ou blanche, cette colonne de fumée qui s’élève de la cheminée spécialement installée sur le […]

Vous avez toujours cuit les brocolis de la mauvaise manière : l’astuce virale qui les rend très tendres

Un papa nommé Sidney est devenu viral sur TikTok grâce à une astuce géniale pour cuire les brocolis de la bonne manière. Au lieu de les couper avant la cuisson, il les plonge entiers dans l’eau bouillante, les têtes vers le bas, puis les coupe après dix minutes : les têtes se détachent toutes seules, […]

L’Inde se dote de sa première piste cyclable alimentée par l’énergie solaire

La première piste cyclable solaire de l’Inde a été récemment inaugurée. Ses 23 kilomètres sont équipés d’un toit solaire d’une capacité installée de 16 MW. Elle s’étend entre Nanakramguda, le cercle TSPA, y compris Narsingi, et Kollur le long des voies de service de l’Outer Ring Road (ORR) entre la chaussée principale (MCW) et la […]

Préparer un voyage au Japon : guide et conseils pour des vacances inoubliables

Aujourd’hui, il existe plusieurs voyages organisés qui permettent de visiter le Japon en un minimum de dix jours, avec des itinéraires bien conçus, idéaux pour ne manquer aucune attraction et avec la possibilité de vivre une expérience unique au sein d’un groupe de personnes enthousiastes et de guides experts.

Comment organiser un blind test entre collègues ?

Organiser un blind test entre collègues est une excellente manière de renforcer les liens, de favoriser la cohésion d’équipe et de s’amuser ensemble en dehors du cadre strictement professionnel. Cet événement ludique, où il faut deviner des morceaux de musique, des répliques de films ou tout autre élément audio, peut transformer une simple soirée entre […]