Transformez vos mots en vidéos: L'application Gemini bénéficie de Veo 2 de Google


Depuis le lancement de Gemini, Google s'est principalement concentré sur l'ajout de la génération d'images et de diverses intégrations de modèles. Aujourd'hui, Google étend ses capacités de génération vidéo en mettant le générateur Veo 2 à la disposition d'un plus grand nombre d'utilisateurs par l'intermédiaire du chatbot d'IA.
Veo 2 a été annoncé en décembre de l'année dernière, promettant un réalisme accru dans la génération de vidéos grâce à un meilleur rendu de la physique du monde réel et des mouvements humains, ainsi que des détails plus fins par rapport aux modèles précédents. Google vient d'annoncer le déploiement du générateur vidéo dans Gemini, le mettant à la disposition des utilisateurs de Gemini Advanced ayant souscrit un abonnement Google One AI Premium sur les plateformes mobiles et web.
Avec Veo 2 intégré à Gemini, les utilisateurs peuvent générer des vidéos à l'aide de simples invites textuelles. Toutefois, l'entreprise souligne que plus la description fournie dans chaque invite est détaillée, plus la vidéo résultante sera précise. Cette fonction prend en charge différents styles et genres de films, y compris les effets cinématographiques et les effets d'objectif.
Comment générer des vidéos dans Gemini
Pour générer une vidéo, les utilisateurs doivent sélectionner le modèle Veo 2 dans le menu de sélection du modèle d'IA avant de saisir leur texte. Google précise que l'emplacement de cette sélection de modèle pourrait changer à l'avenir. En outre, le nombre de vidéos qu'un utilisateur peut générer est limité par mois, bien que Google n'ait pas encore précisé le quota mensuel exact.
Chaque vidéo durera 8 secondes et sera en résolution 720p avec un rapport d'aspect 16:9, ce qui est différent de Sora d'OpenAI, qui peut générer des vidéos 1080p d'une durée maximale de 20 secondes. Les vidéos seront générées au format MP4, que les utilisateurs pourront enregistrer. Sur les appareils mobiles, un outil permettra de télécharger et de partager facilement les vidéos générées sur des plateformes de médias sociaux comme YouTube et TikTok.
Google indique également que les vidéos générées par Veo utilisent les filigranes numériques SynthID, similaires aux filigranes utilisés dans les images générées par Gemini ou le modèle Imagen.
Google étend également les fonctionnalités de Veo à sa fonction expérimentale Whisk. Cette application de génération d'images IA permet aux utilisateurs de créer des images en utilisant à la fois du texte et des images, et maintenant, avec l'intégration de Veo 2, les utilisateurs peuvent animer les images créées dans Whisk. Ces vidéos animées auront une durée de 8 secondes et seront au même format MP4 que les vidéos générées directement dans Gemini.
Le modèle Veo 2 est actuellement déployé dans Gemini Advanced et est disponible en anglais. Il peut s'écouler un jour ou deux avant que le modèle n'apparaisse pour tous les abonnés.
Avez-vous expérimenté les applications de génération de vidéos par IA? Quel est le générateur que vous préférez?
Source : Google