Et si vos PDF pouvaient parler? Gemini transforme les documents en podcasts IA

3 min de lecture 3 min Pas de commentaire 0

20 mars 2025 12:00

Samsung Galaxy A35 with gemini ai keyboard — © nextpit

Jade Bryan

Lire dans d'autres langues :

Deutsch / Português / English

Google s'est lancé dans une course effrénée à l'expansion de Gemini. Après l'introduction de nouveaux modèles, l'entreprise déploie maintenant deux nouvelles fonctionnalités: Audio Overview, qui transforme les documents et les PDF en discussions de type podcast, et Canvas, un espace de travail collaboratif pour des interactions transparentes basées sur l'IA.

Audio Overview est alimenté par le modèle NotebookLM de Google, un assistant d'intelligence artificielle spécialisé doté de capacités d'analyse de documents et de sites web plus avancées que celles de Gemini. Ce modèle alimente également le récapitulatif 2024 de Spotify.

Audio Overview s'étend à la recherche approfondie

Google a présenté pour la première fois l'année dernière l'aperçu audio avec Daily Recap, qui permet aux utilisateurs de générer des résumés de type podcast hébergés par l'IA à partir de sources Web et d'articles. Aujourd'hui, la fonctionnalité s'étend à la prise en charge des documents, notamment les PDF et les articles de recherche, grâce à Deep Research, qui a récemment été intégré à Gemini.

Les utilisateurs peuvent accéder à Audio Overview de Deep Research directement dans l'application Gemini sur mobile. Après avoir généré une étude ou un document de recherche, il suffit d'appuyer sur le fichier et de sélectionner "Générer un aperçu audio" dans le menu pour lancer la fonctionnalité. La même fonctionnalité est également disponible via Deep Research sur le web.

Pour l'instant, la génération d'aperçus audio à partir de documents est limitée à Deep Research sur mobile et sur le web. Nous avons testé la fonctionnalité dans l'application Gemini, mais elle n'a pas fonctionné pleinement, bien qu'un message ait indiqué que l'aperçu audio était en cours de création. Il est probable que Google étende la prise en charge dans un avenir proche. La fonctionnalité est déjà déployée pour les utilisateurs de Gemini et Gemini Advanced, mais n'est actuellement disponible qu'en anglais.

Gemini devient collaboratif

Canvas est un ajout majeur à Gemini, un espace de travail collaboratif conçu pour l'édition de documents en temps réel, le codage interactif et les prévisualisations assistées par ordinateur.

Pour les projets textuels, les utilisateurs peuvent rédiger et éditer des documents tout en tirant parti des outils d'ajustement de Gemini, qui permettent d'ajuster le ton, de raccourcir les phrases et de modifier le style. En outre, Gemini propose des suggestions d'édition pour améliorer la qualité de l'écriture. Les résultats de Canvas peuvent également être partagés pour la collaboration via Google Docs.

Explication du code CSS pour une interface de jeu Tic-Tac-Toe avec options joueur contre ordinateur. — Gemini gagne Canvas, qui permet un codage collaboratif et interactif. / © Google

Google améliore également les capacités de codage de Gemini avec Canvas. Cet espace de travail permet aux utilisateurs de générer, de prévisualiser et de tester le code directement, sans avoir à recourir à des simulateurs ou à des applications de codage distinctes. Les formats pris en charge comprennent les applications web comme HTML et React, les scripts Python, les jeux et d'autres simulations.

En outre, Canvas peut être un outil précieux pour apprendre à coder, car il fournit des aperçus et des explications en temps réel sur des chaînes de code et des extraits spécifiques.

Canvas est désormais disponible sur Gemini Web pour les utilisateurs de base et premium. Il prend en charge toutes les langues dans lesquelles les applications Gemini sont actuellement proposées.

Si les nouvelles mises à jour de Gemini rendent l'IA plus flexible, elles ajoutent également de la complexité à l'expérience globale, la rendant moins rationalisée par rapport à un chatbot unique comme ChatGPT. Néanmoins, ces caractéristiques apportent une fonctionnalité précieuse. Mais qu'en pensez-vous?

Source : Google

	Le choix de la rédaction	Le flagship intermédiaire en 2024	Le flagship de base en 2024	Le flagship pliable	Le pliable compact	Le flagship abordable	Le flagship milieu de gamme	Le milieu de gamme
Produit	Samsung Galaxy S24 Ultra	Samsung Galaxy S24+	Samsung Galaxy S24	Samsung Galaxy Z Fold 5	Samsung Galaxy Z Flip 5	Samsung Galaxy S23 FE	Samsung Galaxy A55	Samsung Galaxy A35
Illustration
Test	Lire le test du Samsung Galaxy S24 Ultra	Lire le test du Samsung Galaxy S24+	Lire le test du Samsung Galaxy S24	Lire le test du Samsung Galaxy Z Fold 5	Lire le test du Samsung Galaxy Z Flip 5	Lire le test du Samsung Galaxy S23 FE	Lire le test du Samsung Galaxy A55	Lire le test du Samsung Galaxy A35
Offres*	Voir l'offre 894,00 € (Amazon - nouveau) * Trouver sur eBay (eBay) *	Voir l'offre 1 289,00 € (Amazon - nouveau) * Trouver sur eBay (eBay) *	Voir l'offre 537,00 € (128 GB - nouveau) * Trouver sur eBay (eBay) *	Voir l'offre 750,00 € (Amazon - d'occasion) * Trouver sur eBay (eBay) *	Voir l'offre 699,00 € (Amazon - d'occasion) * Trouver sur eBay (eBay) *	Voir l'offre 464,19 € (128GB - nouveau) * Trouver sur eBay (eBay) *	Voir l'offre 355,32 € (128GB - nouveau) * Trouver sur eBay (eBay) *	Voir l'offre 257,24 € (128GB - nouveau) * Trouver sur eBay (eBay) *

Le choix de la rédaction

Le flagship intermédiaire en 2024

Le flagship de base en 2024

Le flagship pliable

Le pliable compact

Le flagship abordable

Le flagship milieu de gamme

Le milieu de gamme

Produit

Samsung Galaxy S24 Ultra

Samsung Galaxy S24+

Samsung Galaxy S24