Gemini Live: Parler avec l'IA de Google, c'est marrant, bizarre et un peu inutile
C'est cool, c'est marrant, c'est bizarre, mais à quoi ça sert? J'ai testé Gemini Live, l'IA conversationnelle de Google sur le Pixel 9 Pro XL. En tant que preuve de concept, Gemini Live m'a convaincu. C'est marrant de débattre avec son smartphone- quitte à se faire gaslighter. Mais cette fonction est-elle vraiment utile? Et surtout, est-ce que Gemini Live vaut son abonnement à 21,99 euros par mois?
Gemini Nano, c'est l'assistant IA de Google pour les smartphones Android. Gemini Live, c'est un mode de Gemini Nano qui permet d'entamer des conversations avec l'assistant au lieu de simplement lui soumettre des prompts. Pour utiliser Gemini Live, il faut payer l'abonnement Gemini Advanced à 21,99 euros par mois via votre compte Google. Pour l'instant, vous ne pouvez lui parler qu'en anglais.
J'ai eu beaucoup de mal à écrire cet article. On m'a demandé de faire un truc sur Gemini Live parce que tout le monde en parle. Mais, très honnêtement, c'est comme si on m'avait demandé d'écrire une dissertation au sujet de l'impact de la fonction lampe de poche des smartphones sur l'expérience utilisateur des Français de 18-24 ans depuis 2011. Pas grand-chose à dire, quoi.
Des conversations naturelles
L'intérêt premier de Gemini Live, c'est qu'on peut interrompre l'IA quand elle parle. L'idée est de débattre, de brainstormer autour de concepts, d'idées, d'opinions ou de thématiques de façon naturelle. Gemini Live ne peut pas encore interagir avec d'autres applications ni avec le contenu sur votre écran, contrairement à Gemini Nano.
Il n'y a presque aucun délai entre le moment où vous posez une question à Gemini Live et celui où l'IA vous répond. Le fait de pouvoir l'interrompre rend les discussions intuitives. On peut facilement corriger une requête ou simplement approfondir une question, quitte à changer de sujet si la réponse n'est pas satisfaisante.
Dans une même session, Gemini Live se rappelle certains points d'une discussion passée si on lui demande. Vous retrouvez un compte-rendu écrit de vos sessions dans l'application Gemini. Et dans sa manière de répondre, l'IA fait toujours en sorte de paraphraser votre question/réponse. Cette façon détournée de répéter ce que vous venez de dire permet de s'assurer que l'IA a bien compris votre requête.
Gemini Live le fait de façon assez discrète. Mais parfois, j'avais l'impression que je venais de poser une colle à l'IA et qu'elle essayait simplement de gagner du temps, le temps d'improviser une réponse.
Une relation parfois toxique
Gemini Live gère assez bien les interruptions. L'IA ne se vexe jamais, même si elle a parfois la fâcheuse tendance à continuer de parler ou simplement à s'excuser pile-poil lorsque vous vous apprêtez à prendre la parole. C'est exaspérant. Mais c'est aussi très gênant.
J'ai opté pour une voix féminine, personnellement. Et entendre Gemini se confondre en excuses face à mon impolitesse me donne l'impression d'être dans une relation abusive. Un peu comme si Joaquin Phoenix était un masculiniste toxique en plus d'être un incel dans le film Her.
Le dynamisme des conversations peut aussi être un désavantage. J'ai souvent dû mettre Gemini en pause, le temps de mettre de l'ordre dans mes pensées. Parce que si vous hésitez trop longtemps, ou que vous faites une pause un peu trop longue, Gemini Live y verra l'occasion de vous interrompre.
Et parfois, j'avais l'impression que l'IA se contentait de me dire ce qu'elle pensait que je voulais entendre. Je lui ai par exemple demandé, à partir de nos interactions passées, de me dire ce qu'elle pensait de ma personnalité. Elle m'a d'abord couvert de compliments. J'ai dû insister et m'y reprendre à deux fois pour que Gemini Live me confesse les défauts dont elle m'estimait coupable. Et ça ressemblait vraiment beaucoup à du gaslighting.
Tout ce blabla, mais pourquoi faire?
Globalement, Gemini Live m'a laissé une plutôt bonne impression. En tant que concept, l'IA conversationnelle de Google fonctionne comme prévu. Mais à quoi ça sert?
Pour l'instant, et selon moi, à rien. Je trouve Gemini Nano beaucoup plus intéressant, par exemple. J'en parle plus en détails dans mon test du Pixel 9 Pro XL. Mais Gemini Nano peut interagir avec le contenu affiché sur votre écran. Vous pouvez lancer des prompts- écrits ou vocaux- de façon contextuelle lorsque vous regardez une vidéo sur Youtube ou que vous lisez un article dans votre navigateur. C'est hyper pratique. Gemini Nano peut aussi effectuer des actions à travers plusieurs applications Google.
Tout ça, Gemini Live en est incapable, pour l'instant. Google promet que cela va changer d'ici quelques semaines, voire mois. Et je l'espère, cela donnerait à Gemini Live une toute autre pertinence.
J'ai aussi trouvé les réponses de Gemini Live assez génériques et très vagues. J'avais l'impression constante de devoir piloter la discussion. Je n'ai pas ressenti suffisamment de réciprocité et à la longue, c'était usant. Surtout quand je passais plusieurs minutes à préciser ma demande, en ajoutant progressivement plus de détails et d'éléments. J'ai toujours été assez déçu du peu de valeur ajoutée apportée par Gemini Live à nos échanges.
Gemini Live parle de façon très naturelle, c'est indéniable. Mais je trouve que l'IA manque malgré tout de personnalité. On peut choisir parmi dix voix différentes. Chaque voix est accompagnée d'un descriptif indiquant le ton et le timbre. J'aurais bien aimé que la différence de ton entre une voix "calme" et une autre "engagée" soit plus notable.
Et surtout, j'aurais adoré que le fond ou la forme des discussions varient également selon la voix choisie. Mais hormis l'intonation, je n'ai pas noté de différences suffisamment flagrantes. Il faut sûrement plus de temps à l'IA pour s'entraîner et développer une réelle personnalité. Et introduire des variations dans les réponses apportées selon la "personnalité" de la voix pourrait aussi s'avérer tendancieux. Ce n'est donc pas un défaut "objectif" de Gemini Live.
Gemini Live face à la hype
Durant mes recherches, je suis tombé sur le concept de "cycle de la hype" ou "Gartner hype cycle", en anglais. Ce modèle, proposé par l'entreprise de conseil américaine Gartner, se matérialise par une courbe qui décrit l'évolution de la hype, de l'intérêt, pour une nouvelle technologie.
Cette évolution se décompose en cinq phases. Le succès initial du lancement d'une technologie suscite de grandes attentes de la part du public. Ces attentes deviennent irréalistes, surdimensionnées. Forcément, la technologie ne répond pas à ces attentes qui ne se concrétisent pas. Après ce pic de hype, on entame une chute dans un gouffre de désillusion. Tout le monde se rend compte que la hype était exagérée.
On redevient alors plus réaliste. Certains acteurs persistent et proposent de nouvelles itérations plus rationnelles de ladite technologie. On remonte alors doucement la pente pour finalement atteindre un plateau de productivité. La technologie est rodée et remplit ses fonctions, les demandes/besoins du public.
Gemini Live se trouve au sommet du pic de la hype actuellement. Forcément, il va falloir redescendre et encaisser une certaine déception comme celle que j'ai décrite dans la partie précédente de cet article.
Mais je me dis aussi que Google semble déterminé à remonter la pente pour atteindre ce fameux plateau de productivité. Ce qu'il propose avec Gemini Nano me semble déjà aller dans cette (bonne) direction. Et la concurrence d'Apple Intelligence ne pourra que que renforcer cette dynamique de course à l'IA.
Le jour où Gemini Live pourra identifier l'heure et le lieu d'un rendez-vous à partir d'un texto, puis de créer un événement dans mon agenda, Google m'aura converti aux assistants IA.
Et vous, que pensez-vous de Gemini Live? Avez-vous pu tester l'IA conversationnelle de Google?