Ce que révèle vraiment le test linguistique des assistants vocaux
Il y a quelque chose d'assez fascinant à observer trois entités désincarnées se débattre avec la richesse grammaticale et phonétique du français. Alexa, Google Assistant et Siri : trois voix, trois personnalités, trois philosophies produit. Et une seule langue pour les départager, la nôtre, avec toutes ses exceptions, ses liaisons capricieuses et ses registres qui changent selon qu'on est en train de commander une pizza ou de discuter de Proust.
Le test n'est pas anodin. Le français n'est pas une langue simple pour une machine. C'est une langue qui résiste, qui nuance, qui joue sur les mots avec une perversité légèrement jouissive.
Alexa : l'efficacité américaine face à la complexité française
Ce qu'Amazon a bien compris
Alexa est née pour le commerce. On le sent dans chaque interaction : elle est précise, directe, orientée tâche. Demandez-lui d'ajouter du lait à votre liste de courses ou de lancer une playlist, elle excelle. Le français fonctionnel, celui du quotidien domestique, elle le gère avec une aisance qui ne se discute pas.
Amazon a manifestement investi dans la localisation. L'accent d'Alexa en français est devenu plus naturel au fil des années, les mises à jour successives ayant gommé les aspérités les plus robotiques. Elle comprend les accents régionaux mieux qu'on ne le lui reconnaît en général.
Là où le bât blesse
Les choses se compliquent dès qu'on sort des sentiers balisés. Les phrases longues avec des subordonnées multiples, les questions formulées de manière indirecte, les demandes volontairement ambiguës : Alexa décroche. Elle a tendance à interpréter de manière littérale, sans inférer le contexte implicite.
La conversation, au sens vrai du terme, reste laborieuse. On peut l'interroger en rafale sur un sujet, elle répondra correctement aux questions isolées, mais elle ne tisse pas. Il manque ce fil narratif qui fait qu'un échange devient une vraie discussion.
Google Assistant : le moteur de recherche qui a appris à parler
L'avantage de l'index mondial
Google Assistant a un avantage structurel que ses concurrents ne peuvent pas acheter : l'accès à la quasi-totalité du web indexé, en temps réel. Pour les questions factuelles en français, culture, actualité, géographie, biographies, il est dans une catégorie à part. Sa compréhension du français écrit est probablement la meilleure des trois.
Mais ce n'est pas seulement la base de données. Google a développé une capacité à détecter l'intention derrière les mots. Vous dites "c'est quoi ce truc qui pousse dans mon jardin avec des fleurs jaunes" et il comprend que vous parlez d'une plante, pas d'un concept philosophique. Cette lecture du contexte implicite est solide.
Le paradoxe de la conversation
Pourtant, Google Assistant souffre d'un étrange paradoxe : très à l'aise pour répondre à des questions, mais moins dans la conversation libre. Il y a quelque chose de fonctionnel, presque bureaucratique dans ses échanges. On pense à ce brillant collègue qui peut citer des statistiques de mémoire mais avec qui le déjeuner est toujours légèrement embarrassant.
Sa gestion des expressions idiomatiques françaises reste perfectible. Les tournures argotiques récentes, les néologismes, les expressions très régionales : il hésite, parfois se trompe, parfois produit des réponses qui prouvent qu'il a compris la forme mais pas le fond.
Siri : l'élégance d'Apple et ses limites conversationnelles
Le meilleur accent, vraiment
Siri parle français avec une fluidité qui tient parfois du miracle. La prosodie, ce rythme et ces intonations qui font que le français sonne français, Apple l'a travaillée comme d'autres travaillent le packaging de leurs produits. C'est-à-dire avec une obsession que les non-initiés trouvent légèrement disproportionnée. Mais les résultats sont là.
La synthèse vocale de Siri en français est probablement la plus agréable à écouter des trois. Ce n'est pas un détail anodin : dans une interface entièrement vocale, la qualité de la voix conditionne la confiance qu'on accorde aux réponses.
L'écosystème comme force et comme prison
Siri comprend mieux le français quand on reste dans l'écosystème Apple. Piloter ses applications natives, envoyer des messages, passer des appels, créer des rappels avec des formulations naturelles : c'est là qu'il brille. Sa compréhension des formulations familières du quotidien est solide.
Mais posez-lui une question ouverte, demandez-lui de raisonner sur un sujet un peu complexe, lancez une vraie conversation, et Siri accuse le coup. Il y a une limite assez nette entre ce qu'il fait bien et ce qu'il délègue à une recherche web, avouant ainsi ses propres lacunes avec une franchise légèrement désarmante.
Le test des formulations qui piègent
Les liaisons, le verlan, les sous-entendus
On a soumis les trois assistants à quelques pièges linguistiques classiques. Premier test : les liaisons incorrectes. Prononcer "les haricots" avec une liaison, erreur typique des non-francophones et des machines mal calibrées, pour voir si l'assistant s'en sort. Google Assistant s'en tire le mieux, avec une reconnaissance robuste même face aux approximations phonétiques.
Deuxième test : les questions à double sens. "Comment tu trouves ça ?" peut signifier dix choses différentes selon le contexte. Seul Google Assistant tente, parfois avec succès, de déduire ce "ça" à partir des échanges précédents.
Le registre soutenu versus l'oral familier
Le français parlé informel est la grande épreuve. Les élisions rapides, le "ch'sais pas" qui remplace "je ne sais pas", les fins de phrases avalées : les trois assistants trébuchent, mais à des degrés différents. Alexa est la plus rigide sur ce plan. Siri s'adapte mieux à l'oral relâché grâce à son entraînement sur des données vocales massives. Google Assistant compense par son moteur d'intention.
Il faut admettre une chose qui dérange légèrement l'orgueil national : les trois assistants comprennent mieux le français soutenu que le français parlé tel qu'on le parle réellement. Nous sommes, en quelque sorte, jugés plus compréhensibles quand nous parlons comme des livres.
Alors, qui gagne ?
Une hiérarchie selon l'usage
La question mérite une réponse honnête plutôt qu'un podium arbitraire. Pour la compréhension du français général, Google Assistant reste devant. Son intelligence contextuelle et sa base de données en font l'interlocuteur le plus informé.
Pour la domotique et les tâches domestiques, Alexa tient sa réputation. Elle est née pour ça, elle le fait bien, et son intégration avec les objets connectés du quotidien est difficile à égaler.
Pour l'usage mobile dans un environnement Apple, Siri est cohérent, agréable à écouter, et fonctionnel dans les situations qu'il connaît bien.
Ce que cette course révèle
Ce qui est peut-être plus intéressant que le palmarès lui-même, c'est ce que cette compétition dit de nos attentes envers les machines. On veut qu'elles comprennent, pas seulement qu'elles reconnaissent des mots. On veut une conversation, pas un terminal de commandes déguisé en entité bavarde.
Le français, avec sa complexité, est en réalité un excellent banc d'essai pour mesurer jusqu'où va la compréhension réelle d'un assistant vocal. Et les trois, chacun à leur manière, montrent que nous n'en sommes qu'au début.
