Stratégie digitale

Sur les défis de l’interface utilisateur vocale et les nouvelles opportunités qu’elle présente

La plupart du temps, Alexa, Siri et Bixby sont des assistants pratiques pour les tâches quotidiennes, mais parfois, la technologie vocale en évolution rapide peut gêner. L’interface utilisateur vocale (VUI) est soudainement partout, mais il y a des défis à surmonter avec la technologie encore en développement. Bien que la voix ne soit ni une plate-forme ni le paradigme de l’interface utilisateur du futur, c’est une interface utilisateur supplémentaire qui est là pour rester.

Trouver les créneaux dans lesquels il fonctionne le mieux et exploiter les atouts de la voix sont les principaux défis que les concepteurs et les spécialistes du marketing devront désormais surmonter.

Une interface utilisateur à la recherche d’une application

Des années de travail ont été nécessaires pour que Siri et Google Assistant répondent à vos questions et agissent en tant que partenaire de conversation avec accès à toutes les informations dont vous pourriez avoir besoin. Malgré cela, nous les utilisons à peu près pour vérifier la météo, les scores du match de la nuit dernière et peut-être poser une ou deux requêtes aléatoires pour Internet. Alexa s’est présentée et nous a donné une plus grande capacité à gérer notre expérience audio à domicile, mais si nous sommes honnêtes, VUI est toujours une nouveauté pour la plupart des gens. Bien qu’il s’agisse d’un outil puissant, la plupart des utilisateurs ne savent pas ce qu’ils peuvent en faire ou comment l’intégrer dans leur vie.

La vieille maxime dans l’immobilier est que tout est une question d’emplacement, et VUI partage cette qualité dans la façon dont nous interagissons avec les appareils par la voix est largement déterminée par notre emplacement. La conduite est devenue l’endroit le plus chaud pour VUI en tant qu’endroit mains libres et yeux occupés où la voix excelle.

À la maison, pouvoir contrôler votre musique tout en cuisinant ou en faisant d’autres tâches s’est également avéré populaire, et la possibilité d’obtenir une réponse rapide à une question, sans avoir à sortir votre téléphone, est un autre processus utile.

D’autres emplacements, cependant, sont moins propices à l’IUV. La bibliothèque, par exemple, offre une bonne opportunité pour les interfaces utilisateur graphiques (GUI), mais est un mauvais endroit pour toute communication vocale. De même, une réunion d’affaires ou une conférence est un environnement médiocre pour VUI.

Où VUI n’est toujours pas à la hauteur

Bien que VUI ait parcouru un long chemin et continue de s’améliorer, il est toujours entravé par des difficultés qui détournent les utilisateurs de tous les jours.

Les problèmes de précision continuent d’affliger les principaux systèmes à commande vocale aux États-Unis – le problème n’est pas tant la reconnaissance vocale (les mesures récentes indiquent que Siri, Google, Cortana et Alexa ont une précision supérieure à 90 % pour bien prononcer les mots), mais même lorsque ces assistants obtiennent votre entrée correcte, ils produisent souvent de mauvais retours hilarants. Des requêtes simples comme « J’ai besoin d’un médecin » peuvent donner une liste de médecins à proximité ou une entrée Wikipedia sur les médecins, tandis que des questions plus complexes ne relèvent souvent pas de leur capacité à traiter et à comprendre. C’est peut-être à prévoir à ce stade de développement, mais cela reste un énorme frein pour les utilisateurs.

Certes, si vous utilisez VUI pour poser des questions sur la météo, la réponse commencera presque instantanément. Cependant, les informations fournies prennent souvent plus de temps à traiter qu’une réponse visuelle. L’assistant de Google affichera une carte météo à l’écran si vous posez des questions sur la météo, et dans le temps qu’il faut à Google pour lire les informations sur l’endroit où je suis, les prévisions d’aujourd’hui et la température actuelle, j’ai eu assez de temps pour scannez trois fois toutes ces informations à l’écran et obtenez une idée des prévisions de température pour les prochaines heures.

Un article récent se plaint de la tendance d’Alexa à fournir beaucoup trop d’informations lorsque vous lui demandez de jouer une chanson – Alexa ne commence pas simplement la chanson, elle vous dira la chanson qu’elle joue, l’artiste qui joue, quelle est la source du est la chanson (Spotify, votre bibliothèque, etc…), et sur quel appareil elle est diffusée. Pour les chansons mettant en vedette plusieurs artistes, cela peut entraîner une introduction cauchemardesque lorsque vous vouliez juste entendre de la musique.

Les listes de lecture, c’est ennuyeux

Les concepteurs parlent de charge cognitive – c’est la quantité d’effort nécessaire pour traiter les informations fournies. Les utilisateurs qui interagissent avec une interface graphique ont tendance à avoir une attention constante et gérable requise pour traiter les informations à l’écran. VUI, cependant, ne demande aucune attention lorsqu’il ne s’interface pas activement avec lui, et un degré élevé d’attention lorsque l’utilisateur pose une question et doit écouter une réponse.

Cela pose un problème lorsque vous utilisez VUI pour fournir des informations qui reviennent sous la forme d’une liste. Demandez une recette rapide de poulet pour le dîner et une liste d’options vous sera peut-être présentée pour la réduire. Malheureusement, la liste peut être longue de neuf entrées, et au moment où vous atteignez la fin, vous avez oublié ce qu’était la troisième entrée. Le cerveau n’est tout simplement pas capable de transporter autant d’informations à la fois – en fait, vers le septième élément d’une liste, votre attention maximale sera probablement atteinte et vos yeux commenceront à devenir vitreux lorsque vous vous dirigerez vers le plus proche. GUI et abandonnez VUI.

Présenter l’avenir

Bien sûr, il existe des solutions aux difficultés rencontrées actuellement par les utilisateurs avec VUI, et de nombreuses entreprises investissent des milliards de dollars pour les trouver et améliorer l’expérience. L’une des façons dont l’interaction vocale s’améliore consiste à rendre l’expérience plus conversationnelle pour les utilisateurs. Comme la conception nous permet de personnaliser les résultats et de répondre de manière plus naturelle, la VUI conversationnelle rendra les utilisateurs plus à l’aise pour interagir avec la technologie.

L’intégration transparente des réponses vocales et des données visuelles entre l’écran et le haut-parleur est essentielle pour surmonter les limites de l’interface utilisateur visuelle et créer une interaction plus naturelle pour l’utilisateur. Actuellement, la réponse vocale n’est que marginalement connectée à toute interaction visuelle, avec des appareils comme l’Echo d’Amazon sont presque complètement coupés de tout écran. À mesure que l’Internet des objets se développe, il deviendra impératif que l’information trouve un moyen de se présenter à la fois par la voix et l’écran pour répondre aux besoins de l’utilisateur.

Bien sûr, la technologie sera toujours sujette aux erreurs, mais la gestion efficace des faux pas verbaux peut avoir tendance à rendre les utilisateurs plus à l’aise pour interagir par la voix. Cela signifie fournir une meilleure réponse que « Je suis désolé, je n’ai pas tout à fait compris », ou deviner aveuglément la réponse lorsqu’une requête n’est pas bien comprise. En impliquant l’utilisateur dans le processus de correction d’erreurs, l’utilisateur en apprend davantage sur les limites et deviendra plus confiant pour repousser les limites.

Amélioration, pas un remplacement

Ceux qui tombent dans l’erreur de voir les interfaces vocales en remplacement de l’interface graphique n’apprennent pas de l’histoire. Peut-être que la science-fiction peut être notre guide à la place – sur le Starship Enterprise, l’équipage du 23e siècle communique régulièrement avec l’ordinateur par la voix, tout en incorporant également une interaction visuelle et tactile. Bien que nous dépassions probablement ces méthodes d’ici le 23e siècle, cela donne toujours une image de la façon dont nous, collectivement, imaginons qu’une interaction informatique transparente devrait avoir lieu.

Nos plus grands défis ne sont donc pas tant de mettre la technologie à jour, mais d’imaginer de meilleures façons d’utiliser la technologie. VUI nous fournit un autre outil pour interagir avec la technologie, lorsqu’il est bien utilisé.

Erwan

Rédigé par

Erwan

Erwan, expert digital pour Coeur sur Paris, offre des insights pointus sur le marketing et les réseaux sociaux. Avec une plume vive et une analyse fine, il transforme les complexités du digital en conseils pratiques et tendances à suivre.