Amazon Alexa détecte l’intention latente grâce au machine learning

Amazon Alexa détecte l’intention latente grâce au machine learning

Prédire les intentions des utilisateurs est essentiel pour les assistants vocaux comme Alexa. Amazon revendique une nette amélioration dans ce domaine grâce à l’utilisation d’un nouveau système de machine learning.

« Combien de temps faut-il pour faire infuser le thé ? » C’est le genre de question que les utilisateurs de l’assistant vocal Alexa sont susceptibles de poser à Amazon. Anodine en apparence, elle peut toutefois permettre de deviner une autre attente.

C’est en tout cas une piste de travail pour le géant américain afin de déduire les objectifs latents de ses clients. Grâce à Alexa et ses technologies, Amazon s’efforce ainsi d’identifier les demandes non directement exprimées.

Détecter les objectifs latents d’une commande vocale

Ainsi, le temps d’infusion du thé aurait pour objectif latent de fixer un délai pour infuser une tasse de thé. Le but est ainsi de permettre à Alexa d’apporter plus de valeur à ses utilisateurs en devançant leurs questions et attentes.

« Avec cette nouvelle capacité, Alexa pourrait répondre à cette question : « Cinq minutes est un bon point de départ », puis poursuivre en demandant : « Voulez-vous que je mette un minuteur pour cinq minutes ? » détaillent les ingénieurs d’Amazon.

Rien de plus évident en apparence ? Pour un humain, sans doute. C’est plus complexe pour l’intelligence artificielle. La firme souligne en effet que la détection des buts latents implique le recours à plusieurs algorithmes sophistiqués

La première fonction des algorithmes sera ainsi de déterminer si oui ou non existe une demande implicite. Le système devra trancher cette question avant de faire une suggestion à l’utilisateur d’Alexa.

Des modèles complexes de Deep Learning et Machine Learning

Afin de favoriser des interactions plus naturelles, les équipes du géant américain travaillent donc à la conception d’un modèle de découverte de but latent. Ce modèle analyse de multiples caractéristiques des énoncés des clients.

De plus, des sous-modules basés sur le deep learning évaluent des caractéristiques supplémentaires. Il s’agit par exemple de déterminer « si le client essayait de reformuler une commande antérieure ou d’en émettre une nouvelle, ou si le but direct et le but latent partagent des entités ou des valeurs communes. »

La technologie fait également appel au machine learning. Le but est ainsi de permettre au modèle de découverte d’améliorer ses prévisions grâce à l’apprentissage actif. La méthode exploite en outre le « bandit learning ». Celle-ci permet aux modèles de machine learning de tenir compte de l’utilité ou non de leurs recommandations.

Cette détection des intentions est en production et disponible pour les développeurs tiers d’applications Alexa ou Skills (uniquement aux Etats-Unis). Et selon de premiers indicateurs, cette fonction favorise une hausse du niveau d’engagement des utilisateurs.

A lire également sur MyData

Le paiement vocal débarque dans 11.500 stations essence Exxon et Mobil

Le paiement vocal par Alexa débarque dans 11.500 stations essence Exxon et Mobil

Aux Etats-Unis, les clients de plus de 11.000 stations-services Exxon et Mobil peuvent désormais régler leur carburant par commande vocale : « Alexa, pay for gas ». Leur véhicule doit toutefois embarquer l’assistant Alexa d’Amazon, via par exemple Echo Auto.

A propos de Christophe Auffray 396 Articles
De formation initiale en marketing Web et en économie, je me suis spécialisé par la suite dans la presse B2B consacrée à l'économie numérique et dispose dans ce secteur de 15 ans d'expérience. Spécialiste de la transformation numérique, de l'innovation et des nouveaux business models des entreprises, j'ai développé des compétences dans les domaines du marketing éditorial, de la stratégie éditoriale, de la production de contenus premium et la gestion de sites d'information et d'équipe dans l'univers des médias en ligne et du marketing des solutions innovantes.