Amazon Alexa, Siri d’Apple, Cortana de Microsoft et Google Assistant font partie des assistants numériques les plus populaires. Ces assistants numériques deviennent progressivement l’une des passerelles entre internet et les utilisateurs.Par exemple, il est possible d’effectuer des commandes de produits, de vérifier son solde bancaire, de payer des factures, de se connecter à sa compagnie d'assurance, etc. Alexa peut allumer les lumières de la maison, démarrer la voiture et vous indiquer la quantité d'essence dans le réservoir. Google Assistant peut suivre vos rendez-vous, filtrer les appels, commander un service de covoiturage et faire des réservations de restaurant. Il peut également contrôler les appareils intelligents de la maison, des thermostats et des portes aux systèmes de divertissement. Au total, d'après les chercheurs, Amazon Alexa a maintenant 100 000 « skills » (le nom donné aux tâches qu’Alexa peut réaliser) et Google Assistant a plus d'un million de capacités, selon les entreprises.
Cependant, étant donné que les plateformes vocales sont difficiles à créer et à former, Google et Amazon ont ce qui équivaut à un duopole de haut-parleurs connectés. Les entreprises souhaitant communiquer avec leurs clients via leurs assistants virtuels devront probablement passer par l'une de ces deux plateformes. Si l'une des principales plateformes souhaite privilégier ses produits par rapport à ceux de ses concurrents, elle pourrait facilement le faire. Et comme les consommateurs partagent davantage d'informations privées avec ces deux entreprises, ces données renforcent la domination de Google et d'Amazon.
C’est dans ce contexte qu’une équipe de chercheurs de Stanford a développé un assistant virtuel open source qui, espèrent-ils, élargira considérablement la concurrence et protégera la vie privée. Open Virtual Assistant Lab de Stanford, ou OVAL, utilise une approche novatrice et relativement peu coûteuse pour la formation d’assistants virtuels. Et comme il s’agit d’une plateforme open source, elle peut s’améliorer en permanence à mesure que ses utilisateurs apportent du code ou des compétences supplémentaires à un référentiel partagé.
« Nous nous considérons comme le nouveau Firefox - une plateforme ouverte qui ne dépend pas d’une grande entreprise ayant ses propres intérêts concurrentiels », a déclaré Monica Lam, directrice du projet OVAL, qui est également professeur d’informatique à Stanford et membre du corps professoral de la Stanford Institute of Human-Centered Artificial Intelligence.
Les principaux doctorants travaillant sur le nouvel assistant virtuel, nommé Almond, sont Giovanni Campagna, Silei Xu, Sina Semnani et Mehrad Moradshahi.
Les premiers résultats du prototype Almond ont été si prometteurs que la Fondation Alfred P. Sloan a récemment accordé une subvention d'un million de dollars à OVAL pour le développement de prototypes pratiques.
La boîte à outils Genie
À l'heure actuelle, la formation d'assistants virtuels est d'un coût prohibitif pour la plupart des entreprises, car la tâche nécessite de vastes ensembles de données d'échantillons de langage naturel qui ont été laborieusement annotés par des experts humains. Ces échantillons proviennent principalement de travailleurs rémunérés qui s'engagent dans des dialogues ou qui écoutent ce que disent les clients.
Pour contourner cet obstacle, l'équipe de Stanford a créé un outil baptisé « Genie » qui synthétise automatiquement des exemples de conversations. Il le fait en partie sur la base de principes génériques sur les dialogues transactionnels et en partie sur la connaissance d'une arène particulière. Étant donné que le système ne repose pas sur un dialogue réel recueilli auprès d’un nombre incalculable de personnes, les données de formation peuvent être acquises à une infime fraction du coût normal.
« Cela semble demander trop de travail, mais nous pouvons automatiser le processus, car il existe un modèle général pour les conversations transactionnelles », a déclaré Lam. « Ce modèle fonctionne que vous essayiez de réserver un restaurant ou de trouver et de lire un film. La clé est de générer suffisamment de variété...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.