Par exemple, il est possible d’effectuer des commandes de produits, de vérifier son solde bancaire, de payer des factures, de se connecter à sa compagnie d'assurance, etc. Alexa peut allumer les lumières de la maison, démarrer la voiture et vous indiquer la quantité d'essence dans le réservoir. Google Assistant peut suivre vos rendez-vous, filtrer les appels, commander un service de covoiturage et faire des réservations de restaurant. Il peut également contrôler les appareils intelligents de la maison, des thermostats et des portes aux systèmes de divertissement. Au total, d'après les chercheurs, Amazon Alexa a maintenant 100 000 « skills » (le nom donné aux tâches qu’Alexa peut réaliser) et Google Assistant a plus d'un million de capacités, selon les entreprises.
Cependant, étant donné que les plateformes vocales sont difficiles à créer et à former, Google et Amazon ont ce qui équivaut à un duopole de haut-parleurs connectés. Les entreprises souhaitant communiquer avec leurs clients via leurs assistants virtuels devront probablement passer par l'une de ces deux plateformes. Si l'une des principales plateformes souhaite privilégier ses produits par rapport à ceux de ses concurrents, elle pourrait facilement le faire. Et comme les consommateurs partagent davantage d'informations privées avec ces deux entreprises, ces données renforcent la domination de Google et d'Amazon.
C’est dans ce contexte qu’une équipe de chercheurs de Stanford a développé un assistant virtuel open source qui, espèrent-ils, élargira considérablement la concurrence et protégera la vie privée. Open Virtual Assistant Lab de Stanford, ou OVAL, utilise une approche novatrice et relativement peu coûteuse pour la formation d’assistants virtuels. Et comme il s’agit d’une plateforme open source, elle peut s’améliorer en permanence à mesure que ses utilisateurs apportent du code ou des compétences supplémentaires à un référentiel partagé.
« Nous nous considérons comme le nouveau Firefox - une plateforme ouverte qui ne dépend pas d’une grande entreprise ayant ses propres intérêts concurrentiels », a déclaré Monica Lam, directrice du projet OVAL, qui est également professeur d’informatique à Stanford et membre du corps professoral de la Stanford Institute of Human-Centered Artificial Intelligence.
Les principaux doctorants travaillant sur le nouvel assistant virtuel, nommé Almond, sont Giovanni Campagna, Silei Xu, Sina Semnani et Mehrad Moradshahi.
Les premiers résultats du prototype Almond ont été si prometteurs que la Fondation Alfred P. Sloan a récemment accordé une subvention d'un million de dollars à OVAL pour le développement de prototypes pratiques.
La boîte à outils Genie
À l'heure actuelle, la formation d'assistants virtuels est d'un coût prohibitif pour la plupart des entreprises, car la tâche nécessite de vastes ensembles de données d'échantillons de langage naturel qui ont été laborieusement annotés par des experts humains. Ces échantillons proviennent principalement de travailleurs rémunérés qui s'engagent dans des dialogues ou qui écoutent ce que disent les clients.
Pour contourner cet obstacle, l'équipe de Stanford a créé un outil baptisé « Genie » qui synthétise automatiquement des exemples de conversations. Il le fait en partie sur la base de principes génériques sur les dialogues transactionnels et en partie sur la connaissance d'une arène particulière. Étant donné que le système ne repose pas sur un dialogue réel recueilli auprès d’un nombre incalculable de personnes, les données de formation peuvent être acquises à une infime fraction du coût normal.
« Cela semble demander trop de travail, mais nous pouvons automatiser le processus, car il existe un modèle général pour les conversations transactionnelles », a déclaré Lam. « Ce modèle fonctionne que vous essayiez de réserver un restaurant ou de trouver et de lire un film. La clé est de générer suffisamment de variété à la fois au niveau de la phrase et au niveau du dialogue pour capturer ce que vous rencontreriez dans la vie réelle ».
Le modèle générique peut commencer par une question telle que « Quel est le X de Y? » Les lettres sont des espaces réservés pour les mots susceptibles d'apparaître dans des domaines spécifiques, tels que « adresse du restaurant ».
En plus de rendre le processus de formation beaucoup moins coûteux, le générateur de conversation automatisé offre un grand avantage pour la confidentialité : il élimine le besoin d'écouter les clients, ce qu'Amazon et Google font tous deux pour améliorer les compétences de leurs assistants virtuels.
Premiers résultats
Lors de tests récents, le prochain assistant Almond 2.0, formé aux restaurants, a correctement répondu à environ 70 % des questions complexes de crowdsourcing sur sa base de connaissances. Il a en fait surpassé les principaux assistants virtuels commerciaux sur certaines questions complexes concernant les restaurants, telles que « Pouvez-vous me trouver un restaurant qui sert des fruits de mer et qui a une note moyenne d'au moins 4 étoiles ? » Enfin, les chercheurs ont également découvert que le réseau neuronal était capable de transférer certaines de ses compétences en restauration vers l'arène hôtelière.
Ce sont des résultats remarquables, étant donné que l'assistant Almond n'a été créé que par une poignée de personnes. Pour mettre les choses en perspective, l'activité Alexa d'Amazon emploie plus de 10 000 personnes.
Un autre élément tout aussi important, explique Lam, est que la plateforme open source est conçue pour stimuler la collaboration entre les développeurs, ce qui devrait régulièrement améliorer ses capacités au fil du temps.
« Tout ce que nous faisons est open source », a déclaré Lam. « Les bâtisseurs de compétences peuvent contribuer au système de plusieurs façons. Ils peuvent étendre et améliorer le modèle de dialogue générique. Ils peuvent apporter des informations à la base de connaissances, car de nombreuses entreprises du même secteur partagent des propriétés communes. Et toutes ces données peuvent être utilisées pour transférer l'apprentissage d'un domaine à un autre. »
Feuille de route
Les responsables du projet expliquent :
« Nous avons lancé une initiative en juillet pour créer une infrastructure d'assistant virtuel open source pour soutenir l'expérimentation dans la recherche et fournir une base de collaboration dans l'industrie. Ceci est rendu possible grâce à une subvention de la Fondation Alfred P. Sloan dans le but de protéger le libre accès aux connaissances et de protéger la vie privée. Un oligopole émerge aujourd'hui des assistants virtuels. Avec, par exemple, Alexa disposant de 60 000 appareils IdO compatibles et de 100 000 compétences tierces, nous assistons à la création de sites Web vocaux propriétaires dont les assistants sont les gardiens.
« Étant donné que les assistants virtuels ont généralement accès à de nombreux comptes personnels, ils auront accès à des quantités massives de données personnelles. Le fait d'avoir une poignée d'entreprises détenant des informations privées détaillées dans le monde entier, un accès intermédiaire à la plupart des informations et des services numériques et un pouvoir démesuré pour façonner le comportement individuel sont profondément troublants.
« Nous ferons des versions bêta tout au long de cette année, avec pour objectif de livrer dans un an:
- Genie, une boîte à outils open source bien documentée pour prendre en charge la technologie Virtual Assistant 2.0. Cette boîte à outils prend en charge la programmation en langage naturel en synthétisant les données de formation à partir de spécifications de haut niveau et évite le besoin d'annotation manuelle massive des données de formation.
- Thingpedia, un référentiel de compétences non propriétaire ouvert à tous les assistants. Il recueille des interfaces en langage naturel avec le Web et l'Internet des objets. Thingpedia est ouvert et crowdsourcing comme Wikipedia, qui peut potentiellement devenir plus grand que n'importe quelle base de données propriétaire.
- Un assistant open source préservant la confidentialité avec les 10 domaines les plus populaires. L'objectif est de créer à terme une alternative à Alexa et à Google Assistant, de la même manière qu'Unix / Linux est une alternative à Windows, et Firefox est une alternative à Chrome ».
Source : Open Virtual Assistant Lab
Et vous ?
Que pensez-vous de cette initiative ?
Voir aussi :
La police demande de plus en de données sur les appareils connectés à domicile comme les Amazon Echo, qui peuvent inclure des requêtes sur internet ou des conversations entendues
Des chercheurs ont réussi à tromper Google Assistant et Siri et les amener à effectuer diverses actions en utilisant des ondes ultrasoniques
Google Assistant : le mode interprète débarque sur les smartphones Android et iOS compatibles, permettant de traduire en temps réel des conversations dans 44 langues
Si vous vous souciez de la vie privée, faut-il jeter vos appareils Amazon Alexa par la fenêtre ? L'équipe d'Alexa pourrait vous localiser