Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Des chercheurs de Stanford développent une alternative open source à Alexa et Google Assistant,
Espérant que l'assistant Almond permette d'accroître la concurrence et mieux protéger la vie privée

Le , par Stéphane le calme

117PARTAGES

21  0 
Amazon Alexa, Siri d’Apple, Cortana de Microsoft et Google Assistant font partie des assistants numériques les plus populaires. Ces assistants numériques deviennent progressivement l’une des passerelles entre internet et les utilisateurs.

Par exemple, il est possible d’effectuer des commandes de produits, de vérifier son solde bancaire, de payer des factures, de se connecter à sa compagnie d'assurance, etc. Alexa peut allumer les lumières de la maison, démarrer la voiture et vous indiquer la quantité d'essence dans le réservoir. Google Assistant peut suivre vos rendez-vous, filtrer les appels, commander un service de covoiturage et faire des réservations de restaurant. Il peut également contrôler les appareils intelligents de la maison, des thermostats et des portes aux systèmes de divertissement. Au total, d'après les chercheurs, Amazon Alexa a maintenant 100 000 « skills » (le nom donné aux tâches qu’Alexa peut réaliser) et Google Assistant a plus d'un million de capacités, selon les entreprises.

Cependant, étant donné que les plateformes vocales sont difficiles à créer et à former, Google et Amazon ont ce qui équivaut à un duopole de haut-parleurs connectés. Les entreprises souhaitant communiquer avec leurs clients via leurs assistants virtuels devront probablement passer par l'une de ces deux plateformes. Si l'une des principales plateformes souhaite privilégier ses produits par rapport à ceux de ses concurrents, elle pourrait facilement le faire. Et comme les consommateurs partagent davantage d'informations privées avec ces deux entreprises, ces données renforcent la domination de Google et d'Amazon.

C’est dans ce contexte qu’une équipe de chercheurs de Stanford a développé un assistant virtuel open source qui, espèrent-ils, élargira considérablement la concurrence et protégera la vie privée. Open Virtual Assistant Lab de Stanford, ou OVAL, utilise une approche novatrice et relativement peu coûteuse pour la formation d’assistants virtuels. Et comme il s’agit d’une plateforme open source, elle peut s’améliorer en permanence à mesure que ses utilisateurs apportent du code ou des compétences supplémentaires à un référentiel partagé.

« Nous nous considérons comme le nouveau Firefox - une plateforme ouverte qui ne dépend pas d’une grande entreprise ayant ses propres intérêts concurrentiels », a déclaré Monica Lam, directrice du projet OVAL, qui est également professeur d’informatique à Stanford et membre du corps professoral de la Stanford Institute of Human-Centered Artificial Intelligence.

Les principaux doctorants travaillant sur le nouvel assistant virtuel, nommé Almond, sont Giovanni Campagna, Silei Xu, Sina Semnani et Mehrad Moradshahi.

Les premiers résultats du prototype Almond ont été si prometteurs que la Fondation Alfred P. Sloan a récemment accordé une subvention d'un million de dollars à OVAL pour le développement de prototypes pratiques.


La boîte à outils Genie

À l'heure actuelle, la formation d'assistants virtuels est d'un coût prohibitif pour la plupart des entreprises, car la tâche nécessite de vastes ensembles de données d'échantillons de langage naturel qui ont été laborieusement annotés par des experts humains. Ces échantillons proviennent principalement de travailleurs rémunérés qui s'engagent dans des dialogues ou qui écoutent ce que disent les clients.

Pour contourner cet obstacle, l'équipe de Stanford a créé un outil baptisé « Genie » qui synthétise automatiquement des exemples de conversations. Il le fait en partie sur la base de principes génériques sur les dialogues transactionnels et en partie sur la connaissance d'une arène particulière. Étant donné que le système ne repose pas sur un dialogue réel recueilli auprès d’un nombre incalculable de personnes, les données de formation peuvent être acquises à une infime fraction du coût normal.

« Cela semble demander trop de travail, mais nous pouvons automatiser le processus, car il existe un modèle général pour les conversations transactionnelles », a déclaré Lam. « Ce modèle fonctionne que vous essayiez de réserver un restaurant ou de trouver et de lire un film. La clé est de générer suffisamment de variété à la fois au niveau de la phrase et au niveau du dialogue pour capturer ce que vous rencontreriez dans la vie réelle ».

Le modèle générique peut commencer par une question telle que « Quel est le X de Y? » Les lettres sont des espaces réservés pour les mots susceptibles d'apparaître dans des domaines spécifiques, tels que « adresse du restaurant ».

En plus de rendre le processus de formation beaucoup moins coûteux, le générateur de conversation automatisé offre un grand avantage pour la confidentialité : il élimine le besoin d'écouter les clients, ce qu'Amazon et Google font tous deux pour améliorer les compétences de leurs assistants virtuels.

Premiers résultats

Lors de tests récents, le prochain assistant Almond 2.0, formé aux restaurants, a correctement répondu à environ 70 % des questions complexes de crowdsourcing sur sa base de connaissances. Il a en fait surpassé les principaux assistants virtuels commerciaux sur certaines questions complexes concernant les restaurants, telles que « Pouvez-vous me trouver un restaurant qui sert des fruits de mer et qui a une note moyenne d'au moins 4 étoiles ? » Enfin, les chercheurs ont également découvert que le réseau neuronal était capable de transférer certaines de ses compétences en restauration vers l'arène hôtelière.


Ce sont des résultats remarquables, étant donné que l'assistant Almond n'a été créé que par une poignée de personnes. Pour mettre les choses en perspective, l'activité Alexa d'Amazon emploie plus de 10 000 personnes.

Un autre élément tout aussi important, explique Lam, est que la plateforme open source est conçue pour stimuler la collaboration entre les développeurs, ce qui devrait régulièrement améliorer ses capacités au fil du temps.

« Tout ce que nous faisons est open source », a déclaré Lam. « Les bâtisseurs de compétences peuvent contribuer au système de plusieurs façons. Ils peuvent étendre et améliorer le modèle de dialogue générique. Ils peuvent apporter des informations à la base de connaissances, car de nombreuses entreprises du même secteur partagent des propriétés communes. Et toutes ces données peuvent être utilisées pour transférer l'apprentissage d'un domaine à un autre. »


Feuille de route

Les responsables du projet expliquent :

« Nous avons lancé une initiative en juillet pour créer une infrastructure d'assistant virtuel open source pour soutenir l'expérimentation dans la recherche et fournir une base de collaboration dans l'industrie. Ceci est rendu possible grâce à une subvention de la Fondation Alfred P. Sloan dans le but de protéger le libre accès aux connaissances et de protéger la vie privée. Un oligopole émerge aujourd'hui des assistants virtuels. Avec, par exemple, Alexa disposant de 60 000 appareils IdO compatibles et de 100 000 compétences tierces, nous assistons à la création de sites Web vocaux propriétaires dont les assistants sont les gardiens.

« Étant donné que les assistants virtuels ont généralement accès à de nombreux comptes personnels, ils auront accès à des quantités massives de données personnelles. Le fait d'avoir une poignée d'entreprises détenant des informations privées détaillées dans le monde entier, un accès intermédiaire à la plupart des informations et des services numériques et un pouvoir démesuré pour façonner le comportement individuel sont profondément troublants.

« Nous ferons des versions bêta tout au long de cette année, avec pour objectif de livrer dans un an:
  • Genie, une boîte à outils open source bien documentée pour prendre en charge la technologie Virtual Assistant 2.0. Cette boîte à outils prend en charge la programmation en langage naturel en synthétisant les données de formation à partir de spécifications de haut niveau et évite le besoin d'annotation manuelle massive des données de formation.
  • Thingpedia, un référentiel de compétences non propriétaire ouvert à tous les assistants. Il recueille des interfaces en langage naturel avec le Web et l'Internet des objets. Thingpedia est ouvert et crowdsourcing comme Wikipedia, qui peut potentiellement devenir plus grand que n'importe quelle base de données propriétaire.
  • Un assistant open source préservant la confidentialité avec les 10 domaines les plus populaires. L'objectif est de créer à terme une alternative à Alexa et à Google Assistant, de la même manière qu'Unix / Linux est une alternative à Windows, et Firefox est une alternative à Chrome ».

Source : Open Virtual Assistant Lab

Et vous ?

Que pensez-vous de cette initiative ?

Voir aussi :

La police demande de plus en de données sur les appareils connectés à domicile comme les Amazon Echo, qui peuvent inclure des requêtes sur internet ou des conversations entendues
Des chercheurs ont réussi à tromper Google Assistant et Siri et les amener à effectuer diverses actions en utilisant des ondes ultrasoniques
Google Assistant : le mode interprète débarque sur les smartphones Android et iOS compatibles, permettant de traduire en temps réel des conversations dans 44 langues
Si vous vous souciez de la vie privée, faut-il jeter vos appareils Amazon Alexa par la fenêtre ? L'équipe d'Alexa pourrait vous localiser

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de Uther
Expert éminent sénior https://www.developpez.com
Le 24/10/2020 à 5:09
Bah c'est justement ça qui fait toute le différence, on s'en fiche un peu que ça soit américain ou autre si ça peut être repris par n'importe qui.
9  0 
Avatar de XDev1
Membre du Club https://www.developpez.com
Le 30/10/2020 à 16:14
J'aimerais comprendre ce que cela signifie réellement.
D'un coté, ils prétendent qu'ils ont mis au point un système permettant de synthétiser automatiquement des exemples de conversations. Wow !
De l'autre coté, qu'il ne repose pas sur un dialogue réel …
Ils ont trouvé la boule de cristal ?
C'est très curieux !
Quelqu'un a-t-il mieux compris ce billet ?
0  0 
Avatar de Le gris
Membre averti https://www.developpez.com
Le 24/10/2020 à 7:56
Bahhh fallait y penser en premier.
0  1 
Avatar de air-dex
Membre expert https://www.developpez.com
Le 24/10/2020 à 3:03
Son seul avantage est d'être non commercial. Pour le reste c'est tout aussi américain que Google Assistant, Siri, Alexa et Cortana.
0  4