
Google, Siri, Alexa : quel est le prix du freemium ?
Le Journal du Net ( JDN – 08 décembre 2020 ) se penche sur les choix qui s’offrent à l’industrie pour sélectionner un assistant vocal adapté. Assistants vocaux grand public, assistants vocaux dédiés à des fonctions spécifiques… l’offre devient pléthorique et complexe à suivre sans appliquer certains critères discriminants forts, propres à l’industrie.
SPIX industry offre une vision transversale du sujet avec des éléments tirés de son expérience industrielle et technologique. Les approches du journal numérique et du fournisseur d’assistants vocaux industriels au service des hommes et des femmes de l’industrie peuvent être complémentaires pour répondre à la question du prix de la gratuité !

Assistants vocaux : qui sont les véritables acteurs du marché ?
Si l’on considère le nombre d’assistants vocaux installés, tous terminaux confondus, nous dépasserons en 2019 le chiffre de 2,5 milliards. Sur ce sujet, les principaux acteurs du marché n’hésitent pas à se livrer à une petite bataille de chiffres. Quand Amazon se vante d’avoir vendu plus de 100 millions d’exemplaires de ses enceintes avec Alexa, Google répond en annonçant l’installation de Google Assistant sur plus d’un milliard de terminaux d’ici 2020 (c Célia Garcia-Montero, JND 2020).
Aujourd’hui, les principaux acteurs de l’assistance vocale connus du grand public sont les GAFAM : Google, Amazon, Facebook, Apple et Microsoft. Ces acteurs américains sont essentiels en raison de leur pouvoir de développement technique et de leur puissance économique. Il est important de noter que dans cette catégorie d’acteurs, aucun Européen ne peut réellement être considéré comme un concurrent.
A force de ne parler que des GAFAM, on en oublierait presque les BATX qui arrivent rapidement sur nos marchés, Baidu, Alibaba, Tencen, Xiaomi qui nous viennent directement de Chine. De son côté, l’assistant vocal de Samsung fait une percée remarquable en Asie et aux États-Unis. À titre de comparaison, en 2020, les assistants vocaux chinois sont plus déployés dans le monde que le « Siri » d’Apple, tout comme le Bixby de Samsung.
Ce constat soulève une première question sur la souveraineté de l’industrie européenne, ainsi qu’une réflexion sur nos modèles de veille économique et technologique… En ne regardant que l’arbre, nous risquons de passer à côté de la forêt.
Peut-on tout faire à partir d’un seul modèle économique ?
Cette frénésie pour les assistants vocaux n’est pas sans risque pour les utilisateurs. Depuis leur apparition, ils ont fait l’objet de multiples accusations. Ils sont soupçonnés, entre autres, de ne pas sécuriser totalement les conversations et de ne pas conserver les données personnelles des utilisateurs, ce qui représente un risque sérieux pour la vie privée (c Célia Garcia-Montero, JDN 2020).
Dans ce cas, l’utilisateur aimerait avoir du beurre et de l’argent du beurre ! Le but est de pouvoir disposer d’un assistant vocal surperformant presque gratuitement. L’argent du beurre, c’est garder le contrôle de sa vie privée. Le GAFAM et le BATX en ont décidé autrement pour nous…
Le développement technique des assistants vocaux tels que nous les connaissons aujourd’hui a coûté une petite fortune à chacune des entreprises qui les développent. Ces investissements, qui ne peuvent être réalisés que par les grands acteurs mentionnés ci-dessus, doivent être rentabilisés un jour. Deux solutions s’offrent à eux : faire payer au client un produit pour lui donner accès à un service, ou donner accès à un produit pour monétiser un service. C’est le deuxième choix qui a pris le dessus ! Les grands éditeurs d’assistants vocaux nous proposent leurs produits, afin que nous puissions consommer des services offerts par d’autres acteurs du commerce électronique ou de la publicité. Cerise sur le gâteau, dans les conditions générales d’utilisation de ces produits « gratuits », nous acceptons tous de mettre en commun nos données et de partager notre temps d’écoute de contenus publicitaires à forte valeur ajoutée.
C’est sur la base de ce type de modèle qu’Amazon peut former son assistant vocal Alexa avec plusieurs millions de données et d’échanges entre utilisateurs, partagés gratuitement par tous les utilisateurs du produit. Cet investissement est ensuite rentabilisé par l’augmentation des ventes via les interfaces vocales sur la plateforme Amazon, et par les contenus publicitaires diffusés par d’autres annonceurs.
C’est le prix de la gratuité ! La question à se poser pour le développement de solutions d’assistance vocale pour l’industrie : ce prix est-il acceptable ? Si ce n’est pas le cas, quel modèle économique adopter ?
La monétisation des données et les contraintes industrielles
Pour ce faire, Alexa a été entraînée par des milliards de conversations à travers le monde. D’autre part, dans l’industrie, nous ne disposons pas de suffisamment de données sémantiques pour constituer des « big data ». Ainsi, les assistants vocaux BtoB ne sont pas formés de la même manière (cf Célia Garcia-Montero, JDN 2020).
Si, comme nous l’avons vu, le modèle économique des grands assistants vocaux est basé sur la valorisation des données traitées, il faut se poser la question de l’adéquation de ce modèle avec les capacités et les contraintes de l’industrie.
A moins que le monde de demain ne soit vraiment différent, il est peu probable que des constructeurs parfois concurrents acceptent de mettre en commun toutes leurs ressources documentaires, sémantiques et linguistiques pour former un assistant vocal. Même dans un monde utopique, le partage de ces données pourrait éventuellement être envisagé à un moment précis, mais ce n’est pas suffisant. Les assistants vocaux de nos géants ont besoin d’être constamment alimentés en données fraîches et qualifiées afin d’accroître en permanence leurs capacités.
Il est illusoire de penser que les fabricants mettront à la disposition d’une société tierce tous les échanges entre leurs employés et un assistant vocal en temps réel, et l’autoriseront à utiliser ces données au profit de l’ensemble de l’industrie.
Alors, que faire ? Nous pourrions demander aux acteurs numériques de la côte ouest des Etats-Unis de vendre une licence d’utilisation privée de ce type d’assistant au profit d’un seul industriel. C’est une hypothèse, mais elle sera coûteuse, voire inabordable pour la majorité des fabricants. Se posera ensuite la question de la formation spécifique de ces assistants aux besoins spécifiques de ce fabricant. Pourquoi pas, mais nous nous heurterons rapidement au volume de données disponibles et accessibles. Prenons un exemple concret : un industriel qui gère 100.000 types de tâches différentes pour ses opérations de maintenance est déjà de bonne taille. Néanmoins, 100 000 documents ne représentent pas grand-chose par rapport aux milliards d’échanges utilisés par Alexa pour s’entraîner.
En conclusion, quelle que soit la solution technique envisagée, le fabricant aura du mal à accepter les contraintes imposées par les modèles « libres » des grands acteurs du domaine. Il faut donc être créatif et trouver d’autres approches compatibles avec l’industrie.
Quelle est la solution pour l’industrie ?
Un assistant vocal, également appelé assistant personnel intelligent ou haut-parleur connecté, est un dispositif basé sur le langage naturel reconnaissance vocale pour permettre à son utilisateur d’effectuer une recherche par la voix (cf Célia Garcia-Montero, JDN 2020).
Pour répondre aux besoins de l’industrie en matière d’assistance vocale, il faut d’une part élargir la définition de l’assistant vocal, puis adapter la technologie et le modèle économique aux contraintes spécifiques de cette activité.
L’assistance vocale pour l’industrie prendra différentes formes en fonction de l’utilisation prévue. En effet, un assistant chargé de répondre aux questions des clients (de type FAQ) n’aura pas les mêmes attributs qu’un assistant vocal chargé de produire des rapports de terrain pour les inspecteurs de sites dans l’industrie nucléaire.
Deux besoins coexistent pour un assistant vocal industriel : répondre à une demande d’un utilisateur d’une part, collecter et structurer les informations fournies par un utilisateur d’autre part. Ainsi, pour le domaine industriel, la définition d’un assistant vocal peut être étendue à » des relations fluides entre un employé industriel et un système numérique parfois complexe grâce à une assistance vocale et intelligente « .
D’un point de vue technique, un assistant vocal industriel devra répondre aux contraintes spécifiques du domaine : peu de données, une exigence de fiabilité, fonctionnel dans le bruit, efficace hors ligne, acceptable comme outil de travail par les employés de l’industrie. Toujours sur le plan technique, un assistant vocal industriel doit pouvoir dialoguer avec tous les contenus déjà validés et utilisés de manière opérationnelle dans l’industrie. On peut facilement imaginer qu’aucun industriel ne remettra en cause ce qu’il a validé dans SAP pour mettre en place un assistant vocal… Ainsi, tout assistant vocal industriel intelligent doit prendre comme données d’entrée les contenus des outils numériques déjà déployés comme SAP, IBM-Maximo, Delmia-Apriso, INFOR, IFS, et tant d’autres solutions numériques.
L’assistant vocal industriel » Spix » de SPIX industry répond à ces exigences industrielles pour mieux contrôler les outils de production ou les systèmes en maintenance. En effet, l’investissement à réaliser dans la mise en place d’un assistant vocal industriel est rentabilisé si le fabricant gagne des points de productivité ou de rentabilité de ses opérations. L’assistant vocal au service des employés permet au fabricant de collecter plus de données sur l’état de son outil de production, ou d’être mieux informé de l’état d’un système complexe dont ses employés sont responsables. L’assistant vocal « Spix » de SPIX industry est au service de l’expertise des salariés et leur permet de remonter plus facilement les informations du terrain vers les systèmes d’information de l’entreprise.
Enfin, comme l’industrie ne souhaite pas (ou ne peut pas) partager ses données pour accéder à des services « gratuits », il faut trouver d’autres modèles économiques. Les grands acteurs du numérique industriel tels que SAP, IBM-Maximo, Delmia-Apriso, INFOR, IFS et d’autres ont déjà travaillé sur des modèles économiques adaptés aux attentes de leurs clients. L’assistant vocal industriel doit trouver un modèle commercial compatible avec ces derniers. Par exemple, l’assistant vocal industriel de SPIX industry reprend les codes économiques attendus par ses clients qui utilisent déjà des logiciels industriels.
Conclusion
Les fabricants souhaitent bénéficier des avantages des technologies d’assistance vocale intelligente pour aider leurs employés (ou leurs clients) dans l’accomplissement de leurs tâches. Dans ce monde professionnel où la protection des données n’est pas une option, il est urgent de faire émerger des solutions européennes alternatives aux géants américains et chinois. SPIX industry avec son assistant vocal industriel » Spix » est un pionnier en Europe dans ce domaine et est en bonne position pour prendre le leadership de ce marché émergent.
Contacts presse
André JOLY – Directeur général
Téléphone. : +33 (0)6 25 17 27 94
Courriel : andre.joly@spix-industry.com
Entité légale
Site web : spix-industry.com
Linkedin : linkedin.com/company/spix-industry
Simsoft3D SAS – 1244 rue l’Occitane – 31670 Labège (France)
« SPIX » et « SPIX industry » sont des marques déposées de Simsoft3D SAS.