Reconnaissance automatique de la parole et reconnaissance vocale pour l’industrie

Voice

Reconnaissance automatique de la parole

Commandes vocales pour vos logiciels industriels

Parmi tous les SKILLS de Spix, certains sont simples et répondent à un besoin d’intégrer des commandes vocales dans des logiciels existants.

Les commandes vocales utilisent les fonctions de reconnaissance automatique de la parole qui transforment un signale vocal en texte. Des commandes vocales peuvent être associées à ce texte pour piloter une interface de logiciel, ou déclencher des actions simples.

reconnaissance automatique de la parole

Reconnaissance automatique de la parole

Pour créer des commandes vocales à partir de la parole (la voix) d’un utilisateur, il est nécessaire de reconnaitre automatiquement la parole et la convertir en texte. Ensuite, des intentions simples peuvent être associées à des textes afin de créer une action sur informatique.

Le principe de fonctionnement générique de reconnaissance automatique de la parole repose sur un algorithme de reconnaissance probabiliste d’identification des phonèmes dans une phrase. Afin de rendre l’algorithme plus efficace, trois composants additionnels sont essentiels:

  • Le Modèle Acoustique: Il définit l’environnement sonore dans lequel la reconnaissance automatique de la parole sera le plus efficace. Si un algorithme est configuré avec un modèle acoustique d’intérieur de voiture, il sera moins efficace en extérieur avec du vent. Certains algorithmes disposent de modèles acoustiques génériques, certains peuvent être configurés en fonction du cas d’usage.
  • Le Modèle de Langue: Il permet l’utilisation de la reconnaissance de la parole dans différentes langues.
  • Le Lexique (ou grammaire): Dans le cas d’usage de création de commandes vocales, l’algorithme de reconnaissance de la parole est généralement restreint à une base de vocabulaire limitée. Dans ce cas, l’algorithme va limiter sa recherche de mot au vocabulaire défini dans la base lexicale. Plus le vocabulaire est restreint plus l’algorithme est efficace, mais moins l’expérience utilisateur est satisfaisante.

SPIX industry possède une expertise dans la configuration et la mise en oeuvre de la reconnaissance automatique de la parole dans le domaine industriel.

Disponible dans plusieurs langues

La capacité d’utiliser des commandes vocales dans une langue donnée dépend uniquement de l’efficacité de la reconnaissance de la parole dans cette langue. Les intentions liées aux commandes sont génériques quelle que soit la langue (« valider » exprime la même intention dans toutes les langues).

SPIX industry dispose de capacités de reconnaissance de la parole dans près de 40 langues. Toutes ne sont pas validées au même niveau de fiabilité pour une utilisation industrielle.

Reconnaissances de la parole validées pour le domaine industriel

Français

natif et non natif

Anglais

non natif

Anglais

natif

Espagnol

natif

Portugais

Brésil et natif

Allemand

natif

Autres reconnaissances de la parole disponibles

Italien

Néerlandais

Coréen

Chinois

Autres langues sur demande…

Adapté aux besoins opérationnels de l’industrie

Pour créer des commandes vocales à partir de la parole (la voix) d’un utilisateur, il est nécessaire de reconnaitre automatiquement la parole et la convertir en texte. Ensuite, des intentions simples peuvent être associées à des textes afin de créer une action sur informatique.

Le principe de fonctionnement générique de reconnaissance automatique de la parole repose sur un algorithme de reconnaissance probabiliste d’identification des phonèmes dans une phrase. Afin de rendre l’algorithme plus efficace, trois composants additionnels sont essentiels:

  • Le Modèle Acoustique: Il définit l’environnement sonore dans lequel la reconnaissance automatique de la parole sera le plus efficace. Si un algorithme est configuré avec un modèle acoustique d’intérieur de voiture, il sera moins efficace en extérieur avec du vent. Certains algorithmes disposent de modèles acoustiques génériques, certains peuvent être configurés en fonction du cas d’usage.
  • Le Modèle de Langue: Il permet l’utilisation de la reconnaissance de la parole dans différentes langues.
  • Le Lexique (ou grammaire): Dans le cas d’usage de création de commandes vocales, l’algorithme de reconnaissance de la parole est généralement restreint à une base de vocabulaire limitée. Dans ce cas, l’algorithme va limiter sa recherche de mot au vocabulaire défini dans la base lexicale. Plus le vocabulaire est restreint plus l’algorithme est efficace, mais moins l’expérience utilisateur est satisfaisante.

SPIX industry possède une expertise dans la configuration et la mise en oeuvre de la reconnaissance automatique de la parole dans le domaine industriel.