L’analyse voix avec Newtest

25 mars 2015 Par Posté dans Infos Produits

En janvier, le CU7 du Robot 7.6 a apporté de nouvelles fonctionnalités : l’enregistrement audio, le positionnement des fenêtre Windows dans une extension la primitive WaitWnd() et de nouvelles combinaisons clavier avec la primitive SendKeyCombination(). Nous allons dans cet article faire un focus sur l’analyse audio.

 

Avec le CU7 du Robot / NTBR 7.6, une nouvelle primitive d’enregistrement audio est disponible (StartAudioCapture). Cette fonction permet de réaliser les actions suivantes :

  • capture audio et remontée du fichier dans la supervision NMC en tant que diagnostic (fonction d’envoi générique de diagnostics),
  • retraitement du signal enregistré : suppression des blancs, ré-échantillonnage (8 kHz, etc.),
  • détection de silence, par exemple sur la supervision de flux streaming ou vidéo.

En outre, sur les Robots disposant de la licence Newtest voice, une analyse MOS PESQ peut ensuite être utilisée pour évaluer la qualité audio d’une capture. Cette fonction est par exemple utile pour évaluer la qualité d’appels voix réalisés via des « softphones » comme Lync, Skype ou tout client de communication unifiée.

Pour rappel, le MOS PESQ fonctionne en comparant un signal capturé lors d’une conversation (Test) à un fichier enregistré au préalable dit ‘fichier de référence’. Cet algorithme se base sur un modèle de l’oreille humaine afin de faire une estimation des composants audibles. Ensuite, il réalise une comparaison de ces composants afin d’obtenir la différence audible, soumise enfin à un modèle comparable à celui d’un cerveau humain appelé « modèle cognitif ».

 

Une image de la qualité totale peut alors être générée, le processus complet étant schématiquement représenté ci-dessous :

Modele Cognitif

L’avantage de ce processus est de disposer d’une échelle simple et objective pour la qualité audio. Le tableau ci-dessous montre l’échelle défini par l’ITU :

Qualite ITU

La méthode PESQ permet de récupérer aussi les indicateurs voix secondaires suivants :

  • l‘indice de bruit correspond à la quantité d’information supplémentaire en fréquence lorsque le fichier dégradé présente un offset,
  • l‘indice d’omission correspond à la quantité de données manquantes lorsqu’il y a un offset par rapport au fichier de référence,
  • l’indice de décalage correspond au délai entre les différentes séquences de parole.

L’offre « Newtest Voice » supporte depuis de nombreuses années les appels téléphoniques, la note MOS et ses métriques complémentaires associées (bruit, etc.) dans les Robots munis de cartes analogiques ou numériques (ISDN/RNIS) et connectés à des lignes téléphoniques pour des appels automatisés.

Avec le Robot Newtest version 7.6 CU7, ces fonctionnalités de supervision « voix » deviennent possibles sans carte dédiée en utilisant un « Softphone » (ou client de communication unifiée) comme Lynx, Skype, Jabber… et une liaison réseau IP.

Cependant, les conditions d’enregistrement via une carte audio sont différentes que celles spécifiées dans la norme ITU PESQ pour les lignes téléphoniques. Les valeurs ne peuvent donc être comparées aux valeurs MOS sur téléphone fixe, mais fournissent un indicateur pouvant être utilisé pour suivre des variations dans le temps ou comparer la qualité depuis différents sites géographiques.

Comme d’habitude sur le portail Newtest, des vues supervision temps-réel restituent les performances d’établissement d’appel et de qualité. La visualisation graphique sur le NMC est visible ci-dessous pour l’exemple d’un scénario d’appel Skype.

 

Newtest Voice

 

Dimitri Mottet
Product Owner

Laisser un commentaire

Votre adresse email ne sera pas publié