ex. poste, entreprise, métier
ex. ville, région ou code postal
recherche avancée »

Post Doc Amélioration de la reconnaissance vocale dans un cadre multi-lingue / multi-accent- F/H sur 12 mois

Lieu:
Cesson-Sévigné
Entreprise:
Orange

Postuler à ce poste

Cette étude d'effectuera dans la division Data & IA d'Orange Labs dans l'équipe AI Tools & Technology, dont les activités sont centrées sur l'analyse du langage, de la parole et du dialogue.
L'équipe de recherche travaille notamment sur l'étude, le prototypage et le déploiement de différents systèmes de reconnaissance de parole pour servir les besoins du groupe.


Votre rôle est d'effectuer un travail de Post Doc sur l'amélioration de la reconnaissance vocale dans un cadre multi-lingue / multi-accent.
De la globalisation des échanges découle un nombre important de conversations internationales. Si les personnes s'expriment communément dans leur langue native, elles le font également de plus en plus dans une langue étrangère. Ainsi, dans un cadre professionnel ou dans une relation client, les conversations incluent donc très souvent des variantes de langage notamment caractérisées par des accents et prononciations multiples.
Ces variantes de prononciations dégradent les performances des systèmes de reconnaissance vocale, qui sont, le plus souvent, développés par apprentissage en utilisant des corpus homogènes en termes de type ou origine des locuteurs. De ce fait ces modèles de reconnaissance de parole supportent mal les variations en termes de phonétique dépendantes de l'origine du locuteur.
L'objet de ce travail postdoctoral est de modéliser et d'intégrer les variantes linguistiques en vue d'améliorer la reconnaissance vocale.
Le cadre est applicatif ; il peut inclure des retranscriptions automatiques de réunions, avec par exemple, plusieurs interlocuteurs de langues maternelles différentes parlant une autre langue que celle-ci. Mais également, des applications de relation client où les conversations client-opérateur sont analysées ou résumées.
La présence du groupe Orange dans 29 pays entraîne de nombreux échanges et collaborations entre pays. Des échanges réguliers entre interlocuteurs dont la langue native peut être le français, l'anglais, l'espagnol, le polonais etc. Les solutions de reconnaissance de parole doivent être robustes vis-à-vis de ces spécificités multi-langages afin d'être performantes quels que soient les interlocuteurs.
Les systèmes de reconnaissance de parole développés, notamment par Orange, sont le plus souvent mono-langue et supportent mal les excursions de prononciations. Plusieurs approches existent pour faire face à ces variations, notamment le morphing phonétique ;
Ci-dessous les références qui alimenteront les développements scientifiques décrits plus bas.
[1] AIPNet: Generative Adversarial Pre-training of Accent-invariant Networks for End-to-end Speech Recognition, Chen et al. 2019
[2] Personalizing ASR for Dysarthric and Accented Speech with Limited Data, Shor et al. 2019
[3] Leveraging native language information for improved accented speech recognition, Ghorbani et al. 2019
[4] Foreign English Accent Adjustment by Learning Phonetic Patterns, Kitashov et al. 2018
[5] Solving the Problem of the Accents for Speech Recognition Systems, Kardava et al. 2016
[6] An approach to the problem of regional accent in automatic speech recognition, Barry et al. 1989…
[7] Accent Issues in Large Vocabulary Continuous Speech Recognition, Huant et al. 2004

Postuler à ce poste

Salaires

Le nombre d'emplois pour chaque niveau de salaire dans cette catégorie:

Postes similaires
En créant une alerte email, vous acceptez nos Termes & et Conditions, Avis de Confidentialité, et l'utilisation de cookies.
Post de remplacement

BABILOU
Vern-sur-Seiche, 35770
Voir l'annonce »

Cadre de santé PHUPA

Centre hospitalier RENNES
Rennes, Bretagne, 35000
Voir l'annonce »