Avec l’aide de la population: ZHAW et FHNW numérisent les dialectes suisses allemands

    -     Deutsch
Avec l’aide de la population: ZHAW et FHNW numérisent les dialectes suisse

Les deux universités organisent une collecte de données sur les dialectes suisses dans toute la Suisse alémanique. Le public peut désormais apporter son aide en utilisant une simple application pour créer des enregistrements vocaux. Les dialectes numérisés peuvent être utilisés pour former d’importants programmes informatiques.

Les chatbots et les assistants vocaux comprennent mal le suisse allemand parlé. Cela est dû au manque de fichiers audio nécessaires à l’entraînement de ces systèmes. Pour les grandes entreprises technologiques, le marché suisse est trop petit pour développer une solution qui comprenne le suisse allemand. C’est sur le point de changer. "Nous voulons collecter et numériser les dialectes suisses", explique Mark Cieliebak du Centre d’intelligence artificielle (CAI) de la ZHAW. "Il faudrait réunir au moins 2000 heures d’enregistrements de dialectes suisses allemands pour disposer d’une bonne base de données." Manfred Vogel, de la FHNW, ajoute : "Nous utiliserons ensuite ces données pour apprendre à un algorithme basé sur l’intelligence artificielle à comprendre le suisse allemand et à le convertir automatiquement en texte en haut allemand."

"Nous voulons collecter et numériser les dialectes suisses allemands."

Mark Cieliebak, Centre pour l’intelligence artificielle (CAI) (ZHAW)

Une application web a été développée pour le projet, permettant aux volontaires de créer leurs propres enregistrements audio en traduisant des phrases en haut allemand en dialecte naturel et/ou en révisant les enregistrements faits par d’autres participants. Dans l’application, les participants peuvent voir quels sont les cantons pour lesquels des enregistrements vocaux sont déjà disponibles - et quels sont les cantons et dialectes qui manquent encore.

Grâce à la collecte de données et aux modèles linguistiques formés, il est possible de développer des interfaces linguistiques pour diverses applications. Par exemple, les assistants vocaux pourraient parler en suisse allemand, les entreprises pourraient évaluer automatiquement les réactions des clients, comme les appels au service clientèle. Les sous-titres des émissions télévisées pourraient également être créés automatiquement.

Les technologies d’apprentissage des systèmes de conversion de la parole en texte n’ont cessé de se développer ces dernières années et sont aujourd’hui principalement basées sur les réseaux neuronaux. Pour des langues comme l’anglais et l’allemand, ces méthodes donnent déjà de très bons résultats avec des taux d’erreur inférieurs à deux pour cent.

"Comme nous publions le jeu de données à des fins de recherche, il est possible de développer des programmes informatiques qui pourront ensuite être utilisés à diverses fins en collaboration avec des entreprises locales", explique Manuela Hürlimann de l’Association suisse pour le traitement du langage naturel (SwissNLP), qui coordonne et gère le projet.

Les deux universités sont soutenues par le Media Technology Center de l’ETH et de l’Université de Zurich. Le projet est financé par des fonds internes de la ZHAW et de la FHNW et par le soutien financier du Fonds national suisse de la recherche scientifique et d’AXA Assurances.


Ce site utilise des cookies et des outils d'analyse pour améliorer la convivialité du site. Plus d'informations. |