Accéder directement au contenu Accéder directement à la navigation
Article dans une revue

Un mot pour un autre ? Analyse et comparaison de huit plateformes de transcription automatique

Résumé : Cet article compare les fonctionnalités et résultats de huit outils de transcription automatique (Go Transcribe, Happy Scribe, Headliner, Sonix, Video Indexer, Vocalmatic, Vocapia et YouTube), pour des extraits audio de langue française. Une méthodologie innovante, fruit d’un travail interdisciplinaire, est proposée pour comparer les transcriptions. Elle repose sur un assemblage de trois approches complémentaires : (1) une approche quantitative de comparaison de textes à partir d’une métrique couramment employée, le Word Error Rate (WER), (2) une approche fine de classification et compréhension des erreurs générées par les plateformes, et enfin (3) une estimation du potentiel de gain de temps de transcription pour chacun des fichiers et des plateformes. In fine, aucune plateforme ne serait plus efficace que les autres pour l’ensemble des extraits audio mais deux outils se démarquent : Vocapia et Sonix, chacun ayant ses domaines de prédilection. Quel que soit le type de fichier ou de plateforme, un temps de réécoute et de correction reste indispensable à l’issue des traitements, pour un gain de temps final observé pouvant aller jusqu’à 75 % par rapport à une transcription manuelle. Par ailleurs, l’utilisation de ces outils en ligne peut engendrer des problèmes importants liés à la confidentialité et la sécurité des données. Pour finir, nous revenons sur l’expérience de travail interdisciplinaire qui a rendu ce projet possible.
Type de document :
Article dans une revue
Liste complète des métadonnées

https://hal-univ-pau.archives-ouvertes.fr/hal-03730474
Contributeur : Gaëlle DELETRAZ Connectez-vous pour contacter le contributeur
Soumis le : mercredi 20 juillet 2022 - 17:43:15
Dernière modification le : jeudi 22 septembre 2022 - 05:07:05

Fichier

 Accès restreint
Fichier visible le : 2023-07-20

Connectez-vous pour demander l'accès au fichier

Identifiants

Collections

Citation

Elise Tancoigne, Jean Philippe Corbellini, Gaëlle Deletraz, Laure Gayraud, Sandrine Ollinger, et al.. Un mot pour un autre ? Analyse et comparaison de huit plateformes de transcription automatique. Bulletin de Méthodologie Sociologique / Bulletin of Sociological Methodology, SAGE Publications, 2022, 155 (1), pp.45 - 81. ⟨10.1177/07591063221088322⟩. ⟨hal-03730474v1⟩

Partager

Métriques

Consultations de la notice

79