top of page
Rechercher

Quel est l’avenir des technologies de transcription et de sous-titrage automatique ?


ree

Alors que les technologies automatique de reconnaissance vocale (automatic recognition technology ou speech-to-text en anglais) ne cessent de faire des progrès, de nombreuses solutions de transcription et de sous-titrage automatique sont apparues.

Pourtant, en l’état actuel des choses, l’expertise humaine est toujours nécessaire pour détecter des structures phonétiques plus complexes ou dans des contextes sonores plus confus.

Pour pallier ces manques, voici comment certaines solutions semblent se tourner entre un mix de compétences humaines et technologiques.


Les progrès de la reconnaissance vocale.


Depuis les années 60, la transcription des paroles en texte par un ordinateur s’est progressivement affiné. L’analyse s’est notamment appuyés sur des sources et des paramètres de données de plus en plus divers (acoustiques, phonétiques, linguistiques voire l’articulation).

Aujourd’hui, avec les solutions commercialisées par Google, Microsoft, ou Amazon ont atteint ainsi une probabilité de 80% d’erreurs dans cette reconnaissance, en tout cas dans des conditions idéales. En effet, des interférences comme des paroles dites “réverbérantes” ou des fonds bruyant peuvent particulièrement affectée l’analyse.

Si l’avancée reste importante par rapport à une vingtaine d’année, elle n’est cependant pas suffisante pour se passer d’une expertise humaine. Un transcripteur


Une collaboration IA/humain.



ree

En conséquence, les concepteurs de solution de transcription et de sous-titrage se reposent encore sur un service humain. Mais celle-ci s’appuie de plus en plus sur la reconnaissance vocale automatique, comme base de travail et pour gagner du temps.

La voie est donc vers des plateformes qui fournissent le travail d’un algorithme de reconnaissance, avec le travail d’un professionnel de la transcription. Cette collaboration peut aller encore plus loin, si l’on décide de nourrir cet algorithme de données des transcriptions humaines. Le machine learning permet alors de capter et mémoriser les subtilités de la langue repérées par les professionnels.





 
 
 

Commentaires


Post: Blog2_Post

©2021 par Matahi TEHEIURA. Créé avec Wix.com

bottom of page