personne qui utilise un ordinateur

Les outils de transcription audio à l’UNIL

Les outils d’automatisation de la transformation d’audio en texte sont nombreux, et possèdent chacun leurs avantages et leurs limites. Petit tour d’horizon des solutions disponibles à l’UNIL… et ailleurs.

Transcription, qu’est-ce que c’est au juste ?

La transcription audio, l’OCR (reconnaissance optique de caractères), le text-to-speech (synthèse vocale) et les commandes vocales sont des technologies qui traitent et transforment des informations sous différentes formes, et dans différents sens.

La transcription audio consiste à convertir des enregistrements sonores en texte, souvent utilisée pour les interviews ou les réunions, alors que l’OCR permet de convertir des documents imprimés ou manuscrits en texte numérique, facilitant ainsi l’édition et la recherche.

Dans l’autre sens, le text-to-speech transforme du texte en voix synthétique, rendant le contenu accessible à ceux qui rencontrent des difficultés de lecture ou à ceux qui préfèrent écouter plutôt que lire, et les commandes vocales impliquent la compréhension et l’exécution d’instructions données par la voix, permettant aux utilisateurs d’interagir avec des appareils sans toucher.

Dans cet article, nous nous concentrons sur les outils de transcription audio. Chaque outil a ses avantages et ses inconvénients. Néanmoins, ce qu’il faut retenir peu importe l’outil, c’est que la transcription ne sera jamais parfaite : de manière générale, l’outil sera toujours moins bon qu’un être humain : si vous avez du mal à comprendre quelque chose, l’outil aura davantage de mal à le comprendre. La qualité de l’enregistrement est primordiale pour une transcription réussie, et il faudra tout de même réaliser au moins une écoute/relecture du résultat produit.

Des solutions disponibles à l’UNIL…

A l’UNIL, deux outils de transcription sont disponibles, Microsoft Word pour les données administratives et d’enseignement, Corv pour les données de recherche.

Note : pour rappel, il existe un outil pour choisir le bon service de stockage en fonction de vos données.

Microsoft Word

Microsoft Word propose un outil pour transcrire les données administratives et d’enseignement, directement depuis le Cloud Microsoft. Pour accéder à cette fonctionnalité, il faut se rendre sur la version web de Word, et utiliser le volet de retranscription. Nous avons publié un article avec la marche à suivre, les avantages et les inconvénients sur notre blog.

Corv

Corv est un outil hébergé à l’UNIL pour transcrire les données de recherche. Accessible uniquement depuis le réseau de l’UNIL ou via le VPN de l’UNIL, ce dernier est notamment adapté pour les données personnelles sensibles, et les données concernant la recherche sur le corps humain. Nous avons publié un article avec la marche à suivre, les avantages et les inconvénients sur notre blog.

… et ailleurs !

Bien entendu, il existe de nombreuses autres solutions de transcription, couvrant des besoins différents que les outils proposés à l’UNIL. Nous pouvons vous proposer de consulter une de ces listes, maintenue par la communauté.

Veuillez noter que les solutions institutionnelles sont les seules supportées officiellement ; en raison de la diversité et de la vitesse de l’évolution des solutions en dehors de l’UNIL, nous ne pouvons pas réaliser du support individuel pour chaque solution.

Il faut garder en tête que tous les outils ne peuvent pas être utilisés pour tous les types de données. Pour des données critiques, comme par exemple des données médicales, la loi suisse veut qu’une traçabilité complète soit réalisée, ce qui n’est généralement pas possible avec les solutions Cloud. Le help desk est à votre disposition en cas de question sur le sujet.