Whisper

Whisper est un système de reconnaissance de la parole (ASR) développé par OpenAI, utile pour la transcription de fichiers audio.

Le LabDHN a mis au point deux scripts utilisant le langage de programmation Python qui vous permettent d’interpeller la librairie Whisper et de transcrire des fichiers audio sans avoir besoin de connaissances préalables en programmation. Ceci est rendu possible par l’utilisation de carnets de programmation Jupyter et de l’espace de travail de Google Colaboratory. Veuillez suivre les liens suivants pour consulter lesdits scripts et leur guide d’utilisation respectif pour commencer le traitement de vos fichiers. Veuillez noter que les guides d’utilisation des scripts du LabDHN assument que vous avez préalablement consulté le guide d’utilisation des carnets Jupyter pour vous familiariser avec l’interface de Colab et les carnets de code :

-Liens vers le script de transcription audio simple et son guide d’utilisation.
-Liens vers le script de transcription audio avancée et son guide d’utilisation.

Catégorie

Script

Étape

Pré-traitement

Types d'accès

Disponible au laboratoire HN-UQAM
Gratuit

Types de données

Audiovisuel
Multimédia

Niveau de complexité

Simple

Site internet de l'outil