Whisper
Whisper est un système de reconnaissance de la parole (ASR) développé par OpenAI, utile pour la transcription de fichiers audio.
Le LabDHN a mis au point deux scripts utilisant le langage de programmation Python qui vous permettent d’interpeller la librairie Whisper et de transcrire des fichiers audio sans avoir besoin de connaissances préalables en programmation. Ceci est rendu possible par l’utilisation de carnets de programmation Jupyter et de l’espace de travail de Google Colaboratory. Veuillez suivre les liens suivants pour consulter lesdits scripts et leur guide d’utilisation respectif pour commencer le traitement de vos fichiers. Veuillez noter que les guides d’utilisation des scripts du LabDHN assument que vous avez préalablement consulté le guide d’utilisation des carnets Jupyter pour vous familiariser avec l’interface de Colab et les carnets de code :
-Liens vers le script de transcription audio simple et son guide d’utilisation.
-Liens vers le script de transcription audio avancée et son guide d’utilisation.
Catégorie
- Script
Étape
- Pré-traitement
Types d'accès
- Disponible au laboratoire HN-UQAM
- Gratuit
Types de données
- Audiovisuel
- Multimédia
Niveau de complexité
Simple
Site internet de l'outil
