Whisper

Whisper est un système de reconnaissance de la parole (ASR) développé par OpenAI, utile pour la transcription de fichiers audio.

Le LabDHN a mis au point deux scripts utilisant le langage de programmation Python qui vous permettent d’interpeller la librairie Whisper et de transcrire des fichiers audio sans avoir besoin de connaissances préalables en programmation. Ceci est rendu possible par l’utilisation de carnets de programmation Jupyter et de l’espace de travail de Google Colaboratory. Veuillez suivre les liens suivants pour consulter lesdits scripts et leur guide d’utilisation respectif pour commencer le traitement de vos fichiers. Veuillez noter que les guides d’utilisation des scripts du LabDHN assument que vous avez préalablement consulté le guide d’utilisation des carnets Jupyter pour vous familiariser avec l’interface de Colab et les carnets de code :

-Liens vers le script de transcription audio simple et son guide d’utilisation.
-Liens vers le script de transcription audio avancée et son guide d’utilisation.

Catégorie

  • Script

Étape

  • Pré-traitement

Types d'accès

  • Disponible au laboratoire HN-UQAM
  • Gratuit

Types de données

  • Audiovisuel
  • Multimédia

Niveau de complexité

Simple


Site internet de l'outil