Transcrire automatiquement un podcast ou la bande son d’une vidéo

J’aime les balados, et j’apprécie aussi les documentaires ou les conférences filmées. Lorsque j’écoute un podcast ou que je visionne une vidéo, j’aime bien en relire le script, notamment lorsque je crois utile de vérifier les affirmations qu’ils contiennent.

Depuis quelques jours, j’ai testé à plusieurs reprises buzz. C’est une application qui permet d’interfacer un contenu audio avec le moteur de reconnaissance vocale proposé par OpenAI, Whisper. Elle fonctionne en particulier sur les. systèmes d’exploitation Linux.

Les résultats sont surprenants. Par exemple, j’ai généré le script d’un documentaire s’intéressant au message de Norman Doidge. J’ai testé aussi un podcast en anglais.

Après avoir extrait la bande son, j’ai fait analyser le fichier audio par buzz. Pour un enregistrement d’une durée de 50 minutes, buzz a mis à peine 40 minutes pour rédiger la transcription. Buzz utilisait le modèle LargeV3 turbo .

Il n’y a que quelques erreurs qui correspondent à des expressions ou à des mots ou portions de phrases. dans lesquelles il existe une proposition homophone avec un dispositif grammaticalement cohérent.

Laisser un commentaire