Transcribir audios - estado del arte de las alternativas disponibles

Existen varias opciones para realizar esta tarea según las diferentes necesidades y conocimientos prácticos informáticos que posea quien desea realizar esta tarea.

Opción 1: WhatsApp: Transcribeme

Reenviar los mensajes de audio al contacto: +54 9 11 5349-5987

Es gratuito hasta 10 audios por mes.

Se obtiene una muy buena calidad de reconocimiento de audios. Cuando el hablante repite una frase la herramienta lo detecta y no transcribe dos veces.

Opción 2: El sitio es https://riverside.fm/transcription. Esta web le permite subir archivos mp3, wav, mp4, mov, y más.

Opción 3: Para transcribir videos de YouTube es https://www.happyscribe.com/

Opción 4: Subir el video a youtube y aguardar a que la herramienta lo transcriba. Luego descargar la transcripción.

Opción 5: Para desarrolladores.

Python:

https://www.youtube.com/watch?v=SL6qw9-9NEQ

https://github.com/openai/whisper

se instala en $HOME/.local/bin/whisper

se ejecuta python3 whisper audio.opus --model medium --language Spanish

La versión línea de comandos se ejecuta:

for f in *.opus; do whisper "$f" --model large --language Spanish; done

En Google Colab:

!pip install git+https://github.com/openai/whisper.git 

!mkdir audios

%cd /content/audios

!for f in *.opus; do whisper "$f" --model large --language Spanish; done

!zip -r ../audios.zip .

Pronto a salir:

https://sites.research.google/usm/

Peritajes en Informática

Buscar este blog

Transcribir audios - estado del arte de las alternativas disponibles

Comentarios

Publicar un comentario