Ir al contenido principal

Obtención de coeficientes Mel MFCC mediante Praat

Los coeficientes Mel MFCC pueden ser utilizados para comparación de voces con metodologías tanto gráficas como estadísticas. A continuación se muestra un procedimiento paso a paso para obtener los coeficientes MFCC promedio para una palabra determinada.

Este procedimiento es parte de una metodología de comparación de voces.

1. Abrir el programa Praat. Si no se lo tiene instalado, descargarlo de:
http://www.fon.hum.uva.nl/praat/

2. En el menú superior dirigirse a:
New > Record mono sound (Ctrl - R)

3. En la casilla abajo a la izquierda reemplazar el nombre por defecto: untitled por el de la palabra a pronunciar: Serena

4. Oprimir el botón Record y decir la palabra Serena.

5. Una vez pronunciada la palabra oprimir el botón Stop.

6. Oprimir Play y verificar que la palabra fue íntegramente grabada. Es posible que por el retardo en grabar o por el apuro en hablar, la primera parte de la palabra no se grabe. En tal caso, repetir los pasos 4 y 5 hasta obtener una palabra completa.

7. Una vez realizada la grabación oprimir el botón:
Save to list & Close.
En el listado de objetos de Praat figurará una nueva entrada con el nombre Sound Serena.

8. En la botonera de la derecha dirigirse al menú:
Analyse spectrum > To MFCC...
Se abrirá una nueva ventana con opciones. Dejar los valores por defecto y oprimir OK.
Aparecerá un nuevo objeto de nombre MFCC Serena en el listado de objetos de Praat.

9. En la botonera de la derecha recientemente actualizada dirigirse al menú:
ToTableOfReal...
Dejar la opción por defecto y oprimir OK. En la ventana de objetos de Praat aparecerá uno nuevo llamado TableOfReal Serena.

10. (Opcional) Visualizar los datos de los coeficientes
10.1. Dirigirse al menú superior
Save > Save as headerless speadsheet file...
Guardar el archivo con el nombre Serena.csv y abrirlo con Excel, Libreoffice Calc o similar.
10.2. Observar que aparecen doce columnas denominadas C1 a C12 y varios cientos de filas las que muestran la evolución de los coeficientes con el tiempo.

11. Calcular el promedio de los coeficientes.
11.1. Dirigirse a la botonera lateral
Multivariate Statistics - > To TableOfReal (medians by row tables)...
11.2. Asegurarse de que la casilla Expand se encuentra destildada (no tildada).
11.3. Oprimir OK. Aparecerá un nuevo objeto denominado:
TableOfReal Serena_byrowlabels
Este objeto posee los promedios para cada uno de los coeficientes. A este objeto es posible exportarlo para graficar en software de planilla de cálculos (11.4) o bien graficar con la herramienta propia de Praat (11.5)

11.4. Graficar utilizando planilla de cálculos
11.4.1. Marcar el objeto TableOfReal Serena_byrowlabels haciendo click sobre el mismo.
11.4.2. En el menú superior seleccionar:
Save > Save as headerless spreadsheet file...
11.4.3. Colocar el nombre serena_byrowlabels.csv y almacenarlo en el escritorio (Desktop)
11.4.4. Abrir el archivo csv con Excel o Libreoffice Calc. Seleccionar separador de campos como tabulador (Tab).
11.4.5. De ser necesario reemplazar el caracter . (punto) por , (coma).
11.4.6. Marcar las doce celdas y graficar. Aparecerá un gráfico como el que se muestra en la parte superior.

11.5. Graficar utilizando Praat Draw
11.5.1. Marcar el objeto TableOfReal Serena_byrowlabels haciendo click sobre el mismo.
11.5.2. En la botonera derecha seleccionar:
Convert > To Matrix ...
Aparecerá un nuevo objeto de nombre Matrix Serena_byrowlabels
11.5.3. Seleccionar dicho objeto y luego en la botonera derecha:
Draw > Draw Rows ...
Modificar el parametro 1 (From x): 1
Modificar el parámetro 2 (To x): 12
Y luego presionar OK.
11.5.4. Aparecerá un gráfico como el que se muestra en la parte inferior de la siguiente imagen.



Volver al inicio


Comentarios