Comparación forense de voces (Parte 3)

Diferencias intrahablante. Análisis de la manera en que varían los coeficientes MFCC Mel para ocho repeticiones coeteris paribus, es decir el mismo hablante repitiendo la misma palabra grabado por el mismo equipo, en el mismo tiempo y lugar. Variando únicamente la forma, entonación y energía con la que se pronuncia la palabra.

Este procedimiento es parte de una metodología de comparación de voces.

1. Abrir el aplicativo Praat.
2. Dirigirse al menú superior:
New > Record mono sound ... (Ctrl - R)
3. Modificar el campo Name ubicado en la porción inferior derecha de la ventana.
Colocar el nombre: TemaVariasVeces, ya que se repetirá ocho veces la palabra Tema.
4. Oprimir el botón:
Record
Y luego repetir ocho veces la palabra Tema buscando realizar distintas entonaciones de la misma.
5. Al finalizar, oprimir el botón:
Save to list & close
En la ventana de objetos de Praat aparecerá una nueva entrada de nombre sound TemaVariasVeces
6. Seleccionar la entrada del punto anterior y oprimir el botón:
View & Edit
7. Utilizando el mouse hacer click y mantener apretado sobre la ventana seleccionando la primera repetición de la palabra Tema. La misma se resalta con color rosa claro.
8. Dirigirse al menú superior:
File > Extract selected sound (time from 0)
Generará un nuevo objeto con nombre untitled. De momento mantendrá ese nombre.
9. Realizar nuevamente los pasos 7 y 8 para el resto de las repeticiones de la palabra Tema hasta que la ventana de objetos posea ocho archivos de nombre untitled. Luego cerrar la ventana de modo edición y dirigirse a la ventana principal de Praat.
10. Renombrar objetos:
10.1. Seleccionar el primer objeto de nombre sound untitled. Luego dirigirse a la botonera ubicada en la porción inferior de la ventana y seleccionar:
Rename...
10.2. En la casilla de texto donde dice untitled marcar el texto y reemplazarlo por el número 1.
10.3. Repetir los pasos 10.1 y 10.2 incrementando el número en uno cada vez. De manera tal que al final se posean ocho objetos: sound 1, sound 2, sound 3, ..., sound 8.
11. Calcular los coeficientes Mel promedio para los ocho sonidos a la vez
11.1. Marcar el primer sonido sound 1 haciendo click sobre el mismo.
11.2. Dirigirse al último sonido sound 8 y hacer click sobre el mismo oprimiendo a la vez la tecla Shift del teclado.
Se observa que los ocho sonidos se encuentran marcados.
11.3. Dirigirse a la botonera de la derecha de la ventana y seleccionar:
Analyse Spectrum ... > To MFCC ...
Dejar los valores por defecto y presionar OK en la ventana emergente.
Se observa que se generan ocho nuevos archivos con los nombres MFCC 1, MFCC 2, ... , MFCC8
11.4. Seleccionar estos ocho nuevos archivos MFCC mediante Click de mouse y Shift Click.
11.5. En la botonera ubicada a la derecha seleccionar:
To TableOfReal...
Se generarán ocho archivos TableOfReal 1 al 8 y quedarán por defecto seleccionados.
11.6. Manteniendo la nueva selección, dirigirse a la botonera derecha al menú:
Multivariate Statistics > To TableOfReal (medians by row labels)...
Se generarán ocho archivos de nombre TableOfReal 1_byrowlabels al TableOfReal 8_byrowlabels, los cuales quedarán seleccionados por defecto. Este comando obtiene la mediana de cada coeficiente c1 a c12.
11.7. Manteniendo la nueva selección, dirigirse a la botonera derecha y al menú:
Synthesize > Append
Ahora se generará un único archivo de nombre TableOfReal appended. El que contendrá una tabla con las medianas de cada archivo para los coeficientes c1 al c12.
11.8. Exportar los datos a csv.
11.8.1. Seleccionar el archivo TableOfReal appended y dirigirse al menú superior:
Save > Save as headerless spreadsheet file ...
11.8.2. Colocar el nombre de appended.csv y guardarlo en el escritorio.
11.8.3. Abrirlo con Excel o Libreoffice Calc, reemplazar el símbolo . (punto) por , (coma) de corresponder y luego proceder a copiar la tabla y pegarla transpuesta en nueva hoja.
11.8.4. Seleccionar todos los datos y generar un gráfico de líneas.
Se observará un resultado similar al que se muestra en la imagen a continuación:

Se observa convergencia en los valores de mediana de todos los coeficientes MFCC. En el último archivo de sonido, se procuró cambiar la entonación marcando prolongadamente la letra e de la palabra Tema pronunciada. Lo que resultó en una ligera diferencia en los coeficientes c2, c3 y c5 (ver Columna H de color verde claro).
En razón de ello, en una comparación forense de voces, debe procurarse comparar palabras que se encuentren pronunciadas de la misma manera. Caso contrario, es recomendable utilizar otras metodologías y no tanto la metodología estadística.

Volver al inicio

Peritajes en Informática

Buscar este blog

Comparación forense de voces (Parte 3)

Comentarios

Publicar un comentario