Ir al contenido principal

Identificación de voces. Distancia euclideana

La identificación de voces es una metodología matemático estadística que permite valorar numéricamente la diferencia entre las diferentes voces puestas a disposición. Para calcular la misma se debe primero realizar el siguiente procedimiento:

Extraer coeficientes MFCC promedio

Este procedimiento es parte de una metodología de comparación de voces.


A continuación se lista el procedimiento para realizar el cálculo de la distancia euclideana de los coeficientes c1 a c12 entre las ocho voces, tomadas entre las voces 2 a 8 respecto de la primera (voz 1).

En primer lugar consideremos la distancia euclideana o hipotenusa (h) para el triángulo de dos dimensiones.



12. Realizar el cálculo de las distancias euclideanas entre las muestras 2 a 8 y la muestra 1.
12.1. Calcular el cuadrado de la distancia dc1 ^ 2 = ( c1(2) - c1(1) ) ^ 2  donde:
c1(2) corresponde a la mediana del coeficiente c1 de la muestra 2.
c1(1): Mediana del coeficiente c1 de la muestra 1.
c1(2)-c1(1): Diferencia entre los valores c1 de ambas muestras
( c1(2) - c1(1) ): Variación del coeficiente c1 para ambas muestras.
12.2. Repetir el cálculo para el resto de las muestras. En este ejemplo la muestra 3 respecto de la 1.
( c1(3) - c1(1) ) ^ 2

A finalizar este paso tendremos los cuadrados de las distancias para el coeficiente c1 de las siete voces.-

12.3. Repetir los pasos 12.1 y 12.2 para los coeficientes c2 a c12.

12.4. Realizar las sumas de cada fila (cada voz):
h ^ 2 = dc1 ^ 2 + dc2 ^ 2 + ... + dc12 ^ 2

12.4. Tomar la raiz cuadrada

h = RAIZ (h ^ 2)

Para cada voz obtendremos un h diferente. Observar que existe convergencia entre los distintos h de cada voz. Las palabras que fueron pronunciadas de manera marcadamente diferente presentarán mayores valores de distancia euclideana.

A continuación se muestra el cálculo realizado mediante archivo .xlsx: Descargar Archivo xlsx


Volver al inicio



Comentarios