La identificación de voces es una metodología matemático estadística que permite valorar numéricamente la diferencia entre las diferentes voces puestas a disposición. Para calcular la misma se debe primero realizar el siguiente procedimiento:
Extraer coeficientes MFCC promedio
Este procedimiento es parte de una metodología de comparación de voces.
A continuación se lista el procedimiento para realizar el cálculo de la distancia euclideana de los coeficientes c1 a c12 entre las ocho voces, tomadas entre las voces 2 a 8 respecto de la primera (voz 1).
En primer lugar consideremos la distancia euclideana o hipotenusa (h) para el triángulo de dos dimensiones.
12. Realizar el cálculo de las distancias euclideanas entre las muestras 2 a 8 y la muestra 1.
12.1. Calcular el cuadrado de la distancia dc1 ^ 2 = ( c1(2) - c1(1) ) ^ 2 donde:
c1(2) corresponde a la mediana del coeficiente c1 de la muestra 2.
c1(1): Mediana del coeficiente c1 de la muestra 1.
c1(2)-c1(1): Diferencia entre los valores c1 de ambas muestras
( c1(2) - c1(1) ): Variación del coeficiente c1 para ambas muestras.
12.2. Repetir el cálculo para el resto de las muestras. En este ejemplo la muestra 3 respecto de la 1.
( c1(3) - c1(1) ) ^ 2
A finalizar este paso tendremos los cuadrados de las distancias para el coeficiente c1 de las siete voces.-
12.3. Repetir los pasos 12.1 y 12.2 para los coeficientes c2 a c12.
12.4. Realizar las sumas de cada fila (cada voz):
h ^ 2 = dc1 ^ 2 + dc2 ^ 2 + ... + dc12 ^ 2
12.4. Tomar la raiz cuadrada
h = RAIZ (h ^ 2)
Para cada voz obtendremos un h diferente. Observar que existe convergencia entre los distintos h de cada voz. Las palabras que fueron pronunciadas de manera marcadamente diferente presentarán mayores valores de distancia euclideana.
A continuación se muestra el cálculo realizado mediante archivo .xlsx: Descargar Archivo xlsx
Volver al inicio
Extraer coeficientes MFCC promedio
Este procedimiento es parte de una metodología de comparación de voces.
A continuación se lista el procedimiento para realizar el cálculo de la distancia euclideana de los coeficientes c1 a c12 entre las ocho voces, tomadas entre las voces 2 a 8 respecto de la primera (voz 1).
En primer lugar consideremos la distancia euclideana o hipotenusa (h) para el triángulo de dos dimensiones.
12. Realizar el cálculo de las distancias euclideanas entre las muestras 2 a 8 y la muestra 1.
12.1. Calcular el cuadrado de la distancia dc1 ^ 2 = ( c1(2) - c1(1) ) ^ 2 donde:
c1(2) corresponde a la mediana del coeficiente c1 de la muestra 2.
c1(1): Mediana del coeficiente c1 de la muestra 1.
c1(2)-c1(1): Diferencia entre los valores c1 de ambas muestras
( c1(2) - c1(1) ): Variación del coeficiente c1 para ambas muestras.
12.2. Repetir el cálculo para el resto de las muestras. En este ejemplo la muestra 3 respecto de la 1.
( c1(3) - c1(1) ) ^ 2
A finalizar este paso tendremos los cuadrados de las distancias para el coeficiente c1 de las siete voces.-
12.3. Repetir los pasos 12.1 y 12.2 para los coeficientes c2 a c12.
12.4. Realizar las sumas de cada fila (cada voz):
h ^ 2 = dc1 ^ 2 + dc2 ^ 2 + ... + dc12 ^ 2
12.4. Tomar la raiz cuadrada
h = RAIZ (h ^ 2)
Para cada voz obtendremos un h diferente. Observar que existe convergencia entre los distintos h de cada voz. Las palabras que fueron pronunciadas de manera marcadamente diferente presentarán mayores valores de distancia euclideana.
A continuación se muestra el cálculo realizado mediante archivo .xlsx: Descargar Archivo xlsx
Volver al inicio
Comentarios
Publicar un comentario