Ir al contenido principal

Metodología para realizar una comparación forense de voces paso a paso

El presente procedimiento muestra una metodología a seguir paso a paso para realizar una comparación forense de voces. Este procedimiento está escrito para ser realizado por cualquier persona con la especialidad de informática, electrónica, audio o video.-

Software utilizado para realizar la comparación: 


Es conveniente utilizar alguno de los estándares internacionales para comparación de voces. A modo de ejemplo, la American Board of Recorded Evidence publicó un estándar para comparación de voces:

El estándar determina como Identificación (Identification) a lo siguiente:

Identificación. Al menos el 90% de todas las palabras comparables deben tener características orales y espectrales muy similares, produciendo no menos de veinte (20) palabras coincidentes. Cada palabra debe tener tres (3) o más formantes utilizables. Este nivel de confianza no está permitido cuando hay manipulación electrónica de la voz en cualquiera de las muestras, o los audios tienen más de seis (6) años de diferencia.-

La identificación es el nivel más alto de confianza ofrecido por el estandar. A continuación se colocan los hipervínculos de acceso para cada uno de los pasos a seguir.

Asimismo es recomendable efectuar comparaciones de sonidos puros por ejemplo a través del análisis multidimensional de las pausas llenas.
https://www.researchgate.net/publication/270005905_Comparacion_forense_de_voces_mediante_el_analisis_multidimensional_de_las_pausas_llenas 

1. Preprocesado, conversión y corte de audio. En este post se muestra una forma de cortar y convertir audios utilizando ffmpeg y de realizar un preprocesamiento mediante Praat.

2. Realizar la primera comparación utilizando la herramienta Sonic Visualizer. Previamente se debe incorporar un addin de Sonic Visualizer para que posea la funcionalidad de Transformada Q.

3. Realizar una comparación gráfica de los coeficientes Mel (MFCC). Para ello obtener dichos coeficientes mediante esta metodología.

4. Realizar una comparación matemática y estadística calculando la distancia euclideana de los coeficientes promedio obtenidos en el punto anterior.

5. Graficar el espectrograma Mel de cada uno de los audios y realizar las comparaciones visuales.

6. Para las vocales pronunciadas de manera sostenida es posible utilizar la comparación de formantes F1 y F2 gráfica que se emplea para ubicar las vocales en el triángulo vocálico. Siendo que solamente se grafican dos variables de la voz, las conclusiones de esta prueba no son definitivas, sino solo complementarias respecto del análisis general.

7. Para el caso de ambientes ruidosos cuyo ruido se extienda a lo largo de todo el espectro de frecuencia, es posible utilizar métodos matemáticos para eliminar el ruido y poder comparar las señales de voz. Uno de estos métodos consiste en partir de una señal ruidosa dubitada y una señal no ruidosa indubitada y realizar la autocorrelación para cada una de ellas.

8. Final del procedimiento.

Comentarios