Peritajes en Informática

Entradas

Mostrando entradas de marzo, 2020

Metodología para realizar una comparación forense de voces paso a paso

El presente procedimiento muestra una metodología a seguir paso a paso para realizar una comparación forense de voces. Este procedimiento está escrito para ser realizado por cualquier persona con la especialidad de informática, electrónica, audio o video.- Software utilizado para realizar la comparación: a. Praat ( http://www.fon.hum.uva.nl/praat/ ) b. Sonic Visualizer ( https://www.sonicvisualiser.org/download.html ) c. Ffmpeg ( https://www.ffmpeg.org/ ) Es conveniente utilizar alguno de los estándares internacionales para comparación de voces. A modo de ejemplo, la American Board of Recorded Evidence publicó un estándar para comparación de voces: https://informaticayperitajes.blogspot.com/2022/05/american-board-of-recorded-evidence.html El estándar determina como Identificación (Identification) a lo siguiente: Identificación. Al menos el 90% de todas las palabras comparables deben tener características orales y espectrales muy similares, produciendo no menos

Comparacion forense de voces (Parte 5)

Para el caso de sonidos muy ruidosos, donde el ruido abarca todas las frecuencias incluidas las de la voz, es posible utilizar metodologías matemáticas para recuperar la señal de audio que se desea peritar. A continuación se genera un archivo ruidoso de laboratorio, se lo procesa y se realiza una comparación de voces. Este procedimiento es parte de una metodología de comparación de voces . 1. Abrir el aplicativo Praat. Dirigirse al menú superior: New > Sound > Create sound from formula... En el campo formula colocar: randomGauss(0,0.5) Lo que significa ruido en todas las frecuencias con una amplitud del 50%. 2. Oprimir OK para que se generare el archivo, el cual poseerá el nombre: sineWithNoise Se generará un archivo de nombre sound sineWithNoise En este caso, solamente se tratará de Noise. La parte de la señal de voz se incorporará a continuación. 3. Grabar audio a procesar 3.1. Pronunciar la letra A sostenidamente por un segundo. Para ello dirigirse al menú supe

Autocorrelación de audios

Para audios que poseen ruido con intensidades por encima de las del habla, es posible utilizar funciones matemáticas para transformar las señales de audio y obtener información significativa. Para comprender el concepto, se realiza el presente laboratorio donde se parte de un audio que posee una dosis de ruido cinco veces superior a la de la señal. Este procedimiento es parte de una metodología de comparación de voces . 1. Abrir el aplicativo Praat y dirigirse al menú superior: New > Sound > Create Sound from formula ... 2. En la casilla Fromula colocar lo siguiente: 0.1 * sin(2*pi*1500*x) + randomGauss(0,0.5) Esto generará un tono de 1500 Hz junto con ruido blanco (similar al ruido que produce una radio mal sintonizada). 3. Oprimir Ok. Aparecerá un nuevo objeto llamado sound SineWithNoise. 4. Marcar el objeto sound SineWithNoise y dirigirse a la botonera ubicada a la derecha: View & Edit y luego en el menú superior: Spectrum: verificar que se encuentre marca

Comparacion forense de voces (Parte 4)

En numerosas ocasiones el hablante posee muletillas que llenan silencios, v.gr. luego de una palabra, mientras piensa la que sigue puede decir sostenidamente una vocal: eh..., ah..., y... Estas muletillas deben ser identificadas y comparadas contra el archivo de audio de vocales indubitado. Si bien es posible realizar una comparación mediante Transformada Q , por tratarse de vocales puras, es posible graficarlas en un mapa de formantes . Este procedimiento es parte de una metodología de comparación de voces . A continuación se muestra el procedimiento para realizar esta comparación mediante Praat. 1. Del audio dubitado, identificar la vocal sostenida a comparar. Para ello aplicar las técnicas descriptas en la Parte 1 de la comparación forense. Colocar nombre al archivo: A dubitado. 2. Del audio indubitado repetir el paso 1. Colocar nombre al archivo: A indubitado. 3. En el listado de objetos de Praat seleccionar ambos audios: dubitado e indubitado. Dirigirse a la botonera

Triángulo vocálico con Praat

El triángulo vocálico se conforma a partir de la pronunciación de las cinco vocales del idioma español. Para ello se requiere un archivo de audio en el cual de manera secuencial se pronuncia sostenidamente cada una de las vocales. A continuación el procedimiento para graficar el triángulo vocálico de una determinada persona. Este procedimiento es parte de una metodología de comparación de voces . 1. Generar un archivo con todas las vocales. 1.1. Abrir Praat y dirigirse al menú superior: New > Record mono Sound ... Se despliega una nueva ventana. 1.2. En la casilla de texto Name ubicada abajo a la derecha colocar el nombre aeiou y oprimir el botón: Record para comenzar la grabación. 1.3. Pronunciar sostenidamente las vocales desde la a hasta la u dejando una pequeña pausa en cada una de ellas. Una vez finalizado oprimir el botón: Stop y luego Save to list & Close En la ventana principal aparecerá un nuevo objeto de nombre sound aeiou 1.4. Marcar el objeto sound ae

Comparación forense de voces. Espectrograma Mel.

El espectrograma Mel posee características similares a la transformada Q con la particularidad de poder realizar estadísticas a partir de los coeficientes MFCC . A continuación se muestra la manera en que se obtiene el gráfico de un Espectrograma Mel utilizando el software Praat. Asimismo se realiza una comparación gráfico-visual de dos archivos de audio, uno dubitado y uno indubitado. Para ello debemos contar con los siguientes materiales: Este procedimiento es parte de una metodología de comparación de voces . a. Archivo de audio indubitado donde la persona pronuncia la palabra Es. Nombre del archivo: IndubitadoEs.wav b. Archivo de audio dubitado donde se pronuncia la palabra Es. Nombre del archivo: DubitadoEs.wav 1. Abrir el aplicativo Praat. Dirigirse al menú superior: Open > Read from file... (Ctrl - O) Seleccionar los archivos IndubitadoEs.wav y DubitadoEs.wav 2. Marcar con el mouse y la tecla Ctrl o Shift ambos archivos y luego, en la botonera de la derecha se

Identificación de voces. Distancia euclideana

La identificación de voces es una metodología matemático estadística que permite valorar numéricamente la diferencia entre las diferentes voces puestas a disposición. Para calcular la misma se debe primero realizar el siguiente procedimiento: Extraer coeficientes MFCC promedio Este procedimiento es parte de una metodología de comparación de voces . A continuación se lista el procedimiento para realizar el cálculo de la distancia euclideana de los coeficientes c1 a c12 entre las ocho voces, tomadas entre las voces 2 a 8 respecto de la primera (voz 1). En primer lugar consideremos la distancia euclideana o hipotenusa (h) para el triángulo de dos dimensiones. 12. Realizar el cálculo de las distancias euclideanas entre las muestras 2 a 8 y la muestra 1. 12.1. Calcular el cuadrado de la distancia dc1 ^ 2 = ( c1(2) - c1(1) ) ^ 2 donde: c1(2) corresponde a la mediana del coeficiente c1 de la muestra 2. c1(1): Mediana del coeficiente c1 de la muestra 1. c1(2)-c1(1): Difere

Comparación forense de voces (Parte 3)

Diferencias intrahablante. Análisis de la manera en que varían los coeficientes MFCC Mel para ocho repeticiones coeteris paribus , es decir el mismo hablante repitiendo la misma palabra grabado por el mismo equipo, en el mismo tiempo y lugar. Variando únicamente la forma, entonación y energía con la que se pronuncia la palabra. Este procedimiento es parte de una metodología de comparación de voces . 1. Abrir el aplicativo Praat. 2. Dirigirse al menú superior: New > Record mono sound ... (Ctrl - R) 3. Modificar el campo Name ubicado en la porción inferior derecha de la ventana. Colocar el nombre: TemaVariasVeces, ya que se repetirá ocho veces la palabra Tema. 4. Oprimir el botón: Record Y luego repetir ocho veces la palabra Tema buscando realizar distintas entonaciones de la misma. 5. Al finalizar, oprimir el botón: Save to list & close En la ventana de objetos de Praat aparecerá una nueva entrada de nombre sound TemaVariasVeces 6. Seleccionar la entrada del punto

Obtención de coeficientes Mel MFCC mediante Praat

Los coeficientes Mel MFCC pueden ser utilizados para comparación de voces con metodologías tanto gráficas como estadísticas. A continuación se muestra un procedimiento paso a paso para obtener los coeficientes MFCC promedio para una palabra determinada. Este procedimiento es parte de una metodología de comparación de voces . 1. Abrir el programa Praat. Si no se lo tiene instalado, descargarlo de: http://www.fon.hum.uva.nl/praat/ 2. En el menú superior dirigirse a: New > Record mono sound (Ctrl - R) 3. En la casilla abajo a la izquierda reemplazar el nombre por defecto: untitled por el de la palabra a pronunciar: Serena 4. Oprimir el botón Record y decir la palabra Serena. 5. Una vez pronunciada la palabra oprimir el botón Stop. 6. Oprimir Play y verificar que la palabra fue íntegramente grabada. Es posible que por el retardo en grabar o por el apuro en hablar, la primera parte de la palabra no se grabe. En tal caso, repetir los pasos 4 y 5 hasta obtener una palabra

Comparación forense de voces (Parte 2)

Realizar los procedimientos listados a continuación: a. Extraer las palabras a peritar. Mediante este procedimiento b. Configurar la herramienta Sonic Visualizer con transformada Q constante. Mediante este procedimiento. Una vez realizados los pasos anteriores, es posible efectuar la primera comparación forense de voces en frecuencia a partir del método gráfico. Este procedimiento es parte de una metodología de comparación de voces . 1. Abrir la herramienta Sonic Visualizer. 2. Abrir el archivo (palabra).wav, en este caso tambien.wav dubitado u ofrecido como prueba. 3. Dirigirse al menú Transform > Recent Transforms > CQ Constant-Q Spectrogram (Hz range) (CTRL + T) 4. En caso de no encontrarse disponible la opción, dirigirse al menú: Transform > Find a transform (CTRL + M) En la casilla de texto colocar lo siguiente: CONSTANT Q HZ y seleccionar la primera opción: CQ Constant-Q Spectrogram (Hz range) 5. En el menú Plugin parameters dejar las opciones por de

Configurar herramienta Sonic Visualizer para Transformada Q

Este procedimiento indica la manera en que se debe configurar la herramienta Sonic Visualizer para que la misma funcione con la transformada de Q constante denominada CQ Constant-Q Spectrogram (Hz range) para ello: Este procedimiento es parte de una metodología de comparación de voces . 1. Descargar el aplicativo Sonic Visualizer: https://www.sonicvisualiser.org/download.html Elegir el sistema operativo 32 o 64 bits. Para el caso de Win32 descargará el siguiente archivo. sonic-visualiser-4.0.1-win32.msi. (Ubuntu: $ sudo apt install sonic-visualiser. Si devuelve error de bibliotecas, ejecutar el comando para forzar instalación de las mismas.) 2. Instalar el aplicativo Sonic Visualizer. Ejecutar el archivo sonic-visualiser-4.0.1-win32.msi y seguir los pasos indicados por el instalador. 3. Instalar Vamp plugin genérico. 3.1. Dirigirse al sitio: https://code.soundsoftware.ac.uk/projects/constant-q-cpp/files Y seleccionar la descarga cqvamp-win32-v1.1.0.1.zip, o

Comparación forense de voces (parte 1)

Si el audio es de varios minutos y no se encuentra en formato wav realizar lo siguiente. Este procedimiento es parte de una metodología de comparación de voces . 2. Cortar archivo de audio 2.1. Utilizar el archivo ffmpeg.exe 2.1.1. Suponiendo que el archivo original se llama Nota de voz 004.m4a (grabado con un dispositivo celular) y se desea cortar desde la posición un minuto veinte segundos hasta un minuto cuarenta segundos: Ejecutar la sentencia: C:\Users\julie\Desktop\Conversor>ffmpeg -i "Nota de voz 004.m4a" -ss 00:01:20 -to 00:01:40 -c copy "Nota de voz 004_1.m4a" 2.1.2. Convertir el resultado a formato wav mediante el siguiente comando: C:\Users\julie\Desktop\Conversor>ffmpeg -i "Nota de voz 004_1.m4a" "Nota de voz 004.wav" 2.1.3. Es posible realizar ambas acciones en un solo paso mediante el siguiente comando: C:\Users\julie\Desktop\Conversor>ffmpeg -i "Nota de voz 004.m4a" -ss 00:01:20 -to 00:01:4

Peritaje de metadatos de imágenes y archivos de oficina

Los metadatos contienen información susceptible de ser comparada y analizada. A continuación se muestran dos sitios web donde se pueden peritar rápidamente archivos de manera individual. 1. Imágenes: http://imageedited.com/ 2. Todos los archivos: https://www.metadata2go.com/ Para realizar comparaciones entre varios archivos se deben utilizar metodologías offline las que se incluirán luego en este post.