Ir al contenido principal

Detección de deepfakes aplicada a notas de voz de WhatsApp

 Deepfakes y Notas de Voz de WhatsApp: Desafíos y Soluciones en la Era de la Inteligencia Artificial

Puede ver el video explicativo: https://youtu.be/oSa-KYYmqvA

O bien continuar leyendo...

En la era de la inteligencia artificial (IA) y los deepfakes, las notas de voz de WhatsApp se han convertido en un punto focal para la investigación forense y las antiforencias. Este artículo aborda las particularidades de estos archivos de audio, los desafíos que presentan en términos de confiabilidad y los medios técnicos disponibles para su análisis, todo ello en el marco de lo establecido por el Código Civil y Comercial de la Nación Argentina (CCCN), específicamente el artículo 319.

Confiabilidad del Soporte y Valor Probatorio

El artículo 319 del CCCN establece que el juez debe asignar valor probatorio a los registros visuales y auditivos considerando su congruencia con otras pruebas y su confiabilidad. En este contexto, la confiabilidad del soporte utilizado ha sido severamente cuestionada debido al auge de la IA y los deepfakes. Estos permiten transformar texto en voz o modificar una voz para que imite el timbre de otra persona, dificultando la identificación de grabaciones genuinas.

Herramientas de Antiforencia

En este estudio se analizaron seis herramientas principales de antiforencia:

ElevenLabs: Permite cargar una voz de referencia y generar audio a partir de texto escrito.

Fish Speech: Una herramienta local que no requiere servicios en la nube.

Resemble AI: Especializada en transformaciones de texto a voz y voz a voz.

Vidnoz: Focalizada en la clonación de voces.

Speechify: Incluye requisitos contractuales que obligan a certificar la autorización para usar la voz clonada.

Play HD: Similar a Speechify en sus restricciones legales.

Cabe destacar que Fish Speech es la única herramienta utilizada de manera local, mientras que las demás operan en la nube y exigen declaraciones juradas para garantizar el uso ético de las voces.

Metodologías de Detección

Se implementaron cuatro metodologías para diferenciar archivos genuinos de deepfakes:

Análisis Hexadecimal (Hexdump): Examina los bits de los archivos y encuentra áreas de similitud y discrepancia entre grabaciones fidedignas y apócrifas. En este caso, las áreas rojas indican diferencias que ayudan a identificar archivos falsificados.

Análisis de Metadatos: Compara las características de archivos generados por WhatsApp en Android, iOS o su versión web. Los deepfakes suelen carecer de marcas de origen legítimas, como extensiones Opus típicas de WhatsApp.

Análisis Estructural: Utiliza un esquema XML para identificar diferencias inherentes en los archivos. Un programa en Python permite realizar comparaciones rápidas sobre una gran cantidad de datos.

Comparación Forense de Voces: Analiza parámetros acústicos de forma automática, identificando diferencias en el timbre y la frecuencia de las voces clonadas. Aunque los análisis perceptuales manuales complementan esta metodología, el enfoque automático resulta clave para manejar grandes volúmenes de datos.

Resultados del Estudio

Los análisis demostraron que los deepfakes pueden disfrazarse como notas de voz de WhatsApp mediante la conversión de archivos WAV a Opus. Sin embargo, las herramientas y metodologías aplicadas permitieron identificar sistemáticamente y por medios automáticos todas las falsificaciones. Las diferencias estructurales, metadatos ausentes y anomalías en los parámetros acústicos resultaron determinantes para la detección.

Reflexiones Finales

El avance de la IA y los deepfakes plantea desafíos significativos para la confiabilidad de los soportes digitales en procesos judiciales. Este estudio demuestra que, aunque estas tecnologías pueden ser utilizadas para falsificar evidencias, también existen herramientas y metodologías eficaces para garantizar la autenticidad de los archivos de audio.

En un contexto donde las notas de voz de WhatsApp son cada vez más comunes como prueba, es imprescindible continuar desarrollando y perfeccionando herramientas automáticas y sistemas de detección que permitan separar la paja del trigo. La colaboración entre expertos en antiforencia, juristas y desarrolladores de tecnología será clave para enfrentar estos retos.

Este artículo es una muestra del potencial de la investigación forense en un mundo digitalizado, donde la confianza en la evidencia se construye sobre el análisis riguroso y la innovación constante.

Comentarios