Análisis Perceptual de la Voz: Evaluación de Atributos y Metodología
Introducción
La evaluación perceptual de la voz es una disciplina crucial en la fonética forense, la logopedia, y la investigación de la calidad de la voz. Esta evaluación se basa en la discriminación de atributos perceptuales que pueden correlacionarse con parámetros físicos medibles. En este artículo, exploraremos las escalas utilizadas para esta discriminación, las características perceptuales clave, y cómo se miden y comparan 17 parámetros específicos definidos por Gurlekian J. et. al en su trabajo EVAPER y que son fundamentales en la evaluación de la calidad vocal.
Para cada parámetro se aportará un hipervínculo al artículo sobre cómo efectuar su medición utilizando PRAAT.
Escalas de Evaluación Perceptual
La evaluación de la calidad vocal se realiza a través de escalas que permiten cuantificar las características perceptuales de la voz. Algunas de las escalas más utilizadas incluyen la RASAT brasileña, la CAPE-V americana, y la EVAPER, que se utiliza en diferentes contextos lingüísticos y culturales. Cada una de estas escalas presenta ventajas y desventajas, siendo la EVAPER especialmente destacada por su metodología de "matching", que evita sesgos relacionados con la memoria interna del evaluador.
Atributos Perceptuales y sus Correlatos Físicos
Los atributos perceptuales de la voz incluyen la altura tonal, la sonoridad, la aspereza, la tensión, entre otros. Estos atributos tienen correlatos físicos que se pueden medir con precisión mediante herramientas acústicas. A continuación, se describen los 17 parámetros fundamentales, su correlato físico y la metodología para su medición y comparación.
Metodología para la Medición y Comparación de 17 Parámetros Vocales
1. Altura Tonal (Tonal Height)
Correlato Físico: Frecuencia de vibración de las cuerdas vocales.
Metodología: Se mide la frecuencia fundamental (F0) utilizando un analizador de espectro o software especializado como Praat. Las variaciones en F0 pueden indicar cambios en la altura tonal percibida.
Correlato Físico: Frecuencia de vibración de las cuerdas vocales.
Metodología: Se mide la frecuencia fundamental (F0) utilizando un analizador de espectro o software especializado como Praat. Las variaciones en F0 pueden indicar cambios en la altura tonal percibida.
2. Nivel de Sonoridad (Loudness Level)
Correlato Físico: Intensidad promedio.
Metodología: Se utiliza un medidor de nivel sonoro o software de análisis acústico para calcular la intensidad promedio de la señal vocal. La percepción de la sonoridad se relaciona directamente con la intensidad medida.
Correlato Físico: Intensidad promedio.
Metodología: Se utiliza un medidor de nivel sonoro o software de análisis acústico para calcular la intensidad promedio de la señal vocal. La percepción de la sonoridad se relaciona directamente con la intensidad medida.
3. Variación: Continua o Quebrada (Loudness Contour: Continuous or with Breaks)
Correlato Físico: Continuidad o discontinuidad del contorno de intensidad.
Metodología: Se analiza el contorno de la intensidad a lo largo del tiempo, identificando rupturas o caídas en la energía que puedan correlacionarse con cambios perceptuales.
Correlato Físico: Continuidad o discontinuidad del contorno de intensidad.
Metodología: Se analiza el contorno de la intensidad a lo largo del tiempo, identificando rupturas o caídas en la energía que puedan correlacionarse con cambios perceptuales.
4. Soplo, Aspereza, Astenia-Tensión (Breathiness, Roughness, Asthenia-Strain)
Correlato Físico: Ruido, variación ciclo a ciclo de F0, espectro armónico.
Metodología: Se utilizan medidas como la relación armónico-ruido (HNR) para cuantificar el ruido. El jitter (variación de F0) y el shimmer (variación de amplitud) se calculan para evaluar la aspereza.
Correlato Físico: Ruido, variación ciclo a ciclo de F0, espectro armónico.
Metodología: Se utilizan medidas como la relación armónico-ruido (HNR) para cuantificar el ruido. El jitter (variación de F0) y el shimmer (variación de amplitud) se calculan para evaluar la aspereza.
5. Resonancia: Oral, Nasal, Faríngea (Resonances: Oral or Nasal/Pharyngeal)
Correlato Físico: Espectro de formantes.
Metodología: Se mide la frecuencia y amplitud de los formantes utilizando un análisis espectral. Las variaciones en los formantes pueden indicar resonancias específicas.
Correlato Físico: Espectro de formantes.
Metodología: Se mide la frecuencia y amplitud de los formantes utilizando un análisis espectral. Las variaciones en los formantes pueden indicar resonancias específicas.
6. Timbre: Común vs Opaco/Brillante (Timbre: Common or Dull/Bright)
Correlato Físico: Espectro armónico.
Metodología: Se realiza un análisis de los armónicos del sonido, enfocándose en la distribución espectral para determinar si el timbre es opaco o brillante.
Correlato Físico: Espectro armónico.
Metodología: Se realiza un análisis de los armónicos del sonido, enfocándose en la distribución espectral para determinar si el timbre es opaco o brillante.
7. Temblor (Tremor)
Correlato Físico: Variación de F0 en un rango de 4-5 Hz.
Metodología: Se analiza la modulación en la frecuencia fundamental para identificar el temblor. Este se manifiesta como fluctuaciones periódicas en la curva de F0.
Correlato Físico: Variación de F0 en un rango de 4-5 Hz.
Metodología: Se analiza la modulación en la frecuencia fundamental para identificar el temblor. Este se manifiesta como fluctuaciones periódicas en la curva de F0.
8. Entonación: Típica o Marcada (Intonation: Adequate or Exaggerated)
Correlato Físico: Contorno de F0.
Metodología: Se mide el contorno de F0 a lo largo del discurso para evaluar la entonación. Un análisis detallado permite identificar si la entonación es típica o exagerada.
Correlato Físico: Contorno de F0.
Metodología: Se mide el contorno de F0 a lo largo del discurso para evaluar la entonación. Un análisis detallado permite identificar si la entonación es típica o exagerada.
9. Ritmo silábico, velocidad (Rhythm Speed)
Correlato Físico: Número de sílabas por unidad de tiempo.
Metodología: Se calcula la tasa de sílabas por segundo, analizando el ritmo del habla. La velocidad de producción de sílabas se correlaciona con la percepción del ritmo.
Correlato Físico: Número de sílabas por unidad de tiempo.
Metodología: Se calcula la tasa de sílabas por segundo, analizando el ritmo del habla. La velocidad de producción de sílabas se correlaciona con la percepción del ritmo.
10. Acentos: Esperados o Extraños (Lexical/Tonal Accents: Expected or Unexpected)
Correlato Físico: Acentos mal ubicados o ausentes.
Metodología: Se realiza un análisis prosódico para identificar acentos inusuales o ausentes, comparando con patrones esperados en el lenguaje.
Correlato Físico: Acentos mal ubicados o ausentes.
Metodología: Se realiza un análisis prosódico para identificar acentos inusuales o ausentes, comparando con patrones esperados en el lenguaje.
11. Pausa Llena, Muletillas (Filled Pauses/Tags)
Correlato Físico: Sonidos no fonéticos y sonidos fonémicos sin significado.
Metodología: Se identifican y cuantifican pausas llenas, palabras y frases repetitivas, utilizando herramientas de transcripción y análisis de discurso.
Correlato Físico: Sonidos no fonéticos y sonidos fonémicos sin significado.
Metodología: Se identifican y cuantifican pausas llenas, palabras y frases repetitivas, utilizando herramientas de transcripción y análisis de discurso.
12. Alteraciones Respiratorias (Respiratory Alteration: Agitated/Strong Breathing or Spasms)
Correlato Físico: Ruido, corta duración de palabras, silencios.
Metodología: Se analiza la señal de ruido y los patrones de silencio para identificar alteraciones en la respiración durante el habla.
Correlato Físico: Ruido, corta duración de palabras, silencios.
Metodología: Se analiza la señal de ruido y los patrones de silencio para identificar alteraciones en la respiración durante el habla.
13. Duración y Nro de Grupos Respiratorios (Respiratory Groups)
Correlato Físico: Duración y número de grupos respiratorios.
Metodología: Se mide la duración de las pausas respiratorias y se cuenta el número de grupos respiratorios para evaluar la fluidez del habla.
Correlato Físico: Duración y número de grupos respiratorios.
Metodología: Se mide la duración de las pausas respiratorias y se cuenta el número de grupos respiratorios para evaluar la fluidez del habla.
14. Nro de Sílabas por Exhalación (Exhalation)
Correlato Físico: Número de sílabas en la exhalación.
Metodología: Se calcula el número de sílabas pronunciadas durante una exhalación, relacionando esta medida con el control respiratorio.
Correlato Físico: Número de sílabas en la exhalación.
Metodología: Se calcula el número de sílabas pronunciadas durante una exhalación, relacionando esta medida con el control respiratorio.
15. Articulación: Habitual o Atípica (Mis-articulations: Atypical or Habitual)
Correlato Físico: Estilo de habla según el grupo de referencia regional.
Metodología: Se compara la articulación del hablante con los patrones de habla esperados en su región, identificando alteraciones atípicas.
Correlato Físico: Estilo de habla según el grupo de referencia regional.
Metodología: Se compara la articulación del hablante con los patrones de habla esperados en su región, identificando alteraciones atípicas.
16. Variación de Modo y Punto de Articulación (Phonetic Changes)
Correlato Físico: Alteraciones inesperadas en la sonoridad y el punto de articulación.
Metodología: Se realiza un análisis fonético detallado para detectar cambios en la articulación, como variaciones en la sonoridad o en el punto de articulación.
Correlato Físico: Alteraciones inesperadas en la sonoridad y el punto de articulación.
Metodología: Se realiza un análisis fonético detallado para detectar cambios en la articulación, como variaciones en la sonoridad o en el punto de articulación.
17. Inserción, Sustitución, Eliminación (Phonemic Changes)
Correlato Físico: Inserción, sustitución o eliminación de fonemas dentro de una palabra.
Metodología: Se analiza la transcripción fonética para identificar errores o alteraciones en la estructura fonémica de las palabras.
Correlato Físico: Inserción, sustitución o eliminación de fonemas dentro de una palabra.
Metodología: Se analiza la transcripción fonética para identificar errores o alteraciones en la estructura fonémica de las palabras.
Conclusión
La evaluación perceptual de la voz y su correlación con parámetros acústicos es esencial en diversas áreas de la investigación vocal. La metodología descrita para los 17 parámetros presentados en este artículo permite un análisis detallado y objetivo de las características vocales, facilitando la discriminación entre hablantes y la identificación de patologías vocales.
Este artículo proporciona una guía completa sobre cómo realizar un análisis perceptual y acústico detallado, contribuyendo a la comprensión y mejoramiento de la calidad de la evaluación vocal en diferentes contextos profesionales.
Referencias
Gurlekian, J. A., Suligoy, S., Univaso, P., Torres, H., Masessa, E., & Molina, N. (2024).
Determining the likelihood ratio from perceptual attributes of voice. Journal of Voice, 38(4), 816-825.e3.
https://doi.org/10.1016/j.jvoice.2022.01.022
Dodero, A., Hortas, M. A. S., & Wilder, F. (2002).
Metodología de estudio de alteraciones de la voz y baremos de incapacidad vocal. Cuadernos de Medicina Forense, 4(1), 41-51. Facultad de Medicina U.B.A. Premio Bienal “Profesor Santiago Luis Arauz” 2002/03.
Recuperado de https://www.csjn.gov.ar/cmfcs/files/pdf/_Tomo-4(2005-2006)/Numero-1/Dodero.pdf
Narea-Veas, M. S., Farías, P. G., & Vázquez Fernández, P. (2023).
Consensus Auditory Perceptual Evaluation of Voice (CAPE-V): Revisión sistemática de los métodos utilizados para su adaptación y validación. Revista de Investigación e Innovación en Ciencias de la Salud, 5(2), 178-193.
https://doi.org/10.46634/riics.206
Recuperado de http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S2665-20562023000200178
Comentarios
Publicar un comentario