Ir al contenido principal

Análisis Perceptual de la Voz: Evaluación de Atributos y Metodología

Análisis Perceptual de la Voz: Evaluación de Atributos y Metodología


Introducción

La evaluación perceptual de la voz es una disciplina crucial en la fonética forense, la logopedia, y la investigación de la calidad de la voz. Esta evaluación se basa en la discriminación de atributos perceptuales que pueden correlacionarse con parámetros físicos medibles. En este artículo, exploraremos las escalas utilizadas para esta discriminación, las características perceptuales clave, y cómo se miden y comparan 17 parámetros específicos definidos por Gurlekian J. et. al en su trabajo EVAPER y que son fundamentales en la evaluación de la calidad vocal.

Para cada parámetro se aportará un hipervínculo al artículo sobre cómo efectuar su medición utilizando PRAAT.

Escalas de Evaluación Perceptual

La evaluación de la calidad vocal se realiza a través de escalas que permiten cuantificar las características perceptuales de la voz. Algunas de las escalas más utilizadas incluyen la RASAT brasileña, la CAPE-V americana, y la EVAPER, que se utiliza en diferentes contextos lingüísticos y culturales. Cada una de estas escalas presenta ventajas y desventajas, siendo la EVAPER especialmente destacada por su metodología de "matching", que evita sesgos relacionados con la memoria interna del evaluador.


Atributos Perceptuales y sus Correlatos Físicos

Los atributos perceptuales de la voz incluyen la altura tonal, la sonoridad, la aspereza, la tensión, entre otros. Estos atributos tienen correlatos físicos que se pueden medir con precisión mediante herramientas acústicas. A continuación, se describen los 17 parámetros fundamentales, su correlato físico y la metodología para su medición y comparación.


Metodología para la Medición y Comparación de 17 Parámetros Vocales

1. Altura Tonal (Tonal Height)

  • Correlato Físico: Frecuencia de vibración de las cuerdas vocales.

  • Metodología: Se mide la frecuencia fundamental (F0) utilizando un analizador de espectro o software especializado como Praat. Las variaciones en F0 pueden indicar cambios en la altura tonal percibida.

  • [Click aquí para ver detalle]

2. Nivel de Sonoridad (Loudness Level)

  • Correlato Físico: Intensidad promedio.

  • Metodología: Se utiliza un medidor de nivel sonoro o software de análisis acústico para calcular la intensidad promedio de la señal vocal. La percepción de la sonoridad se relaciona directamente con la intensidad medida.

  • [Click aquí para ver detalle]

3. Variación: Continua o Quebrada (Loudness Contour: Continuous or with Breaks)

  • Correlato Físico: Continuidad o discontinuidad del contorno de intensidad.

  • Metodología: Se analiza el contorno de la intensidad a lo largo del tiempo, identificando rupturas o caídas en la energía que puedan correlacionarse con cambios perceptuales.

  • [Click aquí para ver detalle]

4. Soplo, Aspereza, Astenia-Tensión (Breathiness, Roughness, Asthenia-Strain)

  • Correlato Físico: Ruido, variación ciclo a ciclo de F0, espectro armónico.

  • Metodología: Se utilizan medidas como la relación armónico-ruido (HNR) para cuantificar el ruido. El jitter (variación de F0) y el shimmer (variación de amplitud) se calculan para evaluar la aspereza.

  • [Click aquí para ver detalle]

5. Resonancia: Oral, Nasal, Faríngea (Resonances: Oral or Nasal/Pharyngeal)

  • Correlato Físico: Espectro de formantes.

  • Metodología: Se mide la frecuencia y amplitud de los formantes utilizando un análisis espectral. Las variaciones en los formantes pueden indicar resonancias específicas.

  • [Click aquí para ver detalle]

6. Timbre: Común vs Opaco/Brillante (Timbre: Common or Dull/Bright)

  • Correlato Físico: Espectro armónico.

  • Metodología: Se realiza un análisis de los armónicos del sonido, enfocándose en la distribución espectral para determinar si el timbre es opaco o brillante.

  • [Click aquí para ver detalle]

7. Temblor (Tremor)

  • Correlato Físico: Variación de F0 en un rango de 4-5 Hz.

  • Metodología: Se analiza la modulación en la frecuencia fundamental para identificar el temblor. Este se manifiesta como fluctuaciones periódicas en la curva de F0.

  • [Click aquí para ver detalle]

8. Entonación: Típica o Marcada (Intonation: Adequate or Exaggerated)

  • Correlato Físico: Contorno de F0.

  • Metodología: Se mide el contorno de F0 a lo largo del discurso para evaluar la entonación. Un análisis detallado permite identificar si la entonación es típica o exagerada.

  • [Click aquí para ver detalle]

9. Ritmo silábico, velocidad (Rhythm Speed)

  • Correlato Físico: Número de sílabas por unidad de tiempo.

  • Metodología: Se calcula la tasa de sílabas por segundo, analizando el ritmo del habla. La velocidad de producción de sílabas se correlaciona con la percepción del ritmo.

  • [Click aquí para ver detalle]

10. Acentos: Esperados o Extraños (Lexical/Tonal Accents: Expected or Unexpected)

  • Correlato Físico: Acentos mal ubicados o ausentes.

  • Metodología: Se realiza un análisis prosódico para identificar acentos inusuales o ausentes, comparando con patrones esperados en el lenguaje.

  • [Click aquí para ver detalle]

11. Pausa Llena, Muletillas (Filled Pauses/Tags)

  • Correlato Físico: Sonidos no fonéticos y sonidos fonémicos sin significado.

  • Metodología: Se identifican y cuantifican pausas llenas, palabras y frases repetitivas, utilizando herramientas de transcripción y análisis de discurso.

  • [Click aquí para ver detalle]

12. Alteraciones Respiratorias (Respiratory Alteration: Agitated/Strong Breathing or Spasms)

  • Correlato Físico: Ruido, corta duración de palabras, silencios.

  • Metodología: Se analiza la señal de ruido y los patrones de silencio para identificar alteraciones en la respiración durante el habla.

  • [Click aquí para ver detalle]

13. Duración y Nro de Grupos Respiratorios (Respiratory Groups)

  • Correlato Físico: Duración y número de grupos respiratorios.

  • Metodología: Se mide la duración de las pausas respiratorias y se cuenta el número de grupos respiratorios para evaluar la fluidez del habla.

  • [Click aquí para ver detalle]

14. Nro de Sílabas por Exhalación (Exhalation)

  • Correlato Físico: Número de sílabas en la exhalación.

  • Metodología: Se calcula el número de sílabas pronunciadas durante una exhalación, relacionando esta medida con el control respiratorio.

  • [Click aquí para ver detalle]

15. Articulación: Habitual o Atípica (Mis-articulations: Atypical or Habitual)

  • Correlato Físico: Estilo de habla según el grupo de referencia regional.

  • Metodología: Se compara la articulación del hablante con los patrones de habla esperados en su región, identificando alteraciones atípicas.

  • [Click aquí para ver detalle]

16. Variación de Modo y Punto de Articulación (Phonetic Changes)

  • Correlato Físico: Alteraciones inesperadas en la sonoridad y el punto de articulación.

  • Metodología: Se realiza un análisis fonético detallado para detectar cambios en la articulación, como variaciones en la sonoridad o en el punto de articulación.

  • [Click aquí para ver detalle]

17. Inserción, Sustitución, Eliminación (Phonemic Changes)

  • Correlato Físico: Inserción, sustitución o eliminación de fonemas dentro de una palabra.

  • Metodología: Se analiza la transcripción fonética para identificar errores o alteraciones en la estructura fonémica de las palabras.

  • [Click aquí para ver detalle]


Conclusión

La evaluación perceptual de la voz y su correlación con parámetros acústicos es esencial en diversas áreas de la investigación vocal. La metodología descrita para los 17 parámetros presentados en este artículo permite un análisis detallado y objetivo de las características vocales, facilitando la discriminación entre hablantes y la identificación de patologías vocales.

Este artículo proporciona una guía completa sobre cómo realizar un análisis perceptual y acústico detallado, contribuyendo a la comprensión y mejoramiento de la calidad de la evaluación vocal en diferentes contextos profesionales.


Referencias


Gurlekian, J. A., Suligoy, S., Univaso, P., Torres, H., Masessa, E., & Molina, N. (2024).
Determining the likelihood ratio from perceptual attributes of voice. Journal of Voice, 38(4), 816-825.e3.
https://doi.org/10.1016/j.jvoice.2022.01.022


Dodero, A., Hortas, M. A. S., & Wilder, F. (2002).
Metodología de estudio de alteraciones de la voz y baremos de incapacidad vocal. Cuadernos de Medicina Forense, 4(1), 41-51. Facultad de Medicina U.B.A. Premio Bienal “Profesor Santiago Luis Arauz” 2002/03.
Recuperado de https://www.csjn.gov.ar/cmfcs/files/pdf/_Tomo-4(2005-2006)/Numero-1/Dodero.pdf


Narea-Veas, M. S., Farías, P. G., & Vázquez Fernández, P. (2023).
Consensus Auditory Perceptual Evaluation of Voice (CAPE-V): Revisión sistemática de los métodos utilizados para su adaptación y validación. Revista de Investigación e Innovación en Ciencias de la Salud, 5(2), 178-193.
https://doi.org/10.46634/riics.206
Recuperado de http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S2665-20562023000200178



Comentarios