Procedimientos de audiología conductual en niños con síndrome de Down
Emily E. Nightengale, Kristine Wolter-Warmerdam
Children’s Hospital Colorado, Aurora.
Patricia J. Yoon, Dee Daniels y Fran Hickeyab
Children’s Hospital Colorado, Aurora, y Departamento de Pediatría, Facultad de Medicina de la Universidad de Colorado, Aurora.
Objetivo: Los datos normativos relativos a los procedimientos de pruebas audiológicas conductuales se basan en la población general y, a menudo, no se aplican a los niños con síndrome de Down (SD). Evaluar a niños con SD puede ser complicado y los resultados pueden no ser fiables debido a la diferencia en sus demandas y retrasos cognitivos. El objetivo de este estudio fue evaluar los procedimientos de pruebas audiológicas óptimos para grupos de niños de edades específicas con SD.
Método: En este estudio se utilizó una investigación retrospectiva de 273 niños con SD (145 niños, 128 niñas; edad media en el momento de la evaluación = 5,92 ± 4,74 años) a los que se les había realizado una evaluación audiológica en 2013, formando parte de la atención médica en un gran hospital pediátrico (incluidos centros afiliados).
Resultados: Se facilitan los intervalos de edades para la realización de procedimientos de audiometría en niños con SD. La edad media para realizar de una manera fiable pruebas conductuales en niños con SD se retrasó hasta en 30 meses, en comparación con los niños con un desarrollo típico. En la mayoría de los niños con SD se obtuvo una fiabilidad alta-regular, como mínimo, en los resultados audiológicos empezando a los 16 meses (85,7%) y en los resultados en ambos oídos a los 6-10 años (76,1%). Si bien no es estadísticamente significativa, la intervención de dos auxiliares en cabina, en comparación con un solo evaluador, resultó de utilidad para obtener resultados fiables.
Conclusión: Los resultados facilitan una orientación sobre los procedimientos de pruebas audiológicas óptimos para niños con SD, ya que no se aplican las pautas audiológicas estándar para bebés y niños con un desarrollo típico.
Los niños con síndrome de Down (SD) tienen un mayor riesgo de presentar una pérdida auditiva que sus compañeros con un desarrollo típico (Barr et al., 2011; Maris et al., 2014; Nightengale et al., 2017; Park et al., 2011; Shott et al., 2001; Tedeschi et al., 2015). Se ha notificado que la incidencia de pérdida auditiva en niños con SD alcanza el 78% y la mayoría presenta una pérdida auditiva conductiva. Las estimaciones conservadoras de pérdida auditiva congénita en niños con SD oscilan entre el 15% y el 20% (Tedeschi et al., 2015). Las anomalías en el oído medio son mucho más frecuentes en los niños con SD que en los niños con un desarrollo normal, con una prevalencia máxima al año de edad (67%-93%) y de nuevo a los 6-7 años de edad (60%; Barr et al., 2011; Maris et al., 2014). Entre el 43% y el 83% de los pacientes con SD necesitan la inserción de una cánula de compensación de presión para tratar la pérdida auditiva conductiva secundaria al derrame del oído medio y a las infecciones de oído crónicas (Park et al., 2011; Shott et al., 2001). Utilizando la base de datos genética y audiológica (AudGenDB), en una investigación reciente se observó que aproximadamente el 85% de los niños con SD tienen, como mínimo, una evaluación auditiva con anomalías y el 67% muestra una pérdida auditiva en todos los audiogramas registrados (Kreicher et al., 2018). Para maximizar el acceso de un niño al lenguaje hablado, es preciso que la identificación de la pérdida auditiva, la monitorización y la intervención tengan lugar sin demora. Si no se realizan las intervenciones adecuadas cuando existen problemas de audición, el resultado puede ser una pérdida de oportunidades de aprendizaje y desarrollo. En consecuencia, es esencial facilitar a este grupo de niños en riesgo una monitorización audiológica continua. No obstante, la realidad es que la obtención de resultados fiables y precisos puede ser difícil en el caso de los niños con SD (Shott et al., 2001; Tedeschi et al., 2015). El objetivo de nuestro estudio es, por lo tanto, evaluar y determinar las técnicas y los parámetros de pruebas audiológicas óptimos para esta población.
Desde la década de 1990, el Down Syndrome Medical Interest Group y la American Academy of Pediatrics facilitan pautas de atención médica para personas con SD. En la guía más reciente, «Health Supervision for Children With Down Syndrome» (Supervisión médica a niños con síndrome de Down), publicada en 2011, se siguen facilitando recomendaciones de vigilancia audiológica: «En el caso de un niño que haya superado las pruebas de diagnóstico auditivo, se le debe realizar un examen de detección adicional o un audiograma conductual y una timpanometría cada seis meses hasta que los niveles de audición normales se establezcan bilateralmente mediante pruebas específicas del oído (generalmente después de los cuatro años de edad). Posteriormente, las pruebas de audición conductual se deben realizar anualmente» (Bull y el Comité de Genética, 2011). Para lograr estos objetivos, existe un gran número de herramientas de evaluación y métodos de prueba disponibles para los audiólogos. No obstante, numerosos factores pueden influir en la capacidad de realizar una evaluación fiable, como la edad del niño, el estado de desarrollo, las funciones ejecutivas, la participación en la tarea, el historial médico, el nivel de ansiedad y los retos conductuales (Delaroche et al., 2004; Grieco et al., 2015; Kocoń et al., 2016).
Los datos normativos para las técnicas de audiometría conductual apropiadas para la edad no se suelen aplicar a niños con SD. Si bien la audiología de refuerzo visual (ARV) y la Audiometría Condicionada por Juego (ACJ) se pueden realizar con éxito a bebés de 6 meses y niños de 2,5 años con un desarrollo típico, respectivamente (American Speech-Language-Hearing Association [ASHA], 2004; Delaroche et al., 2004; Gravel y Traquina, 1992; Maurizi et al., 1985; Roizen et al., 1993; Shott et al., 2001), estas tareas pueden resultar problemáticas para muchas personas con retrasos en el desarrollo. Los niños con SD tienen diferentes demandas y retrasos cognitivos en el funcionamiento ejecutivo, lo que puede afectar la capacidad de realizar de manera fiable un procedimiento de prueba conductual como la ACJ. Entre los problemas se incluyen la atención, la inhibición o el control de impulsos, la velocidad de procesamiento, la memoria auditiva a corto plazo, la planificación/organización, la multitarea y la autosupervisión (Gameren-Oosterom et al., 2011; Grieco et al., 2015; Maroudias et al., 1994; Rodman y Pine, 2012).
Nuestra comprensión de las evaluaciones conductuales en niños con discapacidades del desarrollo es bastante limitada. El deterioro de las habilidades psicomotoras puede afectar la fiabilidad de una evaluación audiológica en esta población, dado que disminuye la probabilidad de una respuesta voluntaria del niño (Rodman y Pine, 2012). Las respuestas fiables dependen en gran medida del estado de desarrollo (Manickam et al., 2016; Shott et al., 2001; Venail et al., 2004). Las investigaciones existentes indican que, en el caso de los niños con retrasos en el desarrollo conocidos, la ARV es apropiada cuando el niño tiene una edad de desarrollo de 10-12 meses (Greenberg et al., 1978; Thompson et al., 1979). En estos estudios se notifican retrasos en las respuestas auditivas de bebés con SD, en comparación con otros bebés sin SD, y se cuestiona si los retrasos auditivos son específicos de la modalidad o del paradigma utilizados. En otros estudios se indica que la audiometría de tonos puros permite evaluar de una manera fiable a niños con SD mayores de 8 años, pero no menores de 3,5 años (Maurizi et al., 1985).
Los niños con SD pueden experimentar un mayor nivel de ansiedad y problemas conductuales durante una evaluación que sus compañeros de la misma edad con un desarrollo típico. Los retos conductuales en niños con SD pueden incluir rechazo, problemas de atención, agitación, ansiedad y aumento de los movimientos motores, que pueden influir en su participación durante una evaluación audiológica (Capone et al., 2006; Coe et al., 1999; Patel et al., 2018). Los problemas conductuales también se pueden deber a problemas de procesamiento sensorial relacionados con la audición, como son la falta de respuesta, el filtrado auditivo y la sensibilidad al ruido, así como a factores no sensoriales como el desarrollo cognitivo y la atención (Bruni et al., 2010; Werner et al., 1996). Además, el autismo y/o las conductas autistas son trastornos comórbidos que se observan en el 6% de los niños con SD, lo que representa retos adicionales en una evaluación audiológica (Ghaziuddin et al., 1992; Hickey y Patterson, 2011; Kent et al., 1999; Rasmussen et al., 2001). Cuando una prueba conductual no sea viable en el caso de los niños con SD, se suele necesitar una prueba de potenciales auditivos evocados del tronco cerebral para determinar con precisión la naturaleza y la gravedad de la pérdida auditiva (Kaga y Marsh, 1986; McCreery et al., 2015).
La investigación centrada en los procedimientos audiológicos para niños con SD es limitada. Si bien los estudios anteriores aportan una base importante, están limitados principalmente por el pequeño tamaño de las muestras (16-109 participantes) y la ausencia de información sobre el uso de un auxiliar para la evaluación en sus investigaciones (Tedeschi et al., 2015; Werner et al., 1996). Aunque en la mayoría de la literatura existente se recurrió a dos auxiliares por los requisitos del método, en los estudios no se indica si el número de evaluadores afectó a los bebés y niños con SD en el entorno clínico ni de qué manera. Con la excepción de algunos estudios (Diefendorf et al., 1995; Dille, 2003; Greenberg et al., 1978; Thompson et al., 1979; Werner et al., 1996), las investigaciones anteriores se han centrado en la prevalencia de la pérdida auditiva en esta población y no en las técnicas de pruebas utilizadas (Austeng et al., 2013; Manickam et al., 2016; Roizen et al., 1993; Shott et al., 2001; Tedeschi et al., 2015).
Teniendo en cuenta las pautas recomendadas y la importancia de la monitorización audiológica en niños con SD, es fundamental comprender la validez y las limitaciones de los procedimientos de pruebas audiológicas habituales en esta población. En nuestro estudio nos proponemos determinar (a) la fiabilidad de las pruebas y los patrones de edad observados en los diferentes procedimientos conductuales (ARV, ACJ y audiometría estándar con o sin el uso de un auxiliar en cabina), (b) la edad a la que los niños con SD obtuvieron resultados concluyentes de las pruebas conductuales y (c) la diferencia en campo sonoro frente a las respuestas específicas del oído por edad y tipo de prueba conductual.
Método
Diseño
Se realizaron análisis retrospectivos de datos clínicos audiológicos de 305 niños con SD que fueron tratados en un gran hospital académico pediátrico en 2013. Se identificó a los pacientes y se extrajeron datos del Sie Center for Down Syndrome/Base de datos de audiología clínica. En los datos recopilados se incluían resultados de pruebas audiométricas, hallazgos normales o anómalos y conductas relacionadas con las pruebas. Se excluyó a los pacientes del análisis si su audiólogo no había realizado una evaluación audiológica específica de frecuencias (es decir, cribado auditivo neonatal, pruebas funcionales de audífono o timpanometría solamente). También se les excluyó si el diagrama de flujo documentado estaba «mínimamente completo», definido como las sesiones en las que un audiólogo no introducía el 20% o más de las variables. El estudio lo aprobó el Comité de revisión institucional del Children’s Hospital Colorado, Facultad de Medicina de la Universidad de Colorado.
Participantes
Todos los participantes (145 niños, 128 niñas; edad media en la evaluación = 5,92 ± 4,74 años) cumplían los criterios de inclusión de presentar SD; al menos una prueba audiológica conductual [ OC (observación conductual), ARV, ACJ y audiometría estándar], realizada en el Colorado Children’s Hospital entre el 1 de enero y el 31 de diciembre de 2013; y recibir atención en el hospital entre las edades de 1 día y 22 años. Los 273 niños se sometieron a un total de 403 evaluaciones audiológicas durante este año. En general, se evaluó a los participantes en cumplimiento de las directrices de la American Academy of Pediatrics en cuanto a vigilancia o monitorización de una pérdida auditiva en niños con SD (71,2%), una sospecha de pérdida auditiva o problemas auditivos (29%), una evaluación audiológica posoperatoria (9,4%), una evaluación de audífonos (6%) u otras razones (3%). Como se indica en la Tabla 1, el grupo de participantes reflejaba la diversidad de la población de pacientes del hospital.
Medidas
Evaluación audiológica
Los datos de las evaluaciones auditivas se extrajeron de dos diagramas de flujo clínicos introducidos en el registro médico electrónico del hospital. Para clasificar los resultados, se establecieron parámetros estandarizados para que los audiólogos realizaran los diagramas de flujo. Las evaluaciones audiológicas se clasificaron como normales, esencialmente normales, anómalas o no concluyentes.
Pruebas audiológicas
En esta investigación se analizaron cuatro técnicas de prueba: OC, ARV, ACJ y audiometría estándar. Las definiciones de estas cuatro categorías se describen a continuación. Se registró el uso de un auxiliar en todas las pruebas. En el momento de una evaluación audiológica, la evaluación se iniciaba utilizando el procedimiento de prueba más apropiado según las habilidades de desarrollo del niño y las observaciones anotadas en la clínica. Los audiólogos siguieron las directrices aceptadas de la American Academy of Audiology (AAA) y la ASHA para la evaluación de la audición en la población pediátrica. La OC es un procedimiento que se utiliza para evaluar el desarrollo de habilidades auditivas en recién nacidos, bebés menores de 6 meses de edad de desarrollo y niños que no pueden realizar otras tareas de audiometría conductual (AAA, 2012). La Audiometría por Refuerzo Visual (ARV) es un método en el que se utiliza una respuesta condicionada para estimar la sensibilidad auditiva en niños de aproximadamente 5-24 meses de edad de desarrollo (AAA, 2012). La Audiometría Condicionada por Juego es un método en el que se utiliza una respuesta condicionada por juego para determinar la sensibilidad auditiva en niños de aproximadamente 2-5 años de desarrollo (AAA, 2012). La ARV se utiliza como punto de partida en el caso de numerosos niños, especialmente de aquellos con necesidades especiales; no obstante, cuando con la técnica ARV no se consiguen resultados precisos, se justifica el uso de la OC. La OC no es un método destinado a facilitar información sobre la sensibilidad auditiva (AAA, 2012), sino más bien un método que se puede utilizar para documentar respuestas espontáneas a estímulos supraumbrales. Además, la OC representa una oportunidad para que los audiólogos y sus auxiliares en cabina modelen la respuesta auditiva deseada (es decir, girar la cabeza) hacia la fuente de sonido. Puede resultar particularmente útil porque todos los niños pueden aprender y beneficiarse de la repetición, el modelado y las señales visuales en diversos entornos.
Definición de la fiabilidad de la prueba
En términos estadísticos, la fiabilidad es la calidad y la coherencia de la medición. En este estudio, la fiabilidad de la sesión de evaluación se clasificó en una de cuatro categorías mutuamente excluyentes: alta, alta-regular, regular y baja. Si bien la clasificación de la fiabilidad de la prueba dependía del criterio del audiólogo, se facilitaron pautas/definiciones al equipo. Se asignó una alta fiabilidad a las evaluaciones en las que las respuestas auditivas eran repetibles, en concordancia con un umbral de detección del habla o un umbral de reconocimiento del habla, y coherentes con medidas de evaluación objetivas. También se asignó una alta fiabilidad a las evaluaciones auditivas que se definieron como normales. Se asignó una fiabilidad alta-regular cuando las respuestas se acercaban al umbral esperado según la repetibilidad y la concordancia con el umbral de detección del habla o el umbral de reconocimiento del habla. Se asignó una fiabilidad regular cuando las respuestas de un niño se obtenían en niveles que no se encontraban en el umbral esperado pero con cierta repetibilidad. Se asignó una fiabilidad baja a las pruebas cuando no se podían determinar las capacidades auditivas basándose en respuestas conductuales observadas o en su ausencia. El umbral auditivo se define como la intensidad de sonido más suave que provoca una respuesta conductual repetible, que es diferente del nivel de respuesta mínimo (NRM) notificado. El NRM se define como aquella respuesta que puede no reflejar una respuesta de umbral audiométrico al considerar la fiabilidad y la validez de la sesión utilizando principios de verificación cruzada (Jerger y Hayes, 1976; Matkin, 1977; Norrix, 2015). Se instruyó a los audiólogos para que clasificaran las evaluaciones audiológicas en las que se sospechara que los NRM no eran concluyentes o anómalos con una fiabilidad de la evaluación regular o baja en ausencia de respuestas coherentes o repetibles, incluidos movimientos de ojos, miradas o silencio. En este análisis retrospectivo no se registraron los «ensayos de captura», que a menudo pueden servir para clasificar la fiabilidad de las pruebas durante los procedimientos de audiología conductual; no obstante, el audiólogo en cuestión puede haberlos incorporado en su práctica evaluativa.
Procedimiento
Evaluaciones audiológicas
Se utilizaron los datos audiológicos introducidos en el registro médico electrónico por audiólogos, como parte de una investigación de mejora de la calidad clínica. Durante el periodo de recopilación de los datos, 24 audiólogos, que disponían del Certificado de Competencia Clínica con licencia emitida por la ASHA, formaban parte del personal de nuestra institución. El 88% de estos audiólogos tenían 3 o más años de experiencia directa en audiología clínica pediátrica. Los audiólogos seleccionaron y utilizaron las técnicas y los métodos adecuados para la evaluación de la audiología pediátrica. La audición se evaluó utilizando una o varias técnicas dependiendo de la edad y/o las capacidades de desarrollo. Las evaluaciones se realizaron (a) en la clínica de audiología, (b) en combinación con una consulta clínica de otorrinolaringología del niño o (c) como paciente hospitalizado al lado de la cama. Intervino un auxiliar en cabina en el 76,4% (n = 308/403) de las evaluaciones.
Resultados de las pruebas. Después de cada sesión audiológica, un audiólogo cumplimentaba un formulario de registro médico electrónico en el que se describían la evaluación del niño y el procedimiento de evaluación. Se incluyó información sobre el motivo de la evaluación, el tipo de prueba, la fiabilidad de la prueba, los resultados y las recomendaciones clínicas. Los datos recopilados incluían el nivel de pérdida auditiva notificado (en el campo sonoro y/o en los oídos derecho/izquierdo), las configuraciones de la pérdida auditiva, los resultados de 500 a 4000 Hz, los resultados de timpanometría en ambos oídos y si la pérdida auditiva permanente se había diagnosticado previamente para cada oído. Los datos normativos para los niveles de audición en niños varían dependiendo del procedimiento de evaluación y del grupo de edad (Saba et al., 2003). Por lo tanto, considerando los objetivos de este estudio, para calificar como normal una evaluación, las respuestas de un niño se debían obtener a 20 dB HL o menos en todo el espectro de frecuencias del habla. Los audiólogos emplearon su criterio clínico para identificar las evaluaciones normales que incluían respuestas a 20-25 dB HL y las evaluaciones anómalas, compuestas de respuestas a 25 dB HL o más. Si las evaluaciones no eran concluyentes o no se podían realizar, se indicaba el motivo específico. Los datos se codificaron según la lateralidad a no ser que no se pudieran realizar las pruebas específicas del oído, en cuyo caso se introdujeron los datos del campo sonoro. La evaluación incluía pruebas de timpanometría a tonos de sonda de 226 o 1000 Hz. Si la evaluación auditiva era anómala, el audiólogo incluía recomendaciones como la derivación a un otorrinolaringólogo y/o el uso de un audífono.
Información de antecedentes. Se realizaba un diagrama de flujo con historial/antecedentes por separado para cada niño y se actualizaba si los elementos de su historial se modificaban durante una sesión de evaluación posterior [p. ej., cánulas de compensación de presión, audífonos, evaluaciones de potenciales auditivos evocados (PAE) con sedación]. Este formulario electrónico se cumplimentaba utilizando una revisión de registros médicos electrónicos y datos demográficos capturados, los resultados del cribado auditivo neonatal, el uso de audífonos/amplificación, el historial de derrames del oído medio, las cánulas de compensación de presión, las evaluaciones de PAE con sueño natural y/o evaluaciones de PAE con sedación y otros antecedentes médicos pertinentes. La información la introducía un ayudante de investigación formado en revisión de gráficos audiológicos.
Recopilación de datos
Los datos de los diagramas de flujo se recopilaban y gestionaban con las herramientas de Captura de datos electrónicos para investigación de la Universidad de Colorado (Harris et al., 2009). Para garantizar la precisión de los datos, todas las pruebas audiológicas y los resultados fueron revisados por el investigador principal, un audiólogo certificado por el comité con experiencia en el tratamiento y el trabajo con niños con SD.
Análisis estadístico
Se realizaron estadísticas descriptivas y pruebas de chi-cuadrado sobre las características demográficas y clínicas del conjunto de datos. Los resultados de las estadísticas descriptivas se presentan como media ± desviación típica o porcentaje, según el caso. Se analizaron 403 evaluaciones auditivas de los 273 niños con SD de forma independiente para determinar el procedimiento de evaluación por edad, el uso de dos auxiliares en cabina durante la sesión y los resultados de las sesiones individuales. Las pruebas de chi-cuadrado se realizaron en la primera evaluación de un niño completada en 2013 para determinar asociaciones significativas entre (a) el uso de dos auxiliares en cabina y la fiabilidad de la evaluación, y (b) la capacidad de obtener resultados de pruebas conductuales y la edad. Los datos se analizaron mediante el paquete estadístico SPSS 24.0. Todos los análisis se realizaron a un nivel de significación del 0,05. No se incluyeron niños en algún análisis si la variable de investigación tenía un valor de datos desconocidos o ausentes.
Resultados
En los 273 niños estudiados, se realizaron 403 evaluaciones de pruebas conductuales en 2013. La mayoría realizó la ARV (n = 191), seguida de la ACJ (n = 141), la OC (n = 10), la audiometría estándar (n = 22) o una combinación de dos tipos de evaluaciones (n = 39).
Procedimiento de evaluación por edad
La fiabilidad de la evaluación y los patrones por edad que se determinaron para los diferentes procedimientos de pruebas conductuales para niños con SD se describen en la Tabla 2. Los resultados más fiables para niños con SD, definidos como buenos o buenos-regulares, se obtuvieron con audiometría estándar (100%) o audiometría estándar y ACJ (100%), seguidas de ACJ (93,7%), ARV (66,5%), ARV y ACJ (61,9%), OC y ACJ (5,9%), y OC (0,0%). La media, la desviación típica y la mediana de edad en años en el momento de la prueba progresaron de niños pequeños a mayores con respecto a la complejidad de las tareas de prueba requeridas comenzando con la OC (M = 1,28, DT = 0,84, Mdn = 1,04) y extendiéndose a la OC y la ARV (M = 1,35, DT = 0,85, Mdn = 1,04), la ARV (M = 3,21, DT = 2,70, Mdn = 2,65), la ARV y la ACJ (M = 7,14, DT = 4,76, Mdn = 4,90), la ACJ (M = 8,86, DT = 3,64, Mdn = 7,99) y la audiometría estándar (M = 14,36, DT = 3,91, Mdn = 14,36).
Se realizaron pruebas de chi-cuadrado para determinar el impacto del uso de un auxiliar en la fiabilidad de los resultados para la OC, la ARV, la ACJ, la audiometría estándar y una combinación de dos métodos de evaluación (véase la Tabla 3). Los resultados se clasificaron en dos tipos: (a) fiabilidad óptima (alta y alta-regular) y (b) fiabilidad menor (regular y baja). Se observó la tendencia de que los niños con SD mostraban una mayor fiabilidad cuando se recurría a un auxiliar en cabina; no obstante, esta tendencia no alcanzó significación estadística (ARV: p = 0,332; ACJ: p = 0,667).
Resultados concluyentes de las pruebas
Los resultados de las pruebas conductuales no concluyentes, definidos como una agudeza auditiva que no se puede clasificar de una manera fiable, variaban inversamente con la edad, como se observa en la Tabla 4. Un alto porcentaje de niños pequeños con SD no logró resultados concluyentes, siendo no concluyentes en el 68,4% de los niños menores de 1 año y en el 36,7% de los niños de 1 año. El éxito en la obtención de resultados concluyentes aumentó significativamente con la edad comenzando en los grupos de edad de 2 años (no concluyentes = 18,3%) y de 4 años (no concluyentes = 5,2%). Se notificaban resultados no concluyentes cuando no se obtenían respuestas coherentes o fiables frente a los estímulos tonales (60%) y cuando se sospechaban NRM (30%), documentados en el diagrama de flujo o en el informe escrito. En las sesiones restantes enumeradas como no concluyentes se utilizaron descriptores que incluían «difícil de condicionar para la tarea de escucha», «no participa» y «demasiado distraído». En el caso de estas evaluaciones, en la información obtenida a partir de los procedimientos conductuales (incluidas pruebas de conducción aérea y de conducción ósea) no se pudo descartar una pérdida auditiva de 500 a 4000 Hz en, al menos, el oído con mayor capacidad auditiva.
Se detectó que la capacidad de obtener resultados buenos o buenos-regulares en las pruebas conductuales de los niños de 12-23 meses mejoraba con la edad. Se observó una asociación estadísticamente significativa entre la capacidad de obtener resultados en pruebas conductuales y la edad (12-15 frente a 16-23 meses) de los niños con SD, χ2 (1) = 10,000, p = 0,002. En general, el 88,9% de los niños de 16-23 meses con SD lograron resultados buenos o buenos-regulares en comparación con el 33,9% de los niños de 12-15 meses de edad.
Datos del campo sonoro y datos específicos del oído
En la Tabla 5 se describen los resultados de las respuestas del campo sonoro frente a las respuestas específicas del oído por edad y tipo de prueba conductual. Los niños y adultos jóvenes con SD de 16-21 años (88,2%), 11-15 años (79,5%) y 6-10 años (76,1%) tenían más probabilidades de realizar las pruebas conductuales con resultados de ambos oídos. Entre los motivos notificados de la incapacidad de obtener información específica del oído se encuentran el cansancio del paciente, la resistencia del paciente a que se le tocasen los oídos y la incapacidad de realizar la tarea de escuchar con auriculares/audífonos.
Discusión
En investigaciones anteriores se indicaba que los niños con un desarrollo típico pueden realizar con éxito la ARV a los 6 meses de edad y la ACJ a los 2,5 años (ASHA, 2004; Delaroche et al., 2004; Maurizi et al., 1985; Roizen et al., 1993; Shott et al., 2001). Nuestros resultados muestran que, en comparación con investigaciones anteriores y datos normativos existentes basados en bebés y niños con un desarrollo típico, utilizando los métodos clínicos actuales en un entorno hospitalario pediátrico, la edad media para realizar de una manera fiable las tareas de audiometría conductual en niños con SD se retrasa hasta 30 meses. Este retraso es coherente para todos los procedimientos de prueba. Como se preveía, la edad aumenta con cada procedimiento de prueba audiológica apropiado para el desarrollo. Estas cifras facilitan una orientación con respecto al intervalo de edad previsto para la realización de cada tarea de audiometría. Nuestros resultados son comparables a los de Maurizi et al. (1985) en el sentido de que el 93%-100% de las evaluaciones se obtuvieron con una fiabilidad de prueba alta o alta-regular en el caso de los niños que pudieron realizar la prueba de ACJ y/o de audiometría estándar (edad media de 8 años); no obstante, se debe tener en cuenta que la fiabilidad de prueba alta o alta-regular se obtuvo en la mayoría de los pacientes con la prueba ARV (66,5%), lo que sugiere que la ARV también es una técnica válida para muchos niños pequeños con SD.
En nuestro estudio, los resultados de las pruebas no fueron concluyentes en la mayoría de los niños menores de 13 meses. En los bebés con un desarrollo típico, sólo el 5% presenta resultados no concluyentes en este grupo de edad (Gravilla y Traquina, 1992). No es de extrañar que se observara una tendencia positiva de aumento de los resultados concluyentes con el aumento de la edad. En el grupo de menor de edad, los resultados buenos o buenos-regulares se observaron con mayor frecuencia a partir de los 16 meses. A pesar de estos hallazgos, debido al alto riesgo de pérdida auditiva, la evaluación audiológica sigue siendo importante en la población con menos de 16 meses de edad. El uso eficaz del principio de verificación cruzada y la batería de pruebas puede facilitar una información audiológica adicional, junto con la timpanometría, las otoemisiones acústicas y la audiometría del habla (Jerger y Hayes, 1976).
La comparación de las respuestas del campo sonoro frente a las respuestas específicas del oído mostró que la mayoría de las evaluaciones de niños con SD menores de 4 años sólo se podían obtener en el campo sonoro y que las respuestas bilaterales específicas del oído sólo se obtuvieron de una manera fiable en la mayoría de los pacientes a partir de los 6 años. Como ya se ha indicado anteriormente, entre los motivos se encuentran el cansancio del paciente, la resistencia del paciente a que se le toquen los oídos y la incapacidad de realizar la tarea de escuchar con auriculares/audífonos. Contrasta claramente con los datos de niños con un desarrollo normal, que sugieren que los bebés de 7-10 meses pueden realizar una evaluación audiológica utilizando auriculares de inserción «con una expectativa de éxito razonable»; también se observó que algunos bebés de corta edad (20-26 semanas) respondían, pero con menos fiabilidad y coherencia (Day et al., 2000).
Nuestros resultados sugieren la necesidad de una investigación adicional con respecto a la utilidad de un auxiliar en cabina durante las evaluaciones audiológicas. Si bien nuestros resultados no alcanzaron una significación estadística, este hallazgo se debe interpretar con cautela porque en nuestra clínica se tiende a recurrir a auxiliares en cabina cuando se prevén dificultades a la hora de evaluar a algunos niños. En nuestra práctica clínica, hemos observado que las evaluaciones han sido más fiables en determinados niños con la intervención de un auxiliar en cabina. Los planificadores revisan las notas y plantean preguntas a los padres para determinar la necesidad de un auxiliar. Por lo tanto, en este estudio era más probable que nuestros audiólogos recurrieran a auxiliar en cabina en los casos de los niños que presentaban una mayor dificultad, lo que supuso una limitación en nuestra capacidad de evaluar plenamente la eficacia de esta variable. La intervención de un auxiliar de cabina puede ser útil para evaluar a los niños con SD, pero puede haber limitaciones en el acceso a este personal, como la disponibilidad, la formación, la planificación y el coste. Los padres pueden solicitar la intervención de un auxiliar en las evaluaciones audiológicas de sus hijos. En el caso de que no haya ninguno disponible, existen otras opciones entre las que se encuentran estudiantes capacitados, personal de apoyo u otros audiólogos de la clínica. Se necesitan más estudios para determinar el valor y las indicaciones para recurrir a un auxiliar de cabina.
Las pautas audiológicas para la evaluación de la audición de bebés y niños pequeños publicadas por la AAA reflejan las respuestas de las pruebas conductuales observadas en niños con un desarrollo típico y, por lo tanto, no se aplican a los niños con SD (Silman et al., 1992). En este estudio se facilita una orientación sobre qué procedimiento de prueba podría generar los mejores resultados en grupos de edades específicas de niños con SD. Nuestros resultados también sugieren que una pequeña modificación de las recomendaciones audiológicas de la «Health Supervision for Children With Down Syndrome» (Supervisión médica a niños con síndrome de Down) (Bull y el Comité de Genética, 2011) puede ser apropiada con respecto a la frecuencia de las pruebas. En las pautas del SD se establece que las evaluaciones audiológicas se pueden realizar anualmente, en lugar de semestralmente, una vez que se puedan obtener resultados específicos del oído, lo que suele suceder a partir de los 4 años de edad. No obstante, observamos que no ocurre de una manera fiable hasta que los niños tienen 6 años o más, cuando se utilizaron la ACJ y/o técnicas de prueba de audiometría estándar. Da la impresión de que existe una gran brecha en la capacidad de obtener respuestas conductuales específicas del oído en niños pequeños con SD, dado que la técnica de ARV puede no ser de interés para un niño que haya recibido varias evaluaciones, pero la técnica de ACJ se encuentre por encima de sus habilidades de desarrollo.
Existe una clara necesidad de investigar procedimientos novedosos de pruebas conductuales para satisfacer las necesidades de los niños con SD y otros con discapacidades del desarrollo. Además, en los entornos hospitalarios pediátricos es necesario desarrollar protocolos (que pueden incluir la desensibilización) o iniciativas de servicio en los que se familiarice a los pacientes con la manipulación de los oídos con el fin de que toleren mejor los auriculares de inserción o los auriculares supraurales. En el caso de los niños en los que no se puedan obtener resultados conductuales fiables y se sospeche la presencia de una pérdida auditiva, es posible que se requieran evaluaciones de PAE con sueño natural o sedación para evaluar de una manera fiable la sensibilidad auditiva y se deben recomendar según sea el caso. También es importante señalar que, siempre que sea posible, se deben obtener umbrales de conducción ósea para controlar adecuadamente los cambios en la audición que sean secundarios a patologías del oído externo y medio.
Este estudio se diseñó para identificar técnicas exitosas de pruebas audiológicas para niños con SD a través de un diseño basado en una población extensa, realizado en una sola institución e incorporando una muestra de varias edades y etnias con las prácticas actuales de pruebas audiológicas. Entre las limitaciones que existen en este estudio se incluyen las que son inherentes a cualquier revisión retrospectiva. Los resultados de las evaluaciones audiológicas se basaron en análisis retrospectivos de informes y diagramas de flujo, en lugar de en la observación directa y el análisis de las evaluaciones. Por lo tanto, no pudimos controlar las variaciones en las pruebas y los estilos de informes entre un grupo de audiólogos mayor, lo que puede haber dado lugar a un sesgo no deliberado e influido potencialmente en los resultados. Si bien todos los informes y los resultados de las pruebas fueron revisados por un audiólogo certificado por el comité y con experiencia en el tratamiento y el trabajo con niños con SD, era inevitable que surgieran ligeras diferencias en los informes. Debido a la naturaleza de este estudio que se realizó únicamente en una única institución, se podría especular sobre un posible sesgo poblacional.
Conclusión
Los niños con SD tienen un mayor riesgo de presentar una pérdida auditiva. En este estudio se facilita una orientación sobre las respuestas conductuales previstas y las técnicas óptimas para la evaluación audiológica de niños con SD a diferentes edades utilizando los métodos clínicos actuales, considerando que las pautas audiológicas estándar para bebés y niños con un desarrollo normal no se aplican. Se investigó la edad óptima para las diferentes modalidades de pruebas conductuales, la utilidad de un auxiliar en cabina y la comparación de los resultados con las pautas existentes. En este estudio se facilita información para comprender mejor las necesidades de atención de la salud auditiva de los niños con SD y para establecer expectativas realistas con respecto a la cantidad y la calidad (fiabilidad) de los datos audiométricos conductuales en función de la edad.
Agradecimientos
Queremos agradecer a la Global Down Syndrome Foundation y a la Anna and John J. Sie Foundation por su apoyo financiero a la investigación realizada en el Sie Center for Down Syndrome del Children’s Hospital Colorado. También nos gustaría agradecer a todos los audiólogos del Children’s Hospital Colorado, así como al Bill Daniels Center for Hearing.
Bibliografía
American Academy of Audiology. (2012). Audiologic guidelines for the assessment of hearing in infants and young children.
http://audiology-web.s3.amazonaws.com/migrated/201208_ AudGuideAssessHear_youth.pdf_5399751b249593.36017703.pdf
American Speech-Language-Hearing Association. (2004). Guidelines for the audiologic assessment of children from birth to 5 years of age. https://doi.org/10.1044/policy.GL2004-00002
Austeng, M., Akre, H., Falkenberg, E., Øverland, B., Abdelnoor, M. y Kvaerner, K. J. (2013). Hearing level in children with Down syndrome at the age of eight. Research in Developmental Disabilities, 34(7), 2251-2256. https://doi.org/10.1016Zj.ridd. 2013.04.006
Barr, E., Dungworth, J., Hunter, K., Mcfarlane, M. y Kubba, H. (2011). The prevalence of ear, nose and throat disorders in preschool children with Down syndrome in Glasgow. Scottish Medical Journal, 56(2), 98-103. https://doi.org/10.1258/smj.2011.011036
Bruni, M., Cameron, D., Dua, S. y Nov, S. (2010). Reported sensory processing of children with Down syndrome. Physical & Occupational Therapy in Pediatrics, 30(4), 280-293. https:// doi.org/10.3109/01942638.2010.486962
Bull, M. J. y the Committee on Genetics. (2011). Health supervision for children with Down syndrome. Pediatrics, 128(2), 393-406. https://doi.org/10.1258/smj.2011.011036
Capone, G., Goyal, P., Ares, W. y Lannigan, E. (2006). Neuro-behavioral disorders in children, adolescents, and young adults with Down syndrome. American Journal of Medical Genetics Part C: Seminars in Medical Genetics, 142C(3), 158-172. https:// doi.org/10.1002/ajmg.c.30097
Coe, D. A., Matson, J. L., Russell, D. W., Slifer, K. J., Capone, G. T., Bagilo, C. y Stallinds, S. (1999). Behavior problems of children with Down syndrome and life events. Journal of Autism and Developmental Disorders, 29(2), 149-156. https://doi.org/10.1023/A:1023044711293
Day, J., Bamford, J., Parry, G., Shepherd, M. y Quigley, A. (2000). Evidence on the efficacy of insert earphone and sound field VRA with young infants. British Journal of Audiology, 34(6), 329-334. https://doi.org/10.3109/03005364000000148
Delaroche, M., Thiebaut, R. y Dauman, R. (2004). Behavioral audiometry: Protocols for measuring hearing thresholds in babies aged 4-18 months. International Journal of Pediatric Otorhinolaryngology, 68(10), 1233-1243. https://doi.org/10.1016/j.ijporl.2004.04.030
Diefendorf, A. O., Bull, M. J., Casey-Harvey, D., Miyamoto, R. T., Pope, M. L., Renshaw, J. J., Schreiner, R. L. y Wagner-Escobar, M. (1995). Down syndrome: A multidisciplinary perspective. Journal of the American Academy of Audiology, 6(1), 39-46.
Dille, M. F. (2003). Perspectives on the audiologic evaluation of individuals with Down syndrome. Seminars in Hearing, 24(3), 201-210. https://doi.org/10.1055/s-2003-41219
Gameren-Oosterom, H. B. M. V., Fekkes, M., Buitendijk, S. E., Mohangoo, A. D., Bruil, J. y Wouwe, J. P. V. (2011). Development, problem behavior, and quality of life in a population-based sample of eight-year-old children with Down syndrome. PLOS ONE, 6(7), e21879. https://doi.org/10.1371/journal.pone. 0021879
Ghaziuddin, M., Tsai, L. Y. y Ghaziuddin, N. (1992). Autism in Down’s syndrome: Presentation and diagnosis. Journal of Intellectual Disability Research, 36(5), 449-456. https://doi.org/10.1111/j.1365-2788.1992.tb00563.x
Gravel, J. S. y Traquina, D. N. (1992). Experience with the audiologic assessment of infants and toddlers. International Journal of Pediatric Otorhinolaryngology, 23(1), 59-71. https://doi.org/10.1016/0165-5876(92)90080-9
Greenberg, D. B., Wilson, W. R., Moore, J. M. y Thompson, G. (1978). Visual reinforcement audiometry (VRA) with young Down’s syndrome children. Journal of Speech and Hearing Disorders, 43(4), 448-458. https://doi.org/10.1044/jshd.4304.448
Grieco, J., Pulsifer, M., Seligsohn, K., Skotko, B. y Schwartz, A. (2015). Down syndrome: Cognitive and behavioral functioning across the lifespan. American Journal of Medical Genetics Part C: Seminars in Medical Genetics, 169(2), 135-149. https://doi.org/10.1002/ajmg.c.31439
Harris, P. A., Taylor, R., Thielke, R., Payne, J., Gonzalez, N. y Conde, J. G. (2009). Research Electronic Data Capture (REDCap)—A metadata-driven methodology and workflow process for providing translational research informatics support. Journal of Biomedical Informatics, 42(2), 377-381. https://doi.org/10.1016/j.jbi.2008.08.010
Hickey, F. y Patterson, B. (2011). Dual diagnosis of Down syndrome and autism. International Journal on Disability and Human Development, 5(4), 365-368. https://doi.org/10.1515/IJDHD.2006.5.4.365
Jerger, J. F. y Hayes, D. (1976). The cross-check principle in pediatric audiometry. Archives of Otolaryngology, 102(10), 614-620. https://doi.org/10.1001/archotol.1976.00780150082006
Kaga, K. y Marsh, R. R. (1986). Auditory brainstem responses in young children with Down’s syndrome. International Journal of Pediatric Otorhinolaryngology, 11(1), 29-38. https://doi.org/10.1016/S0165-5876(86)80025-8
Kent, L., Evans, J., Paul, M. y Sharp, M. (1999). Comorbidity of autistic spectrum disorders in children with Down syndrome. Development Medicine and Child Neurology, 41(3), 153-158. https://doi.org/10.1111/j.1469-8749.1999.tb00574.x
Kocoń, S., Wiatr, M., Stręk, P., Wiatr, A., Grudzień-Ziarno, A. y Hartwich, P. (2016). Analysis of difficulties occurring during the early auditory screening in children. Otolaryngologia Polska, 70(4), 41-48. https://doi.org/10.5604/00306657.1202780
Kreicher, K. L., Weir, F. W., Nguyen, S. A. y Meyer, T. A. (2018). Characteristics and progression of hearing loss in children with Down syndrome. The Journal of Pediatrics, 193, 27.e2-33.e2. https://doi.org/10.1016/jjpeds.2017.09.053
Manickam, V., Shott, G. S., Heithaus, D. y Shott, S. R. (2016). Hearing loss in Down syndrome revisited—15 years later. International Journal of Pediatric Otorhinolaryngology, 88, 203-2017. https://doi.org/10.1016/j.ijporl.2016.07.012
Maris, M., Wojciechowski, M., Heyning, P. V. D. y Boudewyns, A. (2014). A cross-sectional analysis of otitis media with effusion in children with Down syndrome. European Journal of Pediatrics, 173(10), 1319-1325. https://doi.org/10.1007/s00431-014-2323-5
Maroudias, N., Economides, J., Christodoulou, P. y Helidonis, E. (1994). A study on the otoscopical and audiological findings in patients with Down’s syndrome in Greece. International Journal of Pediatric Otorhinolaryngology, 29(1), 43-49. https://doi.org/10.1016/0165-5876(94)90107-4
Matkin, N. (1977). Assessment of hearing sensitivity during the pre-school years. En F. Bess (Ed.), Childhood deafness (pág. 127-134). Grune & Stratton.
Maurizi, M., Ottaviani, F., Paludetti, G. y Lungarotti, S. (1985). Audiological findings in Down’s children. International Journal of Pediatrics Otorhinolaryngology, 9(3), 227-232. https://doi.org/10.1016/S0165-5876(85)80038-0
McCreery, R. W., Walker, E. A., Spratford, M., Bentler, R., Holte, L., Roush, P., Oleson, J., Van Buren, J. y Moeller, M. P. (2015). Longitudinal predictors of aided speech audibility in infants and children. Ear and Hearing, 36, 24S-37S. https://doi.org/ 10.1097/aud.0000000000000211
Nightengale, E., Yoon, P., Wolter-Warmerdam, K., Daniels, D. y Hickey, F. (2017). Understanding hearing and hearing loss in children with Down syndrome. American Journal of Audiology, 26(3), 301-308. https://doi.org/10.1044/2017_AJA-17-0010
Norrix, L. W. (2015). Hearing thresholds, minimum response levels, and cross-check measures in pediatric audiology. American Journal of Audiology, 24(2), 137-144. https://doi.org/10.1044/ 2015_aja-14-0095
Park, A. H., Wilson, M. A., Stevens, P. T., Harward, R. y Hohler, N. (2011). Identification of hearing loss in pediatric patients with Down syndrome. Otolaryngology—Head & Neck Surgery, 146(1), 135-140. https://doi.org/10.1177/0194599811425156
Patel, L., Wolter-Warmerdam, K., Leifer, N. y Hickey, F. (2018). Behavioral characteristics of individuals with Down syndrome. Journal of Mental Health Research in Intellectual Disabilities, 11(3), 221-246. https://doi.org/10.1177/0194599811425156
Rasmussen, P., Borjesson, O., Wentz, E. y Gilberg, C. (2001). Autistic disorders in Down syndrome: Background factors and clinical correlates. Developmental Medicine and Child Neurology, 43(11), 750-754. https://doi.org/10.1080/19315864.2018.1481473
Rodman, R. y Pine, H. S. (2012). The otolaryngologist’s approach to the patient with Down syndrome. Otolaryngologic Clinics of North America, 45(3), 559-629. https://doi.org/10.1016/1S0022-3476(05)81588-4
Roizen, N. J., Wolters, C., Nicol, T. y Blondis, T. A. (1993). Hearing loss in children with Down syndrome. The Journal of Pediatrics, 123(1), S9-S12. https://doi.org/10.1016/S0022-3476(05)81588-4
Sabo, D. L., Paradise, J. L., Kurs-Lasky, M. y Smith, C. G. (2003). Hearing levels in infants and young children in relation to testing technique, age group, and the presence or absence of middle-ear effusion. Ear and Hearing, 24(1), 38-47. https://doi.org/10.1097/01.AUD.0000051988.23117.91
Shott, S. R., Joseph, A. y Heithaus, D. (2001). Hearing loss in children with Down syndrome. International Journal of Pediatric Otorhinolaryngology, 61(3), 199-205. https://doi.org/10.1016/ S0165-5876(01)00572-9
Silman, S., Silverman, C. A. y Arick, D. S. (1992). Acoustic-immittance screening for detection of middle-ear effusion in children. American Academy of Audiology, 3(4), 262-268.
Tedeschi, A. S., Roizen, N. J., Taylor, H. G., Murray, G., Curtis, C. A. y Parikh, A. S. (2015). The prevalence of congenital hearing loss in neonates with Down syndrome. The Journal of Pediatrics, 166(1), 168-171. https://doi.org/10.1016/jjpeds.2014. 09.005
Thompson, G., Wilson, W. R. y Moore, J. M. (1979). Application of visual reinforcement audiometry (VRA) to low-functioning children. Journal of Speech and Hearing Disorders, 44(1), 80-90. https://doi.org/10.1044/jshd.4401.80
Venail, F., Gardiner, Q. y Mondain, M. (2004). ENT and speech disorders in children with Down’s syndrome: An overview of pathophysiology, clinic features, treatments, and current management. Clinical Pediatrics, 43(9), 783-791. https://doi.org/10.1177/000992280404300902
Werner, L. A., Mancl, L. R. y Folsom, R. C. (1996). Preliminary observations on the development of auditory sensitivity in infants with Down syndrome. Ear and Hearing, 17(6), 455-468. https://doi.org/10.1097/00003446-199612000-00002
Traducido con autorización del artículo “Procedimientos de audiología conducta en niños con síndrome de Down“, por Emily E. Nightengale, Kristine Wolter-Warmerdam, Patrica J. Yoon, Dee Daniels y Fran Hickeyab (American Journal of Audiology, vol. 29, 356-364, Septiembre 2020, http://aja.pubs.asha.org/journal.aspx)). Este material ha sido originalmente desarrollado y es propiedad de la American Speech-Language-Hearing Association, Rockville, MD, U.S.A., www.asha.org. Todos los derechos reservados. La calidad y precisión de la traducción es únicamente responsabilidad de AG BELL INTERNATIONAL.
La American Speech-Language-Hearing Association (ASHA) no justifica o garantiza la precisión, la totalidad, la disponibilidad, el uso comercial, la adecuación a un objetivo particular o que no se infringe el contenido de este artículo y renuncia a cualquier responsabilidad directa o indirecta, especial, incidental, punitiva o daños consecuentes que puedan surgir del uso o de la imposibilidad de usar el contenido de este artículo.
Translated, with permission, from “Behavioral Audiology Procedures in Children With Down syndrome”, by Emily E. Nightengale, Kristine Wolter-Warmerdam, Patrica J. Yoon, Dee Daniels and Fran Hickeyab (American Journal of Audiology, vol. 29, 356-364, September 2020, http://aja.pubs.asha.org/journal.aspx). This material was originally developed and is copyrighted by the American Speech-Language-Hearing Association, Rockville, MD, U.S.A., www.asha.org. All rights are reserved. Accuracy and appropriateness of the translation are the sole responsibility of AG BELL INTERNATIONAL.
The American Speech-Language-Hearing Association (ASHA) does not warrant or guarantee the accuracy, completeness, availability, merchantability, fitness for a particular purpose, or noninfringement of the content of this article and disclaims responsibility for any damages arising out of its use. Description of or reference to products or publications in this article, neither constitutes nor implies a guarantee, endorsement, or support of claims made of that product, publication, or service. In no event shall ASHA be liable for any indirect, special, incidental, punitive, or consequential damages arising out of the use of or the inability to use the article content.
La percepción y el uso de la energía del habla de alta frecuencia: implicaciones clínicas y de investigación
Helen A. Boyd-Pratt y Jeremy J. Donai
Departamento de Ciencias y Trastornos de la Comunicación, West Virgina University, Morgantown
Objetivo: La energía del habla de alta frecuencia (por encima de unos 4–5 kHz) está logrando una considerable atención por parte del campo de la investigación. En esta revisión se examinan las pruebas recientes en torno a la presencia y el uso de la información perceptual en la región de alta frecuencia. Además, se analizan las aplicaciones clínicas y de investigación relevantes para los profesionales del habla, el lenguaje y la audición.
Método: Durante la búsqueda se utilizaron cinco bases de datos (Medline, CINAHL, WorldCat, ERIC y Google Scholar). Los criterios de inclusión fueron los siguientes: (a) revisión de expertos, (b) utilización de energía de alta frecuencia (por encima de unos 4 kHz) durante las tareas experimentales y (c) publicación entre 2014 y el momento actual. Se identificaron 57 artículos para su revisión y, tras una inspección posterior, se incluyeron 13 que cumplían los criterios de inclusión.
Resultados: Trece estudios revisados por expertos proporcionaron evidencia para respaldar la hipótesis de que existen señales acústicas importantes y utilizables en la parte de alta frecuencia del espectro del habla.
Conclusiones: Considerando la evidencia que se analiza en este documento, es evidente que la región de alta frecuencia contiene más señales perceptuales de las que se asumen actualmente. Específicamente, las señales acústicas con respecto a la información segmental (identificación de vocales y consonantes), la identidad del hablante individual y el género del hablante están disponibles para que las utilicen y escuchen personas y sistemas de reconocimiento automático. Además, la región del habla de alta frecuencia puede reducir el esfuerzo de escucha y mejorar el reconocimiento del habla en situaciones de escucha con ruido de fondo, especialmente cuando el habla y el ruido están separados espacialmente. Por lo tanto, los clínicos y los investigadores deben conocer esta información, que puede ser útil en la práctica clínica cuando se adaptan dispositivos de amplificación en diversas poblaciones clínicas y en las investigaciones experimentales por parte de científicos del habla y la audición.
La parte de alta frecuencia del espectro del habla (es decir, por encima de unos 4-5 kHz) ha recibido una atención considerable en la investigación durante la pasada década. Anteriormente se pensaba que contenía relativamente pocas claves perceptuales, pero las pruebas recientes han puesto en duda esta hipótesis. El objetivo de esta revisión es analizar las pruebas actuales con respecto al estudio de la energía del habla de alta frecuencia. En este artículo de revisión, el término alta frecuencia se refiere a la energía espectral a unos 4 kHz y superior, que se diferencia del término ultra-alta frecuencia (que se refiere a información por encima de 6-8 kHz) de otros autores (p.ej., Monson et al., 2019; Yeend et al., 2019). Habría que señalar que en algunos de los estudios incluidos, en los que se utilizan vocales como estímulos, se utilizaron puntos de corte de filtro y contenían información ligeramente inferior a 4 kHz (aproximadamente 3-3,5 kHz), ya que esta zona frecuencial para las vocales se considera de alta frecuencia. A pesar del uso de un punto de corte de frecuencia ligeramente más bajo, la energía de alta frecuencia (EAF) estaba presente y disponible en las señales utilizadas en estos experimentos, por lo que los estudios se incluyeron en la revisión.
Se facilita una breve descripción general de la información histórica, seguida de una revisión de las evidencias relevantes y actuales con respecto a la percepción y el uso de la energía del habla de alta frecuencia. Se puede encontrar una revisión anterior del tema en Monson et al. (2014). En la revisión actual se facilitan pruebas pertinentes publicadas desde el momento de dicha revisión, que se resumen en la Tabla 1. Se trata de un tema destacado para logopedas y audiólogos, dado que los clínicos e investigadores de ambas profesiones deben ser conscientes de las señales perceptivas en esta región. Se aplica a los profesionales del habla y la audición cuando prestan servicios de habla, de lenguaje o audiológicos a pacientes pediátricos y adultos, o cuando realizan investigaciones experimentales. Específicamente, el estudio de esta región tiene implicaciones para mejorar nuestra comprensión del procesamiento perceptivo del habla por parte de personas con una discapacidad auditiva, para mejorar el reconocimiento humano y automático del habla y las características del hablante (en silencio y en presencia de ruido), y para definir las propiedades acústicas y las señales perceptivas relacionadas con el habla normal y el habla desordenada.
Información histórica
Algunos de los estudios de percepción del habla más influyentes y trascendentales que conformaron el futuro de la investigación de la percepción del habla se realizaron en los Bell Laboratories durante las décadas de 1940 y 1950. Bell Labs actuó como el brazo de investigación de la empresa American Telephone & Telegraph, cuyo objetivo era desarrollar estrategias eficaces y eficientes para transmitir información del habla a través de sistemas telefónicos. En los primeros trabajos de French y Steinberg (1947) y Fletcher y Galt (1950) se sugería que el reconocimiento preciso de la señal del habla se podría mantener utilizando información a aproximadamente 4 kHz e inferior. Este trabajo influyó considerablemente en la manera en que las señales se transmitían a través de los sistemas telefónicos, en el diseño y la función de los audífonos, implantes cocleares y otros dispositivos de ayuda auditiva, y en las investigaciones posteriores sobre la percepción del habla. Además, estos hallazgos dieron lugar al desarrollo del Índice de articulación o, como se ha rebautizado recientemente, el Índice de Inteligibilidad del Habla (IIH), que es una herramienta que se utiliza para predecir la inteligibilidad del habla basándose en la audibilidad ponderada por banda, tanto en entornos clínicos como de investigación (American National Standards Institute, 2017). Actualmente, el IIH tiene relativamente poco peso por encima de unos 4-5 kHz.
A pesar del peso mínimo y la escasa atención prestada a la información en esta región, en varios estudios se han observado mejoras en las tareas relacionadas con el habla en niños (p.ej., McCreery y Stelmachowicz, 2013; Pittman, 2008), mejoras en la calidad del habla (p.ej., Fullgrabe et al., 2010; Moore et al., 2008) y un mayor reconocimiento del habla en presencia de ruido (p.ej., Moore et al., 2010) cuando se incluye información del habla procedente de esta región. A pesar del consenso general de que la presencia de energía del habla de alta frecuencia aporta determinados beneficios, se tiene un conocimiento escaso de las razones subyacentes y de las claves perceptuales precisas que existen en esta región.
El objetivo de este artículo de revisión es analizar el estado actual de las pruebas con respecto a la percepción y el uso de la información del habla de alta frecuencia y las posibles implicaciones para la investigación y la práctica clínica. Las áreas temáticas se dividen en análisis sobre los temas siguientes: EAF y características del hablante (información indexada), EAF y reconocimiento de la señal del habla (información segmental), EAF y esfuerzo de escucha, y detección de cambios de la EAF en la señal del habla. Esta revisión tiene implicaciones tanto para el científico del habla y la audición como para el clínico, dado que es esencial comprender todas las señales acústicas creadas por el mecanismo vocal y, posteriormente, la manera en que se utilizan estas señales en el procesamiento perceptivo de la señal del habla.
Método
Durante la búsqueda se utilizaron cinco bases de datos (Medline, CINAHL, WorldCat, ERIC y Google Scholar). Los criterios de inclusión fueron los siguientes: (a) revisión de expertos, (b) utilización y manipulación de la EAF (por encima de unos 4 kHz) durante las tareas experimentales y (c) publicación entre 2014 y el momento actual. Se excluyeron los estudios que no cumplían estos criterios o los estudios en los que se utilizaron dispositivos de amplificación, dado que el rendimiento de estos dispositivos no entraba en el alcance de esta revisión. Entre los términos de búsqueda se incluyeron alta frecuencia, EAF, señales de alta frecuencia, ancho de banda, hablante, habla y varias combinaciones de estos términos. Se identificaron 57 artículos para su examen y, tras una inspección posterior, se determinó que 13 cumplían los criterios de inclusión, por lo que se mantuvieron. La siguiente información representa una revisión de estos estudios seguida de un análisis de las implicaciones clínicas y de investigación.
EAF y características del hablante
Schwartz et al. (2018) investigaron la capacidad de los participantes con una audición normal para identificar la identidad de un hablante concreto (entre cinco hablantes) con diferentes anchos de banda espectrales en condiciones de ruido. Se realizaron dos experimentos, utilizándose en el primero señales h(Vocal)d (hVd) (had, herd, heed, etc.) y en el segundo tres oraciones del Rainbow Passage. En ambos experimentos, el ancho de banda espectral de las señales se incrementó de 3 a 10 kHz y se presentaron en presencia de ruido con tres relaciones señal/ruido (SNR) de +5, 0 y -5. Los autores informan de una mejor identificación del hablante con un mayor ancho de banda de señal en ambas condiciones experimentales. Específicamente, cuando el ancho de banda de la señal aumentaba de 3 a 10 kHz, se observaba una mejora del 6% en las señales hVd y una mejora del 10% en las oraciones. Además, se observaron disminuciones en el desempeño de identificación del hablante con una SNR reducida en la condición de ancho de banda de 3 kHz para estímulos basados en oraciones, mientras que esta disminución no se observó en la condición de 10 kHz. Estos resultados indican que, a medida que aumenta el nivel de ruido, la aportación de información de alta frecuencia adicional mejora la capacidad de identificación del hablante por parte de personas con una audición normal.
Donai y Halbritter (2017) examinaron la capacidad de las personas con una audición normal de identificar el género de un hablante en diversas condiciones de filtro en paso alto. El punto de corte del filtro en paso alto se incrementó sistemáticamente (desde 4,5 kHz y superior) para los estímulos de ambos experimentos. Los estímulos del Experimento 1 consistieron en segmentos vocálicos y los estímulos del Experimento 2 consistieron en oraciones del Rainbow Passage. En el Experimento 1, los participantes pudieron identificar con precisión el género del hablante por encima de la probabilidad de acierto por azar con una degradación severa a través de filtrado en paso alto para frecuencias de corte de hasta 8,5 kHz. En el Experimento 2, los participantes pudieron identificar con precisión el género del hablante por encima de la probabilidad de acierto por azar con puntos de corte de filtro de hasta 12 kHz. Estos resultados respaldan la presencia de información de alta frecuencia utilizable en el habla. Entre las implicaciones para este estudio se incluye el papel que puede desempeñar la región de alta frecuencia en el análisis del escenario auditivo, especialmente en presencia de ruido ambiental o en el caso de personas con una pérdida auditiva de baja frecuencia significativa (configuraciones auditivas de pendiente inversa que se describirán en el apartado Implicaciones clínicas y de investigación).
Donai et al. (2016) investigaron el papel y el uso de la información de alta frecuencia en la clasificación automática de la categoría vocálica y el tipo de hablante. Se realizaron grabaciones que consistían en señales de hVd de dos hombres, dos mujeres y dos niños. Para aislar la parte vocal, se extrajo un segmento de 100 ms de la grabación. Los estímulos se filtraron en paso alto para eliminar la información de frecuencia en el tercer formante (F3) e inferior. En el proceso de clasificación automático se utilizan Coeficientes cepstrales en las frecuencias de Mel (MFCC, por sus siglas en inglés), que son características motivadas perceptualmente que se suelen emplear en tareas automáticas de reconocimiento de voz y música. Los MFCC se extrajeron de las grabaciones de vocales filtradas de paso alto de cada hablante y se utilizaron para determinar la categoría vocálica y el tipo de hablante. La precisión de la identificación de la categoría vocálica osciló entre el 77% y el 100%, lo que indica un buen rendimiento en la clasificación. La precisión de la identificación del tipo de hablante también indicó un buen rendimiento de clasificación, con unos porcentajes de precisión entre el 85% y el 91%. Conjuntamente, estos resultados respaldan la presencia de información utilizable en el rango del habla de alta frecuencia y que la información de alta frecuencia puede desempeñar un papel importante en presencia de ruido de fondo.
Donai y Lass (2015) examinaron el uso de información de alta frecuencia para identificar el género (o el sexo) de los hablantes utilizando vocales filtradas de paso alto. Las señales de las vocales utilizadas en este estudio se filtraron para eliminar los detalles espectrales de baja frecuencia (aproximadamente 3,5 kHz), específicamente del F3 y por debajo. En los resultados se demostró que las personas con una audición normal podían identificar con precisión el género del hablante a partir de segmentos vocálicos significativamente por encima de la probabilidad de acierto por azar. La capacidad de identificación del género se redujo en apenas un 16% cuando las señales se filtraban para eliminar la energía espectral por debajo de 3,5 kHz. Se utilizaron análisis discriminantes lineales para determinar hasta qué punto las señales se podían clasificar correctamente. Los resultados de la clasificación fueron similares a los hallazgos perceptivos con respecto a una representación de señal tanto espectral como temporal. Los resultados de este estudio también indicaron una variabilidad significativa entre la precisión de los participantes, lo que sugiere que la degradación de la señal a través del filtrado en paso alto ejerció un mayor impacto en unas personas que en otras. El motivo subyacente se desconoce. No obstante, la precisión regular por encima de la probabilidad de acierto por azar en la identificación del género indica que las señales perceptivas están presentes en la región de alta frecuencia de las vocales.
Monson et al. (2014) investigaron la identificación del género y la identificación del modo de producción vocal utilizando la EAF. Este estudio se realizó utilizando grabaciones de extractos de «The Star-Spangled Banner». Las grabaciones incluían extractos hablados y cantados. A continuación, estas grabaciones se filtraron en paso de banda a 5,7 y 20 kHz para mantener sólo la EAF presente en las grabaciones. Se implementó una tarea perceptiva de elección forzada. Los participantes debían identificar el género del hablante y el modo de producción (habla o canto). Los investigadores averiguaron que la puntuación media para el modo de producción fue correcta en un 99,3% y la puntuación media para el género lo fue en un 92,2%. Se realizaron varios estudios de seguimiento para verificar estos hallazgos, incluido un estudio en el que se utilizó un enmascarador de baja frecuencia, otro estudio en el que se utilizaron sólo expresiones habladas para reducir las posibles señales temporales asociadas con el canto y un tercer estudio en el que se utilizó un nivel de presentación comparable al que tiene la EAF en el habla natural (aproximadamente 47 dB SPL). La mayoría de los participantes también pudo identificar la señal como la letra de «The Star-Spangled Banner», lo que sugiere la presencia de información de inteligibilidad en la EAF por encima de unos 5 kHz. Los autores destacaron la relevancia de estos resultados dado que están relacionados con la importancia de las señales de la EAF en la discriminación del género. Es posible que la EAF en el habla incorpore información sobre el género del hablante debido a la respiración residual, a menudo más prominente en hablantes femeninas (Henton y Bladon, 1985). La identificación de las características del hablante, como el género, puede ayudar a seguir a un hablante de interés en condiciones de audición adversas o ser fundamental en determinadas configuraciones de pérdida auditiva que requieran la utilización de la EAF para la recepción precisa del mensaje del habla (p.ej., pérdida auditiva de pendiente inversa).
EAF e inteligibilidad del habla
Además de las características del hablante, en varios estudios se han documentado la importancia y la utilización de la EAF para reconocer la señal del habla. Monson et al. (2019) investigaron la presencia de información utilizable en la región de alta frecuencia ampliada (AFA) del habla (por encima de 8 kHz). Se realizaron mediciones del umbral de recepción del habla en participantes con una audición normal utilizando varias SNR de «parloteo» de dos hablantes. La orientación de la señal de ruido en comparación con la señal de interés se modificó entre 45° y 60°. En los resultados de este estudio se reflejaron mejoras en el umbral de recepción del habla con la presencia del ancho de banda completo en ambas condiciones de orientación, con un aumento mayor en la condición de 60°. Además, los autores investigaron el uso de esta región del habla para detectar la orientación de un hablante sin señales visuales. Los autores detectaron que la adición de la región de AFA daba lugar a una mayor precisión para detectar la orientación del hablante. Específicamente, la presentación con una señal de ancho de banda completo se traducía en un aumento de la precisión del 34%. Estos resultados respaldan la presencia de información útil para escuchar en presencia de ruido y detectar la ubicación del hablante en la región de AFA.
Yeend et al. (2019) investigaron posibles variables relacionadas con la percepción del habla en presencia de ruido en el caso de adultos con una audición normal o «casi normal». Este estudio tenía por objetivo identificar los factores que influyen en las dificultades del habla en presencia de ruido, cuando no existe pérdida auditiva. La capacidad de percepción del habla en presencia de ruido se basó en la puntuación compuesta del habla en presencia de ruido (PCH) del participante. Esta puntuación se basa en la combinación de una escala autonotificada y dos pruebas de habla en presencia de ruido. Los participantes se dividieron en dos grupos según su PCH: un grupo de PCH «baja» y un grupo de PCH «alta». Se analizaron múltiples variables, entre las que se encontraban los datos demográficos del sujeto, la ototoxicidad, la exposición al ruido, la formación musical, la agudeza auditiva, las otoemisiones acústicas, la supresión del ruido, el ruido ecualizador del umbral, la estructura temporal fina, la modulación de la amplitud, la atención, la inteligencia no verbal, la memoria de trabajo y las habilidades lingüísticas. Se encontraron dos factores para predecir la PCH y que se podrían utilizar para identificar a las personas de la categoría de PCH «baja». Los dos factores fueron umbrales elevados en la región de AFA y puntuaciones de memoria de trabajo. La región de AFA se definió como la región de frecuencia entre 9 y 12,5 kHz. Estos resultados respaldan una relación entre el rendimiento deficiente del habla en presencia de ruido y los umbrales elevados de AFA, lo que indica una utilidad potencial para medir clínicamente los umbrales de AFA.
Levy et al. (2015) examinaron el impacto de añadir la región de AFA en la inteligibilidad del habla cuando los estímulos de enmascaramiento se separan de una señal de interés. Las señales de interés se filtraron en paso bajo a diferentes puntos de corte de 4 a 10 kHz. En una condición, el hablante objetivo y el enmascarador estaban separados. En la segunda condición, la señal de interés se encontraba directamente frente al participante y el ruido de enmascaramiento provenía de cuatro lugares diferentes situados a su alrededor. Las puntuaciones de los umbrales de recepción de oraciones (URO) se midieron en estas condiciones en participantes con audición normal y participantes con pérdida auditiva. Se observaron mejoras en los URO en ambas configuraciones. Las puntuaciones de los URO mejoraron en 3 dB cuando el ancho de banda aumentó de 4 a 10 kHz en el caso de los participantes con audición normal. También se observó una mejora menor, pero aun así significativa, en el caso de los participantes con pérdida auditiva. Al igual que en el estudio anterior, estos resultados destacan la importancia potencial de la EAF en la inteligibilidad del habla, especialmente en ubicaciones variables de ruido de fondo/altavoces. Otros investigadores han estudiado la capacidad de una persona para identificar vocales y consonantes a partir del habla compuesta únicamente por energía de alta frecuencia.
Donai y Paschall (2015) utilizaron el filtrado de paso alto para degradar las producciones de hVd generadas naturalmente y eliminar información en el F3 o en su proximidad. El objetivo de los experimentos fue evaluar la identificación de señales degradadas espectralmente después de una formación perceptiva limitada (10 min). A través de varios experimentos, se indicó a los participantes con audición normal que identificaran seis producciones de vocales con filtrado en paso alto de hablantes masculinos, femeninos y pediátricos (consúltese el artículo original para obtener detalles específicos). Los autores informaron de que la precisión de la identificación oscilaba entre aproximadamente el 30% y el 70%, lo que superaba el acierto por azar de forma significativa. En el análisis discriminante lineal utilizando información de picos espectrales, extraída entre 4 y 12 kHz, se reflejaron los datos perceptivos. En conjunto, estos hallazgos demuestran que la información por encima de unos 3 kHz de las vocales producidas naturalmente se puede utilizar para identificar (en niveles significativamente superiores a la probabilidad de acierto por azar) la categoría vocálica después de una formación perceptiva limitada.
En un estudio similar, Vitela et al. (2015) examinaron los efectos del filtrado de paso alto en el reconocimiento de vocales y consonantes. Las señales de vocales y consonantes producidas naturalmente se filtraron en paso alto a 5,7 kHz y se presentaron para su identificación a los participantes con audición normal. En los resultados se muestra un desempeño en la identificación de vocales y consonantes con un nivel significativamente superior a la probabilidad de acierto por azar, con una probabilidad de aproximadamente el 9% en el caso de las vocales y el 4% en el de las consonantes en la tarea de reconocimiento. Cuando se analizó la detección de información fonética, los autores notificaron una precisión aproximada del 57% para el lugar, el 91% para la voz y el 82% para la manera, situándose en todos los casos significativamente por encima de la probabilidad de acierto por azar. En conjunto, los autores sugirieron la presencia de información fonética importante por encima de 5,7 kHz, especialmente en el caso de las consonantes. Estos hallazgos concuerdan con los de Donai y Paschall (2015), que encontraron una identificación de vocales por encima del azar con degradación espectral a través del filtrado en paso alto a unos 3-3,5 kHz. Es posible que las diferencias metodológicas, como el punto de corte del filtro en paso alto (~3 kHz frente a 5,7 kHz) y la cantidad de formación perceptiva, dieran lugar a diferencias en el desempeño de la identificación, siendo mejor en Donai y Paschall (2015). No obstante, en ambos estudios se documentan importantes señales perceptivas en la energía del habla de alta frecuencia.
Silberer et al. (2015) examinaron los efectos de la audibilidad de la señal de alta frecuencia en el reconocimiento del habla con y sin señales visuales en adultos y niños con audición normal. Los autores utilizaron el filtrado de paso bajo (con puntos de corte de 6,3 a 12 kHz) para variar la cantidad de información de alta frecuencia en las señales. Se presentaron varios tipos de señales (es decir, palabras, oraciones, fonemas) con y sin señales visuales en silencio y en diferentes SNR predeterminadas. En los resultados se muestra que la presencia de señales visuales redujo el ancho de banda de la señal requerido para un reconocimiento óptimo del habla, y tanto los niños como los adultos se beneficiaron de la información de alta frecuencia adicional en el reconocimiento del habla en condiciones de escucha en ruido.
EAF y esfuerzo de escucha
Cramer y Donai (2018) investigaron recientemente el impacto de la reducción de la información de alta frecuencia en el esfuerzo de escucha de adultos jóvenes y de mediana edad. Estos dos grupos se denominaron «audición normal de jóvenes» (ANJ) y «audición normal de mayores» (ANM). Se utilizó un paradigma de doble tarea, en el que se requería que el participante repitiera primero la última palabra de la oración en cinco oraciones (Prueba revisada de percepción del habla en presencia de ruido). Tras completar las cinco oraciones, se pidió a los participantes que recordaran las cinco palabras objetivo. A continuación, se les indicó que puntuaran el esfuerzo percibido con la escala Likert (de 1 a 7). En este experimento, todos los participantes tenían una audición normal y se les evaluó la memoria de trabajo antes de participar. Se utilizaron dos anchos de banda de señal (2 y 8 kHz) con tres condiciones de escucha. Las condiciones de escucha incluían una condición en silencio, una condición de SNR de 0 dB y una condición de SNR de +10 dB. Los dos grupos mostraron la misma capacidad para identificar las palabras clave; no obstante, el grupo ANM obtuvo una puntuación un 10% más baja que el grupo ANJ para recordar palabras del experimento, lo que sugiere un esfuerzo de escucha adicional. El grupo ANM también indicó que las palabras clave le resultaron más difíciles de recordar que al grupo ANJ, tal como indican las puntuaciones del esfuerzo percibido. El recuerdo de palabras fue mayor con el ancho de banda ampliado, como lo demuestra el aumento del 8% en la condición de 8 kHz en comparación con la condición de 2 kHz. Ambos grupos mostraron mejoras en el recuerdo de palabras y notificaron un menor esfuerzo percibido cuando el ancho de banda se ampliaba a 8 kHz. Estos hallazgos respaldan la presencia de información importante en la región del habla de alta frecuencia e indican que las reducciones del ancho de banda dan lugar a un mayor esfuerzo de escucha. Se desconoce la razón precisa del aumento del esfuerzo observado en este caso de reducción del ancho de banda; no obstante, las alteraciones en la naturalidad de la señal son una explicación plausible.
McCreery y Stelmachowicz (2013) examinaron el desempeño de los niños en la repetición de palabras en diversas condiciones para determinar los efectos del ancho de banda y el ruido de fondo en el tiempo de procesamiento y en el recuerdo de palabras (ambas actividades están relacionadas con el esfuerzo de escucha). Los estímulos incluían grabaciones de pseudopalabras de consonante-vocal-consonante, además de palabras reales monosílabas de la lista de 50 palabras de la prueba «Phonetically Balanced Kindergarten». Se indicó a los niños con audición normal que repitieran lo que oían en condiciones de ancho de banda variable y diferentes SNR. Se crearon diferentes anchos de banda mediante el filtrado de paso bajo de las señales con valores de corte de frecuencia de 3,2 y 5,6 kHz, además de una condición de ancho de banda completo. Las SNR utilizadas incluían una SNR de 3 dB y una SNR de 9 dB. Las respuestas se clasificaron como correctas o incorrectas y se registró el tiempo de procesamiento verbal. La repetición de pseudopalabras disminuyó y el tiempo de procesamiento verbal aumentó a medida que disminuía la audibilidad de alta frecuencia. El recuerdo de palabras fue significativamente mayor con el ancho de banda completo presente en comparación con la señal filtrada en paso bajo con un punto de corte de 5,6 kHz. La repetición de palabras no varió entre las condiciones de ancho de banda, pero la disminución en el recuerdo de palabras indicó que la capacidad de repetición no es el único factor que influye en los procesos cognitivos de los niños. Estos resultados indican que una audibilidad comprometida, incluidas las reducciones del ancho de banda, influye en el tiempo de procesamiento verbal y en el recuerdo de palabras por parte de los niños. Si bien fuera del marco temporal de esta revisión, los autores actuales consideran que este estudio tiene implicaciones importantes relacionadas con el tema y, por lo tanto, se incluyó en la revisión.
Detección de cambios de la EAF
Monson y Caravello (2019) utilizaron el habla filtrada de paso bajo para identificar la frecuencia de corte audible máxima en el caso de personas con audición normal. Para determinar la frecuencia de corte máxima en la que los participantes podrían detectar una diferencia cualitativa, los autores filtraron señales en paso bajo en incrementos de 1 kHz de 6 a 22 kHz. Se utilizó una tarea de elección forzosa para evaluar el umbral de detección de diferencias en comparación con la señal de referencia (es decir, señal de ancho de banda completo de 22 kHz). En los resultados de este estudio se muestra que, en promedio, los participantes pueden detectar la eliminación de información de frecuencia entre 13 y 20 kHz. Estos resultados indican que la información en esta banda de 7 kHz puede resultar útil. Los autores también destacan que el IIH actual contiene información hasta 11 kHz y afirman que puede ser beneficioso incluir información más allá de 11 kHz.
Si bien fuera del marco temporal de esta revisión, los autores actuales incluyeron el siguiente estudio, dado que contiene detalles importantes y relevantes que son congruentes con el estudio descrito anteriormente. Monson et al. (2011) evaluaron la capacidad de una persona con audición normal de detectar cambios de la EAF en los sonidos vocálicos sostenidos que producen los cantantes. Los niveles de energía de las bandas de octava con una frecuencia central de 8 y 16 kHz se atenuaron en las grabaciones de vocales sostenidas. A los participantes se les dio una tarea de elección forzosa con instrucciones para elegir la señal «extraña». Los participantes pudieron identificar los cambios en la banda de octava de 8 kHz mejor que en la banda de octava de 16 kHz. Si bien los resultados fueron mejores en la banda de octava de 8 kHz, habría que señalar que más de la mitad de los participantes pudo identificar cambios en la banda de octava de 16 kHz. Las diferencias de voz, así como los cambios en el nivel de presión sonora, afectaron la capacidad de los participantes de detectar cambios. El aumento del nivel de presión sonora dio lugar a un aumento de la capacidad de detección de cambios. En general, los resultados de este estudio indican que la información de alta frecuencia puede ser perceptivamente relevante y puede afectar la percepción de la voz. Véase la Tabla 1 donde se muestra un breve resumen de los artículos analizados en este documento.
Implicaciones clínicas y de investigación
Pérdida auditiva de pendiente inversa
A pesar de que históricamente ha recibido escasa atención, la parte de alta frecuencia del espectro del habla (es decir, por encima de unos 4-5 kHz) está demostrando que contiene información perceptiva importante. Es tentador pensar que, debido a que la información de alta frecuencia a menudo se reduce en 20-30 dB en relación con las regiones de baja frecuencia, es menos relevante para la percepción del habla; no obstante, en estudios recientes se ha respaldado la presencia de información relevante para comprender la señal del habla, así como información sobre la identidad del hablante individual y su género. Como se ha descrito anteriormente, Monson et al. (2011) demostraron que las personas con audición normal eran capaces de detectar cambios espectrales de alta frecuencia por encima de 8 kHz en una señal de habla con ancho de banda completo. Por lo tanto, es posible que las personas dependamos de la información en esta región cuando las partes de baja frecuencia se degradan por interferencia de ruido o pérdida auditiva, especialmente aquellas con pérdidas de pendiente inversa que dependen en gran medida de la información de alta frecuencia para comunicarse.
Una pérdida auditiva de pendiente inversa conlleva unos umbrales auditivos de baja frecuencia más deficientes que mejoran a medida que aumenta la frecuencia (véase la Figura 1 donde se observan mejores umbrales en las frecuencias altas que en las bajas). Los resultados de audición que se muestran en la Figura 1 representan un audiograma tradicional (es decir, clínico) en el que la sensibilidad auditiva se evalúa de 0,25 a 8 kHz. En algunos casos, se evalúa la sensibilidad auditiva por encima de 8 kHz (10, 12, 14, 16 kHz), que se suele denominar «ultra alta frecuencia». Si bien hacerlo clínicamente es poco habitual en la mayoría de los centros, las pruebas presentadas en este artículo de revisión respaldan la realización de más evaluaciones rutinarias de esta parte del sistema auditivo.
En un estudio de caso publicado, Berlin (1982), se informa sobre numerosas personas que tenían una audición de alta frecuencia extremadamente aguda (a 6-8 kHz y superior hasta 20 kHz) pero poca sensibilidad auditiva en frecuencias más bajas (una forma severa de pérdida auditiva de pendiente inversa). El autor informa de que muchas de estas personas tenían un habla bastante bien conservada, a pesar de experimentar una pérdida auditiva sustancial en las frecuencias del habla «típicas» por debajo de 4 kHz. En un colegio oral de Luisiana se evaluaron la sensibilidad auditiva y la calidad del habla de los alumnos. Se observó que algunos alumnos tenían una sensibilidad auditiva residual de alta frecuencia, a pesar de mostrar una pérdida auditiva de baja frecuencia sustancial. Un grupo de oyentes entrenados compuesto por logopedas, audiólogos y maestros de audición/lenguaje revisaron las grabaciones de los alumnos y las calificaron en una escala de A a F. Estas calificaciones tenían la finalidad de reflejar las calificaciones escolares que serían administradas por los jueces en función de la calidad del habla. Como controles se utilizaron grabaciones de hablantes con audición normal. Si un profesional no otorgaba una A a las grabaciones de los hablantes normales o si su calificación variaba en más de una letra entre las grabaciones del mismo hablante, sus juicios no se habrían incluido. El autor indicó que los hablantes que recibieron una calificación de calidad del habla A tenían una buena audición de alta frecuencia (por encima de 4-8 kHz) y los que recibieron una calificación baja (F) tenían una baja sensibilidad de alta frecuencia. En total, se concluyó que 56 alumnos tenían una mejor sensibilidad auditiva de 6 a 15 kHz que de 0,300 a 3 kHz. Además, muchos de los alumnos con una agudeza auditiva sensible de alta frecuencia mostraron un buen desempeño utilizando un audífono experimental de «trasposición ascendente», que desplazaba la energía de baja frecuencia a regiones de frecuencia más alta. Por lo tanto, el hecho de que muchos de estos alumnos hayan conservado la audición de alta frecuencia, y también se hayan beneficiado de un audífono que potenciaba la energía de la señal fuera de las «frecuencias del habla» típicas, facilita pruebas de que las altas frecuencias fueron perceptivamente útiles para los individuos con pérdidas auditivas de baja frecuencia sustanciales.
Amplificación para la pérdida auditiva de alta frecuencia
La información facilitada en esta revisión tiene también implicaciones para la adaptación de dispositivos de amplificación en personas con una pérdida auditiva de alta frecuencia. El objetivo de estas adaptaciones es proporcionar una audibilidad de la EAF, normalmente en forma de voz y música. Actualmente, existe un debate sobre los medios más eficaces para proporcionar amplificación en la pérdida auditiva de alta frecuencia. En general, existen dos técnicas de procesamiento de señal diseñadas específicamente para mejorar la audibilidad de la información de alta frecuencia, conocida como amplificación de ancho de banda ampliado y reducción de frecuencia. La amplificación del ancho de banda ampliado implica proporcionar una ganancia (amplificación) del audífono tradicional superior a unos 5-6 kHz. La reducción de frecuencia, por el contrario, toma la energía presente de forma natural en la región de alta frecuencia y, de alguna manera, la reduce artificialmente a una región espectral de frecuencia más baja (véase Alexander, 2013, para obtener una revisión completa). A pesar de esta incertidumbre, en esta revisión se refuerza el hecho de que existen importantes señales perceptuales en la región de alta frecuencia y, por lo tanto, en las investigaciones futuras se debería examinar la manera en que ambas técnicas de amplificación alteran las claves del habla en esta región.
Reconocimiento de hablantes individuales
En pruebas recientes se ha demostrado la presencia de importantes señales del habla de alta frecuencia para el reconocimiento de hablantes individuales. El reconocimiento de hablantes individuales se puede evaluar mediante pruebas conductuales o algoritmos de clasificación automática. Ambas técnicas han documentado la presencia de información de alta frecuencia utilizable para la identificación de un hablante. Desde una perspectiva conductual, Schwartz et al. (2018) investigaron la capacidad de las personas con audición normal de identificar a un hablante con anchos de banda espectrales variables en condiciones de escucha en ruido. Los autores notificaron aumentos significativos en la identificación del hablante al ampliar el ancho de banda de la señal de 3 a 10 kHz, especialmente en la condición de mayor ruido (SNR de -5 dB). Los resultados de este estudio indican que, en presencia de un aumento del ruido de fondo, la aportación de información de alta frecuencia adicional mejora las capacidades de identificación del hablante por parte de personas con una audición normal.
En un experimento de clasificación automática, Donai et al. (2016) utilizaron señales hVd para determinar hasta qué punto se podría clasificar con un algoritmo de clasificación la categoría vocálica y el tipo de hablante utilizando MFCC. Los estímulos experimentales se filtraron en paso alto para eliminar la información de frecuencia en el F3 (unos 3,5 kHz) y por debajo. La identificación de la categoría vocálica y la precisión en la identificación del tipo de hablante indicaban un buen desempeño en la clasificación, con índices de precisión que oscilaron entre el 77% y el 100% para la categoría vocálica y entre el 85% y el 91% para el tipo de hablante. Estos resultados respaldan la presencia de información utilizable en el rango de alta frecuencia del habla para la identificación del hablante.
Los hallazgos notificados por Donai et al. (2016) son congruentes con los notificados por Hayakawa e Itakura (1994), que concluyeron que la tasa de reconocimiento de hablantes individuales mejoraba a medida que aumentaba el ancho de banda de la señal. En este estudio, los autores aumentaron sistemáticamente el ancho de banda espectral de 0 a 3 kHz gradualmente hasta 0-16 kHz y extrajeron las características acústicas de cada conjunto de señales. La tasa de reconocimiento más alta observada fue del 96,4% en la banda de 0 a 16 kHz (señal del ancho de banda más amplio). Hayakawa e Itakura (1995) se centraron en estos hallazgos y estudiaron de una manera similar el reconocimiento de los hablantes con ruido de fondo. Los autores investigaron las tasas de error en el reconocimiento de hablantes utilizando varias formas de ruido de fondo en señales que contenían dos bandas de frecuencia diferentes, 0-4 kHz y 4-10 kHz. Los resultados sugieren que, con la adición de ruido de tráfico (una señal ecológicamente válida), se observaron tasas de reconocimiento significativamente más altas en la banda de 4 a 10 kHz. También sugieren que la región del habla de mayor frecuencia es más resistente a los efectos negativos del ruido ecológico. Además, Deshpande y Holambe (2011) estudiaron el impacto del ruido de fondo en el reconocimiento automático de la identidad del hablante. Los autores utilizaron MFCC y Coeficientes cepstrales basados en el Operador de energía de Teager (TEOCC, por sus siglas en inglés), que representan características acústicas que se utilizan en el proceso automático de reconocimiento de hablantes individuales. Con SNR bajas, las características TEOCC mostraron una mejora significativa en la capacidad de identificación del hablante. En concreto, con una SNR de 0 dB, la tasa de identificación aumentó del 57% en el sistema MFCC al 76,25% en el sistema TEOCC. Estos resultados respaldan la importancia de la región del habla de alta frecuencia en las tareas de identificación del hablante, especialmente en presencia de ruido de fondo adverso. Además, se viene observando un interés en el uso de los potenciales corticales auditivos para evaluar la capacidad de una persona para seguir a un hablante de interés (es decir, un objeto auditivo) en condiciones de escucha de varios hablantes (a menudo denominado análisis de escenario auditivo).
Mesgarani y Chang (2012) reconstruyeron espectrogramas basados en la actividad neuronal de los oyentes para evaluar la codificación neuronal del habla producida por un hablante de interés. Se instruyó a los participantes para que prestaran atención a un hablante específico a partir de una mezcla de habla de dos personas. En los resultados se observó que las características acústicas del hablante al que se prestaba atención mejoraron en comparación con el otro hablante. En concreto, la información codificada de alta frecuencia (aproximadamente 8 kHz) mejoraba en el habla producida por el hablante al que se prestaba atención, lo que sugiere que la codificación de la EAF puede contribuir a la capacidad del sistema auditivo para ayudar a seguir con eficacia a un hablante de interés entre fuentes adicionales de información competitiva. En conjunto, es evidente que la capacidad de seguir a un hablante de interés es un componente importante de una comunicación eficaz, y la parte de alta frecuencia del espectro del habla tiene el potencial de contribuir a este proceso para los sistemas de reconocimiento de personas y máquinas.
Resumen
Basándose en las pruebas presentadas en este documento, queda claro que la parte de alta frecuencia del espectro del habla (por encima de unos 4-5 kHz) contiene más señales perceptivas de lo que se suponía en el pasado. Por este motivo, es importante que los clínicos y los investigadores de las ciencias del habla y la audición tomen conciencia de la importante información que contiene esta parte del espectro del habla. Para los audiólogos, tiene una importancia especial en la selección y la adaptación de audífonos a pacientes con una pérdida auditiva neurosensorial de altas frecuencias. El objetivo de estas adaptaciones debería ser conservar estas señales de alta frecuencia con el mejor grado posible. Para acceder a una revisión basada en pruebas de este tema, se recomienda la de Donai y Schwartz (2016). En el caso de los logopedas que atienden a pacientes con pérdida auditiva, es importante asegurarse de que los audífonos funcionan correctamente antes de iniciar el proceso terapéutico. Tomblin et al. (2014) facilitaron pruebas que respaldaban una mejora en los resultados del habla y el lenguaje en niños cuando se les adaptaban audífonos que ofrecían una audibilidad suficiente, observándose efectos similares en niños con pérdida auditiva neurosensorial leve y pérdida auditiva neurosensorial moderada-severa. Además, esta región parece prometedora en la evaluación y el tratamiento potencial del habla disártrica. Liss et al. (2010) extrajeron características acústicas de varias regiones espectrales en cinco grupos de hablantes (un control y cuatro categorías de habla disártrica) y las utilizaron como entradas en un clasificador discriminante de funciones. Los autores observaron que las características de la banda de frecuencia más alta (aproximadamente 5-11 kHz) contribuían de una manera significativa a la clasificación del habla normal frente al habla disártrica, así como a la clasificación de la categoría del habla disártrica. Si bien los autores reconocen la naturaleza preliminar de sus hallazgos, el uso de la EAF con el objetivo de diagnosticar y tratar el habla disártrica justifica una investigación más exhaustiva.
Bibliografía
Alexander, J. (2013). Individual variability in recognition of frequency-lowered speech. Seminars in Hearing, 34(2), 86-109. https://doi.org/10.1055/s-0033-1341346
American National Standards Institute. (2017). American national standard methods for calculation of the speech intelligibility index. https://blog.ansi.org/2016/06/speech-intelligibility-index/#gref
Berlin, C. I. (1982). Ultra-audiometric hearing in the hearing impaired and the use of upward-shifting translating hearing aids. The Volta Review, 84(7), 352-353.
Cramer, J. y Donai, J. J. (2018). Effects of signal bandwidth on listening effort in young- and middle-aged adults. International Journal of Audiology, 58(2), 116-122. https://doi.org/10.1080/14992027.2018.1533258
Deshpande, M. S. y Holambe, R. S. (2011). Robust speaker identification in the presence of car noise. International Journal of Biometrics, 3(3), 189-205. https://doi.org/10.1504/IJBM.2011.040815
Donai, J. J. y Halbritter, R. (2017). Gender identification using high-frequency speech energy: Effects of increasing the low-frequency limit. Ear and Hearing, 38(1), 65-73. https://doi.org/10.1097/AUD.0000000000000353
Donai, J. J. y Lass, N. J. (2015). Gender identification from high-pass filtered vowel segments: The use of high-frequency energy. Attention, Perception y Psychophysics, 77, 2452-2462. https://doi.org/10.3758/s13414-015-0945-y
Donai, J. J., Motiian, S. y Doretto, G. (2016). Automated classification of vowel category and speaker type in the high-frequency spectrum. Audiology Research, 6(1), 1-5. https://doi.org/10.4081/audiores.2016.137
Donai, J. J. y Paschall, D. D. (2015). Identification of high-pass filtered male, female, and child vowels: The use of high-frequency cues. The Journal of the Acoustical Society of America, 137(4), 1971-1982. https://doi.org/10.1121/1.4916195
Donai, J. J. y Schwartz, J. C. (2016). Strategies for maximizing speech-recognition performance: Adults with mild to moderately severe sensorineural hearing loss. EBP Briefs, 11(4), 1-13.
Fletcher, H. y Galt, R. H. (1950). The perception of speech and its relation to telephony. The Journal of the Acoustical Society of America, 22(2), 89-151. https://doi.org/10.1121/1.1906605
French, N. R. y Steinberg, J. C. (1947). Factors governing the intelligibility of speech sounds. The Journal of the Acoustical Society of America, 19(1), 90-119. https://doi.org/10.1121/1.1916407
Füllgrabe, C., Baer, T., Stone, M. A. y Moore, B. C. J. (2010). Preliminary evaluation of a method for fitting hearing aids with extended bandwidth. International Journal of Audiology, 49(1), 741-753. https://doi.org/10.3109/14992027.2010.495084
Hayakawa, S. e Itakura, F. (1994). Text-dependent speaker recognition using the information in the higher frequency band. Proceedings of ICASSP ’94. IEEE International Conference on Acoustics, Speech, and Signal Processing. Adelaide, SA, Australia, 1, I/137-I/140. https://doi.org/10.1109/ICASSP.1994.389336
Hayakawa, S. e Itakura, F. (1995). The influence of noise on the speaker recognition performance using the higher frequency band. 1995 International Conference on Acoustics, Speech, and Signal Processing. Detroit, MI, United States, 1, 321-324. https://doi.org/10.1109/ICASSP.1995.479538
Henton, C. G. y Bladon, R. A. W. (1985). Breathiness in normal female speech: Inefficiency versus desirability. Language & Communication, 5(3), 221-227. https://doi.org/10.1016/0271-5309(85)90012-6
Levy, S. C., Freed, D. J., Nilsson, M., Moore, B. C. J. y Puria, S. (2015). Extended high-frequency bandwidth improves speech reception in the presence of spatially separated masking speech. Ear and Hearing, 36(5), e214-e224. https://doi.org/10.1097/AUD.0000000000000161
Liss, J. M., LeGendre, S. y Lotto, A. J. (2010). Discriminating dysarthria type from envelope modulation spectra. Journal of Speech, Language, and Hearing Research, 53(5), 1246-1255. https://doi.org/10.1044/1092-4388(2010/09-0121)
McCreery, R. W. y Stelmachowicz, P. G. (2013). The effects of limited bandwidth and noise on verbal processing time and word recall in normal-hearing children. Ear and Hearing, 34(5), 585-591. https://doi.org/10.1097/AUD.0b013e31828576e2
Mesgarani, N. y Chang, E. F. (2012). Selective cortical representation of attended speaker in multi-talker speech perception. Nature, 485(7397), 233-236. https://doi.org/10.1038/nature11020
Monson, B. B. y Caravello, J. (2019). The maximum audible low-pass cutoff frequency for speech. The Journal of the Acoustical Society of America, 146(6), EL496-EL501. https://doi.org/10.1121/1.5140032
Monson, B. B., Hunter, E. J., Lotto, A. J. y Story, B. H. (2014). The perceptual significance of high-frequency energy in the human voice. Frontiers in Psychology, 5, 587. https://doi.org/10.3389/fpsyg.2014.00587
Monson, B. B., Lotto, A. J. y Ternström, S. (2011). Detection of high-frequency energy changes in sustained vowels produced by singers. The Journal of the Acoustical Society of America, 129(4), 2263-2268. https://doi.org/10.112/1.3557033
Monson, B. B., Rock, J., Schulz, A., Hoffman, E. y Buss, E. (2019). Ecological cocktail party listening reveals the utility of extended high-frequency hearing. Hearing Research, 381, 107773. https://doi.org/10.1016/j.heares.2019.107773
Moore, B. C. J., Füllgrabe, C. y Stone, M. A. (2010). Effect of spatial separation, extended bandwidth, and compression speed on intelligibility in a competing speech task. The Journal of the Acoustical Society of America, 128(1), 360-371. https://doi.org/10.1121/1.3436533
Moore, B. C. J., Stone, M. A., Füllgrabe, C., Glasberg, B. R. y Puria, S. (2008). Spectro-temporal characteristics of speech at high frequencies, and the potential for restoration of audibility to people with mild-to-moderate hearing loss. Ear and Hearing, 29(6), 907-922. https://doi.org/10.1097/AUD.0b013e31818246f6
Pittman, A. (2008). Short-term word-learning rate in children with normal hearing and children with hearing loss in limited and extended high-frequency bandwidths. Journal of Speech, Language, and Hearing Research, 51(3), 785-797. https://doi.org/10.1044/1092-4388(2008/056)
Schwartz, J., Whyte, A., Al-Nuaimi, M. y Donai, J. J. (2018). Effects of signal bandwidth and noise on individual speaker identification. The Journal of the Acoustical Society of America, 144(5), EL447-EL452. https://doi.org/10.112m.5078770
Silberer, A. B., Benter, R. y W. Y.H. (2015). Importance of high frequency audibility on speech recognition with and without visual cues in listeners with normal hearing. International Journal of Audiology, 54(11), 865-872. https://doi.org/10.17077/etd.ekan9og9
Tomblin, J. B., Oleson, J. J., Ambrose, S. E., Walker, E. y Moeller, M. P. (2014). The influence of hearing aids on the speech and language development of children with hearing loss. JAMA Otolaryngology-Head & Neck Surgery, 140(5), 403-409. https://doi.org/10.1001/jamaoto.2014.267
Vitela, A. D., Monson, B. B. y Lotto, A. J. (2015). Phoneme categorization relying solely on high-frequency energy. The Journal of the Acoustical Society of America, 137(1), EL65-EL70. https://doi.org/10.1121/1.4903917
Yeend, I., Beach, E. F. y Sharma, M. (2019). Working memory and extended high-frequency hearing in adults: Diagnostic predictors of speech-in-noise perception. Ear and Hearing, 40(3), 458-467. https://doi.org/10.1097/AUD.0000000000000640
Traducido con autorización del artículo “La percepción y el uso de la energía del habla de alta frecuencia: implicaciones clínicas y de investigación“, por Helen A. Boyd y Jeremy J. Donai (Perspectives of the ASHA Special Interest Groups, vol. 5, 1347-1355, Octubre 2020, http://aja.pubs.asha.org/journal.aspx)). Este material ha sido originalmente desarrollado y es propiedad de la American Speech-Language-Hearing Association, Rockville, MD, U.S.A., www.asha.org. Todos los derechos reservados. La calidad y precisión de la traducción es únicamente responsabilidad de AG BELL INTERNATIONAL.
La American Speech-Language-Hearing Association (ASHA) no justifica o garantiza la precisión, la totalidad, la disponibilidad, el uso comercial, la adecuación a un objetivo particular o que no se infringe el contenido de este artículo y renuncia a cualquier responsabilidad directa o indirecta, especial, incidental, punitiva o daños consecuentes que puedan surgir del uso o de la imposibilidad de usar el contenido de este artículo.
Translated, with permission, from “The perception and use of high-frequency speech energy: clinical and research implications”, by Helen A. Boyd and Jeremy J. Donai (Perspectives of the ASHA Special Interest Groups, vol. 5, 1347-1355, October 2020, http://aja.pubs.asha.org/journal.aspx). This material was originally developed and is copyrighted by the American Speech-Language-Hearing Association, Rockville, MD, U.S.A., www.asha.org. All rights are reserved. Accuracy and appropriateness of the translation are the sole responsibility of AG BELL INTERNATIONAL.
The American Speech-Language-Hearing Association (ASHA) does not warrant or guarantee the accuracy, completeness, availability, merchantability, fitness for a particular purpose, or noninfringement of the content of this article and disclaims responsibility for any damages arising out of its use. Description of or reference to products or publications in this article, neither constitutes nor implies a guarantee, endorsement, or support of claims made of that product, publication, or service. In no event shall ASHA be liable for any indirect, special, incidental, punitive, or consequential damages arising out of the use of or the inability to use the article content.