Las personas que tienen deficiencias neurológicas para comunicarse podrían beneficiarse enormemente del desarrollo de tecnología que permita convertir la actividad neuronal en palabras.

Hablar puede ser visto como una actividad sin esfuerzo, pero es una de las acciones más complejas que llevamos a cabo. Requiere de una coordinación dinámica y precisa de músculos en las estructuras del tracto vocal como los labios, la lengua, la laringe y la quijada. Las personas que se encuentran impedidas para producir el discurso debido a un infarto cerebral, esclerosis lateral amiotrófica u otros desórdenes neurológicos pueden vivir una experiencia devastadora.

Un artículo publicado recientemente (24 abril 2019) en la revista Nature reporta que se está cerca de desarrollar una interfaz cerebro computadora que podría restaurar la capacidad de hablar y producir discursos.

Uno de los autores del estudio, el doctor Gopala Anumanchipalli, neurólogo de la Universidad de California en San Francisco, señala que las interfaces cerebro computadora tienen el propósito de ayudar a la gente con parálisis, leyendo directamente de su cerebro y usando esa información para controlar dispositivos externos o para mover miembros que estén paralizados.

El desarrollo de este tipo de interfaces cerebro-computadora destinadas a la comunicación,  se ha enfocado hasta ahora principalmente en la escritura por computadora controlada por el cerebro. Esto permite a la personas que están incapacitadas para hablar teclear a una velocidad de hasta 8 palabras por minuto. Si bien, restaurar la función del habla a este nivel puede cambiar la vida de las personas, aún no permite la comunicación fluida del discurso natural, el cual alcanza un promedio de 150 palabras por minuto.

 

Gopala Anumanchipalli investigador de la Universidad de California, San Francisco.

El doctor Anumanchipalli y los otros autores del estudio han desarrollado una nueva propuesta en la cual las oraciones habladas se producen a partir de las señales cerebrales usando métodos conocidos como “deeplearning” un tipo de aprendizaje automático de inteligencia artificial.

Los investigadores trabajaron con cinco voluntarios que fueron sujetos a un procedimiento denominado monitoreo intracraneal  en el cual se usan electrodos para monitorear la actividad cerebral como parte de un tratamiento contra la epilepsia. Los autores usaron una técnica llamada electro corticografía de alta densidad para seguir la actividad de áreas del cerebro que controlan el discurso y los movimientos articulatorios a medida que los voluntarios pronunciaron varios cientos de frases.

Electrodos intracraneales para monitorear la actividad cerebral.

Para reconstruir el discurso o el habla, en lugar de transformar las señales cerebrales directamente en señales auditivas, usaron un enfoque de decodificación de dos etapas, en el cual primero se transformaron las señales neurales en representaciones de movimientos de los tractos vocales articulatorios, y luego los movimientos decodificados en oraciones habladas.

Ambas transformaciones usaron redes neuronales recurrentes, un tipo de redes neuronales artificiales que son particularmente efectivas en el procesamiento y la transformación de información que tiene una estructura temporal compleja. “Diseñamos un decodificador neural que explícitamente aprovecha las representaciones cinemáticas y sonoras codificadas en la actividad cortical humana para sintetizar discurso audible», reportaron los investigadores.

 

Esquema: Nature
Interfaz cerebro computadora para la síntesis de discurso

En pruebas de vocabulario cerradas, los oyentes pudieron fácilmente identificar y traducir las palabras y frases sintetizadas por la actividad cortical. Las representaciones articulatoria decodificadas se conservaron en todos los participantes permitiendo a un componente del decodificador ser transferible entre participantes.  Incluso el decodificador fue capaz de sintetizar frases aun cuando los participantes únicamente “dijeran” las oraciones en silencio.  Estos hallazgos hacen más prometedor el uso de tecnología para restablecer la comunicación hablada.

Dado que la producción del discurso hablado humano no puede ser estudiado en animales, el rápido progreso en esta área de investigación a lo largo de la década pasada es verdaderamente excepcional; desde los estudios que identificaron las áreas cerebrales que están relacionadas con la organización del habla hasta el desarrollo de las interfaces cerebro computadora. Estos logros son testigos del poder del trabajo interdisciplinario que incluye neurocirujanos, neurólogos, ingenieros, neurocientíficos, lingüistas y científicos de la computación, así como personal clínico.

Consulta el artículo completo aquí