Sistema motor y comprensión lingüística en la cognición corporizada

Hilda Hernández López
Jorge Hermosillo Valadez

Posgrado en Ciencias Cognitivas, UAEM
Profesor e investigador, Facultad de Ciencias, UAEM

La cognición corporizada es un modelo teórico reciente en ciencias cognitivas que, a diferencia de la visión tradicional de la cognición surgida en los años cincuenta, sostiene que las capacidades cognitivas, como la percepción, la atención o la memoria, dependen en gran medida de las propiedades físicas del mundo y son resultado de la interacción entre el agente y su entorno. Bajo este paradigma, el cuerpo, junto con sus estados internos, no solo es el soporte de la maquinaria cognitiva, sino que posibilita la cognición.

En el ámbito de la cognición humana, un conjunto importante de evidencia empírica proveniente de las neurociencias y la psicología respalda el modelo corporizado, lo cual ha permitido, además, que este sea tomado como un marco teórico idóneo para el desarrollo de modelos computacionales que recreen y den cuenta de las capacidades cognitivas humanas.

Sin embargo, un aspecto que continúa siendo objeto de controversia es saber si los procesos cognitivos llamados de nivel alto, como el razonamiento y el lenguaje, se basan en procesos sensoriomotores más básicos o de nivel bajo, o si aún constituyen reductos de la visión tradicional. En este artículo defendemos la perspectiva corporizada centrándonos en el análisis de la relación entre las capacidades motoras y la comprensión lingüística. Proponemos que tal relación nos ofrece una visión psicológicamente plausible respecto al modo en que los humanos comprendemos el lenguaje. Asimismo, comprender esta relación posibilita la creación de modelos computacionales más adecuados para trazar límites más precisos en las predicciones e hipótesis sugeridas por cualquier teoría sobre la cognición humana.

La exposición de nuestra propuesta comprenderá tres apartados. En primer lugar, describiremos la noción de simulación enfatizando la función que esta desempeña para explicar el proceso de comprensión del lenguaje. Posteriormente, exponemos la evidencia empírica que respalda el vínculo entre las capacidades sensoriomotoras y de comprensión lingüística. En tercer lugar, describimos dos modelos computacionales sobre comprensión y adquisición del lenguaje basados en la perspectiva corporizada. Por último, destacamos la relevancia de esta propuesta y discutimos algunas de sus limitaciones teóricas, empíricas y computacionales.

Simulación y comprensión en la cognición corporizada

La noción de simulación fue esbozada en la “teoría de los símbolos perceptuales” del psicólogo norte-americano Lawrence Barsalou.1 De acuerdo con esta, durante un evento particular (por ejemplo, jugar con una pelota) el cerebro organiza y almacena la experiencia obtenida como resultado de la interacción del agente con su entorno. Dicha experiencia es de carácter multimodal porque está constituida por aquella proveniente de los sistemas modales, a saber, perceptivo (visual, auditivo, táctil, olfativo y gustativo), motor y afectivo. La simulación ocurre como un proceso en el que la experiencia previa es recuperada y recreada de forma débil y parcial para llevar a cabo otras tareas cognitivas, como la comprensión y la memoria. Siguiendo con el ejemplo, la comprensión de la palabra “pelota” se basa en la simulación de la experiencia obtenida cuando el agente interactuó con una pelota, la cual incluye información perceptiva sobre el tamaño y el color de la pelota, así como las distintas formas en que el objeto puede ser utilizado (cómo patearlo, lanzarlo, entre otras).

De acuerdo con Barsalou, la experiencia multimodal es almacenada en redes neuronales llamadas simuladores,2 las cuales dan soporte a las simulaciones particulares y se extienden hacia las regiones modales del cerebro involucradas en las tareas propias de los sistemas perceptivo, motor y afectivo. En la cognición corporizada, la comprensión lingüística mediante la simulación es un proceso dinámico en el cual las regiones cerebrales de Broca y Wernicke (frontal inferior izquierda y temporal superior izquierda), tradicionalmente aceptadas como las encargadas del procesamiento lingüístico, trabajan en conjunto con las regiones modales que subyacen a los simuladores.

La noción de simulación en la cognición corporizada es relevante porque vincula la experiencia primaria (perceptiva, motora y afectiva), producto de la interacción del agente con su entorno, con otras capacidades de mayor complejidad, como la comprensión. Desde esta perspectiva, los procesos de adquisición y desarrollo del lenguaje son de vital importancia y, como mostraremos posteriormente, dicha visión ha dado origen a modelos computacionales que recrean el proceso de adquisición basándose en la experiencia sensoriomotora en agentes artificiales.

Evidencia empírica sobre la hipótesis corporizada

Los efectos de modulación,3 que muestran la incidencia de una tarea lingüística en una motora y viceversa, son tomados como la principal evidencia a favor de que la comprensión se basa en un proceso de simulación. En general, dichos efectos son explicados afirmando que la región cerebral asociada con el sistema motor4 también es utilizada durante tareas como la producción y la comprensión del lenguaje. Arthur Glenberg respalda esta propuesta trazando un paralelismo evolutivo y funcional entre el lenguaje y el sistema motor.5 Sostiene que la evolución es “conservadora”, razón por la cual el surgimiento del lenguaje no implicó cambios cognitivos radicales en los humanos porque este debió asentarse sobre capacidades motoras previamente establecidas. Desde un punto de vista funcional, la producción y comprensión de las conductas (propias y de otros) son tareas características tanto del lenguaje como del sistema motor. Esto implica, según Glenberg, que el lenguaje es “oportunista”,6 porque toma los recursos neurales necesarios para su implementación, siendo los del sistema motor los más idóneos por las funciones cognitivas que sostienen.

Rolf Zwaan y Lawrence Taylor explican el vínculo entre sistema motor y comprensión lingüística a partir de lo que ellos denominan “resonancia motora”,7 que consiste en una activación similar de las regiones cerebrales del sistema motor cuando se producen acciones, cuando se observan esas mismas acciones realizadas por otros y cuando se escuchan sonidos y palabras que se refieren a dichas acciones. De acuerdo con ambos, los tres procesos se relacionan funcional y neuronalmente, ocasionando que la puesta en marcha de uno facilite o perjudique la ejecución de los otros. Esto es respaldado por un grupo de estudios en los que se combinaron tareas que incluían la ejecución de movimientos de rotación manual, la observación de movimientos de rotación y la comprensión de oraciones que describían esos movimientos.8 En ellos se encontró que las tareas se llevaban a cabo con facilidad cuando el movimiento de rotación coincidía con aquel que era observado o descrito en la oración.

En estudios como el de Marco Tettamanti y colaboradores se investigó la relación a nivel cerebral entre producción y comprensión tanto de acciones como de oraciones.9 De acuerdo con estos autores, dichas tareas se llevan a cabo en una red neural que abarca regiones, como el área 44 de Brodmann, que podrían incluir neuronas espejo10 como aquellas encontradas en la región F5 de la corteza cerebral de los monos.11 Leonardo Fogassi y Pier Francesco Ferrari también defienden la relación entre sistema motor y comprensión lingüística en términos evolutivos. Afirman que el mismo sistema de neuronas espejo encontrado en los monos evolucionó en los seres humanos para dar soporte a la comprensión.12 Esto es plausible, tal como sostienen los autores, porque el área 44 es funcional y anatómicamente homóloga a F5 en los monos.

Otras investigaciones basadas en técnicas novedosas propias de las neurociencias, la neuropsicología y la psicología cognitiva han sido conducidas para respaldar la relación entre las capacidades motoras y de comprensión. Sobresalen dos estudios en los cuales se registró la actividad cerebral de los sujetos con resonancia magnética funcional (fMRI) mientras leían verbos y oraciones que describían acciones realizadas con distintos efectores, como la cara, el brazo y los pies. En la investigación de Olaf Hauk y colaboradores se encontró que la lectura de verbos como “lamer”, “recoger” y “patear” genera actividad en las regiones motoras que participan en el movimiento real de la lengua, los dedos de la mano y de los pies, respectivamente.13

También en el estudio conducido por Marco Tettamanti se analizó la actividad cerebral de los sujetos mientras leían oraciones que describían acciones realizadas con la mano, la boca y el pie, y se encontró que, en su conjunto, este tipo de oraciones activa una red neuronal que abarca zonas frontales, parietales y temporales del lóbulo izquierdo, incluyendo el pars opercularis, región del cerebro que parece estar involucrada en la codificación de las acciones.14 Además, Tettamanti confirmó el estudio de Hauk porque encontró diferente actividad en las regiones motoras cuando se leyeron oraciones que describían movimientos hechos con distintos efectores.

Resultados similares fueron encontrados con la técnica de estimulación magnética transcraneal por Pulvermüller y su grupo de investigación.15 Este descubrió que estimular la corteza motora izquierda de los participantes mientras juzgaban verbos que se refieren a acciones hechas con las manos o los pies (por ejemplo, “escoger” y “agarrar”) facilitaba la tarea cuando el verbo coincidía con la región motora que era estimulada. Por ejemplo, la estimulación de la región motora que controla el movimiento de las manos facilitaba el juicio de verbos que se refieren a acciones hechas con las manos, como “agarrar”. Este estudio ejemplifica un efecto de modulación en el que la actividad cerebral motora incide sobre la tarea de comprensión lingüística.

En la investigación de Barbara Marino y colaboradores se pidió a los sujetos que juzgaran sustantivos concretos que designan herramientas utilizadas para llevar a cabo acciones con la mano (“tijeras”, “lápiz”) o el pie (“pedal”, “patines”) y oprimieran un botón con la mano derecha o izquierda. 16Los resultados mostraron juicios más lentos cuando los participantes respondían con la mano derecha, indicando que los sustantivos, al igual que los verbos, activan el hemisferio izquierdo, en donde se ubican las regiones cerebrales que corresponden al sistema motor.

En el estudio de Arthur Glenberg y Michael Kaschak se pidió a los participantes que juzgaran oraciones que podían contener verbos de transferencia concretos (“dar”) o abstractos (“delegar”, “presentar”), los cuales describían dos clases diferentes de movimientos (hacia el lector o lejos del lector).17 De este modo, se elaboraron cuatro tipos de oraciones, como “Andrea te da la pizza”, “Tú le das la pizza a Andrea”, “Arturo te presenta el argumento” y “Tú le presentas el argumento a Arturo”. Dichas oraciones eran presentadas a los participantes y estos debían responder inmediatamente oprimiendo un botón que podía estar localizado lejos o cerca de ellos. Los investigadores predijeron que habría juicios más rápidos cuando el movimiento descrito en la oración coincidiera con aquel que llevaban a cabo los participantes para responder. Los resultados respaldaron la predicción evidenciando un efecto de modulación. Cuando las oraciones eran leídas, las regiones motoras que corresponden con el movimiento descrito se activaban, y si este era compatible con el movimiento de respuesta, la tarea se ejecutaba con mayor rapidez.

Todas estas evidencias parecen sugerir que la experiencia obtenida al llevar a cabo acciones puede ser relevante para comprender palabras y oraciones que describen dichas acciones. Ya sea por razones evolutivas o funcionales, las capacidades motoras y de comprensión guardan una relación estrecha en el cerebro. Aunque la investigación actual en ciencias cognitivas continúa su curso y no permite asegurar que esa relación —tal como es defendida en la cognición corporizada— sea concluyente, consideramos que abre nuevas líneas de investigación, al reconsiderar el papel del cuerpo tanto para llevar a cabo acciones como para dar soporte a procesos de gran complejidad, como la comprensión del lenguaje.

Modelos computacionales

La necesidad de desarrollar modelos computacionales que reproduzcan fielmente las capacidades cognitivas humanas, acompaña toda propuesta teórica desde los orígenes de las ciencias cognitivas. En la cognición corporizada, el desarrollo de estos modelos ha partido de reconsiderar el papel que desempeñan las capacidades sensoriomotoras en los procesos cognitivos de alto nivel. Para tareas lingüísticas como la comprensión, los modelos desarrollados han vinculado las capacidades motoras de los agentes con etiquetas lingüísticas (palabras y oraciones simples).

Un modelo que parte de una perspectiva corporizada es el de Angelo Cangelosi y Thomas Riga, el cual vincula el léxico básico de dos agentes virtuales con algunas capacidades motoras y, a través de un proceso de incremento, se logra que un agente responda a etiquetas lingüísticas de un nivel superior.18 En la primera fase del proceso, un agente lleva a cabo un conjunto de ocho acciones primitivas (“cerrar brazo izquierdo”, “cerrar brazo derecho”, “abrir brazo izquierdo”, “levantar brazo derecho”, “levantar brazo izquierdo”, “moverse hacia adelante” y “moverse hacia atrás”) y las vincula con sus respectivas etiquetas lingüísticas, mientras que el otro trata de imitarlo. La segunda fase combina dos acciones básicas para lograr un nivel de mayor complejidad de etiquetas lingüísticas, como “agarrar es cerrar brazo izquierdo y brazo derecho”. La tercera y última fase incluye elementos de la primera y la segunda para lograr un nivel de mayor abstracción, con frases como “llevar es moverse hacia adelante y agarrar”. Los autores argumentan que las oraciones de los últimos niveles se vinculan con las acciones por medio de un mecanismo de transferencia que permite el paso de un nivel de abstracción a otro.

El modelo reciente de Francesca Stramandinoli y colaboradores, inspirado en el de Cangelosi y Riga, se basa en el mismo método, donde los niveles más bajos vinculan directamente las etiquetas lingüísticas con las acciones y, por medio de un proceso de incremento, los niveles más altos también guardan una relación con las acciones.19 Una innovación del modelo de Stramandinoli es que utiliza un agente artificial físico llamado iCub20 y no agentes virtuales, como el de Cangelosi y Riga. En la primera fase del modelo de Stramandinoli se vincularon verbos de acción como “sonreír”, “arrastrar”, “agarrar” y “empujar” con acciones primitivas. Posteriormente, las acciones se combinaron usando pequeñas estructuras sintácticas para obtener frases más complejas, como “recoger [es] agarrar [y] arrastrar [y] soltar”. La última fase combinó etiquetas lingüísticas de la primera y la segunda fase para obtener frases más complejas como “aceptar [es] recibir [y] sonreír”.

Los modelos computacionales de tipo corporizado recrean la relación entre capacidades motoras y lingüísticas en agentes artificiales, basándose en las investigaciones realizadas con humanos. Los agentes artificiales recrean capacidades lingüísticas como la comprensión a partir de un proceso de incremento, es decir, se enfocan en las fases de adquisición y desarrollo del lenguaje, permitiendo que el agente vaya de los niveles más simples de asociación de acciones con palabras, a la asociación de estructuras lingüísticas y conjuntos de acciones cada vez más complejos. Sin embargo, estos modelos carecen de algunos aspectos esenciales que son relevantes para recrear todas las habilidades lingüísticas que exhiben los humanos. Tales carencias serán objeto de discusión en el siguiente apartado.

Discusión: problemas y relevancia de la cognición corporizada

Un problema teórico y empírico discutido en la cognición corporizada concierne a si la simulación es un proceso necesario para la comprensión del lenguaje. La evidencia sugiere que el sistema motor es utilizado durante la comprensión; sin embargo, tal evidencia es incapaz de mostrar que la simulación ocurre de forma rutinaria en los seres humanos. Frente a esta cuestión, parte de la defensa de la cognición corporizada deberá incluir una explicación respecto a qué tan relevante es el uso del sistema motor durante la comprensión. Para ello, se deberán conducir otros estudios basados en las técnicas más novedosas actualmente disponibles en ciencias cognitivas.

Otra cuestión abierta atañe a la evidencia empírica, la cual parece estar circunscrita para cierto tipo de palabras (principalmente verbos y sustantivos que designan herramientas) y oraciones. La mayoría de las investigaciones no considera una parte sustancial del vocabulario y las expresiones que los humanos usamos con regularidad. Como un caso especial destacamos el de las palabras abstractas (por ejemplo, “humanidad” y “autonomía”), porque ha propiciado un amplio debate, debido a que no hay un consenso respecto a qué clase de experiencia (sensorial, motora o afectiva) es simulada cuando tales palabras son comprendidas. Si bien hay estudios como los de Glenberg y colaboradores21 que respaldan una propuesta corporizada, estos no son suficientes para explicar una amplia variedad de palabras abstractas que probablemente tienen que ver con otros aspectos como las relaciones sociales (por ejemplo, palabras como “gobierno”, que se refieren a una institución social), tal como proponen Claudia Scorolli y colaboradores. 22Una explicación adecuada que incluya tanto el lenguaje concreto como el abstracto sigue siendo un reto pendiente para la cognición corporizada.

Los modelos computacionales que hemos descrito constituyen un avance significativo en la búsqueda por reproducir las capacidades lingüísticas humanas. Como hemos mencionado, estos también se basan en estudios sobre el papel que desempeñan las habilidades sensoriomotoras en el desarrollo cognitivo. Sin embargo, dichos modelos son aproximaciones que muestran un conjunto de limitaciones, como la incapacidad de que los agentes artificiales dominen niveles más altos de la práctica lingüística, por ejemplo, el nivel del discurso más que de simples etiquetas lingüísticas. Además, las estructuras sintácticas implementadas en estos modelos son mínimas, por lo cual la necesidad de incluirlas en una perspectiva corporizada es una cuestión relevante que deberá ser abordada en la investigación futura.

El vínculo entre capacidades motoras y lingüísticas en los humanos, tal como es defendido en la cognición corporizada, ejemplifica una nueva tendencia en las ciencias cognitivas que asigna un papel crucial al cuerpo y al entorno al delinear las capacidades humanas de gran complejidad, como la comprensión. A diferencia de la teoría tradicional, los programas de investigación más recientes en ciencias cognitivas exploran las capacidades sensoriomotoras que los humanos tenemos en común con otros animales. Si bien esta es una propuesta aún en discusión, ofrece nuevas posibilidades para la creación de modelos computacionales que, como vimos, resaltan las capacidades motoras de los agentes artificiales y tienden a centrarse en los procesos que delinean la adquisición y el desarrollo de las capacidades lingüísticas.

La cognición corporizada sostiene que el sistema motor es relevante para procesos cognitivos de alto nivel, como la comprensión del lenguaje. Si bien esta teoría cuenta con evidencia empírica, aún posee algunas limitaciones que dificultan respaldar la idea de que la experiencia obtenida al llevar a cabo acciones es vital para otras tareas cognitivas. No obstante, la cognición corporizada constituye un punto de partida para la investigación actual en ciencias cognitivas respecto a las capacidades lingüísticas humanas y el desarrollo de modelos computacionales más adecuados que aquellos hasta ahora propuestos.

Notas

1 Lawrence Barsalou, “Perceptual symbol systems”, The Behavioral and Brain Sciences, vol. 2, núm. 4, 1999, pp. 577-609.

2 Ibid., pp. 582, 586.

3 Lotte Meteyard y Gabriella Vigliocco, “The role of sensory and motor information in semantic representation: A review”, en Paco Calvo y Antoni Gomila (eds., Handbook of cognitive science: an embodied approach, Elsevier, San Diego, 2008, pp. 293-312.

4 Este es el encargado del control de las acciones propias y de la comprensión de las acciones hechas por otros. Abarca procesos como la anticipación, la planeación, la predicción y la preparación para la acción. Sus bases cerebrales comprenden la corteza motora primaria y premotora.

5 Arthur M. Glenberg, “Language and action: creating sensible combinations of ideas”, en Gareth Gaskell (ed.), The Oxford handbook of psycholinguistics, Oxford University Press, Oxford, 2007, pp. 361-370.

6 Ibid., pp. 365-368.

7 Rolf A. Zwaan y Lawrence J. Taylor, “Seeing, acting, understanding: motor resonance in languaje”, comprehension, Journal of Experimental Psychology, vol. 153, núm. 1, 2006, pp. 1-11.

8 Ibid., pp. 3-8.

9 Marco Tettamanti, Giovanni Buccino, Maria C. Saccuman, Vittorio Gallese, Massimo Danna, Paola Scifo, Ferruccio Fazio, Giacomo Rizzolatti, Stefano F. Cappa y Daniela Perani, “Listening to action related sentences activates fronto-parietal motor circuits”, Journal of Cognitive Neuroscience, vol. 17, núm. 2, 2005, pp. 273-281.

10 Las “neuronas espejo” comprenden un conjunto de neuronas descubierto en las partes inferiores de las cortezas frontal y parietal de los monos macacos en 1996 por Giacomo Rizzolati y su grupo de investigación.

11 Giacomo Rizzolatti y Corrado Sinigaglia, Las neuronas espejo: los mecanismos de la empatía emocional, Paidós Ibérica, Barcelona, 2006.

12 Leonardo Fogassi y Pier Francesco Ferrari, “Mirror neurons and the evolution of embodied language”, Current Directions in Psychological Science, vol. 16, núm. 3, 2007, pp. 136-141.

13 Olaf Hauk, Ingrid Johnsrude y Friedemann Pulvermüller, “Somatotopic representation of action words in human motor and premotor cortex”, Neuron, vol. 41, núm. 2, 2004, pp. 301-307.

14 Cfr. Marco Tettamanti, “Listening to action...”, op. cit., p. 274.

15 Friedemann Pulvermüller, Olaf Hauk, Vadim V. Nikulin y Risto J. Ilmoniemi, “Functional links between motor and language systems”, European Journal of Neuroscience, vol. 21, núm. 3, 2005, pp. 793-797.

16 Barbara F. Marino, Patricia M. Gough, Vittorio Gallese, Lucia Riggio y Giovanni Buccino, “How the motor system handles nouns: a behavioral study”, Psychological Research, vol. 77, núm. 1, 2013, pp. 64-73.

17 Arthur M. Glenberg y Michael P. Kaschak, “Grounding language in action”, Psychonomic Bulletin & Review, vol. 9, núm. 3, 2002, pp. 558-565.

18 Angelo Cangelosi y Thomas Riga, “An embodied model for sensorimotor grounding and grounding transfer: experiments with epigenetic robots”, Cognitive Science, vol. 30, núm. 4, 2006, pp. 673-689.

19 Francesca Stramandinoli, Davide Marocco y Angelo Cangelosi, “The grounding of higher order concepts in action and language: a cognitive robotics model”, Neural Networks, vol. 32, 2012, pp. 165-173.

20 Robot humanoide desarrollado a través del proyecto RobotCub de la Unión Europea. Es utilizado en alrededor de veinte centros de investigación en todo el mundo. Información disponible en www.icub.org, consultada en marzo de 2014.

21 Cfr. Arthur M. Glenberg y Michael P. Kaschak, “Grounding language...”, op. cit., p. 561.

22 Claudia Scorolli, Ferdinand Binkofski, Giovanni Buccino, Roberto Nicoletti, Lucia Riggio y Anna M. Borghi, “Abstract and concrete sentences, embodiment, and languages”, Frontiers in Psychology, vol. 2, núm. 227, 2011, pp. 1-11.