La brecha de Babel

LAURA CANO ALMARZA.

Dice Wittgenstein en algún lugar que los límites de su lenguaje son los límites de su mundo. Tratándose de filósofos uno nunca puede estar seguro de hasta qué punto alcanza aquí la trascendencia del término lenguaje, pero pese a todo, la idea que expone no es ajena a la mayoría de nosotros. En múltiples ocasiones uno se topa con esquinas del mundo que escapan a la descripción de la palabra y se estancan en la mente como imágenes vagas e imprecisas. Así, para un hispanohablante resulta difícil sentir la saudade portuguesa, puesto que desconoce los matices que la diferencian de la mera nostalgia. O quizá el hablante de lenguas europeas, acostumbrado a la cuantificación, el tecnicismo y el registro, se sobresalte al descubrir el pirahã. En esta lengua, hablada por nómadas del Amazonas, no existe el concepto de cantidad, la forma de pasado o términos para los colores. Y sin embargo, el pirahã es tan funcional y útil como lo sería el italiano en las calles de Roma. Así, en el aforismo de Wittgenstein se encierra una intuición profundamente arraigada en cada hablante: la palabra es necesaria para esculpir la realidad.

Un caso particular de este proceso es la necesidad de las lenguas de adaptarse a una orografía cambiante, determinada por el ritmo de la carrera tecnológica. Día a día, se incorporan con urgencia términos que se fusionan y multiplican para dar cobertura a las nuevas realidades que nos asaltan. Sin embargo, la relación entre la lengua y la tecnología ha sufrido un cambio radical en los últimos años. La aparición de herramientas como ChatGPT —quizá el ejemplo más conocido, pero no el único, de los llamados modelos de lenguaje de Inteligencia Artificial— ha convertido nuestras lenguas en una llave que nos permitirá, no solo referirnos a los nuevos avances, sino acceder a los potenciales beneficios de estas tecnologías.

La adaptación de las lenguas a los nuevos entornos digitales es un reto ineludible si queremos que nuestro mundo se adentre también en estas nuevas sendas. Sin duda existen cuestiones éticas de necesaria discusión, pero mantenerse inmóvil frente a esta nueva realidad sería un ejercicio de miopía tecnológica con terribles consecuencias a largo plazo. Mientras que tradicionalmente los ordenadores comprendían únicamente aquellos datos con una cuidada lógica y estructura, los nuevos modelos como ChatGPT son capaces de trabajar con textos naturales fruto de las lenguas. Como sistemas creativos y variables, cada una de ellas traba con cuidado elementos aislados que se despliegan en un número casi infinito de combinaciones. Y nuestra cultura, acumulativa como es, encuentra en los textos un soporte vital para transmitir información a través del tiempo y el espacio. Noticias, tweets, novelas, historiales médicos, (wiki)enciclopedias, leyes, anuncios. Estos datos se producen en nuestras sociedades a una velocidad abrumadora que hacen necesario contar con herramientas capaces de gestionar y extraer la información veraz de esa inmensa producción. De lo contrario, sería como tratar de encontrar la famosa aguja escondida en el pajar, si este pajar fuera del tamaño del océano Atlántico y creciera a cada segundo de búsqueda. La traducción automática, la mejora de accesibilidad en la interacción hombre-máquina, la discriminación entre textos humanos y generados por inteligencias artificiales o la mejora del diagnóstico médico basado en datos de otros pacientes son solo algunas de las aplicaciones directas que tienen estos

sistemas de lenguaje. Y la eficiencia de todas ellas depende de la habilidad que las máquinas tengan para «hablar» en nuestro idioma. Desde el significado a la intención, pasando por los matices de la especulación o la ironía, ninguno de estos factores puede soslayarse si se quiere recuperar el sentido completo de un mensaje.

Sin embargo, la incorporación de las distintas lenguas a estos nuevos ecosistemas digitales es irregular, y progresivamente, está germinando una nueva y preocupante desigualdad lingüística que crece cada año sin previsiones de ralentización.

El desarrollo de modelos de lenguaje precisa de numerosos recursos, tanto económicos como computacionales. Para que funcionen correctamente, cada uno de ellos debe entrenarse a través de la exposición del algoritmo a una ingente cantidad de textos en una determinada lengua para que pueda aprender, por pura estadística, en qué contexto aparece cada palabra e inducir de esta situación sus significados. Se ha estimado que un único entrenamiento de ChatGPT-3 —la versión actual disponible para usuarios en internet es la 3.5— puede ascender hasta los 4.600 millones de dólares y precisa el equivalente energético al consumo anual de 126 hogares. La magnitud de las cifras evidencia que el desarrollo de esta tecnología es solo asequible para las grandes tecnológicas, originándose así una brecha entre los recursos digitales disponibles en los países angloparlantes y el resto de territorios. Como muestra de este escenario, bastará decir que a esta desigualdad se la conoce comúnmente con un término inglés: gap lingüístico.

Se ha calculado que idiomas como el francés, el alemán o el español —segunda lengua con más hablantes nativos y la segunda más empleada en la web— tienen un retraso medio de hasta cuatro años en comparación con los modelos de lenguaje ingleses. Y si esto es así, uno pronto llega a preguntarse en qué estado se encontrarán las lenguas habladas muy lejos de Silicon Valley, como el telugu que, con casi cien millones de hablantes en el sur de la India, apenas dispone de recursos digitales.

El problema no es trivial, especialmente si se tiene en cuenta los recursos económicos necesarios para acometer esta transformación para cada lengua. Pero la dificultad de hallar una solución no hace menos necesario que esta se encuentre: un acceso justo a la tecnología es uno de los pilares que sustentarán un futuro justo. El inglés, como lengua franca, puede solventar la comunicación técnica o formal, pero en las casas y en las calles, la lengua materna seguirá siendo el cincel de la realidad. Por eso es necesario un progreso multilingüe, porque así son las personas que se beneficiarán de sus avances. De lo contrario, muchas lenguas quedarán ciegas e inservibles en un territorio nuevo y escarpado, un lugar que sin duda está llamado a ser uno de los grandes escenarios de este siglo.

One thought on “La brecha de Babel

  • el 20 febrero, 2024 a las 4:34 pm
    Permalink

    The passage adeptly explores the dynamic relationship between language and technology, emphasizing the necessity of linguistic adaptation to a rapidly changing digital landscape. It highlights the transformative impact of AI language models like ChatGPT, framing them as essential tools for navigating and leveraging emerging technologies. The discussion eloquently underscores the importance of linguistic evolution in facilitating communication and information management in the digital age.

    Respuesta

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *