Mapa en pixeles de latino américa con líneas que simulan chips tecnológicos

La receta para una inteligencia artificial con sabor latinoamericano

El lanzamiento de LatamGPT ha captado el interés de tomadores de decisiones y referentes políticos en toda América Latina. LatamGPT es un sistema de procesamiento de lenguaje natural (LLM, por sus siglas en inglés) hecho por y para América Latina,  tomando un rol activo en  el desafío de desarrollar tecnología de IA en esta parte del mundo.

De esta forma, LatamGPT habilita una serie de preguntas necesarias para entender dónde estamos y qué pasos debemos priorizar en esta región en cuanto a innovación técnica en un mundo cada vez más polarizado. Por ahora todo indica que, una vez más, las alternativas abiertas y orientadas a tareas específicas son la apuesta estratégica para las regiones del sur.

No se trata de elegir blanco o negro, o entre el sol y la luna, sino de comprender que las alternativas abiertas son “más resilientes e inteligentes” para un contexto como el latinoamericano. Analizando el escenario global, pareciera que  los modelos de IA más populares, como ChatGPT o Claude, son y serán los más eficientes debido a su “tamaño” (cantidad de datos utilizados para su entrenamiento, capacidad de cómputo a disposición, entre otras variables que conforman la escala de un sistema de IA). 

Si bien estos modelos compiten por el liderazgo global, existen voces expertas que alertan de que aumentar la escala de los modelos de IA no ofrece necesariamente una mejora en su rendimiento, sino lo contrario. Además, los altísimos costos económicos que demanda su construcción y funcionamiento están, por el momento, fuera del alcance de los desarrolladores regionales. 

América Latina debe apostar por modelos más pequeños, construidos en base a alternativas abiertas, cómo LatamGPT, basados en una gestión responsable de los datos. LatamGPT no solamente es una expresión de cómo innovar a partir de las oportunidades y restricciones reales que se perciben en el continente, sino que, a su vez, y quizás lo más importante, es una opción sobre la cual se pueden construir nuevas alternativas, agregando valor y sumando al repertorio de soluciones técnicas lógicas para el contexto regional.  

Una estrategia integral latinoamericana de IA necesita políticas para cada uno de los elementos que hacen a la infraestructura de la IA, generalmente estructurados en “capas”. Analizarlas demanda un nivel de detalle que excede el alcance de este aporte, que solo se limita a enunciarlas.

Para empezar, la primera capa suele referirse a la capacidad de cómputo requerida para un sistema de IA. Tomando como referencia el Índice Latinoamericano de Inteligencia Artificial (ILIA), la escasa disponibilidad de infraestructura computacional, analizada desde sus diferentes alternativas y en comparación entre los países latinoamericanos, supone una limitación de base que por ahora puede afrontarse de dos maneras: por un lado, mientras aumenta la inversión en cómputo regional, América Latina debe sostener una histórica dependencia técnica de actores externos, particularmente estadounidenses. Este es el camino que permitió el surgimiento de LatamGPT, entrenado utilizando la nube de AWS. Por otro lado, existe la posibilidad de utilizar la capacidad existente a través de arquitecturas colaborativas donde se comparta capacidad de cómputo distribuyendo la demanda de procesamiento entre las capacidades existentes. De cualquier manera, un enfoque centrado en modelos más pequeños que se concentren en tareas específicas permitiría la obtención de excelentes resultados con una fracción del cómputo requerido por modelos “grandes”.

La siguiente capa se refiere a la necesidad de contar con políticas de gobernanza de datos ajustadas a necesidades y contextos concretos, es decir, de disponer y gestionar datos de forma responsable. Para avanzar en proyectos de innovación regional, es necesario aumentar la cantidad de datos abiertos de calidad y estandarizados que puedan aprovecharse para entrenar, ajustar y evaluar modelos de IA. Un desafío para América Latina es generar datos de alto valor mientras evita que sean captados unilateralmente por grandes corporaciones extranjeras, sin la correspondiente retribución o reconocimiento adecuado. Para revertir esta dinámica, las políticas de datos deben contemplar mecanismos que prioricen el acceso regional, limiten su extracción predatoria y garanticen la privacidad, solo para mencionar algunos de los ejes centrales que deben guiar su desarrollo. 

Adicionalmente, esta dimensión implica superar un obstáculo con frecuencia subestimado, la digitalización del acervo cultural latinoamericano. Bibliotecas nacionales, archivos, museos y centros educativos custodian repositorios de enorme valor para el desarrollo técnico regional, pero gran parte de ese patrimonio permanece inaccesible en formato digital. Avanzar en su disponibilización no es solo una política cultural: es una decisión estratégica para aumentar la representatividad de los datos con los que entrenar modelos.

Seguidamente, el próximo nivel se compone por los modelos de IA en sí mismos. LatamGPT es un ejemplo justamente de lo que es un modelo, en este caso uno “abierto”, con sus engranajes y mecanismos a disposición de la comunidad, a los fines de servir como base para construir nuevas alternativas. A su vez, LatamGPT está construido en base a otro modelo llamado Llama, construido por Meta, lo cual ilustra cómo desarrollos regionales pueden aprovechar recursos desarrollados fuera de la región para superar la dependencia antes mencionada. 

A continuación, un sistema de IA requiere de la capa de “aplicación”, esta es la herramienta concreta con la que el público interactúa, usualmente materializada a través de una interfaz amigable, como un chatbot por ejemplo. Es en esta capa donde los usuarios de América Latina quizás percibimos la ventaja de contar con un modelo que captura nuestra idiosincrasia, reflejando en mayor detalle nuestra forma de entender el mundo.

América Latina no está obligada a elegir entre la supremacía tecnológica de Estados Unidos o la de China; LatamGPT demuestra que existe una tercera vía. Construir nuestras propias alternativas es optar por versiones más resilientes de la tecnología que queremos. Además, es posible hacerlo con lógicas comunitarias, representando nuestros valores culturales. Es momento de avanzar en el imaginario de las herramientas que necesitamos. Aunque es esencial la participación de todos los sectores, son quizás los estados los principales responsables de concretar políticas que habiliten el apoyo financiero y los elementos técnicos que deben solaparse para transformar una necesidad en una realidad de la que podamos servirnos.