LatamGPT está diseñado para reflejar la diversidad cultural y lingüística de la región.
Latinoamérica y el Caribe avanzan en su propio modelo de inteligencia artificial (IA) . LatamGPT es el primer modelo de lenguaje de gran tamaño desarrollado en colaboración en la región. Su objetivo es crear una inteligencia artificial que refleje la diversidad cultural y lingüística de la región.
Este proyecto colaborativo, coordinado por el Centro Nacional de Inteligencia Artificial (CENIA) de Chile, cuenta con la participación de más de 30 instituciones y 60 expertos de distintos países latinoamericanos. Se lanza en junio de este año.
No solo busca mejorar la precisión y relevancia de las aplicaciones de IA en contextos locales, sino también fomentar la soberanía tecnológica y la independencia en el ámbito de la inteligencia artificial.
En la actualidad, los modelos de lenguaje de inteligencia artificial más avanzados, como GPT-4 de OpenAI, Gemini de Google o Claude de Anthropic, han sido desarrollados principalmente en el hemisferio norte. Estos modelos pueden entender y responder en español, pero su entrenamiento se basa en bases de datos en inglés.
«Uno de los problemas que tenemos en Latinoamérica y el Caribe es que los LLM que usamos, si bien funcionan en español y portugués, son bastante limitados en el conocimiento que tienen sobre la región. Al poco andar comienzan a alucinar, porque muy pocos de los datos con los que estos modelos fueron entrenados son de esta parte del mundo», explicó Álvaro Soto, director de CENIA.
Colaboran Chile, Uruguay, Colombia, México, Perú, Ecuador, España, Estados Unidos, Argentina, y Costa Rica, entre otros países.
En total participan 60 expertas y expertos de estas latitudes (universidades, fundaciones, bibliotecas, entidades gubernamentales y organizaciones de la sociedad civil), y el apoyo del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de ese país, para la coordinación internacional entre las administraciones de gobierno, además del financiamiento del Banco de Desarrollo de América Latina (CAF).
Se trata de una apuesta conjunta y colaborativa que ya logró reunir más de 8 TB (terabytes) de información en texto plano y 50 billones de parámetros.
«Es importante que en la región podamos desarrollar capacidades para tener cierta independencia y tomar decisiones de cómo esta tecnología impacta a la sociedad. Hasta el momento no tenemos un modelo de lenguaje regional, y esta tarea no la puede asumir solo un grupo ni un solo país: es un desafío que requiere el esfuerzo de toda la región», concluyó Soto.