Tras anunciar su propio modelo de lenguaje, su alternativa a Google Docs e incluso su propio sistema operativo, la Unión Europea presentó su alternativa al buscador de Google, llamada Open Web Search.
En realidad, lo que presentó este fin de semana es el primer paso hacia ese buscador. Se trata de Open Web Index, es decir, la base de datos abierta a todos para crear buscadores que no se basan en la publicidad potenciada por IA y que no dan prioridad a la cultura anglosajona.
En junio se abrirá el acceso al primer Petabyte de datos, pero ya hay indexados 5 PB y se espera llegar pronto a los 10 PB.
Los primeros buscadores con contenido europeo
Los buscadores de Internet usan bases de datos indexadas creadas y controladas por las grandes tecnológicas norteamericanas. Son datos sesgados que se ajustan principalmente a la cultura y la información anglosajona.
Un segundo problema es que la mayoría de los buscadores de Internet, especialmente el buscador de Google y Bing, que copan el mercado, hace tiempo que dejaron de ser buscadores. Ya no buscan información. Ahora, con ayuda de la IA, la seleccionan, la filtran y la resumen en forma de texto lleno de enlaces patrocinados, que evita la necesidad de visitar las webs.
Por eso un consorcio de 14 miembros, entre los que se encuentran universidades, centros de datos, empresas tecnológicas y el CERN, pusieron en marcha la infraestructura para alojar Open Web Index. Es una base de datos con información y webs de ámbito europeo y mundial para crear buscadores, pero también entrenar a los modelos de lenguaje LLM, y diseñar aplicaciones de todo tipo.
Como es habitual en la UE, esta base de datos está abierta a todos. Pero además, van a crear un buscador «modelo» alrededor de ella, Open Web Search.