La nueva herramienta puede comprender y procesar información en diferentes formatos, incluyendo texto, imágenes, videos, audio y código.
Google lanzó Gemini 2.0, su modelo de IA más avanzado hasta la fecha, diseñado para la era de los agentes de IA.
La herramienta puede comprender y procesar información en diferentes formatos, incluyendo texto, imágenes, videos, audio y código.
El primer modelo lanzado por la compañía es Gemini 2.0 Flash, el más pequeño y menos potente. Sin embargo, supera a su predecesor, el Gemini 1.5 Flash, en rendimiento y velocidad.
Además, 2.0 Flash introduce la ejecución nativa de herramientas como Google Search, código y funciones definidas por el usuario.
Gemini 2.0 Flash está disponible de manera experimental para desarrolladores a través de la API de Gemini en Google AI Studio, y Vertex AI.
«La información es el centro del progreso humano. Por ese motivo, nos enfocamos desde hace 26 años en nuestra misión de organizar la información del mundo y hacerla accesible y útil», afirmó Sundar Pichai, CEO de Google y Alphabet.
A su vez, remarcó: «También es la razón por la que seguimos extendiendo las fronteras de la IA para organizar esa información a través de cada entrada y ofrecerla a través de cada salida, de modo que sea realmente útil para ti».
«Con nuevos avances en multimodalidad (como salida de audio e imagen nativa) y uso de herramientas nativas, nos permitirá crear nuevos agentes de IA que nos acerquen a nuestra visión de un asistente universal», celebró.
Gemini 2.0 incluye el seguimiento y la planificación de instrucciones complejas, la llamada a funciones compuestas, el uso de herramientas nativas y la mejora de la latencia.