OpenAI presentó a Sora, su primer modelo de inteligencia artificial de texto a video. En una serie de publicaciones en redes sociales, el cofundador de OpenAI, Sam Altman, anunció el nuevo modelo y dijo que la compañía comenzará a ofrecer acceso a «un número limitado de creadores».

Según el sitio web de OpenAI, Sora puede generar videos de hasta un minuto de duración en una amplia variedad de estilos artísticos, incluyendo rostros humanos hiperrealistas. El modelo es capaz de crear «escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo». Sora también puede tomar una imagen y generar un video a partir de ella, o tomar un video existente y ya sea extenderlo o completar los fotogramas faltantes.

Algunas debilidades del modelo, según OpenAI, incluyen que puede tener dificultades para simular la física de una escena compleja, no entender completamente la causa y el efecto, y confundir detalles espaciales en una indicación, como mezclar izquierda y derecha. Entonces, si tu video muestra a un corredor corriendo hacia atrás, por ejemplo, es posible que desees intentar generarlo nuevamente. El modelo tampoco puede crear sonido para acompañar un video.

De los «creadores de número limitado» que tendrán la primera oportunidad con Sora, están compuestos por «artistas visuales, diseñadores y cineastas» que darán su retroalimentación para hacer que el modelo sea más útil para los profesionales creativos. Los investigadores de IA también tendrán acceso al modelo para redteam, un proceso en el que los grupos encuentran fallas y errores en el modelo para que pueda mejorarse.

Altman no reveló cuándo estará disponible Sora para el público. Tiene aplicaciones potenciales obvias para negocios como crear anuncios, hacer contenido para una presentación, y crear contenido para redes sociales.

Fuente: Inc.com