OpenAI presenta Sora: Un modelo para generar vídeos a partir de texto

OpenAI presenta Sora: Un modelo para generar vídeos a partir de texto

Primero fue el texto, luego las imágenes, y ahora OpenAI ha dado un paso más allá con la creación de un modelo para generar vídeos.

El jueves, los creadores de ChatGPT y DALL-E anunciaron Sora, un modelo que transforma texto en contenido visual animado. A partir de hoy, Sora está disponible para su evaluación por parte de red teamers (equipos de ataque o equipo rojo), expertos en seguridad que examinarán el modelo en busca de vulnerabilidades y riesgos potenciales. Según el comunicado, también se ha puesto a disposición de un grupo selecto de artistas visuales, diseñadores y cineastas para recopilar comentarios sobre cómo mejorar el modelo y hacerlo más útil para los profesionales creativos.

Desde el lanzamiento de ChatGPT en noviembre de 2022, OpenAI ha estado avanzando rápidamente en el desarrollo de herramientas de IA generativa. Han presentado GPT-4, capacidades de mensajes de voz e imagen, y el nuevo modelo de imagen DALL-E 3, todos accesibles a través de ChatGPT. La API de OpenAI también ha revolucionado la industria de la IA, permitiendo a empresas y desarrolladores crear sus propias herramientas de IA generativa. Ahora, OpenAI da un paso significativo hacia adelante al ampliar las capacidades de la IA con la generación de vídeos.

Aunque existen otros modelos de generación de vídeo en el mercado, ninguno ha alcanzado la capacidad de producir vídeos tan realistas y elaborados como se presume que hace Sora. Por ejemplo, Meta ofrece una herramienta para crear videoclips cortos, y Google está investigando su propio modelo de transformación de texto a vídeo, aunque aún se encuentra en una etapa inicial.

Sora permite a los usuarios crear vídeos de hasta un minuto de duración, incluyendo escenas detalladas y con múltiples personajes. El anuncio presenta fragmentos de un vídeo que sigue a un vehículo todoterreno por una serpenteante carretera de montaña, así como secuencias «históricas» que recrean la California durante la fiebre del oro.

En cuanto a la seguridad, OpenAI ha puesto atención a los detalles. Además de realizar pruebas con los red teamers sobre el modelo, la empresa está desarrollando herramientas para etiquetar los vídeos producidos por Sora según las directrices establecidas por la C2PA. Asimismo, implementa los mismos métodos de seguridad que utiliza en DALL-E para filtrar mensajes de texto inapropiados o dañinos.

Por último, OpenAI ha manifestado su compromiso de colaborar con líderes políticos, educadores y artistas de todo el mundo para comprender sus preocupaciones y explorar posibles aplicaciones positivas de esta nueva tecnología. La compañía considera que aprender del uso real es esencial para mejorar continuamente la seguridad de los sistemas de IA a lo largo del tiempo.