Novedades de OpenAI: presenta Sora, su IA para crear vídeos, y podría lanzar su propio buscador

  • Sora genera vídeos fotorrealistas a partir de texto de hasta 60 segundos de duración
  • La compañía estaría desarrollando su propio buscador de información en internet
Video generado por Sora

OpenAI continúa dando pasos en el desarrollo de soluciones de inteligencia artificial generativa y ha presentado Sora, un modelo capaz de generar vídeos de hasta 60 segundos a partir de instrucciones de texto. Pese a que no se trata de la primera herramienta de este tipo, puesto que Stability AI o Google ya habían lanzado Stable Video Diffusion y Videopoet respectivamente, Sora parece solventar el problema de la coherencia al mantener la calidad visual y el cumplimiento de las indicaciones del usuario durante toda la pieza. 

Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico”, explican desde la compañía. 

Según afirman desde OpenAI el modelo cuenta con un profundo conocimiento del lenguaje que le permite interpretar las instrucciones de texto con precisión, dando como resultado personajes convincentes, múltiples planos dentro de un solo vídeo y generación detallada de estilos visuales. 

No obstante, la compañía advierte que el modelo tiene debilidades, especialmente a la hora de generar escenas complejas o la interpretación de la relación causa-efecto. Tal y como apunta, por ejemplo, es posible que el usuario busque una escena en la que una persona le de un mordisco a una galleta, pero que acto seguido, en el vídeo la galleta aparezca sin el mordisco. 

Además, Sora también puede confundir indicaciones espaciales, como mezclar izquierda con derecha; o puede encontrar dificultades a la hora de interpretar descripciones de acciones que se desarrollan a lo largo del tiempo, como seguir la trayectoria de una cámara. 

Con todo, a juzgar por los ejemplos compartidos por OpenAI, el resultado es de una elevada calidad para tratarse de la primera versión de este modelo. Sora destaca especialmente por su sorprendente fotorrealismo, así como por su capacidad para producir clips más largos que los breves fragmentos que producen otras herramientas.

Contrasta, así, con los generadores de vídeo basados en inteligencia artificial que ha presentado, a lo largo de los últimos meses, compañías como Google, con Videopoet. Estos ofrecen piezas que evidencian mas fricciones, especialmente en lo que respecta a la coherencia o los movimientos, y muestran estilos visuales menos realistas. 

Además, Sora no solo genera vídeos que reflejan lo expresado en las indicaciones de texto, sino que es capaz de hacer una interpretación cinematográfica de los mismos, con especial atención a la consistencia, la profundidad y la perspectiva e, incluso las texturas. Muestra de ello es la pieza que muestra a un ser fantástico jugando con una vela, al más puro estilo de las películas de Pixar. 

Según recoge Wired, OpenAI también está trabajando en la funcionalidad de generar vídeos a partir de una sola imagen o una secuencia de fotogramas. Esta opción podría mejorar considerablemente las capacidades de narración de la herramienta al lograr que los usuarios generen un vídeo a partir de bocetos o dibujos de lo que quieren dar vida. Sin embargo, la compañía aún está trabajando en los aspectos de seguridad puesto que esta misma opción podría facilitar la producción de deepfakes o desinformación. 

A este respecto, OpenAI de momento sólo ha facilitado el acceso a Sora a cineastas, diseñadores y artistas visuales, así como a expertos en seguridad, desinformación y contenido dañino. Además, aseguran que están trabajando en herramientas para ayudar a detectar contenido engañoso, que podrían indicar cuándo Sora generó un video.

Del mismo modo, la herramienta verificará y rechazará las instrucciones de texto que infrinjan las políticas de uso de la compañía, como aquellas que incluyan violencia extrema, contenido sexual, imágenes de odio, imágenes de celebridades o la propiedad intelectual de terceros. También apuntan que el sistema de clasificación de imágenes revisará los fotogramas antes de mostrar el vídeo final al usuario. 

Noticias Relacionadas

Grandes compañías están utilizando la inteligencia artificial para monitorizar las conversaciones de los empleados

La búsqueda online basada en IA y la desaparición de las cookies revitalizarán canales tradicionales como el email marketing

Un posible buscador propio

Además de presentar Sora, OpenAI podría estar trabajando en la creación de su propio buscador, según informa The Information. La compañía estaría desarrollando su propia solución de búsqueda de información en internet, que competiría directamente con Google, y que bien podría incluirse como nueva característica de ChatGPT o presentarse como una aplicación independiente. 

Según el medio, Microsoft Bing impulsaría el posible nuevo servicio de la firma de Sam Altman, y podría suponer una seria amenaza para los buscadores más asentados en el mercado. Además, el supuesto nuevo producto de búsqueda podría ser más rápido que ChatGPT, pero sin comprometer sus capacidades de resumen de la información. 

La inteligencia artificial promete transformar por completo la forma en que se busca información en internet. Y es un terreno en el que, además de OpenAI, también está haciéndose un hueco Perplexity, una start-up respaldada por Jeff Bezos y cuyo servicio de búsqueda, según recoge Quartz, es utilizado por 10 millones de personas cada mes. 

Google, por su parte, es plenamente consciente de que la IA está cambiando la búsqueda online. Es por ello que está impulsando la integración de su modelo Gemini en muchos de sus productos, pero se encuentra a la zaga de los desarrollos de OpenAI y esto podría suponer una rotunda amenaza para el negocio de la compañía que hasta el momento ha dominado internet.