Google sigue ampliando su propuesta de IA con Whisk, que utiliza imágenes en lugar de prompts

  • Permite generar imágenes a partir de otras de sujeto, escena y estilo
  • De momento sólo está disponible a través de Google Labs en Estados Unidos

Google sigue desarrollando y ampliando su propuesta de herramientas basadas en inteligencia artificial generativa y ha presentado Whisk, una nueva innovación de su área de experimentación Google Labs. Se trata de una solución que permite generar imágenes a partir de otras imágenes, en lugar de prompts o instrucciones de texto. 

Tal y como explica la compañía, Whisk se diferencia por un proceso rápido, creativo y divertido, ya que facilita la generación de composiciones simplemente arrastrando otras imágenes. Permite incluir una imagen para el sujeto, otra para la escena y otra para el estilo. Estas se mezclan y se pueden personalizar para crear imágenes únicas. 
No obstante, también se podrá utilizar texto para definir los detalles. 

El sistema se basa en los modelos de inteligencia artificial de Google. Así, Gemini escribe automáticamente un título detallado de las imágenes creadas en Whisk, que sirve luego para alimentar el último modelo de generación de image de la compañía, Imagen 3. Google apunta que se captura la esencia, pero no una réplica exacta, para que luego sea más fácil seguir generando imágenes. 

Google advierte que Whisk extrae sólo algunas características clave de las imagen subidas por le usuario, por lo que los resultado pueden diferir de las expectativas.Entendemos que estas características pueden ser cruciales para tu proyecto y que Whisk puede no ser el indicado, por lo que te permitimos ver y editar las indicaciones subyacentes en cualquier momento”, explica la tecnológica. 

 

 

 

 

En un comunicado, Google ha querido resaltar la diferenciación de Whisk. Comenta que en las primeras pruebas con artistas y creativos, estos han descrito lel nuevo desarrollo como una herramienta creativa, no un editor de imágenes tradicional. “Lo creamos para una exploración visual rápida, no para ediciones perfectas. Se trata de explorar ideas de formas nuevas y creativas, lo que te permite trabajar con docenas de opciones y descargar las que más te gustan”, comenta la compañía. 

De momento, Whisk sólo está disponible a través de Google Labs en Estados Unidos.