Google lo apuesta todo a la inteligencia artificial: presenta PaLM2, refuerza Bard y mejora Search

  • La inteligencia artificial ha sido el eje central de las novedades presentadas en Google I/O
  • Ha actualizado Gmail, Maps y Photos y ha presentado una nueva gama de dispositivos Pixel

Google ha celebrado en su sede de Mountain View (California) su conferencia anual para desarrolladores, Google I/O, en la que presenta sus avances tecnológicos en toda su oferta de productos y servicios, tanto para consumidores, como para profesionales. Un evento que, en esta ocasión, ha puesto el foco en los esfuerzos de la multinacional en el terreno de la inteligencia artificial. 

Siete años en nuestro viaje como empresa pionera en inteligencia artificial, nos encontramos en un emocionante punto de inflexión. Tenemos la oportunidad de hacer que la IA sea aún más útil para todos”; comentan desde la firma en una publicación firmada por Sundar Pichai, CEO de Google y Alphabet. “Hemos estado aplicando IA para hacer que nuestros productos sean radicalmente más útiles durante un tiempo. Con la IA generativa, estamos dando el siguiente paso. Con un enfoque audaz y responsable, estamos reinventando todos nuestros productos principales”.

La presentación de la compañía ha tenido esta tecnología como eje central, y ha adelantado, entre otras cosas, un nuevo modelo de lenguaje natural con capacidades ampliadas, PaLM2; nuevas funcionalidades basadas en IA para Gmail, Photos y Maps; actualizaciones en el chatbot Bard; o nuevos dispositivos Pixel. 

A continuación resumimos lo más destacado de la conferencia Google I/O 2023: 

“Ayúdame a escribir” en Gmail

Tal y como señalan desde Google, gracias a un modelo generativo más potente, Gmail contará con la funcionalidad "Ayúdame a escribir", que ayudará a los usuarios a redactar correos electrónicos mediante la introducción de comandos en el asistente virtuales. Por ejemplo, si tras la cancelación de un vuelo, la aerolínea propone un bono pero el cliente desea un reembolso, podría usar esta herramienta para responder. 

Bastaría con solicitar al sistema el objetivo del texto y aparecerá un borrador completo. La inteligencia artificial se encarga de extraer los detalles del vuelo del correo electrónico anterior, a lo que el usuario podrá añadir los cambios que desee. "Ayúdame a escribir" comenzará a implementarse como parte de las actualizaciones de Workspace. 

Vista inmersiva para Google Maps

Google ha actualizado la Vista Inmersiva de Maps, que introdujo el año pasado, reforzando sus capacidades con inteligencia artificial, especialmente para la visualización de rutas. De esta forma, a partir de ahora los usuarios podrán ver todo tu viaje por adelantado, ya sea que lo hagan caminando, en bicicleta o en coche.

La opción, además, incluirá más información disponible, como la calidad del aire, el tráfico y la situación meteorológica, así como una proyección de cómo podrían cambiar. Immersive View para rutas se implementará durante el verano y se lanzará en 15 ciudades a finales de año, incluidas Londres, Nueva York, Tokio o San Francisco.

Magic Editor para Google Photos

Otro producto mejorado por AI es Google Photos, al que la tecnológica ha introducido la característica Magic Editor con la intención de brindar al usuario más opciones a la hora de editar sus fotografías. La función permitirá retocar las imágenes gracias a la inteligencia artificial generativa, resaltando colores, eliminando elementos, desplazando otros, etc. 

PaLM2 y Gemini

Una de las presentaciones más destacadas de Google I/O ha sido la de PaLM2, el modelo de lenguaje de próxima generación, que es una versión avanzada de PaLM con mejoras en su capacidad multilingüe, de razonamiento y de escritura de código de programación. 

Tal y como explican desde la tecnológica, PaLM2 ha sido entrenado en más de un centenar de idiomas, por lo que ha mejorado notablemente su capacidad para comprender, generar y traducir textos. Además, su base de datos incluye artículos científicos y páginas web con expresiones matemáticas, lo que garantiza mayor razonamiento lógico y matemático; así como un gran volumen de código fuente de programación disponible públicamente que hacen que domine lenguajes de programación como Python y JavaScript, o Prolog, Fortran y Verilog. 

La multinacional ha presentado PaLM2 en cuatro tamaños -de menor a mayor: Gecko, Otter, Bison y Unicorn-, para facilitar su implantación en distintas situaciones. “Gecko es tan liviano que puede funcionar en dispositivos móviles: lo suficientemente rápido para excelentes aplicaciones interactivas en el dispositivo, incluso sin conexión”, detalla Pichai en la comunicación. 

Además, a partir de este modelo, la compañía está trabajando en el desarrollo, actualización y optimización de otros modelos especializados, como Sec-PaLM, entrenado para aplicaciones de seguridad; o Med-PaLM2, alimentado con conocimientos sobre medicina y salud. 

También se ha presentado Gemini, un modelo básico de próxima generación, que todavía está en desarrollo. Según han explicado, ha sido creado desde cero para ser multimodal, altamente eficiente en las integraciones de herramientas y API y construido para permitir innovaciones futuras, como memoria y planificación. También estará disponible en varios tamaños y capacidades, al igual que PaLM 2.

Aproximación responsable

A medida que invertimos en modelos más capaces, también estamos invirtiendo profundamente en la responsabilidad de la IA. Eso incluye tener las herramientas para identificar contenido generado sintéticamente cada vez que lo encuentre”, indican desde Google. 

En esta línea, han presentado dos enfoques. Por un lado, marcas de agua, que incrustará información directamente en el contenido que se mantendrán aunque se realicen ediciones con el objetivo de identificar material generado por IA; y metadatos, que permitirá a los creadores asociar contexto adicional con los archivos originales, brindándole más información cada vez que encuentre una imagen.

Actualizaciones en Bard

Durante la conferencia, Sundar Pichai ha dado a conocer las actualizaciones llevadas a cabo en Bard, el modelo de lenguaje conversacional presentado el pasado mes de marzo como la propuesta de Google para competir con ChatGPT, de OpenAI. En esta línea, ha dado a conocer que el chatbot se apoya ahora en PaLM2, por lo que ahora presenta capacidades mejoradas en razonamiento, lógica y codificación. 

También ha anunciado la eliminación de la lista de espera y la apertura Bard a más de 180 países y territorios; así como su disponibilidad en japonés y coreano, y pronto en decenas de idiomas más. La compañía también ha optimizado el sistema para que sea visual, de tal forma que sus respuestas, además de mostrar texto, también presentarán imágenes. También se podrán adjuntar imágenes en las indicaciones introducidas. 

Entre otras innovaciones de Bard, cabe destacar su apariencia con tema oscuro, una mejor relación entre el texto de respuesta y las fuentes utilizadas, o más opciones para exportar el texto del chatbot a otros servicios de Google. 

Mejoras en Search

Apoyándose en sus recientes desarrollos en inteligencia artificial, Google ha mejorado Search. El buscador de la tecnológica presentará ahora una mayor comprensión del texto escrito en diferentes idiomas, permitiendo hacer preguntas de manera más natural y llegar al contenido más relevante en la web. Además, los avances en la visión por computadora de Google Lens dan lugar a nuevas formas de buscar visualmente. Por otro lado, también se han impulsado capacidades de seguimiento de las búsquedas o la comparación de la información y las respuestas. 

Android, Pixel y Google Cloud

La compañía también ha presentado novedades para su sistema Android, como la optimización de 50 de sus aplicaciones para dispositivos de pantalla grande, la inclusión de la app de Whatsapp en Wear OS, o la actualización de la funcionalidad  Find My Device. 

Por otro lado, la gama de dispositivos móviles Pixel ha ampliado su oferta con el smartphone Pixel 7a, el móvil plegable Pixel Fold; o una nueva tablet, todos ellos equipados con las innovaciones de Android y nuevas capacidades de inteligencia artificial. 

En el apartado de cloud, lo más novedoso es Duet AI para Google Cloud, que la compañía define como un “nuevo colaborador generativo basado en IA, concebido para ayudar a resolver retos del día a día a usuarios de la nube con niveles de cualificación muy variados”. Duet AI ayudará a programar de forma colaborativa, permite revisar el código, realiza sugerencias y contribuye a generar funciones completas en tiempo real. 

Aquí puedes ver la Keynote completa de Google I/O 2023: 

Asociación con Adobe

Google han llegado a un acuerdo para llevar Fyrefly, la familia de modelos creativos de inteligencia artificial generativa de Adobe, a Bard. De esta forma, tal y como explica la compañía en un comunicado. en los próximos meses Firefly se convertirá en el principal partner de IA generativa de Bard, impulsando y realzando las capacidades de conversión de texto a imagen.

Con la integración los usuarios podrán describir la visión de lo que buscan a Bard y este creará imágenes que posteriormente podrán ser editadas para crear diseños en la suite de Adobe Express. La firma asegura que la asociación tiene una perspectiva centrada en los creadores, ya que utilizará tecnología de código abierto de la Content Authenticity Initiative para brindar transparencia a las imágenes generadas. 

Tal y como explica Adobe, el primer modelo de Firefly ha sido entrenado con
imágenes de Adobe Stock, contenido con licencia abierta y contenido de dominio público cuyos derechos de autor han expirado. Además, asegura que las empresas podrán entrenar a Firefly con su propio material creativo para generar contenido en su
propio lenguaje de marca.

Más info.: Novedades Google I/O 2023