OpenAI presenta GPT-4, un modelo con mayor capacidad creativa, resolutiva y de razonamiento

  • El sistema es ahora capaz de reconocer instrucciones de imagen y manejar textos de 25.000 palabras
  • Está disponible para desarrolladores a través de lista de espera y en su versión de pago ChatGPT Plus
OpenAI presenta GPT-4, un modelo con mayor capacidades creativa, resolutiva y de razonamie

OpenAI ha presentado GPT4, una nueva versión de su modelo de lenguaje natural basado en inteligencia artificial que impulsa herramientas como ChatGPT. Tal y como ha señalado la compañía, se trata de una actualización más sofisticada que ha mejorado las capacidades creativas, colaborativas y de razonamiento frente a los sistemas predecesores -GPT, GPT-2 y GPT-3-, y con más foco en la seguridad de las respuestas. 

Aquí está GPT-4, nuestro modelo más capaz y alineado hasta el momento. Está disponible hoy en nuestra API (con una lista de espera) y en ChatGPT+”, ha comentado Sam Altman, CEO de OpenAI, en Twitter al presentar la innovación. “Todavía tiene fallos, todavía es limitado y aún parece más impresionante en el primer uso que después de pasar más tiempo con él. Es más creativo que los modelos anteriores, alucina significativamente menos y es menos sesgado. Hemos tenido el entrenamiento inicial de GPT-4 durante bastante tiempo, pero nos ha llevado mucho tiempo y mucho trabajo sentirnos listos para lanzarlo”.

Las mejoras de GPT-4

Una de las principales características que resaltan desde OpenAI respecto a la nueva versión del modelo es su capacidad creativa. Aseguran que puede generar, editar e iterar con los usuarios en tareas de escritura técnica y creativa, como componer canciones, escribir guiones o aprender el estilo de escritura de un usuario. A modo de ejemplo, expone la solicitud de explicar la trama de Cenicienta en una oración donde cada palabra tiene que comenzar con la siguiente letra del alfabeto de la A a la Z, sin repetir ninguna letra.

No obstante, una de las mejoras más destacadas es la capacidad de aceptar tanto indicaciones de texto como de imágenes, es decir, reconoce imágenes introducidas por los usuarios y responde a las solicitudes como si fuera texto. En este sentido, GPT-4 puede identificar objetos concretos dentro de las fotografías que incluyan varios elementos visuales, y puede llegar a interpretar esquemas escritos a mano y transformarlos en códigos de programación, como HTML, CSS o Javascript. 

Por otro lado, la compañía asegura que GPT-4 supera a ChatGPT en sus capacidades de razonamiento avanzadas, y que es capaz de manejar más de 25.000 palabras de texto. Esto permitiría su aplicación en casos de uso como la creación de contenido de formato largo, conversaciones extensas y búsqueda y análisis de documentos. Así, los usuarios ya no tendrán que interactuar con el modelo mediante preguntas cortas y simples, sino que podrán introducir textos largos, incluso documentos para obtener resúmenes. 

Con todo, al presentar la actualización OpenAI ha puesto el foco en la seguridad.Hemos pasado seis meses haciendo que GPT-4 sea más seguro y más alineado. Tiene un 82% menos de probabilidades de responder a solicitudes de contenido no permitido y un 40% más de probabilidades de producir respuestas fácticas que GPT-3.5 en nuestras evaluaciones internas”, explica la firma en su página web. 

OpenAI ha incorporado comentarios de usuarios al entrenamiento del modelo

Para conseguirlo se ha reforzado el entrenamiento con retroalimentación humana mediante la incorporación de comentarios humanos, entre ellos los enviados por los usuarios de ChatGPT, y también trabajando con más de 50 expertos para obtener comentarios tempranos en dominios que incluyen seguridad y protección de IA.

Por otro lado, se ha apostado por una mejora continua basada en el uso de modelos anteriores en el mundo real y su aplicación en el sistema de monitorización e investigación de seguridad de GPT-4. “Al igual que ChatGPT, actualizaremos y mejoraremos GPT-4 a un ritmo regular a medida que más personas lo usen”, han apuntado desde OpenAI.

GPT-4 está disponible para programadores y desarrolladores a través de lista de espera, y en su versión de pago ChatGPT Plus.

Más info.: Chat GPT-4

Google integra Bard en Gmai, Docs y otras aplicaciones de Workspace

En paralelo a la presentación de GPT-4, Google ha anunciado la integración de Bard, su modelo de inteligencia artificial generativa, en varias de sus aplicaciones, entre ellas Gmail, Docs, Slides, Sheets, Meet y Chat. No obstante, la introducción de estas nuevas capacidades en sus herramientas se está haciendo de forma inicial entre un grupo de usuarios seleccionados en Estados Unidos y en inglés, antes de ampliarlas al público general, tanto particulares como empresas en más países e idiomas. 

La introducción de Bard en Gmail y Docs ayudará principalmente a generar borradores de texto editables a partir de la introducción de temas o instrucciones; así como correos electrónicos de forma automática. Del mismo modo, el sistema también podrá generar resúmenes a partir de notas o apuntes tomados en un reunión o de largas cadenas de emails. También brindará la posibilidad de crear presentaciones a partir de solicitudes de texto. 

“Como hemos experimentado nosotros mismos con la IA generativa, una cosa está clara: la IA no reemplaza el ingenio, la creatividad y la inteligencia de las personas reales. A veces, la IA se equivoca, a veces te deleita con algo poco convencional y, a menudo, requiere orientación", ha apuntado la compañía en un comunicado, destacando el diseño de sus productos de acuerdo con los Principios de IA de Google y la búsqueda constante de feedback.

Cuando se trata de ofrecer todo el potencial de la IA generativa en Workspace, apenas estamos comenzando. De la misma manera que revolucionamos la colaboración en tiempo real con la coautoría en Docs hace 17 años, estamos emocionados de transformar la creación y la colaboración nuevamente en Workspace", comentan desde la tecnológica respecto a lo que consideran una nueva era de sus productos.