Las Seis actualizaciones importantes de ChatGPT 4o presentadas por OpenAI

  • GPT-4o de OpenAI podría redefinir la interacción de la IA tal y como la conocemos

OpenAI acaba de celebrar su esperado evento de actualización de primavera, haciendo una serie de emocionantes anuncios y demostrando las capacidades llamativas y ensordecedoras de sus nuevos modelos de IA GPT. Hubo cambios en la disponibilidad del modelo para todos los usuarios, y en el centro de la exageración y la atención: GPT-4o.

Llegando solo 24 horas antes del Google I/O, el lanzamiento pone a Gemini de Google en una nueva perspectiva. Si GPT-4o es tan impresionante como parecía, más vale que Google y su anticipada actualización de Gemini sean alucinantes.

¿A qué se debe todo este alboroto? Profundicemos en todos los detalles de lo que anunció OpenAI.

1. El anuncio y la demostración de GPT-4o, y que estará disponible para todos los usuarios de forma gratuita

El anuncio más importante de la transmisión fue la presentación de GPT-4o (la ‘o’ significa ‘omni’), que combina procesamiento de audio, visual y texto en tiempo real. Eventualmente, esta versión de la tecnología GPT de OpenAI estará disponible para todos los usuarios de forma gratuita, con límites de uso.

Por ahora, sin embargo, se está implementando para los usuarios de ChatGPT Plus, que obtendrán hasta cinco veces los límites de mensajería de los usuarios gratuitos. Los usuarios de Team y Enterprise también obtendrán límites más altos y acceso a ellos antes.

GPT-4o tendrá la inteligencia de GPT-4, pero será más rápido y más sensible en el uso diario. Además, podrás proporcionarle o pedirle que genere cualquier combinación de texto, imagen y audio.

En la transmisión, Mira Murati, directora de tecnología de OpenAI, y dos investigadores, Mark Chen y Barret Zoph, demostraron la capacidad de respuesta en tiempo real de GPT-4o en la conversación mientras usaban su funcionalidad de voz.

La demostración comenzó con una conversación sobre el estado mental de Chen, con GPT-4o escuchando y respondiendo a su respiración. Luego le contó un cuento antes de dormir a Barret con niveles crecientes de dramatismo en su voz cuando se lo pidió, incluso se le pidió que hablara como un robot.

Continuó con una demostración de Barret “mostrando” GPT-4o un problema matemático y el modelo guiando a Barret a través de su resolución proporcionando pistas y aliento. Chen preguntó por qué era útil este concepto matemático específico, a lo que respondió extensamente.

A continuación, mostraron a GPT-4o algún código, que explicaba en un lenguaje sencillo, y proporcionaron comentarios sobre el gráfico que generaba el código. El modelo hablaba de eventos notables, las etiquetas del eje y una serie de entradas. Esto fue para mostrar la convicción continua de OpenAI de mejorar la interacción de los modelos GPT con las bases de código y la mejora de sus habilidades matemáticas.

La penúltima demostración fue una impresionante muestra de las habilidades lingüísticas de GPT-4o, ya que tradujo simultáneamente dos idiomas, inglés e italiano, en voz alta.

Por último, OpenAI proporcionó una breve demostración de la capacidad de GPT-4o para identificar emociones a partir de una selfie enviada por Barret, señalando que se veía feliz y alegre.

Si el modelo de IA funciona como se ha demostrado, podrá hablar con él de forma más natural que muchos modelos de voz de IA generativa existentes y otros asistentes digitales. Podrás interrumpirlo en lugar de tener una conversación por turnos, y continuará procesando y respondiendo, de manera similar a cómo hablamos entre nosotros de forma natural. Además, el retraso entre la consulta y la respuesta, que antes era de dos a tres segundos, se ha reducido drásticamente.

ChatGPT equipado con GPT-4o se lanzará en las próximas semanas, de forma gratuita. Esto se produce unas semanas después de que Open AI hiciera que ChatGPT estuviera disponible para probar sin registrarse para obtener una cuenta.

2. Los usuarios gratuitos tendrán acceso a la tienda GPT, la función de memoria, la función de exploración y el análisis avanzado de datos

Los GPT son chatbots personalizados creados por usuarios de OpenAI y ChatGPT Plus para ayudar a habilitar conversaciones y tareas más específicas. Ahora, muchos más usuarios pueden acceder a ellos en la Tienda GPT.

Además, los usuarios gratuitos podrán utilizar la funcionalidad de memoria de ChatGPT, lo que la convierte en una herramienta más útil y útil al darle una sensación de continuidad. También se agregarán al plan sin costo las capacidades de visión de ChatGPT, que le permiten conversar con el bot sobre elementos cargados como imágenes y documentos. La función de exploración le permite buscar en conversaciones anteriores más fácilmente.

Las capacidades de ChatGPT han mejorado en calidad y velocidad en 50 idiomas, lo que respalda el objetivo de OpenAI de llevar sus poderes a la mayor cantidad de personas posible.

3. GPT-4o estará disponible en API para desarrolladores

El último modelo de OpenAI estará disponible para que los desarrolladores lo incorporen a sus aplicaciones de IA como un modelo de texto y visión. El soporte para las capacidades de video y audio de GPT-4o se lanzará pronto y se ofrecerá a un pequeño grupo de socios de confianza en la API.

4. La nueva aplicación de escritorio de ChatGPT

OpenAI está lanzando una aplicación de escritorio para macOS para avanzar en su misión de hacer que sus productos sean lo más fáciles y sin fricciones posible, dondequiera que esté y sea cual sea el modelo que esté utilizando, incluido el nuevo GPT-4o. Podrás asignar atajos de teclado para realizar procesos aún más rápido.

Según OpenAI, la aplicación de escritorio ya está disponible para los usuarios de ChatGPT Plus y estará disponible para más usuarios en las próximas semanas. También tiene un diseño similar a la interfaz actualizada de la aplicación móvil.

5. Una interfaz de usuario de ChatGPT renovada

ChatGPT tiene una interfaz de usuario más natural e intuitiva, actualizada para que la interacción con el modelo sea más fácil y menos discordante. OpenAI quiere llegar al punto en el que la gente apenas se centre en la IA y que sientas que ChatGPT es más amigable. Esto significa una nueva pantalla de inicio, diseño de mensajes y otros cambios.

6. OpenAI aún no ha terminado

La misión es audaz, ya que OpenAI busca desmitificar la tecnología mientras crea algunas de las tecnologías más complejas a las que la mayoría de la gente puede acceder. Murati concluyó afirmando que pronto estaremos actualizados sobre lo que OpenAI se está preparando para mostrarnos a continuación y agradeciendo a Nvidia por proporcionar las GPU más avanzadas para hacer posible la demostración.

OpenAI está decidida a dar forma a nuestra interacción con los dispositivos, estudiando de cerca cómo los humanos interactúan entre sí y tratando de aplicar sus aprendizajes a sus productos. La latencia del procesamiento de todos los diferentes matices de la interacción es parte de lo que dicta cómo nos comportamos con productos como ChatGPT, y OpenAI ha estado trabajando arduamente para reducir esto. Como dice Murati, sus capacidades continuarán evolucionando y mejorará aún más para ayudarlo exactamente con lo que está haciendo o preguntando en el momento exacto.

Deja una respuesta