OpenAI lanza la guerra de navegadores con IA

ChatGPT ha trascendido el mundo de los chatbots. El martes, OpenAI anunció el lanzamiento de un navegador web llamado ChatGPT Atlas , que, según afirma, reinventará la experiencia de navegación desde cero, ahora basado en una experiencia de chat para lo que la compañía denominó la "próxima era de la web".
Durante una demostración, Ben Goodger, jefe de ingeniería de OpenAI para Atlas, explicó que Atlas es la respuesta de la compañía a la pregunta: "¿Qué pasaría si pudieras chatear con tu navegador?". Si bien Atlas cuenta con muchos elementos familiares de navegadores web, como pestañas, marcadores y autocompletado de contraseñas, la compañía ha convertido ChatGPT en el centro de la experiencia, en lugar de un navegador antiguo con un chatbot integrado. Esto comienza en la pantalla de inicio, donde la barra de búsqueda estándar ahora funciona como una barra de composición para comunicarse con ChatGPT.
Los usuarios pueden usar indicaciones conversacionales para que ChatGPT encuentre páginas web específicas, realice una búsqueda web estándar o acceda directamente a un sitio web o a un marcador. En la demostración, Ryan O'Rouke, diseñador principal de Atlas, explicó que los usuarios deberían poder usar lenguaje humano para buscar tanto en la web como en el historial de navegación (OpenAI lo llama "memorias") y así encontrar páginas web, documentos e información a través de información contextual. Por ejemplo, la empresa mostró cómo podía encontrar un documento de Google sin conocer la URL ni el nombre exacto del documento.
Los resultados de búsqueda en Atlas se muestran en una página de inicio que selecciona información diversa de la web según las indicaciones del usuario. Los usuarios también pueden navegar entre resultados de búsqueda más tradicionales, incluyendo una lista de enlaces, imágenes, vídeos o noticias similar a la de Google Search.
El principal atractivo de Atlas reside en que el usuario podrá abrir ChatGPT en cualquier momento mientras navega por la web y usar el chatbot para interactuar con la página en la que se encuentre. Sam Altman, CEO de OpenAI, lo describió durante la demostración como si estuviera chateando con una página web. El chatbot se activa mediante un botón en la esquina superior derecha de la pantalla en computadoras de escritorio y aparecerá como una barra lateral. Una vez abierto, el usuario puede solicitarle que resuma la información de la página, haga preguntas específicas y que el chatbot extraiga la respuesta directamente del sitio web que está visitando, e incluso interactúe con la página por él.
Esa última función es donde entra en juego el Agente de ChatGPT. OpenAI lleva meses promocionando su nueva función de Agente, incluyendo la introducción de un kit de herramientas de Agente durante su reciente DevDay para que los desarrolladores puedan crear sus propios agentes de IA. Este Agente se integrará en el navegador, se activará en la parte inferior de la barra lateral de ChatGPT y podrá realizar tareas en nombre del usuario. En una demostración de la función, Will Ellsworth, jefe de investigación del Agente Atlas de OpenAI, solicitó al agente que comprara los ingredientes necesarios para una receta. Una vez solicitado, el Agente accedió a Instacart y compró los ingredientes correspondientes.
Según la empresa, Agent tendrá acceso a las credenciales del usuario para realizar tareas en su nombre, aunque se le solicitará que apruebe ciertas acciones. Los usuarios podrán ver cómo Agent completa la tarea en tiempo real con el cursor moviéndose visiblemente en la página, o dejar que se ejecute en segundo plano. Si el usuario necesita intervenir, puede retomar el control en cualquier momento. Ellsworth describió Agent como una herramienta para mejorar la experiencia y sugirió que los usuarios podrían delegar todo tipo de tareas, tanto personales como profesionales, en Agent en Atlas.
Atlas estará disponible de inmediato para macOS, y pronto estará disponible para Windows, iOS y Android. Aunque parece que el navegador estará disponible para todos los usuarios de ChatGPT, Agent será de pago y solo estará disponible para suscriptores Plus que paguen $20 al mes o usuarios Pro que paguen $200 al mes.
A principios de este año, Google hizo todo lo posible para anticiparse a esta inevitabilidad. La compañía anunció una renovación de IA de su navegador Chrome , que actualmente posee más del 70% de la cuota de mercado total de navegadores , incluyendo la integración de su chatbot Gemini en todo el navegador para hacer cosas como resumir páginas web y hacer búsquedas contextuales dentro de una página. La compañía también dejó caer que eventualmente incluirá un agente de IA capaz de navegar por la web y completar tareas en nombre del usuario, aunque esa función actualmente no está disponible. Perplexity también tiene un navegador AI-first llamado Comet, mientras que compañías como Opera, Microsoft y The Browser Company han integrado funciones de IA en sus respectivos navegadores.
gizmodo