OpenAI начинает войну браузеров на базе искусственного интеллекта

ChatGPT превзошёл чат-бот. Во вторник компания OpenAI объявила о запуске веб-браузера ChatGPT Atlas , который, по её словам, полностью переосмыслит процесс работы в интернете. Теперь он построен на основе чат-интерфейса, что, по словам компании, соответствует «новой эре интернета».
Во время демонстрации ведущий инженер OpenAI по Atlas Бен Гудгер объяснил, что Atlas — это ответ компании на вопрос: «Что, если бы вы могли общаться в чате со своим браузером?». Хотя в Atlas есть множество привычных элементов веб-браузера, включая вкладки, закладки и автозаполнение паролей, компания сделала ChatGPT центральным элементом интерфейса, а не «старым браузером, просто с прикрученным чат-ботом». Всё начинается с главного экрана, где стандартная строка поиска теперь служит панелью композитора для взаимодействия с ChatGPT.
Пользователи могут использовать диалоговые подсказки, чтобы ChatGPT находил определённые веб-страницы, выполнял стандартный поиск в интернете или напрямую переходил на сайт или в закладки. В демонстрации ведущий дизайнер Atlas Райан О’Рук объяснил, что пользователи должны иметь возможность использовать «человеческий язык» для поиска как в интернете, так и в истории браузера (OpenAI называет это «воспоминаниями»), чтобы находить веб-страницы, документы и информацию по контексту. Например, компания продемонстрировала, как найти документ Google Doc, не зная URL-адреса или точного названия документа.
Результаты поиска в Atlas отображаются на главной странице, где по запросу пользователя отбирается разнообразная информация из интернета. Пользователи также могут переключаться между более традиционными результатами поиска, включая список ссылок, изображений, видео или новостей, аналогичный поиску Google.
Главное преимущество Atlas заключается в том, что пользователь сможет в любой момент при просмотре веб-страниц вызвать ChatGPT и использовать чат-бота для взаимодействия с текущей страницей. Генеральный директор OpenAI Сэм Альтман во время демонстрации описал это как чат с веб-страницей. Чат-бот можно вызвать кнопкой в правом верхнем углу экрана на десктопе, он появится в виде боковой панели. После открытия чат-бота пользователь может попросить его обобщить информацию на странице, задать вопросы, относящиеся к конкретной странице, и чат-бот сможет получить ответ непосредственно с сайта, который просматривает пользователь, и даже взаимодействовать со страницей.
Эта последняя функция и есть то, где появляется агент ChatGPT. OpenAI уже несколько месяцев рекламирует свою новую функцию агента, в том числе представив набор инструментов для агента на недавнем мероприятии DevDay, чтобы дать разработчикам возможность создавать собственные ИИ-агенты. Однако этот агент будет встроен в браузер, активируется в нижней части боковой панели ChatGPT и сможет выполнять задачи от имени пользователя. В демонстрации функции Уилл Эллсворт из OpenAI, руководитель исследований Atlas Agent, попросил агента купить ингредиенты, необходимые для рецепта. Получив запрос, агент перешёл в Instacart и купил необходимые ингредиенты.
По данным компании, Agent будет иметь доступ к учётным данным пользователя, что позволит ему выполнять задачи от его имени, хотя будут появляться подсказки, требующие от пользователя одобрения определённых действий. Пользователи смогут наблюдать за выполнением задачи Agent в режиме реального времени, наблюдая за перемещением курсора по странице, или смогут оставить его работать в фоновом режиме. При необходимости пользователь может в любой момент взять управление на себя. Эллсворт описал Agent как инструмент для «жизнерадостной атмосферы» и предложил пользователям делегировать «Agent в Atlas» «любые задачи, как в личной, так и в профессиональной жизни».
Atlas будет доступен для macOS уже сейчас, а вскоре планируется добавить браузер для Windows, iOS и Android. Хотя браузер, по всей видимости, будет доступен всем пользователям ChatGPT, Agent будет платным и доступен только подписчикам Plus с ежемесячной оплатой 20 долларов США или пользователям Pro с ежемесячной оплатой 200 долларов США.
Ранее в этом году Google сделала всё возможное, чтобы предотвратить эту неизбежность. Компания объявила о модернизации своего браузера Chrome , который в настоящее время занимает более 70% от общей доли рынка браузеров , с использованием ИИ, включая интеграцию чат-бота Gemini в браузер для таких задач, как суммирование веб-страниц и контекстный поиск по странице. Компания также заявила, что в конечном итоге добавит агента ИИ, способного осуществлять навигацию по веб-страницам и выполнять задачи от имени пользователя, хотя эта функция в настоящее время недоступна. У Perplexity также есть браузер Comet, работающий в первую очередь с ИИ, в то время как такие компании, как Opera, Microsoft и The Browser, интегрировали функции ИИ в свои браузеры.
gizmodo