ChatGPT Agent від OpenAI зможе керувати вашим комп’ютером
ШІ від OpenAI навчився керувати комп’ютером без участі людини (фото: Pexels)
OpenAI робить ставку на головний тренд у ШІ – інтелектуальних агентів. Це інструменти, які виходять за рамки чат-ботів і виконують складні завдання від імені користувача. Компанія представила ChatGPT Agent – інструмент, що працює як повноцінний віртуальний комп’ютер.
ChatGPT Agent вміє не тільки аналізувати текст, а й виконувати дії від імені користувача: перевіряти календар, бронювати столики, купувати продукти, створювати презентації та навіть складати аналітичні звіти. Усе це стало можливим завдяки новій моделі, розробленій спеціально під цей продукт.
В OpenAI уточнюють, що ChatGPT Agent поєднує в собі можливості попередніх АІ-інструментів компанії – Operator і Deep Research. Ці технології об’єднали в одну команду, до якої увійшло від 20 до 35 фахівців із продукту та досліджень.
Що вміє ChatGPT Agent:
- Перевірити ваш календар і нагадати про зустріч із клієнтом
- Запланувати сімейний сніданок і замовити продукти
- Скласти презентацію за аналізом конкурентів
- Забронювати ресторан на вечір через OpenTable, звірившись із Google Calendar
- Створити звіт за трендами – наприклад, порівняти популярність Labubus і Beanie Babies
- Виконувати повсякденні завдання, наприклад, щотижня автоматично запитувати парковку біля офісу.
Як це працює
ChatGPT Agent працює не просто як браузер – у нього є доступ до віртуального комп’ютера з набором інструментів: текстовий браузер, візуальний інтерфейс, термінал і можливість завантажувати користувацькі дані. Модель навчалася через посилене навчання (reinforcement learning), як і всі моделі “міркувань” від OpenAI.
Безпека та обмеження
Перед виконанням незворотних дій, на кшталт надсилання листів або бронювань, агент обов’язково запитує підтвердження у користувача.
Також активовано захисні механізми від потенційної біохімічної шкоди – навіть попри відсутність прямих ризиків. Схожу систему в травні включала компанія Anthropic, коли запускала модель Claude Opus 4.
Фінансові операції поки що заблоковані: якщо користувач заходить на сайт із фінансової категорії, агент працює тільки в межах поточної вкладки. Якщо піти з неї – робота зупиняється. Це називається Watch Mode.
Коли і кому стане доступний
OpenAI починає розгортання ChatGPT Agent вже сьогодні – для користувачів тарифів Pro, Plus і Team. Доступ можна отримати через меню інструментів (“режим агента”) або командою /agent. Пізніше цього літа функція з’явиться й у користувачів ChatGPT Enterprise та Education.
Поки що невідомо, коли інструмент стане доступний у країнах ЄС.
Хто ще в агентських перегонах
ШІ-агенти – ключовий тренд останніх років. Інвестори і розробники порівнюють їх з J.A.R.V.I.S. з Iron Man – асистентом, який може все: планувати, шукати, купувати, аналізувати. Поки що більшість таких рішень обмежена завданнями на кшталт кодингу та аналітики.
З початку 2024 року технологічні гіганти масово долучилися до перегонів агентів. Так, Klarna в лютому повідомила, що її АІ-агент опрацював дві третини звернень у підтримку – роботу, яку раніше виконували близько 700 співробітників. Після цього про АІ-агентів почали регулярно згадувати на звітних дзвінках Amazon, Meta, Google та інших компаній.
На тлі цього OpenAI в січні запустила Operator, а в жовтні 2023 року Anthropic – інструмент “Computer Use”, що дає змогу АІ діяти на комп’ютері як людина. Усе це частина перегонів за увагу користувачів і спроба перетворити ШІ-агента на звичний повсякденний інструмент.