OpenAI запускає AI-агента, який зробить все за користувачів на сайтах: натискає, вводить текст і навіть шукає потрібну інформацію.
OpenAI представила новий AI-агент Operator, здатний виконувати завдання в Інтернеті за користувачів.
що відомо
Агент використовує власний браузер, щоб переглядати веб-сторінки, натискати на кнопки, вводити текст та прокручувати контент. Це дозволяє йому виконувати завдання в Інтернеті як людина, яка самостійно натискає кнопки, прокручує сторінки та вводить текст на сайтах. Спочатку новинка буде доступна лише для передплатників ChatGPT Pro у США.
Operator працює на спеціальній моделі, яка поєднує можливості GPT-4o із поглибленим навчанням. Це дозволяє йому не просто «бачити» сторінки через знімки екрана, а й взаємодіяти з інтерфейсами, як ми звикли це робити мишкою та клавіатурою.
Найцікавіше, що агент не просто виконує завдання, а може самокоректуватися. Якщо щось піде не так, то він дасть вам контроль над процесом. А ще він обов'язково попросить дозволу, якщо сайт вимагає чутливої інформації (наприклад паролів) або запитає вашу згоду перед тим, як надіслати листа.
OpenAI співпрацює з популярними компаніями, такими як Uber, DoorDash, Instacart та іншими, щоб агент виконував реальні завдання, дотримуючись норм безпеки та етики. Однак не все працює ідеально — складні інтерфейси на кшталт створення слайд-шоу поки що даються йому важко.
Вже найближчим часом Operator з'явиться для користувачів Plus, Team і Enterprise планів, а OpenAI планує інтегрувати цю технологію безпосередньо в ChatGPT.
Джерело: OpenAI