OpenAI обновляет модель ИИ, на которой работает агент Operator

OpenAI обновляет модель искусственного интеллекта, лежащую в основе Operator — агента ИИ, который может автономно просматривать веб-страницы и использовать определенное программное обеспечение в облачной виртуальной машине для выполнения запросов пользователей.

Вскоре Operator будет использовать модель, основанную на o3 — одной из новейших моделей серии «рассуждающих» моделей OpenAI. Ранее Operator работал на специальной версии GPT‑4o.

По многим метрикам, o3 — значительно более продвинутая модель, особенно в задачах, связанных с математикой и логическим мышлением.

Operator — один из многих инструментов-агентов, выпущенных ИИ-компаниями в последние месяцы. На данный момент идет гонка по созданию высокоразвитых агентов, способных выполнять задачи почти без вмешательства человека.

Компания Google предлагает агента computer use через свой API Gemini — он тоже умеет просматривать веб-страницы и выполнять действия от имени пользователя. Кроме того, у Google есть более потребительский продукт Mariner. Модели Anthropic также могут выполнять компьютерные задачи, включая открытие файлов и навигацию по веб-страницам.

По данным OpenAI, новая модель Operator под названием o3 Operator была дообучена с использованием дополнительных данных по безопасности для компьютерного использования», включая датасеты, предназначенные для «обучения модели границам принятия и отказа в выполнении действий.

OpenAI выпустила технический отчет о производительности o3 Operator на определенных проверках безопасности. В сравнении с моделью GPT‑4o Operator, модель o3 Operator реже соглашается на выполнение «незаконных» действий, поиск персональных данных и менее подвержена атакам через так называемые prompt injection.

o3 Operator использует тот же многоуровневый подход к безопасности, что и версия на базе 4o. Хотя o3 Operator унаследовал программные возможности модели o3, он не имеет нативного доступа к среде программирования или терминалу

Источник: TechCrunch