Главният изпълнителен директор на OpenAI Сам Алтман започна тази година, заявявайки, че 2025 ще бъде голяма за агентите с изкуствен интелект (AI) - инструменти, които могат да автоматизират задачи и да предприемат действия от името на потребителите.

Сега виждаме първия реален опит на OpenAI.

В четвъртък компанията обяви, че стартира изследователска предварителна версия на Operator - агент с изкуствен интелект с общо предназначение, който може да поеме контрола над уеб браузър и самостоятелно да извършва определени действия. Operator ще бъде достъпен първо за потребителите на абонаментния план ChatGPT Pro за 200 долара в САЩ. От OpenAI обаче твърдят, че планират в крайна сметка да предоставят тази функция в нивата Plus, Team и Enterprise.

„Operator скоро ще се появи и в други страни“, заяви главният изпълнителен директор на OpenAI Сам Алтман по време на живо предаване в четвъртък. „За съжаление, за Европа това ще отнеме известно време.“

Първоначалната предварителна визуализация е достъпна чрез operator.chatgpt.com, но скоро платформата трябва да се появи във всички ChatGPT клиенти.

Според OpenAI Operator обещава да автоматизира задачи като резервиране на места за пътуване и ресторанти и онлайн пазаруване. В интерфейса му има няколко категории задачи, от които потребителите могат да избират, включително пазаруване, доставка, хранене и пътуване - всички те позволяват различни видове автоматизация.

Когато потребителите на ChatGPT активират Operator, ще се появи малък прозорец, показващ специален уеб браузър, който агентът използва за изпълнение на задачите, заедно с обяснения на конкретните действия, които той извършва. Потребителите все още могат да контролират екрана си, докато инструментът работи, тъй като той използва свой собствен специализиран браузър.

OpenAI казва, че Operator се захранва от Computer-Using Agent AI модел (CUA), който съчетава възможностите за виждане на GPT-4o на компанията с тези за разсъждение на по-усъвършенстваните ѝ системи. CUA е обучен да взаимодейства с фронтенда на уебсайтовете, което означава, че не е необходимо да използва API за разработчици, за да комуникира с различни услуги.

С други думи, CUA може да използва бутони, да навигира в менютата и да попълва формуляри на уебстраницата, както би направил човек.

OpenAI казва, че си сътрудничи с компании като DoorDash, eBay, Instacart, Priceline, StubHub и Uber, за да гарантира, че платформата спазва условията на споразуменията за услуги на тези компании.

„CUA моделът е обучен да иска потвърждение от потребителя преди финализиране на задачи с външни странични ефекти, например преди подаване на поръчка, изпращане на имейл и т.н., така че потребителят да може да провери работата му два пъти, преди тя да бъде потвърдена“, пише OpenAI в материали, предоставени на TechCrunch. „Това вече е доказано полезно в различни случаи и ние се стремим да разширим тази надеждност в по-широк кръг от задачи.“

Компанията обаче предупреждава, че CUA не е съвършен и „не очаква да работи надеждно във всички сценарии все още“.

„Понастоящем Operator не може да се справи надеждно с много сложни или специализирани задачи, като например управление на сложни календарни системи или взаимодействие със силно персонализирани или нестандартни уеб интерфейси”, добавя OpenAI.

Разработчиците са категорични, че се изисква стриктен надзор за някои задачи, като банкови транзакции, които CUA и Operator могат да изпълняват самостоятелно. Потребителите ще трябва да поемат управлението, за да въведат информация за кредитни карти например. OpenAI твърди, че системата не събира и не прави скрийншоти на никакви данни.

„При особено чувствителни уебсайтове, като например електронна поща, Operator изисква активен надзор от страна на потребителя, гарантирайки, че той може директно да улови и отстрани всички потенциални грешки, които моделът може да направи“, казва още OpenAI.

Това със сигурност ограничава полезността на Operator - но също така гарантира, че агентът няма да халюцинира и, да речем, да похарчи вноската по ипотеката ви за столове. Google възприе подобен подход със своя агент за изкуствен интелект Project Mariner, който също не попълва информация като номера на кредитни карти.

Operator има няколко конкретни ограничения, които си струва да бъдат отбелязани.

Има такова на скоростта - както дневни, така и зависещи от задачите. От OpenAI казват, че Operator може да изпълнява няколко задачи едновременно, но за това има „динамични ограничения“. Съществува и общ лимит на използване, който се нулира ежедневно.

На този етап системата също така отказва да изпълнява задачи от съображения за сигурност, като например изпращане на имейли (въпреки факта, че CUA може да прави това) и изтриване на събития от календара. От OpenAI твърдят, че това ще се промени в бъдеще, но не посочват конкретна дата.

Операторът може също така да „заседне“, ако се натъкне на особено сложен интерфейс, поле за парола или CAPTCHA проверка. Когато това се случи, OpenAI казва, че той ще помоли потребителя да поеме управлението.

Агентично бъдеще

OpenAI разработва агент с изкуствен интелект доста бавно в сравнение с конкурентите си - Rabbit, Google и Anthropic - което може би е свързано с рисковете за безопасността на технологията.

Когато една система за изкуствен интелект може да предприема действия в мрежата, това отваря вратата за много по-опасни случаи на използване от недобросъвестни участници. Те могат да автоматизират организирането на фишинг измами или DDoS атаки. Особено за толкова широко използван инструмент като ChatGPT е важно OpenAI да предприеме мерки за предотвратяване на подобни експлойти.

Явно компанията вече смята, че Operator е достатъчно безопасен, за да бъде пуснат в сегашната си форма, поне като изследователска предварителна версия.

„Платформата използва инструменти, които се стремят да ограничат податливостта на модела на злонамерени подкани, скрити инструкции и опити за фишинг“, обяснява OpenAI на своя уебсайт. „Системата за наблюдение спира изпълнението, ако бъде засечена подозрителна дейност, а автоматичните и прегледаните от човек конвейери непрекъснато актуализират защитните мерки“.

Operator е най-смелият досега опит на OpenAI за създаване на агент с изкуствен интелект. Миналата седмица разработчикът пусна Tasks, предоставяйки на ChatGPT прости функции за автоматизация, като например възможност за задаване на напомняния и планиране на подкани за изпълнение в определено време всеки ден.

Tasks предостави на потребителите на ChatGPT някои познати, но необходими функции, за да направи ChatGPT толкова практичен за използване, колкото Siri или Alexa. Едновременно с това той демонстрира възможности, които предишното поколение виртуални асистенти никога не са могли да направят.

Агентите с изкуствен интелект бяха представени като следващото голямо нещо в сферата след ChatGPT: нова технология, която ще промени начина, по който хората използват интернет и своите компютри. Вместо просто да предоставят и обработват информация, агентите могат - на теория - да предприемат действия и действително да вършат неща.

С пускането на първата конкретна версия на агентите на OpenAI скоро ще стане ясно колко реалистична е тази визия.