OpenAI пуска AI инструмент, който ще управлява компютъра ви от ваше име
Предстоящото навлизане на компанията в сферата на AI агентите идва в момент, когато съперници като Anthropic и Google се борят за лидерство в нея
OpenAI се приближава до пускането на инструмент с изкуствен интелект, който може да поеме контрола над вашия компютър и да извършва действия от ваше име.
Тибор Блахо, софтуерен инженер с репутация на точен информатор за предстоящи продукти, твърди, че е открил доказателства за отдавна споменавания инструмент Operator на OpenAI. Много медии, в това число и Bloomberg, вече са съобщавали за Operator, за който се твърди, че е „агентична“ система, способна самостоятелно да изпълнява задачи като писане на код и резервиране на пътувания.
Според The Information OpenAI е избрала януари за месец на пускане на Operator. Кодът, открит от Блахо този уикенд, потвърждава тези данни.
Клиентът ChatGPT на OpenAI за macOS се е сдобил със скрити за момента опции за дефиниране на бързи клавиши за „Toggle Operator“ и „Force Quit Operator“, обяснява той пред TechCrunch. Освен това OpenAI е добавила препратки към Operator на своя уебсайт, макар и те все още да не са публично видими.
Според Блахо сайтът на OpenAI съдържа и все още непубликувани таблици, в които се сравнява производителността на Operator с други системи за изкуствен интелект, управляващи компютри. Възможно е тези таблици да са заместващи. Но ако числата са точни, те предполагат, че новата платформа на създателя на ChatGPT не е 100% надежден в някои задачи.
На OSWorld, бенчмарк, който се опитва да имитира реална компютърна среда, „OpenAI Computer Use Agent (CUA)“ - вероятно AI моделът, който управлява Operator - получава 38,1%, изпреварвайки конкурентната система на Anthropic. Той обаче остава далеч от резултата на хората - 72,4%.
CUA надминава човешките резултати в WebVoyager, който оценява способността на AI да навигира и взаимодейства с уебсайтове. Но моделът не успява да постигне резултати на човешко ниво на друг уеб базиран бенчмарк - WebArena.
Operator също така се затруднява със задачи, които човек може да изпълни лесно, ако се вярва на изтичането на информация. В тест, в който на платформата е възложена задачата да се регистрира при доставчик на облачни услуги и да стартира виртуална машина, тя успява в едва 60% от случаите. При задачата за създаване на криптопортфейл Operator има успеваемост от 10%.
Предстоящото навлизане на OpenAI в сферата на агентите с изкуствен интелект идва в момент, когато съперници, сред които гореспоменатите Anthropic, Google и други, се борят за лидерство в този новосъздаващ се сегмент. Агентите с изкуствен интелект може да са рискови и спекулативни, но технологичните гиганти вече ги изтъкват като следващото голямо нещо, свързано с AI. Според анализаторската компания Markets and Markets пазарът на агенти на изкуствен интелект може да достигне 47,1 млрд. долара до 2030 г.
Днес те са доста примитивни, а някои експерти изразяват загриженост за тяхната безопасност, ако технологията бързо се усъвършенства.
Една от изтеклите диаграми показва, че Operator се представя добре при някои оценки на безопасността, включително тестове, които се опитват да накарат системата да извършва „незаконни дейности“ и да търси „чувствителни лични данни“. Именно тестовете за безопасност са сред причините за дългия цикъл на разработка на платформата.
В неотдавнашна публикация в X съоснователят на OpenAI Войчех Заремба разкритикува Anthropic за пускането на агент, за който твърди, че няма мерки за безопасност.
„Мога само да си представя негативните реакции, ако OpenAI пусне подобна версия“, пише Заремба.
OpenAI често е критикувана от изследователи на изкуствения интелект, включително бивши служители, за това, че според твърденията не набляга на работата по безопасността в полза на бързото разработване на технологията си.