OpenAI пуска нови инструменти за създаване на AI агенти в помощ на бизнеса
Компанията се надява да успее да преодолее пропастта между демонстрациите на агенти на изкуствен интелект и реалните продукти тази година

Във вторник OpenAI пусна нови инструменти, предназначени да помогнат на разработчиците и предприятията да създават агенти с изкуствен интелект. Автоматизираните системи, които могат самостоятелно да изпълняват задачи, ще се изграждат с помощта на собствените модели и рамки на компанията.
Инструментите са част от новия API Responses на OpenAI, който позволява на предприятията да разработват персонализирани AI агенти. Те могат да извършват търсене в интернет, да сканират фирмени файлове и да навигират в уебсайтове, подобно на продукта Operator на OpenAI. API Responses на практика заменя API Assistants на OpenAI, който компанията планира да закрие през първата половина на 2026 г.
През последните години шумът около агентите с изкуствен интелект нарасна драстично, въпреки че технологичната индустрия се затруднява да покаже на хората или дори да определи какво всъщност представляват те. В най-новия пример за това, че шумът около агентите изпреварва полезността, китайският стартъп Butterfly Effect по-рано тази седмица стана известен с нова платформа за AI агенти, наречена Manus. Бързо обаче потребителите откриха, че тя не изпълнява много от обещанията на компанията.
С други думи, залогът за OpenAI е голям.
„Доста е лесно да демонстрирате своя агент“, казва в интервю за TechCrunch Оливие Годмънт, ръководител на API продукта на OpenAI. „Но мащабирането му е доста трудно, а да накараш хората да го използват често още по-трудно“.
По-рано тази година OpenAI представи два агента с изкуствен интелект в ChatGPT: Operator, който навигира уебсайтове от името на потребителя, и Deep Research, който съставя доклади за проучвания. И двата инструмента предложиха поглед към това, което агентичната технология може да постигне, но оставиха доста да се желае по отношение на автономността.
Сега с API Responses OpenAI иска да продава достъп до компонентите, които захранват агентите на изкуствения интелект, позволявайки на разработчиците да създават свои собствени агентични приложения в стил Operator и Deep Research. Компанията се надява, че разработчиците ще могат да създадат някои приложения с нейната технология за агенти, които са по-автономни от наличните днес.
Използвайки API Responses, разработчиците получават достъп до същите AI модели, които захранват инструмента за търсене в интернет ChatGPT Search на OpenAI: GPT-4o search и GPT-4o mini search. Те могат да преглеждат мрежата за отговори на въпроси, като при генерирането на отговорите посочват източниците на информацията.
От OpenAI твърдят, че GPT-4o search и GPT-4o mini search са изключително точни от фактологична гледна точка. В сравнителния тест SimpleQA на компанията, който измерва способността на моделите да отговарят на кратки въпроси, търсещи факти, GPT-4o search получава 90%, а GPT-4o mini search - 88% (по-високият резултат е по-добър). За сравнение, GPT-4.5 - много по-големият, наскоро пуснат модел на OpenAI - получава едва 63%.
API Responses включва и помощна програма за търсене на файлове, която може бързо да сканира в базите данни на компанията, за да извлече информация. OpenAI твърди, че няма да обучава модели върху тези файлове.
Освен това разработчиците, използващи API Responses, получават достъп и до модела CUA (Computer-Using Agent) на OpenAI, който управлява Operator. Той генерира действия с мишката и клавиатурата, което позволява на разработчиците да автоматизират задачи за използване на компютър, като например въвеждане на данни и работни процеси на приложенията.
Предприятията могат по желание да стартират модела CUA, който се пуска в изследователска предварителна версия, локално на собствените си системи. Потребителската версия на CUA, налична в Operator, може да извършва действия само в интернет.
API Responses няма да реши всички технически проблеми, които днес тормозят агентите с изкуствен интелект. Въпреки че инструментите за търсене, задвижвани от AI, са по-точни от традиционните модели, това не е панацея за „халюцинациите“ на AI. Търсенето в GPT-4o все още дава грешни резултати в 10% от фактологичните въпроси. Освен с точността си, AI инструментите за търсене също така са склонни да се затрудняват с кратки, навигационни заявки, а последните доклади показват, че цитатите на ChatGPT невинаги са надеждни.
В публикация в блога си, цитирана от TechCrunch, OpenAI заявява, че моделът CUA „все още не е изключително надежден за автоматизиране на задачи в операционните системи“ и че е податлив на допускане на „неволни“ грешки. Въпреки това компанията добавя, че това са ранни итерации на техните инструменти за агенти и постоянно работи за тяхното подобряване.
Заедно с API Responses, OpenAI пуска и пакет инструменти с отворен код, наречен Agents SDK, който предлага на разработчиците безплатни възможности за интегриране на моделите с техните вътрешни системи, въвеждане на защитни мерки и наблюдение на дейностите на агентите с изкуствен интелект с цел отстраняване на грешки и оптимизация. Agents SDK е своеобразно продължение на Swarm на OpenAI - рамка за оркестрация на много агенти, която компанията пусна в края на миналата година.
OpenAI се надява да успее да преодолее пропастта между демонстрациите на агенти на изкуствен интелект и реалните продукти тази година. Според компанията „агентите са най-въздействащото приложение на изкуствения интелект, което ще се случи“. Това повтаря изявлението на главния изпълнителен директор на OpenAI Сам Алтман, направено през януари: че 2025 г. е годината, в която AI агентите ще навлязат в работната сила.
Независимо дали 2025 г. наистина ще стане „годината на агента с изкуствен интелект“, последните версии на OpenAI показват, че компанията иска да премине от ефектни демонстрации на агенти към въздействащи инструменти.