Според високопоставени ръководители на технологични компании големи езикови модели (LLM) като тези, разработени от подкрепяната от Microsoft OpenAI, ще загубят блясъка си през тази година на фона на бързия напредък на AI агентите от следващо поколение и по-пъргавите конкуренти с отворен код.

Миналата седмица китайската компания за изкуствен интелект DeepSeek пусна R1 – модел за разсъждения с отворен код, който твърди, че може да се конкурира с o1 на OpenAI както по цена, така и по производителност. Под „отворен код“ се разбира софтуер, чийто изходен код е свободно достъпен в отворената мрежа за всевъзможни модификации и разпространение.

Тази седмица появата на новия модел на DeepSeek доведе до сериозен спад в акциите на Nvidia и други технологични гиганти, тъй като инвеститорите се опасяват от евентуално намаляване на разходите за мощните графични процесори, необходими за обучението и изпълнението на усъвършенствани задачи с изкуствен интелект.

В понеделник Nvidia загуби близо 600 млрд. долара пазарна капитализация - най-големият еднодневен спад за която и да е компания в историята на САЩ.

Междувременно всички ръководители и учени във водещи лаборатории за AI говорят за преминаване от големи езикови модели към така наречените „агенти на AI“, които могат да извършват действия от името на потребителите.

LLM са основополагащата технология, която стои зад днешните генеративни приложения за AI. Експертите обаче смятат, че тласъкът към агентичните системи - които също включват LLM - през тази година ще намали стойността на тези модели.

Комерсиализация на LLM

Очаква се в близко бъдеще LLM да се превърнат в достъпна стока, тъй като технологията става все по-напреднала, а разходите, свързани с обучението и експлоатацията им, продължават да намаляват.

Томас Волф, съосновател и главен научен директор на Hugging Face, предполага, че LLM ще станат по-интегрирани в интелигентни системи, свързани със собствените бази данни на компаниите.

„Мисля, че хората се отдалечават от тази лудост около модела, разбирайки, че благодарение на отворения код много от тях ще бъдат безплатни и свободно достъпни“, казва Волф пред CNBC. Hugging Face е популярно хранилище за проекти за изкуствен интелект с отворен код.

Появата на модела R1 на DeepSeek миналата седмица се разглежда от някои технологични изпълнителни директори като още един знак, че LLM стават все по-достъпни. Платформата включва някои ключови аспекти, които го отличават от другите модели на пазара. Пример за това е рамката със „смесена точност“, която използва комбинация от 32-битови числа с плаваща запетая с пълна точност (FP32) и 8-битови числа с плаваща запетая с ниска точност (FP8). Последната се обработва по-бързо, но може да бъде по-неточна. Вместо обаче да разчита на едното или другото, DeepSeek използва FP8 за повечето изчисления и преминава към FP32 за определени задачи, при които се изисква по-висока степен на точност.

„Тъй като изкуственият интелект става все по-ефективен и достъпен, ще станем свидетели на рязко нарастване на неговата употреба, превръщайки го в стока, на която просто не можем да се наситим“, предвижда Сатя Надела, главен изпълнителен директор на Microsoft в социалната медийна платформа X.

Мат Калкинс, главен изпълнителен директор на американската софтуерна компания Appian, поддържа това мнение.

„Според мен ще станем свидетели на превръщането на AI в стока. Много компании ще постигнат конкурентоспособна технология, а липсата на диференциация ще бъде лоша за първите, които правят големи разходи“, казва Калкинс пред CNBC.

Какво представляват AI агентите?

През последните две години голяма част от вниманието беше насочено към продукти, задвижвани от AI - от генеративни чатботове като ChatGPT на OpenAI до инструменти, които могат да създават изображения и видео съдържание. Те разчитат на команди от страна на потребителите, за да им връщат резултати. За разлика от тях AI агентите са проектирани да бъдат по-ориентирани към действия.

Ако например искате да си запишете час при лекар, можете да поискате от ChatGPT информация за най-близките практики - подобно на начина, по който правите справки в интернет с помощта на търсачката на Google. Следващото поколение изкуствен интелект ще включва агенти, които ще могат да откриват къде се намира най-близкият ви лекар, да проверяват за свободни часове и да ви записват час - всичко това директно в рамките на една платформа. Очаква се това да промени начина, по който хората взаимодействат с интернет.

„През десетилетията, откакто е изобретена мрежата, стандартният интерфейс от уебстраници и менюта не се е променил много“, казва Боби Блумоф, главен технологичен директор на Akamai. „Живеем като в тирания на привързаността към екрана, към уебстраниците и менютата, които трябва да помним как да навигираме“.

Преминаване от модели към агенти

Миналата седмица Артур Менш, главен изпълнителен директор на Mistral, заяви, че според него „фокусът трябва да се измести към системи“, които интегрират както езикови модели, така и контекстуални бизнес данни.

„Това е мястото, към което се измества фокусът“, казва Менш пред CNBC по време на годишната среща на Световния икономически форум в Давос, Швейцария. „Това също така означава, че индустрията, която го приема, ще дестилира своя опит в тези системи. И точно това ще бъде необходимо, за да може действително да се повиши стойността на AI в тези индустрии“.

Mistral, която е подкрепена от Microsoft, бързо се превърна в една от най-нашумелите компании за изкуствен интелект в Европа. Основана само преди две години, през юни 2024 г. тя беше оценена от инвеститорите на около 6 млрд. долара.

Тенденцията за използване на агенти вече е набрала значителна сила. Миналата седмица OpenAI пусна своя платформа, наречена Operator. Лабораторията го описва като „агент, който може да отиде в интернет, за да изпълнява задачи вместо вас“, като добавя, че е обучен да взаимодейства с „бутоните, менютата и текстовите полета, които хората използват ежедневно“.

Microsoft, която е инвестирала милиарди долари в OpenAI, също пусна свои агенти с изкуствен интелект през ноември.

Anthropic, подкрепен от Amazon стартъп за изкуствен интелект, основан от бивши ръководители на изследователската дейност на OpenAI, миналата година представи Computer use - функционалност, позволяваща на агентите му да използват компютри като хора за изпълнение на сложни задачи. Дарио Амодей, главен изпълнителен директор на Anthropic акцентира, че Computer use трябва да се разглежда като предшественик на „по-широка визия“, която интегрира тези агенти с често използвани приложения.

„Планираме през 2025 г. да създадем нещо, което наричаме „виртуален сътрудник“, казва Амодей, описвайки го като „агент, който работи на вашия компютър“.

„Можете да му давате задачи. Можете да кажете: „Напиши тази функция за това приложение“, и то ще напише някакъв код, ще го компилира, ще го провери, ще разговаря с колегите си в Slack, Google Docs или на някоя друга платформа“, обяснява още шефът на Anthropic.

Компанията планира постепенно да изгради части от тази визия през следващата година - като все пак гарантира, че тя е „безопасна и контролируема“.

Пол О'Съливан, главен технологичен директор на Salesforce за Великобритания и Ирландия, прогнозира, че вербалната комуникация ще придобие все по-голямо значение в новия свят на агентите с изкуствен интелект. Компанията му е от първите играчи на това поле, като пусна собствената си система Agentforce през септември - преди Microsoft, OpenAI или Anthropic.

„Ще разговаряме повече“, казва той пред CNBC. „Екраните ще стават все по-малки. Те вероятно ще бъдат заменени с мобилни устройства, които така или иначе са по-мощни от лаптопите“.