Откакто китайският DeepSeek се появи на сцената през януари, инерцията около отворените модели изкуствен интелект от Китай набира скорост. Но някои изследователи гледат отвъд съревнованието между държави и предлагат нещо още по-радикално – напълно децентрализиран начин за изграждане на AI, при който моделите се създават и усъвършенстват от хора и машини по целия свят, без зависимост от технологичните гиганти.

Една от компаниите, които са водещи в тази нова вълна, е Prime Intellect – стартъп, специализиран в децентрализиран изкуствен интелект. В момента тя обучава свой фронтови голям езиков модел (LLM), който носи името INTELLECT-3, чрез нов вид разпределено обучение с подсилване (distributed reinforcement learning).

„Моделът ще покаже как можем да изграждаме конкурентоспособен отворен AI, като използваме хардуер, разпределен на различни места, без да разчитаме на големите технологични компании“, казва Винсент Вайсер, изпълнителен директор на Prime Intellect.

Според Вайсер светът на изкуствения интелект днес се разделя на два лагера – онези, които разчитат на затворени американски модели, и тези, които използват отворени китайски решения, пише WIRED.

Технологията, която разработва Prime Intellect, цели да демократизира AI, като позволява на повече хора и организации сами да създават и модифицират усъвършенствани модели.

„Това, което правим, е да дадем възможност на всеки да бъде част от процеса на обучение и подобрение“, обяснява Вайсер.

Съвременните модели за изкуствен интелект не стават по-добри само чрез добавяне на повече данни и изчислителна мощ. Най-напредналите системи използват обучение с подсилване (reinforcement learning), при което моделът се „учи“ след първоначалното си трениране.

„Искате модел, който да решава задачи по математика, право или игри като Sudoku? Позволете му да се упражнява в среда, където успехът и провалът могат да бъдат измервани“, казва Вайсер.

Prime Intellect е създала рамка, която позволява на всеки да изгражда такава среда за обучение, пригодена за конкретна задача. Компанията комбинира най-добрите среди, разработени от собствения ѝ екип и от общността, за да оптимизира INTELLECT-3.

Един от изследователите, Уил Браун, създава среда, в която моделът решава Wordle пъзели, като наблюдава как малък AI модел методично достига до правилната дума, дори по-успешно от човек.

„Ако бях AI изследовател, щях да стартирам куп GPU машини и да оставя модела да се упражнява до безкрай, докато алгоритъмът с подсилване коригира теглото му“, обяснява Браун. „В крайна сметка той би станал истински майстор в играта.“

Въпреки че reinforcement learning вече е едно от най-важните неща, когато става въпрос за подобряването на моделите, процесът все още е затворен и достъпен основно за технологичните корпорации. Необходимата експертиза и ресурси поставят бариера пред повечето изследователи и компании.

Вайсер смята, че отварянето на този процес може да доведе до нова генерация специализирани AI агенти, пригодени за конкретни индустрии и задачи.

С него е съгласен и Андрей Карпати, бивш ръководител на екипа по AI в Tesla. Той описва reinforcement средите на Prime Intellect като „великолепно усилие и идея“, като насърчава изследователите с отворен код да адаптират различни среди за нови задачи.

Prime Intellect вече доказва, че разпределените методи могат да конкурират традиционните подходи за обучение на модели. В края на 2024 г. компанията представя INTELLECT-1, 10-милиарден параметърен модел, обучен изцяло с разпределен хардуер. През март тази година се появява INTELLECT-2 – още по-мощен модел с подобрени логически способности, базирани на reinforcement learning.

INTELLECT-3 ще надгради тези резултати, като използва глобална мрежа от децентрализирани GPU ресурси, които взаимодействат в реално време.

Пейзажът на индустрията за изкуствен интелект драстично се променя. Meta поставя началото на ерата на отворения код още през 2023 г. с Llama, но последната версия от април 2025 г. е посрещната хладно.

Междувременно DeepSeek – непознат до януари китайски играч – шокира индустрията с мощния си и евтин reasoning модел, което води до лавина от нови китайски AI системи като Alibaba Qwen, Kimi от Moonshot и DeepSeek R1.

Дори OpenAI реагира през август, като пуска първия си отворен модел от години, но китайските системи остават по-популярни, тъй като са по-гъвкави и лесни за адаптиране.

„Почти изглежда, че САЩ вече нямат опции, когато става въпрос за отворени гранични модели“, казва Вайсер. „А това е нещо, което ние се опитваме да променим.“