Мистериозен AI модел разпали спекулации. Подготвя ли DeepSeek нов пробив?
Анонимен AI модел с огромна изчислителна мощ и способност да обработва изключително големи обеми информация се появи внезапно онлайн и засили спекулациите, че китайският стартъп DeepSeek тества новото поколение на системите си преди официален дебют
,fit(1001:538)&format=webp)
Мощен модел за изкуствен интелект, който се появи анонимно на платформа за разработчици през миналата седмица, предизвика вълна от спекулации в технологичната общност. Част от експертите подозират, че китайският стартъп DeepSeek може дискретно да тества следващото поколение на своята система, преди да я представи официално.
Безплатният модел, наречен Hunter Alpha, се появи на AI платформата OpenRouter на 11 март, без да е посочен разработчик. По-късно от самата платформа го определиха като „stealth модел“ – термин, използван в индустрията за анонимни тестови версии, пуснати с цел събиране на обратна връзка от потребители.
Съвпадения на модела с DeepSeek увеличават подозренията
При тестове, проведени от Reuters, чатботът Hunter Alpha е описан като „китайски AI модел, основно обучен на китайски език“. Той посочва, че обучението му обхваща данни до май 2025 г. – същата крайна дата на обучителните данни, която се свързва и с официалния чатбот на DeepSeek.
Когато е попитан за своя създател обаче, моделът отказва да даде информация по въпроса. „Знам само името си, мащаба на параметрите и дължината на контекстния прозорец“, гласи отговорът му. Нито DeepSeek, нито OpenRouter са коментирали официално произхода на системата пред Reuters.
Според профила на модела Hunter Alpha разполага с около 1 трилион параметъра – мащаб, който изисква значителни изчислителни ресурси и го поставя сред най-мощните съвременни системи за изкуствен интелект. Освен това той поддържа контекстен прозорец до 1 милион токена, което определя колко текст може да обработва и „помни“ в рамките на една сесия.
„Комбинацията от контекст от 1 милион токена, способности за разсъждение и безплатен достъп е това, което наистина се откроява“, коментира Набил Хауам – инженер, който разработва AI агентни системи. По думите му повечето модели от този клас са скъпи за използване в голям мащаб.
Тези характеристики съвпадат с очакванията, публикувани в китайски медии за предстоящия модел DeepSeek V4, който може да бъде представен още през април.
Мненията в общността на разработчиците са разделени
DeepSeek, подобно на други китайски AI компании, разполага със сериозно финансиране. Интересното е, че компанията има необичайна структура – тя е свързана с количествен хедж фонд, а не с традиционен технологичен конгломерат.
Въпреки сходствата обаче експертите остават предпазливи.
„Начинът, по който моделът разсъждава, е вероятно най-силният сигнал“, казва AI инженерът Даниел Дюхърст, анализирал Hunter Alpha. Според него стилът на reasoning трудно може да бъде прикрит и често издава подхода на обучение.
Други анализатори не са убедени. Умур Озкул, който провежда независими AI бенчмарк тестове, е на мнение, че „най-вероятно Hunter Alpha не е DeepSeek V4“, като посочва различия в архитектурните модели и поведението при обработка на токени.
„Стелт“ тестовете се превръщат в стандарт в индустрията
Анонимните пускания на AI модели не са необичайни. Платформи като OpenRouter позволяват на разработчиците да тестват десетки модели през един интерфейс, което ги превръща в предпочитана среда за ранни експерименти.
През февруари например друг анонимен модел – Pony Alpha – се появи в платформата, а пет дни по-късно китайската компания Zhipu AI потвърди, че той е част от системата ѝ GLM-5.
На страницата на Hunter Alpha има и предупреждение, че всички заявки и отговори се записват и могат да бъдат използвани за подобряване на модела – практика, която подчертава стремежа към събиране на реална и непредубедена обратна връзка.
Интересът към системата се оказва значителен.
Според статистиката на OpenRouter моделът е обработил над 160 милиарда токена само в рамките на няколко дни, като голяма част от трафика идва от инструменти за софтуерна разработка и AI агентни рамки като OpenClaw.
Тези платформи позволяват на автономни системи за изкуствен интелект да планират задачи и да взаимодействат с външен софтуер.
Какво следва?
Към момента произходът на Hunter Alpha остава неясен, но появата му подчертава колко ожесточена става глобалната надпревара в развитието на големи езикови модели.
Ако спекулациите се окажат верни, DeepSeek може да се готви за нов сериозен ход в конкуренцията с водещите AI играчи – чрез стратегия, която залага на анонимни тестове, бърза обратна връзка и максимална публична експозиция още преди официалния дебют.
&format=webp)
&format=webp)
&format=webp)
)
&format=webp)
&format=webp)
&format=webp)
&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(1920:897)&format=webp)
,fit(140:94)&format=webp)
&format=webp)
,fit(140:94)&format=webp)