Година след като разтърси глобалните пазари: DeepSeek представи новото си поколение модели
Китайският стартъп твърди, че V4 превъзхожда всички конкурентни модели с отворен код при задачи по математика и програмиране
,fit(1001:538)&format=webp)
Китайският AI стартъп DeepSeek представи предварителна версия на дългоочаквания си голям езиков модел V4, позволявайки на потребителите да тестват новите му възможности и функции.
Подобно на предишния модел V3, новата версия е с отворен код, което позволява на разработчиците да изтеглят кода, да го стартират локално и да го модифицират.
Базираната в Ханджоу компания твърди, че V4 показва силни резултати спрямо местните конкуренти, особено при задачи, свързани с агенти, обработка на знания и интерференция.
От компанията допълват, че DeepSeek-V4 е оптимизиран за работа с популярни инструменти за агенти като Claude Code и OpenClaw.
Моделът се предлага в две версии – „pro“ и „flash“, в зависимост от размера.
V4-Pro превъзхожда всички конкурентни модели с отворен код при задачи по математика и програмиране и изостава единствено от затворения модел Gemini 3.1-Pro на Google по отношение на общите знания, съобщи DeepSeek в социалните мрежи.
По думите на стартъпа представянето на „pro“ версията изостава само „незначително“ от GPT‑5.4 и Gemini 3.1-Pro, което „подсказва траектория на развитие, изоставаща от най-напредналите модели от ново поколение с приблизително 3 до 6 месеца“. Според компанията „flash“ версията има сходни способности за разсъждение с „pro“ варианта, но предлага по-бързи отговори и „силно конкурентна“ цена за използване.
Основана през 2023 г., DeepSeek привлече внимание в края на 2024 г. с безплатния си модел V3 с отворен код, за който твърди, че е обучен с по-слаби чипове и на значително по-ниска цена от моделите на OpenAI и Google.
Няколко седмици по-късно, през януари 2025 г., компанията представи модела R1, който достигна сходни резултати или дори надмина много от водещите езикови модели в света.
R1 предизвика тревога сред инвеститорите, след като DeepSeek разкри, че е създаден само за два месеца и с по-малко от 6 млн. долара, използвайки по-слаби чипове на Nvidia. Това постави под въпрос лидерството на САЩ в AI, както и огромните разходи на големите технологични компании за инфраструктура.
Оттогава DeepSeek пусна серия от подобрения на моделите си, но нито едно не успя да повтори ефекта на R1.
V4 също едва ли ще има същото въздействие, тъй като пазарите вече са калкулирали факта, че китайският AI е конкурентоспособен и по-евтин за използване, коментира Иван Су, старши анализатор в Morningstar, пред CNBC.
Въпреки това новото позициониране на DeepSeek поставя останалите китайски модели с отворен код като директни конкуренти, допълва той.
След пускането на R1 DeepSeek се сблъсква с нарастваща конкуренция в бързо развиващия се китайски AI сектор, като играчи като Alibaba и ByteDance също представиха нови модели тази година.
Акциите на няколко други китайски AI компании поевтиняха в петък в Хонконг. MiniMax и Knowledge Atlas Technology (известна още като Zhipu) загубиха около 8%, а Manycore Tech поевтиня с 9%.
С какви чипове е обучен V4?
Един от ключовите въпроси след представянето на V4 е какви чипове са използвани за обучението му.
Китайският технологичен гигант Huawei потвърди в петък, че най-новият му AI изчислителен клъстер, базиран на процесорите Ascend, може да поддържа модела V4.
Не е ясно обаче до каква степен чиповете на Huawei са използвани при обучението му спрямо тези на Nvidia.
Китайските разработчици на AI са ограничени в директната покупка на най-напредналите чипове на Nvidia за обучение на модели заради експортните ограничения на САЩ.
В същото време Пекин засилва усилията си за развитие на собствената чип индустрия и според информации насърчава технологичните компании да използват местни алтернативи, като тези на Huawei.
След обявяването на V4 акциите на китайските контрактни производители на чипове се повишиха в Хонконг, като SMIC и Hua Hong Semiconductor поскъпнаха съответно с 8,9% и 15,2%.
&format=webp)
&format=webp)
)
&format=webp)
&format=webp)
&format=webp)
,fit(1920:897)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(1920:897)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
&format=webp)