DeepSeek пуска AI модел от ново поколение – с какво е различен и има ли „уловка“

Китайският стартъп обещава, че ще направи мощния AI по-достъпен за разработчици, изследователи и по-малки компании, което потенциално може да доведе до вълна от иновативни приложения

Getty Images

Новият експериментален модел на DeepSeek обещава да повиши ефективността и да подобри способността на изкуствения интелект да обработва голямо количество информация на много по-ниска цена, но въпреки това остават въпроси относно ефективността и безопасността на архитектурата, съобщава CNBC.

Китайският стартъп предизвика фурор в Силициевата долина, когато миналата година изненадващо пусна на пазара първия си модел R1, показвайки, че е възможно да се обучават големи езикови модели (LLM) бързо, на по-малко мощни чипове и с по-малко ресурси.

В понеделник компанията пусна DeepSeek-V3.2-Exp, експериментална версия на настоящия DeepSeek-V3.1-Terminus, която доразвива мисията си за повишаване на ефективността на AI системите, според публикация във форума за AI Hugging Face.

Акциите на местните производители скочиха след като AI стартъпът обяви нов модел

DeepSeek намеква за „следващо поколение“ китайски чипове

„DeepSeek V3.2 продължава да се фокусира върху ефективността, намаляването на разходите и споделянето на отворен код“, заяви пред CNBC Адина Якефу, ръководител на китайската общност в Hugging Face.

„Голямото подобрение е нова функция, наречена DSA (DeepSeek Sparse Attention), която подобрява AI при обработката на дълги документи и разговори. Тя също така намалява разходите за работа на AI наполовина в сравнение с предишната версия.“

„Това е важно, защото трябва да направи модела по-бърз и по-рентабилен за използване, без забележимо понижение на производителността“, коментира Ник Пейшънс, вицепрезидент и ръководител на AI в The Futurum Group.

„Това прави мощния AI по-достъпен за разработчици, изследователи и по-малки компании, което потенциално може да доведе до вълна от иновативни приложения.“

Безплатните модели на DeepSeek, Alibaba и други привличат потребители от цял свят

Отворен код: Стратегията на Китай за AI монопол

AI моделът взема решения въз основа на тренировъчни данни и нова информация, като например подсказка.

Например, ако една авиокомпания иска да намери най-добрия маршрут от А до Б, въпреки че има много варианти, не всички са осъществими. Като отсявате по-малко осъществимите маршрути, значително намалявате времето и в крайна сметка парите, необходими за пътуването. Точно това прави новият модел – взема предвид само данните, които счита за важни за задачата, за разлика от другите, които обработват всички данни.

Новите възможности способстват ефективността и способността за мащабиране на изкуствения интелект, тъй като са необходими по-малко ресурси, но едно от притесненията е, че това може да доведе до спад в надеждността на моделите поради липсата на контрол върху това как и защо се пренебрегва информация.

R1-0528 предпочита думи и изрази, подобни на тези, които Google Gemini 2.5 Pro предпочита, което повдига обосновани съмнения

Иновация или дестилация: Как е създаден новият модел на DeepSeek?

„Реалността е, че тези модели са загубили много нюанси. И тогава истинският въпрос е: имат ли те подходящия механизъм за изключване на неважните данни или механизъм, който изключва наистина важни данни, и тогава резултатът ще бъде много по-малко релевантен?“, пита Екатерина Алмъск, съосновател и управляващ партньор на фонда за рисков капитал BlankPage Capital.

Това може да е особено проблемно за безопасността и приложимостта на изкуствения интелект, и да не е „най-оптималният или най-безопасният“ модел в сравнение с конкурентите или традиционните архитектури.

Представител на китайския стартъп е обявил, че компанията е завършила това, което описва като „незначителна пробна актуализация“ и че потребителите могат да започнат да я тестват

DeepSeek пусна актуализация на AI модела, който срина технологичните акции по-рано тази година

DeepSeek обаче твърди, че експерименталният модел работи на равнището на V3.1-Terminus.

Компанията освен това е споделила действителния програмен код и инструментите, необходими за използването на модела. „Това означава, че други хора могат да се учат от него и да създават свои подобрения.“

Но за Алмъск самата същност означава, че технологията може да не е защитима.

„Подходът не е супер нов“, казва тя, като отбелязва, че индустрията „говори за разредени модели от 2015 г.“ и че DeepSeek не може да патентова своята технология, тъй като е с отворен код. Следователно конкурентното предимство трябва да е в това как решава коя информация да включи, допълва експертът.

Самата компания признава, че V3.2-Exp е „междинна стъпка към нашата архитектура от следващо поколение“, според публикацията в Hugging Face.

„DeepSeek играе дългосрочна игра, за да поддържа интереса на общността към своя напредък. Хората винаги ще избират това, което е евтино, надеждно и ефективно“, допълват експертите.

Сподели Сподели Сподели Сподели

СВЪРЗАНИ СТАТИИ

Технологии/Изкуствен интелект

Китайската Z.ai обяви, че новият ѝ AI модел е още по-евтин за използване от този на DeepSeek

Китайските компании създават все по-интелигентни продукти с изкуствен интелект на все по-ниска цена, като по този начин повтарят ключови елементи от пробивния успех на DeepSeek

от profit.bg -

прочети

Технологии/Изкуствен интелект

DeepSeek по 100: Китай става все по-амбициозен в стремежа си за AI доминация

Бившият заместник-управител на Китайската народна банка вижда AI трансформацията като възможна благодарение на използването на ресурсите от инженери в Китай, огромната потребителска база и подкрепящите правителствени политики

прочети

Технологии/Изкуствен интелект

„Моментът на Android“ за Китай - отвореният код като път към хегемония в AI

Успехът на DeepSeek доказва, че стратегиите с отворен код могат да доведат до по-бързи иновации и широко внедряване на технологията

от profit.bg -

прочети

Последни Технологии

виж още

Технологии

Дори умереното недоспиване може да доведе до напълняване

Технологии/Изкуствен интелект

Проучване: Все повече потребители откриват интимни партньори в лицето на AI асистенти като ChatGPT

Ново изследване на института INGENIO и Кеймбридж показва как разговорите с различни AI модели започват от любопитство, но все по-често прерастват в силна емоционална привързаност и дори "планиране" на общо бъдеще

от profit.bg -

прочети

Технологии/Изкуствен интелект

Оръжието на хакерите се превръща в защита – промпт инжекциите спират злонамерени AI агенти

Изследователи от компанията Tracebit превръщат една от най-опасните киберзаплахи в ефективен „капан“, който кара алгоритмите сами да прекратят атаката си

от profit.bg -

прочети

Технологии/Изкуствен интелект

Китайският изкуствен интелект преобръща пазара, а OpenAI и Anthropic искат защита

Евтините отворени модели печелят позиции в САЩ и разпалват спор дали регулациите пазят сигурността или ограничават конкуренцията

от profit.bg -

прочети

Последни Profit

виж още

Глобално

Иранското външно министерство предупреди България да не помага на американските операции

Глобално/България

Комисията по отбрана подкрепи пребиваването на авиация и военнослужещи на САЩ у нас за операции в Близкия изток

Предложението на МС е свързано с получена дипломатическа нота от САЩ с искане самолетите-цистерни, военнослужещите с лично оръжие и боеприпаси, както и летищно оборудване да бъдат разположени в авиационна база „Безмер“ от 24 юли до 1 октомври 2026 г.

от profit.bg -

прочети

Бизнес/Компании

„Казах ви, че ще струва повече от Земята“: Мъск предупреди залагащите срещу SpaceX, че „няма да оцелеят“

Т. нар. продавачи на къси позиции увеличиха залозите срещу компанията, достигайки до 32% от акциите ѝ на пазара в навечерието на ключови събития

от profit.bg -

прочети

Глобално/Европа

Унгарската прокуратура е извършила обиски в партийни офиси на Виктор Орбан

„Фидес“ съобщава, че целта са били сървърите, за да се провери „цялата комуникационна система и базите данни“ на партията

от profit.bg -

прочети