Ново оръжие в AI надпреварата: Самокритичният модел на DeepSeek
Китайският стартъп представи технология, при която моделите сами оценяват и подобряват отговорите си без нужда от допълнителна човешка намеса

Китайският AI стартъп DeepSeek и изследователите от университета Цинхуа твърдят, че са открили нов начин за създаване на по-умни и по-ефективни езикови модели. И всичко това – без да се налага да ги правят по-големи или по-скъпи, пише Euronews.
Компанията, която предизвика вълна от шум още през януари със своя AI модел R1 – евтина, но впечатляващо добра алтернатива на ChatGPT – сега представя нова техника, която има потенциала да промени пазара за изкуствен интелект.
Тя носи името Self-Principled Critique Tuning (SPCT) и позволява на моделите не просто да учат, а да си дават самооценка, като подобряват отговорите си в реално време.
Как работи? Вместо
да разчитат на по-големи и по-ресурсни модели, от DeepSeek тренират езиковия модел да развива свои собствени правила, по които да преценява дали един отговор е качествен. Така AI се учи как да се „самокритикува“ – напълно автономно.
Системата, наречена DeepSeek-GRM (Generative Reward Modeling), съчетава машинно обучение със „съдия“, вграден в самия модел. Когато потребител зададе въпрос, съдията сравнява предложения отговор с вътрешните правила на модела и с това как би трябвало да изглежда един добър отговор. Ако двете съвпадат – моделът получава положителна обратна връзка. Ако не – значи има още какво да учи.
С други думи, по този начин AI моделът се тренира сам, по свои собствени критерии.
Според DeepSeek този подход позволява на моделите им да се справят по-добре от конкурентите, включително и от GPT-4 на OpenAI, Gemini на Google и Llama на Meta. И още нещо – компанията обещава, че ще направи тези инструменти с отворен код, което означава свободен достъп за всички.
Засега обаче няма обявена точна дата кога това ще се случи.
Новината за революционната техника идва в момент, когато слуховете за нов модел – R2 – набират инерция в китайските медии. Все още няма официални данни от страна на DeepSeek по темата, но очакванията са доста големи.