Китайските компании продължават да пускат модели на изкуствен интелект, които съперничат на възможностите на системите, разработени от OpenAI и други водещи американски играчи.

Тази седмица MiniMax, стартъп, подкрепен от Alibaba и Tencent, който е набрал около 850 млн. долара рисков капитал и се оценява на повече от 2,5 млрд. долара, дебютира с три нови модела. Това са MiniMax-Text-01, MiniMax-VL-01 и T2A-01-HD. MiniMax-Text-01 е модел само за текст, докато MiniMax-VL-01 може да разбира както изображения, така и текст. В същото време T2A-01-HD генерира аудио - по-специално реч.

Разработчикът твърди, че MiniMax-Text-01, който е с размер 456 милиарда параметри, се представя по-добре от модели като наскоро представения Gemini 2.0 Flash на Google при бенчмаркове като MMLU и SimpleQA. Те измерват способността на модела да отговаря на математически задачи и въпроси, базирани на факти. Параметрите приблизително съответстват на уменията на модела за решаване на проблеми. Тези с повече параметри обикновено се представят по-добре от системите с по-малко.

Що се отнася до MiniMax-VL-01, MiniMax твърди, че той съперничи на Claude 3.5 Sonnet на Anthropic при оценките, които изискват мултимодално разбиране, като ChartQA. Този тест оценява дали моделите могат да отговарят на запитвания, свързани с графики и диаграми (напр. „Каква е максималната стойност на оранжевата линия в тази графика?“). Все пак MiniMax-VL-01 не успява да надмине Gemini 2.0 Flash в много от тези тестове. GPT-4o на OpenAI и отвореният модел, наречен InternVL2.5, също го побеждават в няколко от тях.

TechCrunch отбелязва обаче, че MiniMax-Text-01 има изключително голям контекстен прозорец. Контекстът на модела или контекстният прозорец се отнася до входните данни (напр. текст), които моделът разглежда, преди да генерира изходни такива (допълнителен текст). С контекстен прозорец от 4 милиона лексеми MiniMax-Text-01 може да анализира около 3 милиона думи наведнъж - или малко над пет копия на „Война и мир“. По друг начин казано, контекстният прозорец на MiniMax-Text-01 е приблизително 31 пъти по-голям от този на GPT-4o и Llama 3.1.

Последният от пуснатите тази седмица модели на MiniMax, T2A-01-HD, е аудиогенератор, оптимизиран за реч. Той може да генерира синтетичен глас с регулируем каданс, тон и тенор на около 17 различни езика, включително английски и китайски, и да клонира глас само от 10 секунди аудиозапис.

MiniMax не е публикувала сравнителни резултати, сравняващи T2A-01-HD с други модели, генериращи звук. Но според запознати с работата на модела анализатори той се справя наравно с аудио моделите на Meta и стартъпи като PlayAI.

С изключение на T2A-01-HD, който е достъпен изключително чрез API на MiniMax и платформата Hailuo AI, новите модели на компанията могат да бъдат изтеглени от GitHub и платформата за разработване на AI Hugging Face. Но това, че моделите са „открито“ достъпни, не означава, че не са заключени в определени аспекти.

MiniMax-Text-01 и MiniMax-VL-01 не са истински модели с отворен код. MiniMax не е пуснала компонентите (напр. данни за обучение), необходими за повторното им създаване от нулата. Освен това те са под ограничителния лиценз, който забранява на разработчиците да използват моделите за подобряване на конкурентни системи с изкуствен интелект и изисква специален лиценз за платформите с повече от 100 милиона активни потребители.

MiniMax е основана през 2021 г. от бивши служители на SenseTime, една от най-големите китайски компании за AI. Проектите на компанията включват приложения като Talkie, платформа за ролеви игри с AI по подобие на Character AI, и модели за преобразуване на текст във видео, които MiniMax пусна в Hailuo.

Някои от продуктите на стартъпа станаха обект на спорове. Talkie, който беше изтеглен от App Store на Apple през декември по неуточнени „технически“ причини, включва AI аватари на публични личности, включително Доналд Тръмп, Тейлър Суифт, Илон Мъск и Леброн Джеймс, никой от които изглежда не е дал съгласието си да бъде включен в приложението.

През декември списание Broadcast съобщи, че видеогенераторите на MiniMax могат да възпроизвеждат логата на британските телевизионни канали, което предполага, че са били обучени на съдържание от тези канали. Освен това MiniMax е съдена от iQiyi, китайска услуга за видео стрийминг, която твърди, че стартъпът незаконно е обучавал моделите си на нейни записи, са защитени с авторски права.

Новите модели на MiniMax се появяват дни след като отиващата си администрация на Байдън предложи по-строги правила за износ и ограничения за технологиите за изкуствен интелект за китайските предприятия. На компаниите беше забранено да купуват усъвършенствани чипове за изкуствен интелект. Ако новите правила влязат в сила, както са написани, компаниите ще бъдат изправени пред по-строги ограничения и за моделите, необходими за създаването на сложни системи за изкуствен интелект.

Една от многото

MiniMax далеч не е единствената китайска компания, която е правила заявки, че нейните модели са равностойни на западните лидери.

Alibabа създаде семейство модели с изкуствен интелект, наречени Qwen. Те са изключително популярни в Азия и се отличават с висока производителност.

Стартъпът DeepSeek пък разработи модел, наречен DeepSeek-R1, който също казва, че може да се конкурира с водещите платформи на OpenAI.

Списъкът завършват гиганти като Baidu, ByteDance и Tencent, както и от стартъпи като SenseTime, Zhipu AI и Moonshot AI.