Водещи китайски компании обучават моделите си за изкуствен интелект в чужбина, за да имат достъп до чиповете на Nvidia и да заобиколят американските усилия да възпрепятстват развитието на мощната технология.

Alibaba и ByteDance са сред технологичните групи, които обучават най-новите си големи езикови модели в центрове за данни в Югоизточна Азия, съобщава Financial Times.

Според изданието през последните месеци има постоянна експанзия извън Китай, след като администрацията на Тръмп ограничи през април продажбите на H20 - полупроводниците на Nvidia, предназначени само за китайския пазар.

„Очевидният избор е да дойдеш тук“, казва пред FT оператор на център за данни със седалище в Сингапур.

„Нуждаеш се от най-добрите чипове, за да обучиш най-авангардните модели, а тук всичко е напълно съобразено със закона.“

През последната година моделите Qwen на Alibaba и Doubao на ByteDance се превърнаха в едни от най-ефективните LLM системи в света. Qwen се използва широко и извън Китай, тъй като е свободно достъпен „отворен“ модел.

Клъстерите от центрове за данни в Сингапур и Малайзия отбелязват бум, движен основно от китайското търсене. Много от тези обекти са оборудвани с висок клас продукти на Nvidia, аналогични на тези, използвани от големите американски технологични компании за обучение на модели.

Според FT китайските компании обикновено подписват договори за наем на мощности в чуждестранни центрове за данни, които се управляват от недържавни китайски собственици. Това отговаря на американските експортни ограничения, тъй като т.нар. „правило за дифузия“, въведено от администрацията на Байдън с цел затваряне на този пролука, беше отменено от Доналд Тръмп по-рано тази година.

Едно изключение е DeepSeek, чието обучение се провежда изцяло в Китай. Компанията е изградилa значителен клъстер от чипове на Nvidia преди въвеждането на американските забрани за износ, посочва FT.

В същото време DeepSeek работи в тясно сътрудничество с местни производители на чипове, водени от Huawei, за оптимизиране и разработване на следващото поколение китайски AI процесори.

Huawei е разположила екип от инженери в централата на DeepSeek в Ханджоу. Компанията разглежда партньорството като стратегически инструмент за напредък в областта на полупроводниците и софтуерните системи, които да бъдат използвани за обучение на AI модели в цялата страна.

Обучението на LLM модели изисква огромна изчислителна мощ, за да се обработват масивни набори от данни, което кара повечето китайски компании да предпочитат напредналите продукти на Nvidia за тази задача.

Въпреки това тези компании все по-често използват китайски чипове за т.нар. „инференция“ – етапът, при който системата отговаря на потребителски заявки и който заема все по-голям дял от общото натоварване на AI системите.

Освен за обучение, китайските технологични компании използват центровете за данни в Югоизточна Азия, за да обслужват своите чуждестранни клиенти, тъй като Alibaba и ByteDance се стремят да увеличат дела си на глобалния пазар на облачни услуги. Китайски компании разширяват достъпа си и до центрове за данни в други региони, включително Близкия изток.

Едно ограничение остава в сила: на китайските технологични гиганти не е позволено да изнасят лични данни извън страната. Това означава, че ако даден модел трябва да бъде персонализиран спрямо специфични данни на местен клиент, обучението трябва да се провежда в Китай.