Въпрос, който отдавна занимава феновете на LEGO, вече получи своя научен отговор – и той идва не откъдето очаквате.

Изследователи от Carnegie Mellon University (CMU) представят модел на изкуствен интелект, способен да превърне всеки текстови промпт в напълно реален LEGO проект.

Моделът носи името LegoGPT и представлява генеративна AI система, която може да състави списък с нужните части, 3D модел и дори да провери дали крайният резултат ще бъде стабилен и физически възможен за изпълнение.

Инструментът е описан в наскоро публикувана научна статия и вече е достъпен за обществеността. LegoGPT разчита на адаптирана версия на LLaMA-3.2-Instruct-1B – отворен модел, базиран на същите принципи като ChatGPT, пише Fast Compаny.

За да може да „разбере“ как се строят LEGO обекти, моделът е обучен с база данни от 47 000 LEGO структури и 28 000 уникални 3D форми, всяка с описание на външния вид и функцията си.

„Ако генеративните AI модели днес могат да създават снимка или видео на стол, нашият модел вече може да ви покаже как той да бъде построен с реални елементи и как тези елементи да се държат заедно“, коментира Ава Пън, докторант и съавтор на проекта.

LegoGPT работи чрез т.нар. автогересивен модел – познат механизъм от всички големи езикови AI системи, където прогнозата на всяка следваща „единица“ (дума, блокче) зависи от предходните. Но вместо текст, тук моделът „предвижда“ следващия строителен елемент.

Голямото предизвикателство пред разработчиците е не просто да „измислят“ конструкция, а да гарантират, че тя няма да се разпадне при реален монтаж.

Точно по тази причина LegoGPT използва собствено разработен физически алгоритъм, който взема предвид гравитацията, триенето, контактните сили между различните блокчета и проверява дали сумата на тези сили ще бъде нула – гаранция, че моделът ще бъде стабилен и няма да се разпадне.

Когато даден прототип не премине теста за устойчивост, алгоритъмът автоматично продължава да търси по-стабилна конфигурация, докато постигне физическа възможност.

Въпреки че към момента LegoGPT работи с ограничен брой категории (около 20 – от китари до кораби и автомобили) и на 20x20x20 voxel grid, потенциалът е много по-голям.

Изследователите вече гледат отвъд детските игри. Техният модел може да стане част от новите бизнес решения в архитектурата, индустриалния дизайн и дори производството на мебели – навсякъде, където има нужда от сглобяване на компоненти по ясно определени правила.

Важно предимство за феновете на LEGO и професионалистите е, че демо версията на софтуера е публична и достъпна чрез уеб портал, където всеки може да въведе кратко текстово описание и да получи 3D модел за изграждане и списък с необходимите части.

Единственият пропуск е липсата на пълни инструкции за последователността на строежа, което към момента остава предизвикателство за потребителите.

Отличителната черта на LegoGPT спрямо останалите генеративни системи е способността да интегрира физически закони и реални ограничения още на ниво алгоритъм. Така AI реално създава решения, които могат да бъдат реализирани извън екрана.

Екипът на CMU избира LEGO заради достъпността и универсалността на блокчетата, но визията им е далеч по-мащабна: в бъдеще подобни модели могат да автоматизират създаването на строителни прототипи, да оптимизират производствени линии и да ускорят процеса на иновации в редица индустрии.

„Днес генеративният изкуствен интелект не може да предложи продукти, които реално работят. Той може да нарисува стол, но не знае как този стол се изгражда и държи цял. Целта ни беше да обединим физически закони и изисквания за сглобяване, така че създаваните от модела обекти да могат реално да функционират“, коментира Ава Пън.