Изкуствен интелект за „жълти стотинки“ - какво означава това за бъдещето на AI индустрията
Евтини техники за обучение на AI модели предизвикват въпроси за бъдещето на изкуствения интелект и ролята на големите компании в индустрията
![Изкуствен интелект за „жълти стотинки“ - какво означава това за бъдещето на AI индустрията](https://sportal365images.com/process/smp-images-production/profit.bg/06022025/bc3b9a7e-01cd-4ee1-856f-5aaed7681972.webp?operations=crop(0:0:1792:1008)&format=webp)
Изследователи от Станфорд и Университета във Вашингтон успяват да обучат AI модел за логическо разсъждение, като инвестират само $50 в облачни услуги. Новото откритие, описано в научна публикация, разтърсва индустрията, защото s1 постига резултати, съпоставими с някои от най-усъвършенстваните модели, като o1 на OpenAI и R1 на DeepSeek, пише TechCrunch.
Моделът s1 и кодът, използван за обучението му, вече са достъпни в GitHub, а това повдига важни въпроси за бъдещето на изкуствения интелект - ако достъпът до мощен AI става толкова лесен, къде изобщо са предимствата на големите компании?
Екипът, който стои зад s1, използва готов AI модел, който усъвършенства чрез дистилация - техника, при която модел се обучава да имитира разсъжденията на по-усъвършенстван AI, като използва неговите отговори.
В случая s1 е дистилиран от Gemini 2.0 Flash Thinking Experimental, един от AI моделите на Google. Подобен метод е използван и от изследователи в Бъркли, които миналия месец създават подобен AI модел за $450.
Google AI Studio предлага безплатен достъп до Gemini 2.0 Flash Thinking Experimental, макар и с дневно ограничение. Условията на компанията забраняват използването на техните модели за създаване на конкурентни услуги. Засега няма официален коментар от Google дали s1 нарушава тези правила.
Интересното е, че s1 е базиран на безплатен AI модел от китайската лаборатория Qwen (собственост на Alibaba), а екипът го обучава само върху 1 000 внимателно подбрани въпроса с обяснения как се стига до отговора, които са извлечени от Gemini 2.0.
Целият процес по обучението на s1 отнема по-малко от 30 минути с 16 Nvidia H100 GPU, а разходите за изчислителната мощност днес възлизат на около $20, според Никлас Мюнихоф, един от учените, които работят по проекта.
Изследователите прилагат и хитър подход, за да подобрят точността на новия модел - добавят думата "wait" (изчакай) в алгоритъма му, което кара системата да проверява отговорите си по-внимателно, за да бъде крайният резултат още по-добър.
Какво означава това за AI индустрията?
Докато Meta, Google и Microsoft планират да инвестират стотици милиарди долари в AI инфраструктурата си през 2025 г., s1 показва, че високото качество не винаги изисква огромни ресурси.
Все пак, според експерти, такива методи не водят до създаването на революционни нови модели, а по-скоро предоставят по-евтин начин за възпроизвеждане на съществуващите технологии.