Изследователи от Станфорд и Университета във Вашингтон успяват да обучат AI модел за логическо разсъждение, като инвестират само $50 в облачни услуги. Новото откритие, описано в научна публикация, разтърсва индустрията, защото s1 постига резултати, съпоставими с някои от най-усъвършенстваните модели, като o1 на OpenAI и R1 на DeepSeek, пише TechCrunch.

Моделът s1 и кодът, използван за обучението му, вече са достъпни в GitHub, а това повдига важни въпроси за бъдещето на изкуствения интелект - ако достъпът до мощен AI става толкова лесен, къде изобщо са предимствата на големите компании?

Екипът, който стои зад s1, използва готов AI модел, който усъвършенства чрез дистилация - техника, при която модел се обучава да имитира разсъжденията на по-усъвършенстван AI, като използва неговите отговори.

В случая s1 е дистилиран от Gemini 2.0 Flash Thinking Experimental, един от AI моделите на Google. Подобен метод е използван и от изследователи в Бъркли, които миналия месец създават подобен AI модел за $450.

Google AI Studio предлага безплатен достъп до Gemini 2.0 Flash Thinking Experimental, макар и с дневно ограничение. Условията на компанията забраняват използването на техните модели за създаване на конкурентни услуги. Засега няма официален коментар от Google дали s1 нарушава тези правила.

Интересното е, че s1 е базиран на безплатен AI модел от китайската лаборатория Qwen (собственост на Alibaba), а екипът го обучава само върху 1 000 внимателно подбрани въпроса с обяснения как се стига до отговора, които са извлечени от Gemini 2.0.

Целият процес по обучението на s1 отнема по-малко от 30 минути с 16 Nvidia H100 GPU, а разходите за изчислителната мощност днес възлизат на около $20, според Никлас Мюнихоф, един от учените, които работят по проекта.

Изследователите прилагат и хитър подход, за да подобрят точността на новия модел - добавят думата "wait" (изчакай) в алгоритъма му, което кара системата да проверява отговорите си по-внимателно, за да бъде крайният резултат още по-добър.

Какво означава това за AI индустрията?

Докато Meta, Google и Microsoft планират да инвестират стотици милиарди долари в AI инфраструктурата си през 2025 г., s1 показва, че високото качество не винаги изисква огромни ресурси.

Все пак, според експерти, такива методи не водят до създаването на революционни нови модели, а по-скоро предоставят по-евтин начин за възпроизвеждане на съществуващите технологии.