Артюр Менш, Mistral и изкуственият интелект в Париж
Кой стои зад 9-месечният френски стартъп, предизвикващ гигантите от Силициевата долина
Миналата година по това време 30-годишния Артюр Менш работи в отдел на Google, докато изкуственият интелект тъкмо започва да се налага в общественото съзнание като нещо повече от научна фантастика.
Оттогава така нареченият генеративен AI, който може да разговаря – и вероятно да разсъждава – като хората, се превърна в най-обсъждания технологичен пробив от десетилетия.
А стартъпът на Менш, който напуска Google, за да основе бизнес в най-горещото поле на технологиите, днес се оценява на малко повече от 2 милиарда долара.
Скоростта на промяната отразява лудостта - и страха – които съпътстват усилията за изграждане и комерсиализиране на напреднали AI системи.
Базираният в Париж стартъп на Менш, наречен Mistral AI, оспорва общоприетото схващане, че победителите в надпреварата за AI ще бъдат гигантите на технологичната индустрия в САЩ. Менш, който основава компанията с двама приятели от инженерното училище, не смята, че огромният мащаб е от съществено значение или че САЩ непременно ще доминират.
„Винаги съм съжалявал, че в Европа няма силни технологични играчи. Мисля, че това е нашият шанс да станем такъв“, казва 31-годишният Менш пред The Wall Street Journal.
Компанията на Менш, която е събрала малко над 500 милиона долара от инвеститори, включително от Andreessen Horowitz, остава малка в сравнение с „голиатите“ в индустрията. Microsoft и Google наливат милиарди долари в обучение на най-новите AI системи, като използват достъпа си до специализираните компютърни чипове, необходими за изграждането на такива системи, и дълбоките си джобове, необходими за плащане на електроенергията, която тези чипове консумират.
Mistral, кръстен на метеорологично явление по югоизточното крайбрежие на Франция, свързано със силен студен вятър, се основава отчасти на идеята, че много от тези пари се губят.
Менш, чийто опит започва от академичните среди, е прекарал дълго време в изследване на това как да направи изкуствения интелект и системите за машинно обучение по-ефективни. В началото на миналата година той обединява усилия със съоснователите Тимоти Лакроа (32 г.) и Гийом Лампъл (33 г.), които тогава работят в лабораторията за изкуствен интелект на Meta Platforms в Париж.
Заедно те се обзалагат, че техният малък екип може да надхитри титаните от Силициевата долина, като намери по-ефективни начини за изграждане и внедряване на AI системи. И те искат да го направят, като раздадат много от своите AI системи като софтуер с отворен код.
„Искаме да бъдем капиталово най-ефективната компания в света на изкуствения интелект“, казва Менш. „Това е причината да съществуваме.“
В понеделник Mistral представи нов AI модел, наречен Mistral Large, който според Менш може да изпълнява някои задачи, свързани с разсъждение, сравними с GPT-4, най-модерният езиков модел на OpenAI до момента, и Gemini Ultra, новия модел на Google.
Менш добавя, че обучението на неговия нов модел струва по-малко от 20 милиона евро. За сравнение, главният изпълнителен директор на OpenAI Сам Алтман заяви миналата година след пускането на GPT-4, че обучението на най-големите модели на неговата компания струват много повече - от 50 до 100 милиона долара.
Mistral привлече интереса на корпоративни клиенти и инвеститори, включително Microsoft, който в понеделник заяви, че добавя новия модел на Mistral като опция за разработчиците в своята облачна услуга Azure. Като част от многогодишната сделка Microsoft ще придобие малък дял в компанията.
Ерик Бойд, корпоративен вицепрезидент на платформата за изкуствен интелект на Microsoft, казва, че Mistral представя интригуващ тест за това докъде интелигентното инженерство може да тласне системите с изкуствен интелект.
Mistral си партнира и с други компании, на които продава малки дялове – сред тях са Salesforce, както и Nvidia - производителят на най-мощните графични процесори или GPU, използвани за изграждане на AI системи като тази на Mistral.
Менш, който е известен в технологичните среди с това, че е завършил маратона в Париж за по-малко от 3 часа и половина през 2018 г., отдавна балансира между академичните и предприемаческите занимания.
Израснал е в предградията на запад от Париж, дете е на учителка по физика и собственик на малък технологичен бизнес. Посещавал е някои от най-добрите френски училища по математика и машинно обучение. Менторите му го описват като студент, който се впуска с нетърпение в проекти, дори и да няма достатъчно опит.
„Харесвам нови преживявания“, казва Менш пред WSJ. „Много бързо се отегчавам.“
Менш се присъединява към звеното за изкуствен интелект на Google, което тогава се нарича DeepMind, в края на 2020 г. Там работи върху изграждането на т. нар. големи езикови модели, тип система за изкуствен интелект, която по-късно ще захранва ChatGPT. През 2022 г. той е един от водещите автори на статия за нов AI модел, наречен Chinchilla, който променя разбирането на полето за връзката между размера на AI модела, колко данни се използват за изграждането му и колко добре се представя , известни като закони за мащабиране на AI.
С разгарянето на AI надпреварата през 2022 г. Менш е разочарован, че големите частни лаборатории започват да публикуват по-малко статии за големи езикови модели, споделяйки по-малко с по-широката изследователска общност. След стартирането на ChatGPT, в рамките на Google започва надпревара за създаването на подобен продукт. Менш споделя, че е преминал от работа в екип от 10 души до 30, а след това до 70.
„Мисля, че напуснах точно преди да стане твърде бюрократично за мен“, казва още Менш и добавя: „Не исках да изграждам непрозрачна технология.“
Първоначалният документ за представяне на Mistral пред инвеститорите миналата пролет осъжда „олигопола, който се оформя“, воден от американски компании, които продават собствени модели.
В началото Менш се заема с лобиране сред френските политици, включително президента Еманюел Макрон, срещу определени елементи от новия Закон за AI на Европейския съюз. Той предупреждава, че документът може да забави компаниите и според него няма да направи нищо, за да направи технологията по-безопасна.
За Менш и другите съоснователи пускането на AI системите като отворен код, който всеки може да използва или адаптира безплатно, е начин да бъдат забелязани от разработчици и потенциални клиенти, жадуващи за повече контрол върху изкуствения интелект, който използват. Най-модерните модели на Mistral, включително този, представен в понеделник, не са достъпни с отворен код.
„Поддържаме фин баланс между изграждането на бизнес модел и спазването на нашите ценности, свързани с отворения код“, казва Менш. „Искаме да измисляме нови неща, нови архитектури, както и да имаме нещо, което да продаваме допълнително на нашите клиенти.“