Нов играч с големи амбиции дебютира на терена на GenAI
За разлика от милионите, които компании като OpenAI и Anthropic наливат за обучението на моделите си, Writer успява да изгради своя за едва 700 000 долара
Базираният в Сан Франциско стартъп за изкуствен интелект Writer дебютира в сряда с голям модел на изкуствен интелект, чиято цел е да влезе в конкуренция с корпоративните предложения на OpenAI, Anthropic и другите основни играчи на този терен. Но за разлика от някои от тези свои конкуренти, компанията не е инвестирала огромни суми за неговото обучение.
От Writer разкриват пред CNBC, че са похарчили около 700 000 долара за обучението на своя модел, включително за данни и графични процесори, в сравнение с милионите долари, които конкурентните стартъпи харчат. И тази стратегия привлича вниманието на инвеститорите.
Writer е набрала 200 млн. долара при оценка от 1,9 млрд. долара в последния си кръг на финансиране. Това е почти четири пъти повече от оценката на компанията през септември 2023 г., когато тя привлича 100 млн. долара при оценка от 500 млн.
Writer намалява разходите, като използва синтетични данни или такива, създадени от изкуствен интелект. Те са предназначени да имитират информацията от реалния свят, която обикновено се подава на моделите, без да се нарушава неприкосновеността на личния живот на потребителите, и стават все по-популярен метод за обучение.
Проучване на изследователи на AI, публикувано през юни, установява, че ако настоящите тенденции в развитието на технологията продължат, компаниите ще „изчерпят напълно“ публично достъпните данни за обучение между 2026 и 2032 г. Според изследователите „генерираните от човека публични текстови данни не могат да поддържат мащабирането след това десетилетие“.
Amazon е използвала синтетични данни при обучението на Alexa, а Meta – за да прецизира моделите си Llama. OpenAI също включва подобни набори в своите модели.
Някои експерти обаче предупреждават, че синтетичните данни трябва да се използват предпазливо, тъй като имат потенциала да влошат работата на моделите и да засилят съществуващите предубеждения.
Уасим Алшикх, съосновател и главен технически директор на Writer, коментира пред CNBC, че неговата компания работи по своя конвейер за синтетични данни от години.
„В бранша има известно объркване относно определението за „синтетични“ данни“, казва той. „За да бъдем ясни, ние не обучаваме моделите си върху фалшиви или халюцинационни данни и не използваме модел за генериране на случайни такива. Вземаме реални данни и ги преобразуваме в синтетични, които са специално структурирани по по-ясен и чист начин за обучение на модели.“
Генеративният AI на компанията позволява на корпоративните клиенти да използват нейните големи езикови модели (LLM), за да генерират човешки звучащи отговори за всичко - от публикации в LinkedIn до описания на длъжности и мисии, да анализират и обобщават данни или текст и да изграждат персонализирани AI приложения за пазарен анализ. Компанията има повече от 250 корпоративни клиенти, включително Accenture, Uber, Salesforce, L'Oreal и Vanguard, които използват технологиите ѝ в сектори като поддръжка, ИТ, операции, продажби и маркетинг.
Пазарът на генеративен изкуствен интелект е напът да достигне приходи от 1 трилион долара в рамките на десетилетие. До момента през 2024 г. инвеститорите са вложили 26,8 млрд. долара в 498 сделки в сферата, според PitchBook, а компаниите в сектора са набрали 25,9 млрд. долара през 2023 г., което е с над 200% повече от 2022 г.
Но не лиспват и проблеми около тази технология.
Хакерски групи използват ChatGPT за намеса в американските избори
OpenAI все повече се превръща в предпочитана платформа за зловредните актьори в киберпространството, които искат да повлияят на демократичните избори по света.
В доклад от 54 страници, публикуван в сряда, създателят на ChatGPT разкрива, че е прекъснал „повече от 20 операции и измамни мрежи от цял свят, които са се опитали да използват нашите модели“. Заплахите са варирали от статии в уебсайтове, генерирани от изкуствен интелект, до публикации в социалните медии от фалшиви акаунти.
Докладът на OpenAI се появява по-малко от месец преди президентските избори в САЩ. Но освен там, това е важна година за изборите в световен мащаб – в рамките на 2024 ще се проведат кампании, засягащи над 4 милиарда души в повече от 40 държави. Възходът на съдържанието, генерирано от изкуствен интелект, доведе до сериозни опасения, свързани с дезинформацията по време на изборите, като броят на създадените дълбоки фалшификати се е увеличил с 900% на годишна база, според данни на компанията за машинно обучение Clarity.
Дезинформацията по време на избори не е ново явление. Тя е сериозен проблем още от президентската кампания в САЩ през 2016 г., когато руски групи намериха евтини и лесни начини да разпространяват невярно съдържание в социалните платформи. През 2020 г. те бяха залети с дезинформация относно ваксините за COVID-19 и изборни измами.
Притесненията на законодателите днес са по-скоро насочени към възхода на генеративния изкуствен интелект, който стартира в края на 2022 г. с пускането на ChatGPT и сега се възприема от компании от всякакъв мащаб.
OpenAI пише в доклада си, че свързаните с изборите употреби на AI „варират по сложност от прости заявки за генериране на съдържание до сложни, многоетапни усилия за анализ и отговор на публикации в социалните медии“. Съдържанието в социалните медии е свързано предимно с избори в САЩ и Руанда и в по-малка степен с тези в Индия и ЕС, казват от OpenAI.
В края на август иранска операция използва продукти на OpenAI за генериране на „дълги статии“ и коментари в социалните медии за изборите в САЩ, както и за други теми, но компанията заяви, че по-голямата част от идентифицираните публикации са получили малко или никакви харесвания, споделяния и коментари.
През юни OpenAI трябваше да преустанови тайна операция, при която продуктите ѝ бяха използвани за генериране на коментари за изборите за Европейски парламент във Франция, както и за политиката в САЩ, Германия, Италия и Полша. Компанията заяви, че макар повечето идентифицирани от нея публикации в социалните медии да са получили малко харесвания или споделяния, някои реални хора са отговорили на генерираните от AI публикации.
Нито една от операциите, свързани с избори, не е успяла да привлече „огромна ангажираност“ или да изгради „устойчива аудитория“ чрез използването на ChatGPT и други инструменти на OpenAI, става ясно още от доклада.