Симбиоза: Колкото повече се развива AI, толкова повече се нуждае от човека
Тъй като компаниите пускат по-усъвършенствани модели, търсенето на специализирани обучители, говорещи десетки езици, се увеличава
В първите години, за да могат моделите с изкуствен интелект като ChatGPT или конкурента му Cohere да дават отговори, подобни на човешките, бяха необходими огромни екипи от евтини работници, които да им помагат да различават основни факти, като например дали дадено изображение е на кола или на морков.
Но по-сложните актуализации на моделите в условията на ожесточена конкуренция вече изискват бързо разширяваща се мрежа от обучители, които имат специализирани познания - от историци до учени, някои от които с докторски степени.
„Преди година можехме да се справим с наемането на бакалаври, които просто да обучават AI как да се подобрява“, казва съоснователят на Cohere Иван Жанг пред Reuters. „Сега имаме лицензирани лекари, които учат моделите как да се държат в медицинска среда, или финансови анализатори, или счетоводители.“
За повечето обучения Cohere, която последно беше оценена на над 5 млрд. долара, работи със стартъп, наречен Invisible Tech. Компанията е един от основните конкуренти на OpenAI и е специализирана в областта на изкуствения интелект за бизнеса.
Стартъпът Invisible Tech наема хиляди обучители, работещи от разстояние, и се превърна в един от основните партньори на редица разработчици на AI, вариращи от AI21 до Microsoft, за обучение на техните модели с цел намаляване на грешките, известни като „халюцинации“.
„Имаме 5000 души в над 100 държави по света, които са доктори на науките, магистри и специалисти по работа със знания“, казва основателят на Invisible Франсис Педраза.
Invisible плаща до 40 долара на час в зависимост от местоположението на работника и сложността на работата. Някои компании като Outlier плащат до 50 долара на час, а друга организация, наречена Labelbox, посочва, че плаща до 200 долара на час за „високо експертни“ теми като квантова физика, но започва с 15 долара за основни теми.
Invisible е създадена през 2015 г. като доставчик на услуги за автоматизация на работните процеси. Тя обслужва компании като тази за доставка на храна DoorDash, за да дигитализира менюто ѝ. Но нещата се променят, когато сравнително неизвестната тогава изследователска компания OpenAI се свързва с нея през пролетта на 2022 г., преди публичното стартиране на ChatGPT.
„OpenAI дойде при нас с проблем, който се състоеше в това, че когато задавате въпрос на ранната версия на ChatGPT, тя „халюцинираше“. Нямаше как човек да се довери на отговорите“, разказва Педраза. „Нуждаеха се от усъвършенстван партньор, който да осигури усилено обучение с обратна връзка от човека“.
Генеративният AI (GenAI) създава ново съдържание въз основа на данните, използвани за обучението му. Понякога обаче той не може да прави разлика между вярна и невярна информация и генерира фалшиви резултати. В един от забележителните примери през 2023 г. чатбот на Google сподели неточна информация за това кой сателит пръв е направил снимки на Земята извън Слънчевата система в промоционален видеоклип.
Компаниите за изкуствен интелект са наясно, че халюцинациите могат да намалят привлекателността на GenAI за бизнеса, и опитват различни начини да намалят грешките, включително да използват човешки обучители, които да преподават концепцията за факти и измислици.
След като се присъединява към OpenAI, Invisible става партньор за обучение на AI на повечето от компаниите за GenAI, включително Cohere, AI21 и Microsoft.
„Това са все компании, които са се сблъскали с предизвикателства в областта на обучението, където техният разход номер едно е бил изчислителната мощност, а разход номер две – качественото обучение“, казва Педраза.
Как работи?
Компанията OpenAI, която започна лудостта около GenAI, разполага с екип от изследователи, наречен Human Data Team, който работи с обучители на AI, за да събира специализирани данни за развиване на своите модели като ChatGPT.
Изследователите на OpenAI измислят различни експерименти за намаляване на халюцинациите или подобряване на стила на писане и работят с обучители на AI от Invisible и други доставчици, казва източник Reuters, запознат с процесите в компанията.
Във всеки един момент се провеждат десетки експерименти, някои от които с инструменти, разработени от OpenAI, а други - с такива на външни доставчици.
Въз основа на това, което искат компаниите за изкуствен интелект - от това да станат по-добри в историята на Швеция до това да са лидери във финансово моделиране - Invisible наема работници със съответните дипломи за тези проекти, намалявайки тежестта на управлението на стотици обучители от страна на AI разработчиците.
„OpenAI разполага с някои от най-невероятните компютърни учени в света, но те не са непременно експерти по шведска история или въпроси по химия или биология или всяка друга тема, по която можете да попитате техните чатботове“, казва Педраза, добавяйки, че над 1000 работници, сключили договори с неговата компания, обслужват само OpenAI.
Жанг от Cohere казва, че също е използвал инструкторите на Invisible, за да намери начин да научи своя GenAI модел да намира релевантна информация от голям набор от данни.
Надпревара
Сред конкурентите в тази област е Scale AI, частен стартъп, оценен на 14 млрд. долара, който предоставя на компаниите, занимаващи се с изкуствен интелект, набори от данни за обучение. Компанията е навлязла и в областта на предоставянето на обучители и посочва OpenAI като свой клиент.
Invisible, която е на печалба от 2021 г. насам, е набрала само 8 млн. долара първичен капитал.
„Ние сме 70% собственост на екипа и само 30% собственост на инвеститорите“, казва Педраза. „Ние улесняваме вторичните кръгове, а последната търгувана цена беше при оценка от половин милиард долара“.
Човешките обучители за пръв път навлязоха в изграждането на AI чрез работа по етикетиране на данни, която изисква по-малка квалификация и също така е по-ниско платена, понякога само 2 долара. Тя се извършва предимно от хора в африкански и азиатски страни.
Но, тъй като компаниите за AI пускат по-усъвършенствани модели, търсенето на специализирани обучители и на десетки езици се увеличава, създавайки добре платена ниша, в която експертите от различни сфери могат да станат обучители, без дори да знаят как се кодира.
Търсенето от страна на компаниите за AI води до създаването на още компании, които предлагат подобни услуги.
„Пощенската ми кутия е залята от нови предложения. Наистина виждам това като ново пространство, в което компаниите наемат хора само за да създават данни за лабораториите за AI като нас“, казва Жанг.