Учените в Eli Lilly са изненадани от дизайна на молекулите, които AI създава при изследване за откриване на лекарства

Главният директор по информацията и дигиталните технологии на Eli Lilly Диого Рау е в екипа, провеждащ експеримент с генеративен изкуствен интелект за нови лекарства.

При положение, че AI е в състояние да се движи със скорост на откритията, която за пет минути може да генерира толкова молекули, колкото фармацевтичната компания синтезира за една година в традиционните лаборатории, има смисъл да се тестват границите на технологията в медицината, пише CNBC.

Но няма как да знаем дали изобилието от проекти, генерирани от изкуствен интелект, ще работи в реалния свят и това е нещо, за което скептичните ръководители на компанията искат да научат повече.

Най-добрите биологични проекти, генерирани от AI молекули, които Рау описва като "странно изглеждащи структури", не могат да бъдат сравнени с познатата молекулярна база данни на компанията, но изглеждат като потенциално силни кандидати за лекарства. Затова те са предоставени на учени от изследователския център на Eli Lilly, а Рау очаква резултатите да бъдат отхвърлени.

"Не е възможно да са толкова добри?", мисли си той, докато ги изследва.

Очаква се учените да посочат всичко, което не е наред с проектите, генерирани от изкуствен интелект, но това, което предлагат в отговор, е изненада за ръководството на Eli Lilly.

"Интересно, не бяхме мислили за проектиране на молекула по този начин", спомня си Рау, когато разказва историята, която досега не е отразявана.

"Това беше прозрение за мен. Винаги говорим за обучението на машините, но другото изкуство е, когато машините произвеждат идеи въз основа на набор от данни, които хората не биха могли да визуализират. Това подтиква към още по-голяма креативност, като открива пътища в развитието на медицината, които хората иначе не биха могли да изследват."

Според експерти с опит в пресечната точка на AI и здравеопазването, областта е на траектория, която в близко бъдеще ще види лекарства, изцяло генерирани от AI. Някои смятат, че най-много до няколко години това ще се превърне в норма при откриването на лекарства.

Генеративният изкуствен интелект бързо ускорява приложимостта си в разработването и откриването на лекарства, което ще промени не само фармацевтичната индустрия, но и основополагащи идеи, вградени в научния метод от векове.

Когато DeepMind наруши веригата на протеина

Моментът, в който тази траектория стана ясна за първи път, беше години преди ChatGPT да пробие. Според Кимбърли Пауъл, вицепрезидент по здравеопазването в Nvidia, това е бил "моментът AlphaFold" през 2021 г.

Тогава звеното за изкуствен интелект DeepMind на Google, известно с това, че показа колко различно може да бъде творческото мислене на AI от това на хората в китайската игра Го, стана пионер в прилагането на езикови модели в биологията.

"AlphaFold беше този ключов момент, в който можехме да обучим трансформационни модели с много големи масиви от данни и да минем от аминокиселинна последователност към протеинова структура, което е в основата на разработването и проектирането на лекарства", допълва Пауъл.

Напредъкът, свързан с изкуствения интелект, се осъществява в областта на биологията, която все повече се дигитализира, което Пауъл описва като "безпрецедентни мащаби и резолюции".

Това е медицинска революция, включваща пространствена геномика, сканираща милиони клетки в рамките на тъкани в триизмерна форма, и изграждане на модели на изкуствен интелект, които се възползват от каталога на химикалите, които са в дигитален вид, а това позволява генеративните модели на AI-трансформатори да започнат да работят върху тях.

"Това обучение може да се извърши с помощта на неконтролирано и самоконтролирано учене и може да се извърши не само бързо, но и с въображение: AI може да "мисли" за модели на лекарства, които човек не би могъл", казва Пауъл.

Аналогия за разбирането на разработването на лекарства с AI може да се намери в механизмите на ChatGPT.

"По същество той е обучен на всяка книга, уебстраница, всеки PDF документ и е кодирал знанията за света по такъв начин, че можете да му задавате въпроси и той да ви генерира отговори", казва Пауъл.

GPT-версията на откриването на лекарства

Откриването на лекарства е процес на наблюдаване на взаимодействия и промени в биологичното поведение, но това, което би отнело месеци или години в лабораторията, може да бъде представено в компютърни модели, които симулират традиционното биологично поведение.

"А когато можете да симулирате поведението, можете да предвидите как нещата си взаимодействат. Сега имаме възможност да представим света на лекарствата, защото разполагаме със суперкомпютри, използващи изкуствен интелект и метод, подобен на GPT, и с всички цифрови биологични данни за първи път можем да представим света на лекарствата в компютър.", допълва още Пауъл.

Това е радикално отклонение от класическия емпиричен метод, който доминира през последния век в откриването на лекарства: обширни експерименти, събиране на данни, анализ на данните на човешко ниво, последван от друг процес на проектиране въз основа на тези резултати.

Експериментиране в една компания, последвано от няколко точки на вземане на решения, които учените и ръководителите се надяват да доведат до успешни клинични изпитвания.

"Това е много занаятчийски процес", казва Пауъл. В резултат, процентът на неуспешните опити е 90%.

"Халюциниращи" лекарства

Пример за това е откриването на протеини.

Биологичната еволюция работи чрез идентифициране на протеин, който работи добре и след това природата продължава напред. Тя не тества всички други протеини, които също могат да работят по-добре.

Изкуственият интелект от друга страна, може да започне работата си с несъществуващи протеини в рамките на модели - подход, който би бил несъстоятелен при класическия емпиричен модел.

Погледнато в цифри, AI разполага с много по-голям набор от открития за изследване. С потенциалния брой протеини, които биха могли да действат като терапия, по същество безкраен – 10 на степен 160, или 10 със 160 нули, съществуващото ограничение за работа с протеините, които природата е дала на човечеството, е взривено.

"Можете да използвате тези модели, за да халюцинирате протеини, които биха могли да имат всички функции и характеристики, от които се нуждаем. Може да се стигне до там, докъдето човешкият ум не би стигнал, но компютърът може", казва Пауъл.

Тексаският университет в Остин наскоро закупи един от най-големите изчислителни клъстери на NVIDIA за своя нов Център за генеративен изкуствен интелект. "Точно както ChatGPT е в състояние да се учи от поредици от символи, химикалите могат да бъдат представени като поредици и ние можем да се учим от тях", казва Анди Елингтън, професор по молекулярна биология.

AI се учи да различава лекарствата от нелекарствата и да създава нови лекарства по същия начин, по който ChatGPT може да създава изречения. "Тъй като тези постижения се съчетават с продължаващите усилия за предсказване на протеиновите структури, скоро би трябвало да е възможно да се идентифицират съединения, подобни на лекарства", казва ученият.

Даниел Диас, докторант по компютърни науки, който ръководи групата за дълбоки протеини в Института за основи на машинното обучение на UT, заяви, че повечето настоящи работи по AI в областта на лекарствата са съсредоточени върху откриването на малки молекули, но по-голямо въздействие ще има при разработването на нови биологични лекарства (на основата на протеини), където вече вижда как AI може да ускори процеса на намиране на най-добрите дизайни.

Понастоящем екипът му провежда експерименти с животни върху терапевтично средство за рак на гърдата, което представлява разработена версия на човешки протеин, разграждащ ключов метаболит, от който зависи ракът на гърдата – по същество кара рака да гладува.

Традиционно, когато учените се нуждаят от протеин за терапия, те търсят няколко характеристики, включително стабилни протеини, които не се разпадат лесно. Това изисква да въведат генно инженерство, за да коригират даден протеин, което е тромав процес в лабораторната работа – картографиране на структурата и определяне от всички възможни генетични модификации на най-добрите варианти.

Сега моделите с изкуствен интелект помагат за ограничаване на възможностите, така че учените по-бързо да знаят кои са оптималните модификации.

В експеримента на Диас, използването на подобрена от изкуствения интелект версия, която е по-стабилна, е довело до приблизително седемкратно подобряване на добива на протеина, така че изследователите разполагат с повече протеин за тестване, използване и т.н. "Резултатите изглеждат много обещаващи", казва той. И тъй като това е протеин на човешка основа, вероятността пациентите да станат алергични към лекарството, е сведена до минимум.

Неотдавнашното пускане на т.нар. "микроуслуги" на Nvidia за AI в здравеопазването, включително за откриване на лекарства, позволява на изследователите да проверяват трилиони лекарствени съединения и да предсказват структурата на протеините.

Компанията Cadence, занимаваща се с проектиране на изчислителен софтуер, интегрира Nvidia AI в платформа за молекулно проектиране, която позволява на изследователите да генерират, търсят и моделират библиотеки с данни за стотици милиарди съединения. Тя също така предлага възможности за изследвания, свързани с модела на протеина AlphaFold-2 на DeepMind.

"AlphaFold е труден за използване от един биолог, затова го опростихме", казва Пауъл. "Можете да отидете на уебстраница, да въведете аминокиселинна последователност и да излезе действителната структура", обяснява ученият.

В крайна сметка лекарствата, разработени с изкуствен интелект, ще се издигнат или провалят въз основа на традиционния последен етап: резултатите от изпитванията върху хора.

"Все още трябва да се създаде доказателство", казва Пауъл.

Тя сравнява сегашното ниво на напредък с обучението на самоуправляващи се автомобили, при което непрекъснато се събират данни, за да се подсилват и усъвършенстват моделите.

"Абсолютно същото се случва и при откриването на лекарства. Можете да използвате тези методи, за да изследвате ново пространство, да го усъвършенствате, да го подобрявате, да правите интелигентни експерименти, да вземате данните и да ги връщате обратно в моделите, и така цикълът се завърта."

Но биологичното пространство в рамките на по-широкото поле на моделите на изкуствения интелект все още е малко в сравнение с него. Индустрията е в диапазона на един трилион или повече модели в областите на мултимодалната и естествената езикова обработка. За сравнение, биологичните модели са десетки милиарди.

"Ние сме в началото. Една дума средно е дълга по-малко от десет букви. Геномът е дълъг 3 милиарда букви.", казва в заключение Пауъл.