На глас ли го казах? Нова технология разчита човешките мисли
Неинвазивен мозъчно-компютърен интерфейс, способен да превръща мислите на човека в думи, един ден може да помогне на хора, загубили способността си да говорят в резултат на инсулт, травми или други заболявания, сред които и склероза, съобщава MIT Technology Review, позовавайки се на публикация в Nature Neuroscience.
Ново проучване, включващо модел, обучен на базата на сканиране на функционален магнитен резонанс на трима доброволци, е в състояние да предскаже цели изречения, които те чуват, с изненадваща точност. И това единствено на база на анализ на мозъчната им активност, което мотивира екипът да предупреди, че откритиеto доказва необходимостта от бъдещи политики за защита на „мозъчните данни на хората“.
Реч е била декодирана от мозъчна активност и преди, но процесът обикновено изисква силно инвазивни устройства с електроди, които да бъдат вградени в мозъка на човека. Други неинвазивни системи обикновено са се ограничавали до декодиране на отделни думи или кратки фрази.
Според създателите на интерфейса, екип от изследователи от Тексаския университет в Остин, за първи път в историята тяхната технология е успяла да изведе цели изречения чрез неинвазиен анализ на мозъчната активност, направени чрез ядрено-магнитен резонанс – обикновената магнитно-резонансна томография (МРТ) прави снимки на структурата на мозъка, а функционалната оценява кръвния поток в мозъка, изобразявайки кои части се активират при определени дейности.
В началото на проекта екипът обучава GPT-1, голям езиков модел, разработен от OpenAI, върху набор от данни от английски изречения, получени от Reddit, 240 истории от The Moth Radio Hour и транскрипции на подкаста Modern Love на New York Times.
Изследователите искат разказите да са интересни и забавни за слушане, тъй като това е по-вероятно да доведе до добри данни, отколкото нещо, което кара участниците да се отегчават.
"Всички обичаме да слушаме подкасти, така че защо да не лежим в скенера за ядрено-магнитен резонанс и да не слушаме?", шегува се Александър Хът, доцент по неврология и компютърни науки в Тексаския университет в Остин, който ръководи проекта.
По време на проучването трима участници слушат по 16 часа различни епизоди от едни и същи подкасти, докато са в скенер за ядрено-магнитен резонанс, както и няколко лекции от TED. Идеята е да се съберат богати данни, които според екипа са над пет пъти по-големи от наборите, обикновено използвани при експерименти с ядрено-магнитен резонанс, свързани с езика.
Моделът се научава да предсказва мозъчната активност, която четенето на определени думи ще предизвика. За да декодира, той отгатва последователности от думи и проверява доколко това отгатване съвпада с действителните думи. Моделът прогнозира как мозъкът ще реагира на предположените думи и след това сравнява прогнозата си с реално измерените мозъчни реакции.
Когато тестват модела върху нови епизоди на подкаст, той успява да възстанови същността на това, което потребителите чуват, само по мозъчната им дейност, като често идентифицира точни думи и фрази. Един от потребителите, например, чува "Още нямам шофьорска книжка", а системата извежда изречението "Тя дори не е започнала да се учи да шофира".
Изследователите показват на участниците и кратки видеоклипове на Pixar, които не съдържат диалог, и записват реакциите на мозъка им в отделен експеримент, предназначен да провери дали декодерът е в състояние да възстанови общото съдържание на това, което потребителят гледа. Оказва се, че може.
Но Ромен Брет, теоретичен невролог от парижкия Vision Institute, който не е участвал в експеримента, не е напълно убеден в ефикасността на технологията на този етап.
"Начинът, по който работи алгоритъмът, се състои основно в това, че моделът на изкуствения интелект съставя изречения от неясна информация за семантичното поле на изреченията, получена от сканирането на мозъка", казва той. "Възможно е да има някои интересни случаи на употреба, като например извод за това какво сте сънували, на общо ниво. Но съм малко скептичен, че наистина се доближаваме до нивото на четене на мисли".
Но дори да е в начален етап на развитие, технологията вече поражда етични въпроси около евентуалното бъдещо използване на мозъчни декодери за наблюдение и разпит. Имайки предвид това, екипът си поставя за цел да провери дали може да се обучи и пусне декодер без съдействието на човека. Те правят това, като се опитават да декодират възприетата реч от всеки участник, използвайки модели, обучени върху данни от друг човек.
Опитът е неуспешен, което според екипа подсказва, че декодерът не би могъл да се приложи към мозъчната дейност на някого, освен ако той не е пожелал и не е помогнал за обучението му.
И все пак, както казахме по-горе, технологията е съвсем в начален етап на развитие, което означава, че бъдещето крие много неизвестни.