Сред множеството способности, които ние хората притежаваме, кои всъщност са уникално човешки? Езикът е сред водещите кандидати поне от времето на Аристотел, който определя човека като „животно, което има език“.

Днес, дори когато големи езикови модели като ChatGPT все по-убедително имитират ежедневната реч, учените се опитват да разберат дали съществуват аспекти на човешкия език, които нямат аналог нито в комуникацията на други животински видове, нито в изкуствения интелект.

През последните години фокусът все по-често пада върху въпроса дали езиковите модели могат да разсъждават за езика, а не просто да го използват. За част от лингвистичната общност отговорът е категоричен: не могат – и по принцип никога няма да могат. Тази позиция е формулирана през 2023 г. от Ноам Чомски и негови съавтори в публикация за The New York Times, в която те пишат, че „правилните обяснения за езика са сложни и не могат да бъдат усвоени просто чрез киснене в огромни масиви от данни“. Според тях моделите могат да боравят с езика, но не и да го анализират на дълбоко, концептуално ниво, разказва WIRED.

Това виждане обаче беше поставено под въпрос от скорошно изследване на Гашпер Бегуш – лингвист от Калифорнийския университет в Бъркли, заедно с Максимилиан Домбковски (докторант по лингвистика в Бъркли) и Райън Роудс от университета „Рътгърс“. Екипът подлага няколко големи езикови модела на серия от строги лингвистични тестове, включително задача, при която моделите трябва да изведат правилата на изцяло измислен език.

Резултатите се различават: повечето модели се провалят и не успяват да анализират езика по начина, по който хората го правят. Един от тях обаче се откроява. Моделът демонстрира способности, които значително надхвърлят очакванията – анализира изречения по начин, сравним с този на докторант по лингвистика, създава синтактични диаграми, разпознава многозначност и работи с комплексни структури на езика, като рекурсията. Според Бегуш това „предизвиква разбирането ни за това какво всъщност може да прави изкуственият интелект“.

Проучването се появява в изключително подходящ момент. Том Маккой, компютърен лингвист от Йейл, който не е част от изследването, го определя като „навременно и изключително важно“. По негови думи, с нарастващата зависимост на обществото от подобни технологии става все по-необходимо да разбираме не само в какво са добри те, но и къде се провалят.

Лингвистичният анализ, смята Маккой, е идеалната тестова среда за оценка на това доколко езиковите модели могат да разсъждават като хора.

Безкрайно сложният език, който AI никога няма да разбере

Едно от главните предизвикателства при подобни тестове е да се гарантира, че моделите не „знаят“ отговора предварително. Те са обучавани върху огромни масиви от текстове – не само почти целия интернет на десетки езици, но и академични материали, включително учебници по лингвистика. На теория е възможно моделът просто да възпроизвежда вече видяна информация.

За да избегнат това, Бегуш и колегите му създават тест от четири части. В три от тях моделите трябва да анализират специално конструирани изречения с помощта на синтактични дървета – метод, въведен още през 1957 г. от Чомски в книгата Syntactic Structures. Тези диаграми разбиват изреченията на съществителни и глаголни фрази, а след това – на отделни граматични категории като съществителни, глаголи, прилагателни, наречия и други.

Една от задачите се фокусира върху рекурсията – способността да се вграждат фрази в други фрази. „Небето е синьо“ е обикновено изречение. „Джейн каза, че небето е синьо“ вече съдържа рекурсия.

На теория този процес може да продължи до безкрай: „Мария се чудеше дали Сам знае, че Омал е чул, че Джейн е казала, че небето е синьо“ също е граматически коректно, въпреки че е тромаво изречение.

Рекурсията често бива определяна като една от основните характеристики на човешкия език – и дори на човешкия ум. Именно тя позволява от ограничен речник и краен набор от правила да се генерира безкраен брой изречения. До момента не съществуват убедителни доказателства, че други животни използват рекурсия по подобен начин.

Най-трудната форма на рекурсия е т.нар. „централно вграждане“, при което допълнителната структура се появява в средата на изречението – например „котката умря“ спрямо „котката, която кучето ухапа, умря“.

В теста, който Бегуш провежда, моделите получават 30 оригинални изречения с подобни сложни конструкции. Един от тях успява правилно да анализира структурата на изречения като: „Астрономията, която древните, които почитаме, са изучавали, не е била отделена от астрологията“. Моделът създава коректна синтактична структура и в същото време добавя допълнително ниво на рекурсия, без да наруши граматиката.

Самият Бегуш признава, че не е очаквал да срещне изкуствен интелект с подобен „металингвистичен“ капацитет – способност не само да използва езика, но и да го осмисля.

Разбиране или предсказване?

Това е и една от най-провокативните части на изследването, според Дейвид Мортенсен от университета „Карнеги Мелън“, който също не е участвал в проекта. В лингвистиката отдавна се води дебат дали езиковите модели просто предсказват следващата дума в изречението, или демонстрират по-дълбоко разбиране. „Някои лингвисти твърдят, че големите езикови модели всъщност не работят с език. Получените резултати поставят това под сериозно съмнение“, коментира той пред WIRED.

Особено впечатляваща за изследователите е способността на модела да разпознава двусмислие – задача, с която компютърните системи традиционно имат сериозни затруднения. Изречение като „Роуън нахрани своето домашно пиле“ може да означава както живото животно, което той отглежда, така и храна от пилешко месо, дадена на друг домашен любимец. Моделът коректно генерира две различни синтактични интерпретации.

Екипът тества моделите и в областта на фонологията – изучаването на звуковите модели в езика. За целта създават 30 изцяло нови „миниезици“ с измислени думи и правила. Моделите трябва да изведат фонологичните закономерности без никакъв предварителен контекст. Един от тях успява да формулира точно сложни правила за промяна на гласните звуци в зависимост от съседните съгласни – задача, която традиционно се смята за изключително сложна.

По-малко уникални, отколкото си мислехме?

Въпросът докъде могат да стигнат тези модели остава отворен. Дали подобрението е просто въпрос на повече изчислителна мощ и повече данни? Или някои свойства на езика са резултат от еволюционен процес, уникален за човешкия вид?

Към момента езиковите модели показват, че могат да извършват сложен лингвистичен анализ, но не са създали нищо оригинално и не са ни научили на нещо фундаментално ново за езика. Въпреки това, според Бегуш, границата на „уникално човешкото“ постепенно се измества. „Изглежда, че сме по-малко уникални, отколкото сме смятали досега“, заключава той.