На най-убедителните роботи им липсва едно просто умение
Хуманоидите не трябва да бъдат по-умни, а по-бързи
Още преди чешкият писател Карел Чапек да въведе термина "робот" в романа си R.U.R. от 1920 г., хората са били обсебени от идеята да създадат живот от неодушевени предмети. От митичния бронзов човек, който защитавал Крит от пирати около 400 г. пр.н.е., до C-3PO на Джордж Лукас - в нашите истории са се появявали същества от метал, глина или протоплазма, които са "живи" точно като нас, пише Fast Company.
Днес, наблюдавайки робота Figure 01, задвижван от OpenAI, лесно може да се стигне до извода, че компанията за изкуствен интелект си играе на Господ. Има само един елемент, който липсва.
Този недостатък не е изкуственият общ интелект (AGI). Той не е и човешки облик. Разбира се, наличието на мозък с AGI, способен да разбира и да се адаптира към физическия свят, ще бъде ключът към превръщането на синтетичния живот в по-реалистичен. И да, в крайна сметка ще стигнем до момента, в който ще можем да създаваме съвършени "репликанти" като в Blade Runner, Westworld и The Bicentennial Man. Но всичко това засега няма значение.
Във видеото, публикувано от Figure - компания, основана от Брет Адкок с финансовата подкрепа на OpenAI, Nvidia, Microsoft, Intel и Джеф Безос - робот, който няма AGI или човешки облик, ви кара да си мислите за няколко кратки секунди, че е живо същество. Той разговаря с човек, дава му ябълка, подрежда някакъв боклук, след което продължава да въвежда ред на плота, поставяйки чаши и съдове в миялната.
За тези кратки секунди гласът и взаимодействието изглеждат толкова реални, че наподобяват предварително режисираните танци и акробатика, които Boston Dynamics прави със своя робот Atlas.
Присъствието на съмнение в гласа и използването на междуметия създават усещането, че човек всъщност озвучава робота зад кулисите, коментира Fast Company. Но кратката илюзия се разваля с дългите паузи между отговорите. Тогава става ясно, че вече разполагаме с всичко необходимо, за да създадем робот, който да може да се свързва с нас по същия начин, по който го правят научнофантастичните изкуствени същества като HAL 9000, Терминатора или Бендер от Futurama. Всичко се свежда до времето - скоростта. Това е най-забележимото качество, което липсва в момента. Независимо от това, видеото създава впечатлението, че компанията разполага с всичко от което се нуждае, за да създаде хуманоиден робот.
В продължение на милиони години еволюция мозъците ни са обучени да очакват отговор от живите същества, които ни заобикалят. Всъщност това е очакване, заложено в мозъчната ни структура, което влияе на възприемането ни на света. Ако то не се изпълни или ако няма отговор на нашите подкани, ние автоматично си мислим, че нещо не е наред, отбелязва Fast Company.
Ето защо, когато поддържаме разговор и не получаваме незабавна реакция - която не е задължително да е словесна – умът ни просто не може да го възприеме. Няма значение дали след това отговорът е най-умното, най-осведомяващото нещо, което някой някога е казвал. Той просто се проваля, точно както се случва в комедията, където таймингът е най-важното нещо.
Бързината и синхронът са основните причини, поради които виждаме акробатичните видеоклипове на робота Atlas, като човекоподобни. Същото е и с отговорите на HAL 9000:
Естественият ход на разговора го прави толкова заплашителен, колкото и човешкия социопат в "2001: A Space Odyssey". Всичко е свързано с потока на разговорите. Но, разбира се, това работи, защото всичко е написано по сценарий, хореография и се изпълнява от хора.
Тук, в реалния свят, следващата голяма бариера не е получаването на по-умни AI творения или човекоподобни облици, а правилният поток на реакциите, така че разговорите да протичат естествено.
По отношение на AI чатботовете, те работят чудесно, защото вече сме научени да чакаме в текстовите си комуникации с други хора. Тук паузата е нещо нормално.
Когато обаче става въпрос за директна комуникация на живо - моментите, в които трябва да поръчате кафе, да дадете инструкции на бота си за гледане на деца или да поговорите за това къде наблизо има добър ресторант, в който да отидете на среща - времето е ключът към потребителското изживяване.
Може би затова Nvidia работи по хардуера, който ще може да накара роботите да се движат и да общуват толкова свободно, колкото и хората.