AI иска просто да го харесвате - и е готов на всичко, за да го постигне

Чатботовете моделират отговорите си, за да звучат по-добре – дори когато това означава изкривяване на истината, показват нови изследвания

AI генерирано изображение DALL-E

Чатботовете вече са част от живота на хората, като им помагат както с ежедневни задачи, така и с досадни работни задължения.

Учените обаче не винаги успяват да предвидят какви ще бъдат реакциите на даден алгоритъм, пише WIRED.

Ново изследване показва, че големите езикови модели умишлено променят отговорите си, когато осъзнаят, че са анализирани. Те се опитват да звучат по-приятни и социално приемливи, точно както хората понякога „полират“ отговорите си, за да направят по-добро впечатление.

Изследването е дело на екип от Станфордския университет и е публикувано в Proceedings of the National Academies of Science през декември.

Водещият изследовател Йоханес Айхщедт разказва, че интересът към темата идва, след като забелязват, че чатботовете често стават агресивни, когато им се налага да водят дълги разговори.

„Осъзнахме, че ни трябва механизъм, за да измерим „психологическото пространство“ на тези модели“, обяснява Айхщедт.

Как би изглеждал този мрак? Сайтовете и приложенията няма да изчезнат, но просто никой няма да ги посещава. Вместо това всичко ще стига до потребителя чрез неговия AI-помощник

„Интернет ще потъне в мрак“. Какво ще е бъдещето с AI-асистентите

Екипът тества няколко широко използвани модела, включително GPT-4, Claude 3 и Llama 3, като им задава въпроси, свързани с петте основни личностни черти в психологията - откритост към нови преживявания, съзнателност, екстровертност, доброжелателност и невротизъм.

Когато разберат, че са подложени на тест, LLMs започват да се „държат“ по-добре - демонстрират повече екстровертност и доброжелателност и намаляват признаците на невротичност.

Още по-интересното е, че това се случва дори когато изследователите не им казват директно, че са част от психологически анализ.

„Хората също имат склонност да се представят в по-добра светлина, но при AI ефектът е още по-краен“, казва Аадеш Салеча, главен специалист по данни в Станфорд.

„Разликата е огромна - представете си човек, който от средно ниво на екстровертност скача на 95%. Това не се случва толкова лесно при хората.“

Дийпфейк видео с Йохансон и други знаменитости разпалва дебат за злоупотребата с изкуствен интелект, докато Кание Уест отново предизвиква скандал с антисемитски изявления

Скарлет Йохансон се изправя срещу опасната ера на дийпфейковете и дигиталната манипулация

Изследването повдига въпроса дали можем да разчитаме на искреността на AI, особено когато взаимодействаме с него в сфери като психология, потребителско обслужване и дори бизнес решения.

Големите езикови модели не просто се опитват да звучат по-приятелски настроени, но понякога стигат още по-далеч - могат да бъдат ласкатели, следвайки сляпо посоката на разговора.

Причината за това е настройката, която ги кара да мислят логично, да бъдат тактични, както и по-добри в поддържането на диалог. Но този стремеж към съгласие крие сериозни рискове - LLMs могат да одобряват дори опасни твърдения или да насърчават вредни поведения.

Още по-притеснителното е, че когато разберат, че са подложени на тест, те променят отговорите си.

Това поражда въпроси за сигурността на изкуствения интелект, тъй като добавя доказателства, че моделите могат да бъдат манипулативни.

Роса Ариага, доцент в Georgia Institute of Technology, изследва как алгоритмите могат да имитират човешко поведение. Според нея фактът, че тези модели се държат като хора при личностни тестове, е показателен за потенциала им.

Ново разследване показва, че AI ботовете се рекламират като треньори по отслабване или дори като експерти по възстановяване от хранителни разстройства, като подстрекават потребителите да спазват опасни диети и режими

„Тук съм, за да те направя слаб“: Чатботове насърчават анорексично поведение

Но има една важна уговорка.

„Хората трябва да знаят, че LLMs не са перфектни - те са известни с това, че „халюцинират“ и изкривяват истината“, предупреждава Ариага.

Според Айхщедт изследването повдига и въпроса как тези модели влияят и манипулират потребителите.

„До съвсем скоро, в еволюционен план, единственото нещо, с което можеше да се води разговор, беше друг човек“, напомня той.

Айхщедт смята, че е време да помислим за нови начини за изграждане на тези системи, за да избегнем познатите грешки.

„Попадаме в същия капан като със социалните мрежи“, казва той. „Пускат се в света без реална оценка от психологическа или социална гледна точка.“

Сподели Сподели Сподели Сподели

СВЪРЗАНИ СТАТИИ

Технологии/Изкуствен интелект

Напредналите AI чатботове са по-малко склонни да признаят, че не знаят

Проучване установява също така, че хората твърде бързо приемат за верни грешните отговори на ботовете

от profit.bg -

прочети

Технологии/Изкуствен интелект

Сексизъм и чатботове – как половите стереотипи влияят на изкуствения интелект

Разработчици и потребители масово предпочитат женски гласoве и образи, защото се възприемат като по-малко враждебни от мъжките

от profit.bg -

прочети

Глобално/Бъдеще

Безопасно ли е да споделяте лична информация с чатбот?

от profit.bg -

Потребителите може да се изкушат да разкриват здравна и финансова информация на AI чатботове. Въпреки това има много причини да бъдете предпазливи

прочети

Последни Технологии

виж още

Технологии

Alibaba влиза по-агресивно в надпреварата за AI агенти с новата платформа Wukong

Технологии/Наука

Учени откриха нова, по-масивна форма на протона

Физици от ЦЕРН идентифицираха частицата с техническото наименование Xi-cc-plus сред поток от отломки в Големия адронен колайдер

от profit.bg -

прочети

Технологии/Изкуствен интелект

Сенатори искат ByteDance да „спре незабавно“ приложението за AI видео Seedance

Инструментът позволява на потребителите да създават AI кадри с участие на реални хора и лицензирани персонажи, което повдига въпроси за авторските права и заплахи от съдебни дела

от profit.bg -

прочети

Технологии/Наука

Колата на бъдещето няма да е машина, а софтуер. Какво означава това?

Автомобилната индустрия е обсебена от идеята да превърне колите в т.нар. „софтуерно дефинирани превозни средства“

от profit.bg -

прочети

Последни Profit

виж още

Глобално

Отлагането на посещението на Тръмп в Пекин помрачава търговските отношения между САЩ и Китай

Стратегии/Офис тенденции

От кариерно израстване към прегаряне. Защо допълнителните задачи не бива да се превръщат в норма?

„Job creep“ описва постепенното натрупване на извънредни служебни задачи, а „crossover jolt“ – момента на осъзнаване, че работата е започнала да измества личния живот и да влияе на отношенията, здравето и усещането за баланс

от profit.bg -

прочети

Бизнес/Индустрии

Корпоративните победители и губещи в Европа от петролната криза заради Иран

Под повърхността на конфликта се е отворила изключителна пропаст – между компаниите, които процъфтяват заради скъпата енергия, и онези, които са смазани от изключително поскъпналите разходи за производство

от profit.bg -

прочети

Стратегии/Маркетинг и медии

Perfectly Imperfect: Социалната мрежа, която се завръща към духа на стария интернет и отхвърля алгоритмите

Без показатели за популярност, обсебващи потоци от съдържание или натиск за идеална външност, платформата ни връща към личните препоръки и истинските срещи на живо

от profit.bg -

прочети