OpenAI подобрява речевите възможности на ChatGPT
През последните няколко седмици Google пусна своя гласова функция, очаква се и Meta да направи това тази седмица
ChatGPT е готов за по-естествени аудио чатове. От OpenAI съобщиха във вторник, че популярният им чатбот вече разполага с усъвършенствана гласова функция за хората, които плащат за премиум достъп до услугата. Инструментът позволява по-плавни и по-близки до човешките разговори.
Пускането на версията ще продължи през цялата седмица, като тя все още не е налична в страните от ЕС, Исландия, Лихтенщайн, Норвегия, Швейцария и Великобритания.
OpenAI обяви разработването на новата възможност през май. Проектът получи голяма публичност заради гласа, наречен Sky, който приличаше на този на Скарлет Йохансон във филма „Тя“ от 2013 г. Юридически съветници, работещи от нейно име, изпратиха на OpenAI писма, в които бяха категорични, че компанията няма право да използва почти идентичния глас, и тя спря да го прави.
През изминалите месеци хората можеха да конфигурират ChatGPT да им говори с различни гласове чрез безплатното ниво. Разширената версия обаче реагира по-бързо и ще спира да говори и да слуша, ако я прекъснете. AI чатботът разполага с девет гласа, от които потребителите могат да избират, както и да въвеждат инструкции за аудио разговори в частта „Персонализации“ в настройките на приложението.
„Надявам се, че според вас си заслужаваше чакането“, пише Сам Алтман, съосновател и главен изпълнителен директор на OpenAI, в публикация в X, цитирана от CNBC.
Това пространство е все по-конкурентно. През последните няколко седмици Google пусна своя гласова функция Gemini Live на английски език за устройства с Android, а в понеделник стана ясно, че Meta ще представи гласове на известни личности по-късно тази седмица, които ще бъдат достъпни чрез Facebook, Instagram и WhatsApp.
OpenAI набра преднина на пазара на чатботове с генеративен изкуствен интелект, когато в края на 2022 г. пусна ChatGPT. През август компанията съобщи, че платформата има над 200 млн. Активни потребители седмично.
Притисната от конкуренцията, от стартъпа са подобрили акцентите в някои чужди езици и са увеличили скоростта на разговорите. Но ако не им харесва това, което чуват, потребителите могат да помолят ChatGPT да говори по различен начин - да ускори, да намали темпото или да включи друг акцент.
С новите си възможности чатботът може да разкаже приказка, да помогне при подготовката за интервю за работа или дори да усъвършенства чуждоезиковите умения на потребителите.
Разширеният аудио режим на ChatGPT е достъпен само за тези, които имат абонамент за плановете Plus, Team или Enterprise. Най-достъпният вариант е ниво Plus на цена от 20 долара на месец.