Инструмент, който създава фотореалистични аватари и ги анимира, за да произнасят фрази от посочено лице, стана един от най-неочакваните продукти на събитието Microsoft Ignite 2023, пише TechCrunch.

Azure AI Speech text-to-speech avatar е новата функция, която в момента е налична в публична предварителна версия.

Тя дава възможност на потребителите да генерират видеосъдържание, в което аватар може да говори. Потребителите постигат това, като качват изображения, наподобяващи желания първообраз и предоставят сценарий, който да бъде изговорен.

Инструментът на Microsoft използва модел за анимиране на аватара и отделен модел за преобразуване на текст в реч.

Той може да бъде или предварително създаден, или обучен по гласа на лицето - за вербализиране на сценария.

В публикация в блога на Microsoft се обявява потенциалът на този инструмент и неговата ефективност при изготвянето на видеоклипове за обучение, представяне на продукти и препоръки от клиенти.

"Може да използвате аватара, за да създавате разговорни агенти, виртуални асистенти, чатботове и други", пише Microsoft. Предлагайки многоезични възможности, тези аватари могат да използват модели на изкуствения интелект като GPT-3.5 на OpenAI, за да отговарят на вербални запитвания от клиенти.

Анатомия на дълбокия фейк: Как се създават събития, които не са се случвалиСитуационните фейкове са следващия етап на технологиите, които преобръщат възприятията на аудиторията за реалността

Въпреки това, Microsoft адресира потенциала на инструмента за злоупотреба, като признава рисковете, свързани с подобни технологии в предишни случаи, познати като Deepfake.

Добър пример е злоупотребата с технологиите за генериране на аватари от стартъпа за изкуствен интелект Synthesia за пропаганда и фалшиви новинарски съобщения, пише TechCrunch.

Подменена реалност: Битката с фалшиви изображения от AI е в ключов етапГенеративният изкуствен интелект е достигнал критична точка по отношение на качеството и достъпността

Защо реклама с изкуствен интелект разгневи Скарлет Йохансон Актрисата предприема съдебни действия срещу приложение с изкуствен интелект, използвало името и гласа ѝ в реклама без разрешение

За да предотврати правните усложнения, Microsoft изисква "изрично съгласие" чрез записано изявление, преди потребителите да могат да синтезират гласовете си за лични аватари.

Понастоящем достъпът до инструмента е ограничен чрез регистрационен формуляр, като потребителите са задължени да спазват конкретни насоки, ограничаващи използването на личния глас до определени приложения, лишени от съдържание, създадено от потребителя, или съдържание с отворен край, информира TechCrunch.