Анимиран аватар с глас на човек - отключва ли Microsoft кутията на Пандора?
Инструмент, който създава фотореалистични аватари и ги анимира, за да произнасят фрази от посочено лице, стана един от най-неочакваните продукти на събитието Microsoft Ignite 2023, пише TechCrunch.
Azure AI Speech text-to-speech avatar е новата функция, която в момента е налична в публична предварителна версия.
Тя дава възможност на потребителите да генерират видеосъдържание, в което аватар може да говори. Потребителите постигат това, като качват изображения, наподобяващи желания първообраз и предоставят сценарий, който да бъде изговорен.
Инструментът на Microsoft използва модел за анимиране на аватара и отделен модел за преобразуване на текст в реч.
Той може да бъде или предварително създаден, или обучен по гласа на лицето - за вербализиране на сценария.
В публикация в блога на Microsoft се обявява потенциалът на този инструмент и неговата ефективност при изготвянето на видеоклипове за обучение, представяне на продукти и препоръки от клиенти.
"Може да използвате аватара, за да създавате разговорни агенти, виртуални асистенти, чатботове и други", пише Microsoft. Предлагайки многоезични възможности, тези аватари могат да използват модели на изкуствения интелект като GPT-3.5 на OpenAI, за да отговарят на вербални запитвания от клиенти.
Въпреки това, Microsoft адресира потенциала на инструмента за злоупотреба, като признава рисковете, свързани с подобни технологии в предишни случаи, познати като Deepfake.
Добър пример е злоупотребата с технологиите за генериране на аватари от стартъпа за изкуствен интелект Synthesia за пропаганда и фалшиви новинарски съобщения, пише TechCrunch.
Защо реклама с изкуствен интелект разгневи Скарлет Йохансон Актрисата предприема съдебни действия срещу приложение с изкуствен интелект, използвало името и гласа ѝ в реклама без разрешение
За да предотврати правните усложнения, Microsoft изисква "изрично съгласие" чрез записано изявление, преди потребителите да могат да синтезират гласовете си за лични аватари.
Понастоящем достъпът до инструмента е ограничен чрез регистрационен формуляр, като потребителите са задължени да спазват конкретни насоки, ограничаващи използването на личния глас до определени приложения, лишени от съдържание, създадено от потребителя, или съдържание с отворен край, информира TechCrunch.