Microsoft въвежда речеви превод на различни езици в реално време в Teams
Технологичният гигант ще интегрира своя Windows 11 в хедсета за смесена реалност на Meta – Quest 3
Microsoft планира да даде възможност на потребителите на Teams да клонират гласовете си, така че звуковите им двойници да говорят на различни езици на другите участници в срещите.
По време на събитието Microsoft Ignite 2024 във вторник компанията разкри Interpreter in Teams - инструмент, който предоставя възможности за превод на реч „в реално време“. От началото на 2025 г. хората, които използват Teams за срещи, ще могат да използват Interpreter, за да симулират гласовете си на до девет езика: английски, френски, немски, италиански, японски, корейски, португалски, мандарин и испански.
„Представете си, че можете да звучите точно като самия себе си, но на друг език“, пише главният организационен директор на Microsoft Джаред Спатаро в публикация в блога на компанията, цитирана от TechCrunch. „Агентът Interpreter в Teams осигурява превод на реч в реално време по време на срещи и можете да изберете той да симулира вашия глас за по-лично и ангажиращо преживяване.“
Microsoft дава малко конкретни подробности за функцията, която ще бъде достъпна само за абонатите на Microsoft 365. Засега е ясно единствено, че инструментът не съхранява никакви биометрични данни, не добавя настроения извън това, което „естествено присъства“ в гласа, и може да бъде деактивиран чрез настройките на Teams.
„Interpreter е проектиран така, че да възпроизвежда посланието на говорещия възможно най-точно, без да добавя предположения или външна информация“, посочва говорител на Microsoft пред TechCrunch. „Гласовата симулация може да бъде активирана само когато потребителите дадат съгласието си чрез известие по време на срещата или чрез активиране на „Съгласие за гласова симулация“ в настройките.“
Редица други компании също са разработили технологии за цифрово имитиране на гласове, които звучат сравнително естествено. Meta неотдавна заяви, че работи по пилотен проект за инструмент за превод, който може автоматично да превежда гласове в Instagram Reels. ElevenLabs също предлага платформа за многоезично генериране на реч.
Преводите с изкуствен интелект обикновено имат по-малки лексикални възможности от тези на човешките преводачи. Те често се затрудняват да предадат точно разговорни думи, аналогии и културни нюанси. Въпреки това, икономиите на средства са достатъчно привлекателни, за да направят компромиса целесъобразен понякога. Според Markets and Markets секторът на технологиите за обработка на естествен език, включително тези за превод, може да възлезе на 35,1 млрд. долара до 2026 г.
AI клонингите обаче представляват и предизвикателство за сигурността. Дълбоките фалшификати (deepfake) се разпространяват като горски пожар в социалните медии, което затруднява разграничаването на истината от дезинформацията. Досега тази година дълбоки фалшификати с участието на президента Джо Байдън, Тейлър Суифт и вицепрезидента Камала Харис са събрали милиони гледания и споделяния. Те се използват и за т.нар. вишинг атаки, при които нападателя се представя за близък на жертвата, имитирайки неговия/нейния глас. По данни на Федералната търговска комисия (FTC) загубите, свързани с подобни измами, са достигнали 1 млрд. долара през миналата година.
Това беше причината OpenAI по-рано тази година да се откаже да пуска технологията си за клониране на глас - Voice Engine.
Windows влиза в света на смесената реалност
Друга новина от Microsoft Ignite 2024 е, че операционната система Windows влиза в смесената реалност. Технологичният гигант обяви, че ще предостави „пълните възможности“ на Windows 11 на Meta Quest 3 и Quest 3S през декември.
„Пълните възможности“ в този контекст означават, че потребителите ще получат достъп до локален компютър с Windows или до облачна инстанция на операционната система (чрез Windows 365) от хедсета за смесена реалност Quest. Microsoft казва, че свързването отнема само „секунди“, и оприличава преживяването на „лична, висококачествена, голяма, многомониторна работна станция“.
Поддържаните приложения в тази нова модалност на Windows се разпростират в 3D пространството. Microsoft ги нарича Volumetric Apps. По време на демонстрация през май технологичният гигант показа цифров контролер за Xbox от гледна точка на притежател на Quest 3 - обект, който може да бъде управляван с ръце в мета пространството.
Разработчиците могат да се регистрират, за да получат достъп до API, който им позволява да създават плъгини за нови или съществуващи 3D приложения за настолни компютри с Windows.
Microsoft заговори за съдържание за Windows за Quest още през 2022 г., когато заяви, че ще си партнира с Meta, за да предостави избрани приложения, включително Microsoft Teams, на потребителите на хедсета. През декември миналата година компанията предостави функциите за продуктивност на Microsoft 365 - Word, Excel и PowerPoint - на Quest, както и своята услуга за стрийминг на видеоигри - Xbox Cloud Gaming.