Projekt “Own My Voice” umožňuje uživatelům poslouchat jedinečné a přirozené hlasy
Praha, 19. května 2022 – Společnost Xiaomi představuje svou nejnovější aplikaci plnou pokročilých algoritmů a vlastní hlasové technologie. Technologie Text-To-Speech, kterou vyvinula laboratoř Xiaomi AI Lab, slouží ke generování jedinečného a přirozeného hlasu pro uživatele s poruchami řeči.
Takoví uživatelé mohou nyní komunikovat s ostatními pomocí “vlastního hlasu” namísto typického monotónního elektronického. Tento úspěšný pokus, který je součástí výzkumného projektu “Own My Voice” vedeného Technologickým výborem společnosti Xiaomi, demonstruje poslání společnosti, kterým je umožnit všem na světě užívat si lepší život prostřednictvím inovativních technologií.
Proč právě tento projekt?
Společnosti Xiaomi na lidech záleží a snaží se naplňovat jejich rozmanité potřeby prostřednictvím technologických inovací. Po zjištění, že mnoho uživatelů s poruchami řeči touží vlastnit svůj unikátní hlas pro každodenní komunikaci, se rozhodla založitprojekt “Own My Voice”. „Jsme nadšeni, že můžeme prozkoumávat různé hodnoty, které nám přináší technologické inovace, jako jsou požadavky uživatelů na vlastní identitu a její budování,“ říká Zhu Xi z Technologického výboru společnosti Xiaomi.
Jak byl projekt zrealizován?
Aby bylo možné vygenerovat co nejvhodnější a nejosobnější hlas pro příjemce, najal projektový tým více než 200 dobrovolníků ze společnosti Xiaomi, kteří darovali svůj hlas. K porovnání vlastností darovaných hlasů byl použit speciální algoritmus pro porovnávání hlasových otisků. Tímto přístupem našel tým nejvhodnější hlas jako základní zvuk hlasové reference pro příjemce. S ohledem na personalizaci a ochranu soukromí byl vybraný hlas upraven komplexní akustickou modifikací tak, aby vznikl nový a originální.
Dále byla použita technologie Text-To-Speech k tréninku modelu umělé inteligence, díky čemuž tento nový hlas postupně získal přirozený rytmus a intonaci, které vyjadřují emoce a tón člověka.
Projekt “Own My Voice” kombinuje řadu nejpokročilejších algoritmů s hlasovou technologií vyvinutou společností Xiaomi, aby byla zajištěna specifičnost, bezpečnost a vysoká realističnost syntetizovaného hlasu, a vytváří tak novou myšlenku na syntézu řeči na míru pro uživatele s jejími poruchami.
Jaký má “Own My Voice” význam?
Základem tohoto projektu je skupina odborníků na hlasové technologie ze společnosti Xiaomi AI Lab. Od roku 2017 tito odborníci publikovali 37 článků o řeči ve sbornících špičkových mezinárodních konferencí. Úspěch aplikace “Own My Voice” závisí především na jimi vyvinuté technologii Text-To-Speech.
Technologie Text-To-Speech v podstatě způsobuje, že se syntetizovaný hlas se svou intonací, pauzami, rychlostí a dalšími vlastnostmi podobá skutečnému lidskému hlasu. Monotónní a nepřirozený pocit z elektronického hlasu je tak nahrazen přirozenějším. V současné době se tato technologie uplatňuje v mnoha chytrých zařízeních vybavených Xiaoai, hlasovým asistentem s umělou inteligencí společnosti Xiaomi.
Zhu Xi dodává: „Pokud si všimneme potřeb menšinových skupin a budeme se jimi zabývat v rané fázi, proces šíření technologií se může výrazně zkrátit. Díky tomu se výhody nových technologií stanou pro uživatele se zvláštními potřebami dostupnými bez prodlení.“
Do budoucna bude společnost Xiaomi nadále získávat zpětnou vazbu a zkoumat proveditelnost tohoto projektu v širším rozsahu. Xiaomi bude i nadále zpřístupňovat produkty prostřednictvím špičkových technologií a bude se snažit naplňovat rozmanité potřeby lidí prostřednictvím technologických inovací.