ČESKÁ APLIKACE NA PŘEPIS ŘEČI DO TEXTU NOVĚ UMÍ I NORŠTINU
Česká webová aplikace Beey, která umí převést mluvené slovo na text již v téměř dvaceti světových jazycích, do svého portfolia nově zařadila i norštinu a švédštinu. Severské jazyky zvládla díky výzkumnému projektu Nordtrans.
Ilustrační foto Shutterstock
V rámci projektu spojili své síly Vědci z Technické univerzity v Liberci (TUL), výzkumníci z Norwegian University of Science and Technology v Trondheimu (NTNU) a tým pražské společnosti Newton Technologies, která je tvůrcem aplikace Beey. Projekt Nordtrans byl finančně podpořen grantem ve výši 1,24 mil. eur z prostředků Norských fondů a TAČR.
Newton Technologies tuto stále populárnější službu vyvinula již před několika lety, ovšem ze začátku se specializovala pouze na slovanské jazyky (čeština, slovenština, polština, chorvatština). Program se mezi uživateli těchto jazyků rychle osvědčil – jeho editované titulky používají například české televize DVTV, Nova nebo Prima. Společnost Newton Technologies se proto rozhodla rozšířit své portfolio na germánské jazyky. Nabídnout mezi nimi i norštinu by však nebylo možné bez již zmíněného úsilí českých a norských vědců.
Tým českých a norských vědců představil výsledky projektu Nordtrans. Foto Velvyslanectví ČR v Oslo
Strojové učení v akci
Pro přepis norštiny vědci použili novou generaci systémů rozpoznávání řeči, tzv. end-to-end rozpoznávač, který se skládá z jedné mohutné neuronové sítě. Tato umělá inteligence se pomocí algoritmů strojového učení natrénuje na požadovaný jazyk, k čemuž je potřeba hlavně obrovské množství dat, konkrétně zvukové nahrávky a jejich doslovný přepis. Při dostatečném množství kvalitních dat se pak tato verze rozpoznávače je schopna naučit velmi přesnému přepisu audiozáznamu na text. Běžně dosahuje přesnosti nad 90 %. V automatickém přepisu pak mohou uživatelé dále provádět změny k dosažení 100 % přesnosti, dělit text podle jednotlivých mluvčích, strukturovat podle témat a provádět mnoho dalších úprav. Navíc v Beey zůstane u každého slova uložená časová značka propojená na audio stopu, a to umožňuje přehrávat zvuk i podle umístění kurzoru v textu.
Díky rozšiřující se nabídce jazyků může aplikace zajistit klientům ve stále více zemích inovativní řešení pro diktování, automatický přepis nahrávek a jeho efektivní editaci. Program je vhodný pro novináře, videoproducenty, přednášející, zapisovatele a další širokou škálu uživatelů, kteří využívají ve své práci přepisy textů, editaci, titulkování nebo překlady. Časová úspora při použití aplikace Beey je velmi významná.
„Nová end-to-end technologie rozpoznávání řeči dosahuje mnohem lepších výsledků, než na které jsme byli dosud zvyklí. Přesnost přepisu je v mnoha případech neuvěřitelně vysoká,“ uvádí́ hlavní řešitelka projektu, Lenka Weingartová z Newton Technologies. „Doposud jsme se soustředili zejména na slovanské jazyky, tento projekt byl naším prvním výletem do severní Evropy. Spolupráce s NTNU nám otevírá mnoho možností dostat se na tyto rozvinuté trhy,“ dodala.
Edita Gabrielová, ekonomická stážistka, Velvyslanectví ČR v Oslo