Meta AI
Metin govorni AI prepoznaje više od 4000 jezika
Metin jezični model MMS može napraviti transkripciju teksta u govor na 1100 jezika i dijalekata.
Meta je objavila da njezini open source istraživački modeli masivnog višejezičnog govora (Massively Multilingual Speech- MMS) uz pomoć umjetne inteligencije mogu identificirati više od 4000 govornih jezika, 40 puta više od bilo koje poznate prethodne tehnologije.
Ovi modeli proširuju tehnologiju pretvaranja teksta u govor i govora u tekst s oko 100 jezika na više od 1100, a tehnologija bi se mogla koristiti za VR i AR aplikacije na željenom jeziku osobe.
Iz tvrtke navode da su mnogi svjetski jezici u opasnosti od nestajanja, a ograničenja trenutne tehnologije prepoznavanja govora samo će ubrzati ovaj trend. "Želimo olakšati ljudima pristup informacijama i korištenje uređaja na jeziku koji preferiraju, a danas najavljujemo niz modela umjetne inteligencije (AI) koji bi im mogli pomoći u tome", kaže Meta u svojem priopćenju i dodaje kako je za treniranje AI-a prikupljala audio podatke korištenjem vjerskih tekstova poput Biblije, koji su prevedeni na mnoge različite jezike i čiji su prijevodi naširoko proučavani za istraživanje prijevoda jezika temeljenog na tekstu.
Ovi prijevodi imaju javno dostupne audio zapise ljudi koji čitaju te tekstove na različitim jezicima. "U sklopu projekta MMS izradili smo skup podataka čitanja Novog zavjeta na više od 1100 jezika, što je u prosjeku dalo 32 sata podataka po jeziku. Uzimajući u obzir neoznačene snimke raznih drugih kršćanskih vjerskih čitanja, povećali smo broj dostupnih jezika na više od 4000. Iako su ovi podaci iz određene domene i često ih čitaju muški govornici, naša analiza pokazuje da naši modeli rade jednako dobro za muške i ženske glasove. I dok je sadržaj audiozapisa religiozan, naša analiza pokazuje da to ne utječe na model da proizvede religiozniji jezik", tvrdi Meta i dodaje kako u budućnosti žele povećati pokrivenost MMS-a kako bi podržali još više jezika, a također se uhvatili u koštac s izazovom rukovanja dijalektima, što je često teško za postojeću govornu tehnologiju.
Kako to funkcionira možete vidjeti u videu objavljenom na ovoj poveznici.
Učitavam komentare ...