Umelá inteligencia založená na Biblii rozpoznáva viac ako 4000 jazykov

Meta trénuje svoje nové modely umelej inteligencie pre masovo viacjazyčnú reč pomocou údajov z biblických nahrávok a sprístupňuje ich v softvéri s otvoreným prístupom.

Meta (predtým spoločnosť Facebook) vytvára technológie, ktoré pomáhajú ľuďom spájať sa, hľadať komunity a rozvíjať firmy. Vyvinula modely umelej inteligencie, ktoré sú schopné identifikovať viac ako 4 000 hovorených jazykov a rozpoznať 1 100 z nich hovorených nahlas, pričom vychádza z údajov z Biblie. Vie ich rozpoznať 40-krát viac ako ktorákoľvek známa predchádzajúca technológia.

„Je to významný krok smerom k zachovaniu jazykov, ktorým hrozí zánik,“ hovorí spoločnosť stojaca za Facebookom a Instagramom.

Ich modely MMS (Massive Multilingual Speech) majú za cieľ „uľahčiť ľuďom prístup k informáciám a používanie zariadení v ich preferovanom jazyku“.

Meta ich sprístupňuje na softvéri s otvoreným prístupom, aby „ostatní z výskumnej komunity mohli stavať na našej práci“.

Údaje z Biblie

Na svete existuje asi 7 000 jazykov, ale existujúce modely rozpoznávania reči komplexne pokrývajú len asi 100 z nich. Aby to prekonali a model trénovali, vytvorili dva súbory údajov s náboženskými textami, ktorých preklady a zvukové nahrávky sú verejne dostupné v rôznych jazykoch.

Jeden zo súborov obsahuje zvukové nahrávky Nového zákona a jeho zodpovedajúci text prevzatý z internetu v 1 107 jazykoch, čo v priemere poskytlo 32 hodín údajov na jeden jazyk. Druhý obsahuje neoznačené nahrávky rôznych iných kresťanských náboženských čítaní.

Zdôrazňujú však, že „zatiaľ čo obsah zvukových nahrávok je náboženský, tak naša analýza ukazuje, že to neskresľuje model, aby produkoval viac náboženský jazyk“. Meta dúfa, že v budúcnosti „zvýši pokrytie MMS tak, aby podporovala ešte viac jazykov, a tiež sa vysporiada s výzvou zvládania dialektov, čo je často ťažké pre existujúcu rečovú technológiu“.

Zdroj: Evangelical Focus
Ilustračné foto: pixabay.com