Dirbtinis Intelektas Išmoko Teisingai Atpažinti Kalbą Tarp Triukšmo - Alternatyvus Vaizdas

Dirbtinis Intelektas Išmoko Teisingai Atpažinti Kalbą Tarp Triukšmo - Alternatyvus Vaizdas
Dirbtinis Intelektas Išmoko Teisingai Atpažinti Kalbą Tarp Triukšmo - Alternatyvus Vaizdas

Video: Dirbtinis Intelektas Išmoko Teisingai Atpažinti Kalbą Tarp Triukšmo - Alternatyvus Vaizdas

Video: Dirbtinis Intelektas Išmoko Teisingai Atpažinti Kalbą Tarp Triukšmo - Alternatyvus Vaizdas
Video: Kokias galimybes prekybininkams atveria dirbtinio intelekto panaudojimas? 2024, Gegužė
Anonim

Virtualūs padėjėjai ir balso atpažinimo sistemos išmoko „atpažinti“tai, ką žmogus jiems sako, ir vykdyti jo komandas. Tačiau norint tinkamai valdyti tuos pačius „Siri“ir „Cortana“, pašalinis triukšmas gali būti didelė problema. Susitvarkyti su šia technine klaida gali padėti „Mitsubishi Electric“ekspertai, kurie pristatė naują technologiją, skirtą atskirti vieno žmogaus kalbą nuo bendro triukšmo.

Japonijos kompanijos technologija vadinama „Deep Clustering“, kurios veikimas grindžiamas mašininio mokymosi principais. Pirmiausia dirbtinis intelektas išmoko savarankiškai atskirti vieno žmogaus kalbą nuo bendro įvairių garsų ir triukšmo srauto. Neuroninis tinklas atskiria gaunamus garso duomenis į įvairius elementus ir analizuoja kiekvieną atskirai, po kurio jis jau gali apdoroti žmogaus balsą. Panašus darbas stebimas, kai du ar daugiau pašnekovų yra „sujungti“.

- „Salik.biz“

Demonstruodami Japonijos kompanijos technologiją, sistema sugebėjo sėkmingai atskirti dviejų žmonių, kalbančių tą patį sakinį skirtingomis kalbomis, kalbą į vieną mikrofoną. Visas apdorojimas buvo atliekamas realiu laiku, o uždelsimas neviršijo trijų sekundžių. Atpažinimo tikslumas buvo 90 procentų, o kai trys žmonės pradėjo kalbėti į mikrofoną, „pataikymų“procentas sumažėjo iki 80, o tai taip pat yra geras rezultatas. Anot projekto autorių Anthony Vetro ir Yohei Okato,

„Priešingai nei atskiriant kalbą nuo foninio triukšmo, vieno žmogaus kalbos atskyrimas nuo tuo pačiu metu kalbančių žmonių„ balso “triukšmo yra labai sunki užduotis, nes skirtingų žmonių balso garsai turi daug ypatumų. Daugumoje sistemų balso atskyrimo problema išsprendžiama įdiegiant du ar daugiau mikrofonų, tačiau naudojant tik vieną mikrofoną, balso atskyrimo užduotį gali atlikti tik dirbtinis intelektas. Ši technologija gali būti naudojama visur, kur reikalingas didelis balso pranešimų atpažinimo tikslumas. Pavyzdžiui, automobilių, liftų, buitinių ir kitų elektroninių prietaisų balso valdymo sistemose “.

VLADIMIRAS KUZNETSOVAS