Kada Dirbtinis Intelektas Pradės Garsinti Serialus - Alternatyvus Vaizdas

Turinys:

Kada Dirbtinis Intelektas Pradės Garsinti Serialus - Alternatyvus Vaizdas
Kada Dirbtinis Intelektas Pradės Garsinti Serialus - Alternatyvus Vaizdas

Video: Kada Dirbtinis Intelektas Pradės Garsinti Serialus - Alternatyvus Vaizdas

Video: Kada Dirbtinis Intelektas Pradės Garsinti Serialus - Alternatyvus Vaizdas
Video: Kokias galimybes prekybininkams atveria dirbtinio intelekto panaudojimas? 2024, Balandis
Anonim

Rusijos leidėjai jau eksperimentuoja su audio knygų knygų įrašymu mašinomis; ateityje dirbtiniam intelektui gali būti patikėta versti serialus ir dubliuoti juos su mėgstamų aktorių balsais. Apie tokių technologijų ypatybes ir kiek laiko prireiks joms sukurti.

- „Salik.biz“

Žodinė kalba tampa rašytine

„YouTube“automatiniai vaizdo įrašų subtitrai sukuriami naudojant balso atpažinimo ir vertimo iš kalbos į kalbą programinę įrangą. Jis remiasi savarankiško mokymosi neuroniniais tinklais. Ši parinktis yra senesnė nei dešimt metų, tačiau rezultatas vis dar toli gražu nėra idealus. Dažniau galite sugauti tik tai, kas pasakyta, bendrą prasmę. Koks sunkumas?

Tarkime, aiškina ITMO universiteto mašinų mokymosi laboratorijos vadovas Andrejus Filchenkovas, kad mes kuriame kalbos atpažinimo algoritmą. Tam reikia išmokti neuroninį tinklą dideliame duomenų masyve.

Tai užtruks šimtus, tūkstančius valandų kalbos įrašų ir teisingą jų palyginimą su tekstais, įskaitant frazių pradžios ir pabaigos žymėjimą, pašnekovų pakeitimą ir pan. Tai vadinama gaubtu. Kuo jis didesnis, tuo geriau treniruojamas nervų tinklas. Anglų kalbai sukurtos tikrai didelės korporacijos, todėl atpažinimas yra daug geresnis. Tačiau apie rusų ar, tarkime, ispanų kalbą yra žymiai mažiau duomenų, o apie daugelį kitų kalbų duomenų nėra.

„Ir rezultatas yra tinkamas“, - reziumuoja mokslininkas.

„Be to, žodžio, frazės reikšmę filme vertiname ne tik pagal garsą, taip pat svarbu aktoriaus intonacija ir jo veido išraiška. Kaip jūs tai aiškinate? - priduria Tomsko politechnikos universiteto Informacinių technologijų katedros docentas Sergejus Aksenovas.

Reklaminis vaizdo įrašas:

„Kaip elgtis sklandžiai kalbant? Apytikslė artikuliacija, eskizas, įsiterpimai, pauzės? Galų gale, atsižvelgiant į tai, prasmė pasikeičia, kaip sakoma „tu negali būti atleistas“. Kaip išmokyti mašiną nustatyti, kur kalbėtojas turi kablelį? O poezijoje? “- išvardija Marina Bolsunovskaya, NTI SPbPU centro laboratorijos „Pramoninio duomenų srauto apdorojimo sistemos“vadovė.

Sėkmingiausi projektai, pasak eksperto, yra siaurose srityse. Pvz., RTC įmonių grupės sukurta gydytojų profesinės kalbos atpažinimo medicininiais terminais sistema padeda gydytojams išsaugoti ligos istoriją.

„Čia galite aiškiai apibrėžti temą ir išryškinti raktinius žodžius kalboje. Gydytojas ypač pabrėžia tam tikrus intonacijos skyrius: paciento skundai, diagnozė “, - patikslina Bolsunovskaja.

Kita problema pabrėžia Michailo Burtsevo, MIPT nervų sistemų ir gilaus mokymosi laboratorijos vadovas. Faktas yra tas, kad kol kas mašina labiau atpažįsta tekstą, kai kalba vienas asmuo, nei keli, kaip filmuose.

Vertimas su kontekstu

Paimkime vaizdo įrašą angliškai, pavyzdžiui, iš TV serialo „Sostų žaidimas“, ir įjunkite automatinius rusiškus subtitrus. Tai, ką matome, greičiausiai privers juoktis.

Vis dar iš * Sostų žaidimo *
Vis dar iš * Sostų žaidimo *

Vis dar iš * Sostų žaidimo *.

Tačiau mašininio vertimo srityje technologija sulaukė įspūdingos sėkmės. Taigi „Google“vertėjas gana tolerantiškai verčia tekstus bendromis kalbomis, dažnai reikia tik minimalaus redagavimo.

Faktas yra tas, kad neuroninio tinklo vertėjas taip pat mokomas daugybės pradinių, teisingai pažymėtų duomenų - lygiagretaus korpuso, kuris parodo, kaip kiekviena originalo frazė turėtų atrodyti rusų kalba.

„Tokių pastatų statyba yra labai daug darbo, brangi ir daug laiko reikalaujanti mėnesiai bei metai. Norint mokyti neuroninį tinklą, mums reikia Aleksandrijos bibliotekos dydžio tekstų. Modeliai yra universalūs, tačiau daug kas priklauso nuo kalbos. Jei pateiksite daug duomenų, pavyzdžiui, „Avar“, ir vertimas bus aukštos kokybės, tačiau „Avar“duomenų paprasčiausiai nėra “, - sako Andrejus Filchenkovas.

„Vertimas yra atskiras produktas, susijęs su originalu, tačiau nėra su juo lygus“, - sako Ilja Mirin, Tolimųjų Rytų federalinio universiteto skaitmeninės ekonomikos mokyklos direktorius. - Tipiškas pavyzdys yra Dmitrijaus Pučkovo (Goblino) užsienio filmų vertimai 90-aisiais. Tik po jo darbo tapo aišku, kas ten vyko. Negalėjome sužinoti nieko tinkamo iš VHS versijų. Arba pabandykite išversti į gerai jums žinomą kalbą ką nors iš „The Master“ir „Margarita“. Pavyzdžiui, „juodoje skraiste su kruvinu pamušalu“. Mašina to negali padaryti “.

Neuroniniai tinklai gerai mokosi iš daugelio tipiškų pavyzdžių, tačiau filmai yra pilni sudėtingų prasmių ir konotacijų, anekdotų, kurie nėra prieinami mašinai - jis negali jų atskirti.

„Kiekviename animacinio serialo„ Futurama “epizode yra nuoroda į klasikinį amerikiečių kiną -„ Casablanca “,„ Roman Holiday “ir panašiai. Tokiais momentais, norėdamas sugauti ir perpakuoti prasmę tiems, kurie nežiūrėjo šių filmų, vertėjas turi sugalvoti artimą analogą iš Rusijos konteksto. Neteisingas mašininis vertimas gali labai atgrasyti žiūrovą “, - tęsia Mirinas.

Jo nuomone, mašininio vertimo kokybė siekia beveik 80 procentų, visa kita - specifiškumas, kurį reikia pridėti rankiniu būdu, įtraukiant ekspertus. "Ir jei 20-30 procentų frazių reikia taisyti rankiniu būdu, tada koks mašininio vertimo tikslas?" - sako tyrėjas.

„Vertimas yra pats problemiškiausias etapas“, - sutinka Sergejus Aksenovas. - Viskas priklauso nuo semantikos ir konteksto. Turimas priemones galima naudoti vertimui ir automatiniam balso perdavimui, pavyzdžiui, vaikų animaciniai filmai su paprastu žodynu. Tačiau aiškinant frazeologinius vienetus, vardus, žodžius, nukreipiančius žiūrovus į tam tikras kultūros realijas, kyla sunkumų “.

Filmuose ir vaizdo įrašuose kontekstas visada yra vizualus, jį dažnai lydi muzika ir triukšmas. Iš paveikslo spėliojame, apie ką herojus kalba. Kalboje, paverstoje tekstu, šios informacijos nėra, todėl sunku išversti. Tokia situacija yra vertėjams, dirbantiems su teksto subtitrais, nematant filmo. Jie dažnai klysta. Mašininis vertimas yra ta pati istorija.

AI balsas

Norėdami kopijuoti į rusų kalbą išverstą seriją, jums reikia algoritmo, kad būtų galima sukurti natūralų kalbą iš teksto, - sintezatoriaus. Juos kuria daugybė IT kompanijų, įskaitant „Microsoft“, „Amazon“, „Yandex“, ir jiems sekasi gana gerai.

Andrejaus Filčenkovo teigimu, prieš porą metų kalbos sintezatoriaus dubliavimo minutė užtruko kelias valandas, dabar apdorojimo greitis labai padidėjo. Kalbos sintezės užduotis kai kuriose srityse, kur būtini neutralūs dialogai, išspręsta gana gerai.

Daugelis jau laiko savaime suprantamu dalyku pokalbį su robotu telefonu, komandų vykdymą iš automobilio navigatoriaus, dialogą su Alisa „Yandex. Drive“automobilyje. Tačiau norint kopijuoti TV serialus, šios technologijos dar nėra tinkamos.

„Problema yra emocijos ir elgesys. Mes išmokome mašiną paversti žmogišku, tačiau tol, kol ji vis dar skamba tinkama kontekstui ir įkvepia pasitikėti. Prastas balso vaidmuo gali lengvai sunaikinti filmo suvokimą “, - teigė Filčenkovas.

Pasak Michailo Burtsevo, kalbos sintezė yra gana reali. Tačiau tai yra sudėtinga skaičiavimo tikslais ir to negalima padaryti realiu laiku už priimtiną kainą.

„Yra algoritmų, kurie sintezuoja kalbą, panašią į konkretaus aktoriaus balsą. Tai yra tembras, kalbėjimo būdas ir dar daugiau. Taigi bet kuris užsienio aktorius iš tikrųjų kalbės rusiškai “, - prognozuoja Burtsevas. Ateinančiais metais jis tikisi pastebimos pažangos.

Sergejus Aksenovas nuo penkerių iki dešimties metų kuria įrankius, leidžiančius versti ir dubliuoti sudėtingus kūrinius iš labiausiai paplitusių kalbų, tokių kaip anglų. Mokslininkas cituoja „Skype“pavyzdį, kuris prieš keletą metų pademonstravo galimybę organizuoti internetines pamokas moksleiviams, kalbantiems skirtingomis kalbomis. Bet net ir tada sistema nebus ideali, ji turės nuolat mokytis: įgyti žodyną, atsižvelgti į kultūrinį kontekstą.