Dirbtinis Intelektas Pradėjo Mokytis 10 Kartų Greičiau Ir Efektyviau - Alternatyvus Vaizdas

Dirbtinis Intelektas Pradėjo Mokytis 10 Kartų Greičiau Ir Efektyviau - Alternatyvus Vaizdas
Dirbtinis Intelektas Pradėjo Mokytis 10 Kartų Greičiau Ir Efektyviau - Alternatyvus Vaizdas

Video: Dirbtinis Intelektas Pradėjo Mokytis 10 Kartų Greičiau Ir Efektyviau - Alternatyvus Vaizdas

Video: Dirbtinis Intelektas Pradėjo Mokytis 10 Kartų Greičiau Ir Efektyviau - Alternatyvus Vaizdas
Video: Kokias galimybes prekybininkams atveria dirbtinio intelekto panaudojimas? 2024, Kovo
Anonim

„Google“dirbtinio intelekto padalinys paskelbė kuriantis naują neuroninių tinklų treniravimo metodą, derinant pažangių algoritmų ir senų vaizdo žaidimų naudojimą. Senieji „Atari“vaizdo žaidimai naudojami kaip mokymosi aplinka.

„DeepMind“kūrėjai (prisiminkite, kad šie žmonės sukūrė „AlphaGo“neuroninį tinklą, kuris ne kartą nugalėjo geriausius loginio žaidimo žaidėjus) mano, kad mašinos gali mokytis taip pat, kaip ir žmonės. Naudodamiesi treniruočių sistema „DMLab-30“, paremta šaulių „Quake III“ir „Atari“žaidimų žaidimais (naudojami 57 skirtingi žaidimai), inžinieriai sukūrė naują mašinų mokymosi algoritmą IMPALA (Svarbumo svertinis aktoriaus ir besimokančiojo architektūros). Tai leidžia atskiroms dalims išmokti atlikti kelias užduotis vienu metu, o vėliau keistis žiniomis tarpusavyje.

- „Salik.biz“

Image
Image

Daugeliu atžvilgių naujoji sistema rėmėsi ankstesne Asinchroninių veikėjų-kritikų atstovų (A3C) architektūros sistema, kurioje atskiri agentai tiria aplinką, tada procesas pristabdomas ir jie keičiasi žiniomis su centriniu komponentu - „studentu“. Kalbant apie IMPALA, ji gali turėti daugiau agentų, o pats mokymosi procesas vyksta šiek tiek kitaip. Jame agentai siunčia informaciją dviem „studentams“iš karto, kurie taip pat keičiasi duomenimis vieni su kitais. Be to, jei A3C nuostolių funkcijos gradiento apskaičiavimą (kitaip tariant, numatytų ir gautų parametrų verčių neatitikimą) atlieka patys agentai, kurie siunčia informaciją į centrinį branduolį, tada IMPALA sistemoje šią užduotį atlieka „studentai“.

Žmogaus, žaidžiančio per žaidimą, pavyzdys:

Štai kaip „IMPALA“sistema vykdo tą pačią užduotį:

Vienas iš pagrindinių iššūkių plėtojant AI yra laikas ir aukštos skaičiavimo galios poreikis. Net ir autonomiškoms mašinoms reikia taisyklių, kurių jie gali laikytis atlikdami savo eksperimentus ir ieškodami problemų sprendimo būdų. Kadangi mes negalime tiesiog kurti robotų ir leisti jiems mokytis, kūrėjai naudoja modeliavimą ir gilaus mokymosi metodus.

Kad šiuolaikiniai neuroniniai tinklai ko nors išmoktų, jie turi apdoroti didžiulį kiekį informacijos, šiuo atveju milijardus kadrų. Ir kuo greičiau jie tai daro, tuo mažiau laiko reikia mokytis.

Reklaminis vaizdo įrašas:

Turėdamas pakankamai procesorių, „DeepMind“sako, kad IMPALA pasiekia 250 000 kadrų per sekundę arba 21 milijardą kadrų per dieną. Anot „The Next Web“, tai yra absoliutus tokio pobūdžio užduočių rekordas. Patys kūrėjai komentuoja, kad jų AI sistema geriau susidoroja su užduotimi nei panašios mašinos ir žmonės.

Ateityje panašūs AI algoritmai gali būti naudojami robotikoje. Optimizuodami mašinų mokymosi sistemas, robotai greičiau prisitaikys prie savo aplinkos ir veiks efektyviau.

Nikolajus Khizhnyak