Jūs Iškart žinote, Kad Tai Yra Porno. Ar Kompiuteris Supras? - Alternatyvus Vaizdas

Turinys:

Jūs Iškart žinote, Kad Tai Yra Porno. Ar Kompiuteris Supras? - Alternatyvus Vaizdas
Jūs Iškart žinote, Kad Tai Yra Porno. Ar Kompiuteris Supras? - Alternatyvus Vaizdas

Video: Jūs Iškart žinote, Kad Tai Yra Porno. Ar Kompiuteris Supras? - Alternatyvus Vaizdas

Video: Jūs Iškart žinote, Kad Tai Yra Porno. Ar Kompiuteris Supras? - Alternatyvus Vaizdas
Video: Week 10 2024, Rugsėjis
Anonim

Tumblr praėjusio mėnesio pradžioje paskelbė, kad uždraus pornografiją. Kai įsigaliojo naujoji turinio politika, maždaug po dviejų savaičių - gruodžio 17 d. - tapo akivaizdu, kad problemų bus. Išdiegęs dirbtinio intelekto sistemą, kuri turėjo uždrausti visą pornografiją svetainėje, ji klaidingai pažymėjo nekaltus įrašus 455,4 mln. Tinklaraščių tinklalapyje tarp 168,2 milijardo įrašų: vazų, raganų, žuvų ir viso to džiazo.

- „Salik.biz“

Dirbtinio intelekto pornografija

Nors neaišku, kurį automatinį filtrą „Tumblr“naudojo ar sukūrė - bendrovė neatsakė į užklausas šia tema - akivaizdu, kad socialinis tinklas įstrigo tarp savo pačios politikos ir technologijos. Pavyzdžiui, nenuoseklus požiūris į „moteris, demonstruojančias spenelius“ir meninis nuogybės atvejis, lėmė kontekstinius sprendimus, kurie parodo, kad net Tumblras nežino, ką uždrausti savo platformoje. Kaip dažna įmonė gali nustatyti, ką ji laiko nepadoraus?

Pirma, sunku užblokuoti rizikingą turinį, nes sunku apibrėžti, kas tai yra nuo pat pradžių. Nepadorumo apibrėžimas yra lokio spąstai, senesni nei šimtas metų, dar 1896 m. JAV pirmą kartą buvo priimti įstatymai, reglamentuojantys nepadorumą. 1964 m. Byloje Jacobellis prieš Ohajo valstiją klausdamas, ar Ohajas galėtų uždrausti rodyti Louis Malle filmą, Aukščiausiasis teismas paskelbė bene garsiausią šių dienų hardcore pornografijos apibrėžimą: kaip suprantu, jis bus įtrauktas į pažodžiui aprašymą; ir aš galbūt niekada nesugebėsiu to padaryti suprantamai “, - sakė teisėjas Poteris Stewartas. "Bet aš žinau, kas tai yra, kai matau, o filmas, susijęs su šia byla, nėra."

Mašinų mokymosi algoritmai turi tą pačią problemą. Būtent tokią problemą bando išspręsti Brianas Delorge'as, bendrovės „Picnix“, prekiaujančios specializuotomis dirbtinio intelekto technologijomis, generalinis direktorius. Vienas iš jų produktų, „Iris“, yra kliento pritaikyta pornografijos aptikimo programa, skirta „padėti žmonėms“, kaip sako Delorge, „kurie nenori pornografijos savo gyvenime“. Jis pažymi, kad vienintelė porno problema yra ta, kad tai gali būti bet kas, daugybė skirtingų dalykų - ir ne pornografiniai vaizdai gali turėti panašius elementus. Paplūdimio vakarėlio vaizdas gali būti užblokuotas ne todėl, kad ant jo yra daugiau odos nei biuro nuotraukoje, o todėl, kad jis yra krašte. „Štai kodėl labai sunku išmokyti vaizdo atpažinimo algoritmą, kad būtų galima padaryti viską iš karto“, - sako DeLorge."Kai apibrėžimas tampa sunkus žmonėms, kompiuteris taip pat turi sunkumų". Jei žmonės negali susitarti, kas yra porno, o kas ne, ar kompiuteris gali tikėtis sužinoti skirtumą?

Norint išmokyti AI aptikti pornografiją, pirmiausia reikia ją maitinti pornografija. Daug pornografijos. Kur galiu tai gauti? Na, pirmas dalykas, kurį žmonės daro, yra atsisiųsti krūva vaizdo įrašų iš „Pornhub“, „XVideos“, sako Danas Shapiro, „Lemay.ai“, startuolio, kuris sukuria AI filtrus savo klientams, įkūrėjas. "Tai yra viena iš pilkųjų teisinio pobūdžio sričių - pavyzdžiui, jei mokotės iš kitų žmonių turinio, ar ji priklauso jums?"

Po to, kai programuotojai atsisiuntė daugybę pornografijos įrašų, jie iš vaizdo įrašo iškirpo ne pornografinę medžiagą, kad įsitikintų, jog jų naudojama medžiaga neužkerta kelio picos pristatymo vaikinams. Platformos moka žmonėms, dažniausiai už JAV ribų, tokiam turiniui žymėti; darbas mažai apmokamas ir nuobodus, pavyzdžiui, įėjimas į „captcha“. Jie tiesiog sėdi ir pažymi: tai yra porno, tai yra tai. Jūs turite šiek tiek filtruoti, nes visa porno išeina su etikete. Mokytis geriau, jei naudojate ne tik fotografijas, bet ir didelius duomenų pavyzdžius.

Reklaminis vaizdo įrašas:

„Dažnai reikia ne tik filtruoti pornografiją, bet ir pridedamą medžiagą“, - sako Shapiro. "Patinka netikri profiliai su merginos nuotrauka ir telefonu." Jis nurodo sekso paslaugų teikėjus, ieškančius klientų, tačiau tai gali būti viskas, kas nėra visiškai teisėta. "Tai nėra porno, bet tai, ko nenorėtum žiūrėti savo platformoje?" Geras automatizuotas moderatorius sužino iš milijonų - jei ne dešimtys milijonų - pavyzdžių turinio, o tai gali sutaupyti tonų žmogaus valandų.

„Galite palyginti tai su skirtumu tarp vaiko ir suaugusiojo“, - sako Mattas Zeileris, „Clarifai“generalinis direktorius ir įkūrėjas, kompiuterio vizijos startuolio, atliekančio tokio tipo vaizdų filtravimą verslo klientams, generalinis direktorius. „Galiu jums pasakyti tvirtai - prieš porą mėnesių mes susilaukėme kūdikio. Jie nieko nežino apie pasaulį, jiems viskas yra nauja “. Jūs turite parodyti vaikui (algoritmą) daug dalykų, kad jis ką nors suprastų. Milijonai ir milijonai pavyzdžių. Bet būdami suaugę žmonės, sukūrę tiek daug konteksto apie pasaulį ir supratę, kaip jis veikia, galime išmokti ko nors naujo iš vos kelių pavyzdžių “. (Taip, mokyti AI filtruoti turinį suaugusiesiems yra tarsi parodyti vaikui daug pornografijos.) Tokių kompanijų kaip „Clarifai“šiandien sparčiai auga. Jie turi gerą pasaulio duomenų bazę, gali pasakyti šunis iš kačių, apsirengusių nuogas.„Zeiler“įmonė naudoja savo modelius, kad mokytų naujų algoritmų savo klientams - kadangi originalus modelis apdorojo daug duomenų, suasmenintoms versijoms veikti tereikės naujų duomenų rinkinių.

Tačiau algoritmui sunku jį tinkamai panaudoti. Tai gerai daro su turiniu, kuris akivaizdžiai yra pornografinis; tačiau klasifikatorius gali neteisingai pažymėti apatinių drabužių skelbimus kaip neribotus, nes paveikslėlyje yra daugiau odos, nei, tarkime, biure. (Su bikiniais ir apatiniais, pasak Zeilerio, labai sunku). Tai reiškia, kad pardavėjai savo darbe turėtų sutelkti dėmesį į šiuos kraštutinius atvejus, pirmenybę teikdami sunkiai klasifikuojamiems modeliams.

Kokia sunkiausia dalis?

„Anime pornografija“, - sako Zeileris. "Pirmojoje mūsų nuogumo detektoriaus versijoje švietimui nenaudota animacinių filmų pornografija." Daug kartų AI suklydo, nes nepripažino hentai. „Atlikę šį darbą klientui, mes įpurškėme daug jo duomenų į modelį ir žymiai pagerinome animacinių filtrų tikslumą, išlaikydami tikrų nuotraukų tikslumą“, - sako Zeileris.

Technologija, išmokyta uostyti pornografiją, gali būti naudojama ir kitiems dalykams. Šios sistemos technologijos yra nepaprastai lanksčios. Tai daugiau nei anime papai. Pvz., Dėlionė iš abėcėlės yra plačiai naudojama kaip automatinis laikraščio komentarų moderatorius. Ši programinė įranga veikia panašiai kaip vaizdų klasifikatoriai, išskyrus tai, kad ji rūšiuojama pagal toksiškumą, o ne nuogybes. (Toksiškumą tekstiniuose komentaruose nustatyti taip pat sunku, kaip pornografiją nuotraukose.) „Facebook“naudoja tokį automatinį filtravimą, kad aptiktų suicidinius pranešimus ir su terorizmu susijusį turinį, ir bandė šią technologiją aptikti melagingoms naujienoms savo masinėje platformoje.

Visa tai vis tiek priklauso nuo žmogaus priežiūros; mes geriau tvarkome dviprasmiškumą ir dviprasmišką kontekstą. Zeileris sako nemanantis, kad jo gaminys ėmėsi kažkieno darbo. Tai išsprendžia interneto mastelio problemą. Žmonės vis tiek mokys AI rūšiuodami ir ženklindami turinį, kad PG galėtų jį atskirti.

Tai yra modernavimo ateitis: individualizuoti, iki galo priimti sprendimai, teikiami įmonėms, kurios visą savo verslą vykdo mokydamos vis daugiau pažangių klasifikatorių daugiau duomenų. Panašiai kaip „Stripe“ir „Square“siūlo tiesioginius atsiskaitymo sprendimus įmonėms, kurios nenori jų apdoroti patys, tokios pradedančiosios įmonės kaip „Clarifai“, „Picnix“ir „Lemay.ai“vykdys internetinį moderavimą.

Danas Shapiro iš Lemay.ai teikia vilties. „Kaip ir bet kuri kita technologija, ji vis dar yra išradinėjama. Taigi nemanau, kad pasiduosime, jei nepavyks. Bet ar AI kada nors galės veikti autonomiškai be žmogaus priežiūros? Neaišku. „Snuff dėžutėje nėra nė vieno žmogaus, kuris filtruotų kiekvieną kadrą“, - sako jis. "Norėdami išmokti algoritmo, turite gauti duomenis iš visur."

Kita vertus, Zeileris mano, kad vieną dieną dirbtinis intelektas viską sutvarkys pats. Galų gale žmogaus intervencijų skaičius bus sumažintas iki nulio arba nereikšmingų pastangų. Palaipsniui žmogaus pastangos pavirs tuo, ko PG dabar negali padaryti, pavyzdžiui, aukšto lygio samprotavimai, savimonė - viskas, ką turi žmonės.

Pornografijos pripažinimas yra to dalis. Identifikavimas yra gana nereikšminga užduotis žmonėms, tačiau išmokyti algoritmą atpažinti niuansus yra daug sunkiau. Nustatyti ribą, kai filtras vaizduoja vaizdą kaip pornografinį ar ne pornografinį, taip pat yra sudėtinga, iš dalies matematinė užduotis.

Dirbtinis intelektas yra netobulas veidrodžio to, kaip mes matome pasaulį, kaip ir pornografija, atspindys to, kas vyksta tarp žmonių, kai jie yra vieni. Jame yra šiek tiek tiesos, tačiau nėra išsamaus vaizdo.

Ilja Khel