AI, ML og Deep Learning: Hver er munurinn?

Af hverju verða vélar að læra? Vegna þess að menn geta ekki haldið uppi.

Núverandi AI / ML uppsveifla er afleiðing framfara í sérstakri nálgun við nám, Deep Learning. Gervigreind, vélinám og djúpt nám eru öll ábyrg fyrir nokkrum stærstu framförum undanfarins árs og fólk fagnar þessari tækni til skiptis. Undanfarið heyra tækniráðstefnur saman við fólk sem vill vita meira um gervigreind, vélinám og djúpt nám eins og það væri sami hluturinn. Það er heilmikið af sögu á bak við hverja þessa tækni, en einfaldari leið til að fylgjast með mismuninum er af hvötum okkar.

Hundruð manna safnast saman til að fræðast um Vélanám hjá AI Frontiers fyrir Tensorflow verkstæði árið 2017.

Munurinn á hvötum

Vélar læra af því að mennirnir hafa betri hluti að gera. Ég er að hálf grínast en það er góð byrjun. Auðvitað eru fleiri tæknilegar kröfur um hvernig AI, ML og Deep Learning tengjast.

Munurinn í skilgreiningum

Gervigreind er verkfræðigreindin innblásin af því sem við upplifum sem menn. Nám er ekki aðeins hlið þess heldur leið sem við sjálf notum til að ná meiri greind. Gervigreind er tæki, en Vélarnám er leið til að smíða verkfærið. Deep Learning er tegund vélináms sem notuð er til að ná gervigreind. Fyrir sjónrænt er hér kennslubókarskýring á samskiptum AI, ML og Deep Learning.

http://www.deeplearningbook.org/

Ef einhver spyr hvað það þýðir að vinna í AI, þá myndi ég svara, „Ég vinn að því að fá tölvur betri í að gera hluti sem menn gera.“ Ef einhver biður um eina leið til að ná AI gæti ég svarað „með Vélanám,“ eða „Djúpt nám“ til að vera nákvæmari.

Munurinn í sögu

Þessi staðall að hafa vélar sem standa sig betur en mennirnir var frægur kynntur af Alan Turing í ritgerð sinni frá 1950 um tölvuvélar og upplýsingaöflun, almennt þekktur sem Turing prófið (byggt á eftirlíkingarleiknum). Turing leggur til að vélar geti staðist prófið með stakum reglum og eindæmum vélum, það er hvernig tölvuforrit virka í dag. Í lok blaðsins ímyndar hann sér hugmyndina um „læra vélar“, röð flókinna umfram hugsunarvélar. Turing spurði fyrst: „Getur vélar hugsað?“ Undir lok blaðsins spyr hann: „Getur verið að vél sé gerð yfirmáta?“ Sú fyrri snýst um það hvort við getum náð AI. Síðarnefnda spurningin snýst um hvort við náum ML.

ML var kynnt af Alan Turing árið 1950. Árið 1952 var fyrsta tölvunámsforritið smíðað til að læra aðferðir við afgreiðslukassann. Fyrsta taugakerfið var hannað árið 1957. Djúpt nám er frekari þróun gervin taugakerfis en fær það ekki nafn fyrr en árið 2006. Síðan 2010 hafa orðið miklar framfarir í vélin leyniþjónustu. Núverandi ML / AI uppsveifla er að mestu leyti vegna framfara í Deep Learning.

Samkvæmt Forbes eru hér helstu framfarir í AI, ML og Deep Learning

Til að skilja muninn á AI, ML og Deep Learning er önnur góð byrjun með því að skilja hvers vegna við höfum búið til vélar til að læra í fyrsta lagi. Þegar tölvur verða eins góðar og (eða betri en) menn við ákveðin verkefni, lendum við á helstu tímamótum fyrir AI. Vélarnám hefur í mörgum tilfellum sýnt að það er ákjósanlegasta leiðin í þessum tímamótum.

Af hverju vélar læra

Ein stærsta gagnrýni á tillögu Alan Turing um að prófa AI, eru rök Associative Priming (og viðbótar rammavandamál). Vegna þess hversu flókið við öðlumst greind okkar er því haldið fram að vélar geti ekki unnið þetta ferli. Þetta ferli er kallað nám og tölvur höfðu ekki verið svona frábærar (fyrr en nú).

Hugmyndin er eftirfarandi: Menn þróa með sér í tengslum við líf sitt ákveðin samtök af ólíkum styrk meðal hugtaka. Nánast eina leiðin sem vél gat ákvarðað, jafnvel að meðaltali, alla tengd styrkleika mannlegra hugtaka er að hafa upplifað heiminn eins og mannlegur frambjóðandi og viðmælendurnir höfðu. (Franska, 1990)

Að vera sú að mannleg reynsla er flókin og flókin, með hvaða kennslufræði þýðum við reynslu okkar fyrir vélar? Turing ímyndaði sér að vélar gætu þurft að læra sjálfir þann skilning sem við tökum sem sjálfsögðum hlut.

Mikilvægur þáttur í kennsluvél er að kennarinn mun oft að mestu vera ókunnugur um það sem er að gerast inni, þó að hann gæti samt að einhverju leyti spáð fyrir um hegðun nemandans. Þetta ætti helst að eiga við um síðari menntun á vél sem stafar af barnavél með vel reyndri hönnun (eða forriti). Þetta er í andstæðum við venjulega aðferð þegar verið er að nota vél til að gera útreikninga. Markmiðið er að hafa skýra andlega mynd af stöðu vélarinnar á hverju augnabliki í útreikningnum. (Turing, 1950)

Vélar læra vegna þess að fyrir ákveðna iðju er það (sem stendur) valið að forrita tölvur til að læra greind heldur en að forrita tölvur til að vera beinlínis greindar. Það kann að vera ákjósanlegt, vegna þess að (1) það þarf minna mannlegt átak til að byggja upp lærða upplýsingaöflun (en til að byggja upplýsingaöflun beint); eða (2) það getur verið æskilegt, vegna þess að vélin skilar betri árangri þegar hún kennir sig.

Í reynd er vélanám gagnlegt þegar vandamál eru í þörf fyrir nákvæmar spár. Taktu leikinn Tuttugu spurningar. Það var upphaflega spilað á milli manna. Til að skipta einum þeirra út fyrir vél, þá þurfum við vélina til að líkja mannlegri upplýsingaöflun. Í tuttugu spurningum er vélinám ekki eina leiðin til að ná gervigreind, heldur er það að öllum líkindum betri leiðin eins og sýnt er hér að neðan.

(1) Dæmi um ML sem krefst minni mannafla:

Í tveimur vefútgáfum af Twenty Questions, 20Q og Akinator, er mönnum skipt út fyrir forrit. Svo hvernig komu þeir í stað mannsins? Frekar en að láta einhvern smíða gagnagrunn með upplýsingum fyrir alla almenningstölur (allra tíma) gætirðu þjálfað forrit til að læra eiginleika frægs fólks í gegnum fólk sem svarar spurningum í leiknum. Það sparar fyrirhöfn að gera það með þessum hætti.

(2) Dæmi um ML sem gerir vélum kleift að skila betri árangri

Óháð því hversu mikil fyrirhöfn það sparar, Vélarnám getur einfaldlega skilað betri árangri en aðrar gerðir af reikniritum. Sundar Pichai sýndi á nýlegum Google I / O atburði að tölvur hafa komist yfir menn í myndgreiningunni. Þessi tímamót voru færð til framfara í vélakennslu, sérstaklega Deep Learning.

Frá Google IO Keynote 2017

Dæmi um hvernig ML er öðruvísi en AI

Eins og myndin hér að ofan sýnir eru tölvur nú betri (á margan hátt) en mennirnir við að spá fyrir um, bera kennsl á og sannreyna hvað er á mynd. Hér að neðan er skemmtilegt klippimynd af hundum sem líta út eins og muffins, bagels og moppur. Hvernig vitum við muninn? Hvernig veit tölva muninn? Til að það sé AI skiptir það ekki máli hvernig tölva er fær um að greina mismuninn, bara að hún getur það. Til þess að það væri ML þurfti tölvan að hafa þjálfað og kennt sjálfum sér mismuninn.

Að fara í staðalinn fyrir upplýsingaöflun var alltaf okkar eigin greind og hegðun. Ef við ætluðum að tengja hæfileika okkar við akademíska iðju í AI og tækni þeirra sem af því hlýst, komumst við að því að nám er ekki aðeins meðal þeirrar færni sem menn gera vel, heldur leið til að ná valdi á færni.

Að læra er kunnátta sem hjálpar þér að öðlast aðra færni

Til að tölva geti greint muninn á myndum af hundum og muffins er sannað að ML hefur gert betur en aðrar aðferðir. Samt sem áður, ekki öll vandamál við aðgreining mynda þurfa ML. Til dæmis er hægt að greina línur á mynd með því að bera kennsl á rétt skipulag pixla án ML. Að sama skapi þurfa sjálfstæðir farartæki ekki að læra vél til að greina hluti í grenndinni. Það getur einfaldlega notað lidar. Tic Tac Toe AI þarf heldur ekki ML, og hvorki myndi skák leikur.

Tic Tac Toe sem leitarvandamál.

Nánar tiltekið, ef hægt er að kortleggja vandamál á viðráðanlegt leitarrými (eins og ofangreint Tic Tac Toe leikjatré), þá getur leitargagnfræði hjálpað til við að skila ákjósanlegu svari. Til að gefa dæmi um kennslubók skaltu taka leiðsögn. A *, gráðug dýptar-fyrsta eða besta-fyrsta leit, er vel þekktur reiknirit til að finna stystu slóðir frá einum stað til annars. Geta A * til að spá fyrir um ákjósanlegar slóðir (sýnt hér að neðan) krefst ekki vélarfræðslu.

https://en.wikipedia.org/wiki/A*_search_algorithm

Þrátt fyrir að því sé haldið fram að þessi vandamál vanhæfi sig frá því að vera greindar iðkanir (þar sem hægt er að leysa þau á reiknirit), þá er það líka svolítið nærsýni að gera lítið úr sögu AI. Ef eitthvað er, þá er framtíð AI nokkuð blandað framtak mannlegrar stefnu, formlegra fyrirmynda, leitarniðurstöðum og vélakennslu.

Hvað er djúpt nám?

Deep Learning svarar spurningum um hvernig vélin getur lært eitthvað. Vélarnám er hvernig við höfum kennt tölvum að sjá betur en við (á vissan hátt), en það er aukin flækjustig í því hvernig Vélin gat kennt sjálfri sér að sjá. Eins og menn eru ýmsar aðferðir (og þær sem enn er ekki að uppgötva) í því hvernig tölvur geta lært. Núverandi AI / ML uppsveifla er afleiðing framfara í sérstakri nálgun við nám, Deep Learning.

Einn helsti eiginleiki Deep Learning frá annars konar AI er hversu vel við (skiljum) ekki útreikninginn að baki ákvörðunum og spám sem gerðar eru. Sem dæmi má nefna að formleg rökfræði er afturkræf. Ef A-> B-> C geturðu mótað þessa rökfræði með höndunum. Deep Learning notar falin lög af tilbúnum taugafrumum og hafa ekki svo stak, ákvörðunarhæf eða rekjanleg skref. Myndin hér að neðan sýnir einfaldaða mynd af Deep Learning.

Myndin hér að ofan sýnir dýr í hamri. Ef við vildum spá fyrir um hvort þetta sé köttur eða hundur myndu gáfur okkar (ef til vill) greina lengd hársins og lögun höfuðsins að hundi. Fyrir tölvu eru pixlarnir úr myndinni inntakslag fyrir ályktunina, milli inntakslagsins og framleiðslunnar eru falin reiknilög sem reynir að bera kennsl á hvaða tiltekna hópa pixla er líklegt til að tákna.

Pixlar ljósmyndar eru í eðli sínu ómótaðir. Þó að eiginleikarnir sem við leitum að geti verið formlega rökstuddir (eins og hárlengd eða lögun höfuðs dýrsins), hefur reynst árangursríkara að láta tölvuna átta sig á því hvað það þýðir að vera hundur og byggja sína eigin fyrirmynd. Þessar gerðir eru þjálfaðar með því að senda fjölmargar hunda- og kattamyndir fyrir tölvuna til að læra af fyrirfram.

En hvað ef það væri meiri uppbygging í gögnunum? Ekki eru öll vandamál með ómótað gögn. Segjum að við erum að spila leikinn, “Giska á hver?” Svipað og að spá í hvort það sé hundur eða köttur í körfunni, Giska á hver? gerir leikmönnum kleift að minnka leitarrýmið þar til þeir geta spáð nákvæmlega hver mynd mynd andstæðingsins er. Í þessu tilfelli getum við rakið rökfræði, vegna þess að við höfum staka eiginleika / eiginleika til að vinna með. Af þessum sökum myndirðu ekki þurfa Deep Learning að kenna vél til að vinna þennan leik.

Akinator og 20Q, netútgáfur borðspilsins, Giska á hver ?, eru frábær dæmi um AI sem er smíðað í gegnum Machine Learning, en ekki endilega Deep Learning. Hægt er að móta Akinator með höndunum, en var jafn góður í að læra með því að spila aftur og aftur.

Skák og Tic Tac Toe er hægt að spila með tölvu með reglunum og ríkjum sem eru harðkóðuð inn. Akinator og 20Q eru þjálfaðir með skilvirkari hætti. Það sem gerir leiki eins og Go og Starcraft mismunandi er að þeir eru með miklu stærri leitarrými, ríki og aðferðir. Og þangað til vélar okkar verða nógu öflugar til að kortleggja alla þessa leiki, treystum við okkur á Deep Learning.

Samantekt á dæmum

Hér er yfirlit yfir dæmin og hvernig þeim var vísað til umræðu

Hvernig á að „fylgjast með Jonesesunum“

Svo, hvar, ef yfirhöfuð, passar Vélarnám í lífi þínu? Góður staður til að byrja væri staðir þar sem lýðræðisaðgerð AI á sér stað. Google tilkynnti nýlega Google.ai sem skiptir ML rými í þrjá flokka: Rannsóknir, verkfæri og innviði og forrit. Í rannsóknum vinnur þú að leiðum til að finna upp betra AI. Í Verkfærum munt þú finna leiðir til að gera AI keyrt á skilvirkan hátt. Að lokum, í forriti, myndir þú vinna að starfsháttum og leiðum til að nota AI. Fyrirtæki eins og Google miða að því að gera ML aðgengilegt fyrir hundruð þúsunda verktaki, þar sem AI er notað af daglegu fólki.

www.google.ai

(Ef þú hefur virkilega áhuga á frammistöðu AI, hér er rannsóknarrit um heimild til skuldsetningar.)