Dziļo mācību modeļu ekskursija

Video: 3D printēšana | #2 3D modeļa izstrāde

Saturs

Neironu stils
Neironu stāstītājs
Dati
Char-RNN TED
Secinājums

Avots: Kran77 / Dreamstime.com

Izņemšana:

Dziļās mācīšanās modeļi māca datoriem domāt paši, dodot ļoti jautrus un interesantus rezultātus.

Dziļās mācības tiek izmantotas arvien vairāk jomās un nozarēs. Sākot ar automašīnām bez vadītāja, līdz Go spēlēšanai un attēlu mūzikas ģenerēšanai, katru dienu parādās jauni dziļas apmācības modeļi. Šeit mēs aplūkojam vairākus populārus dziļās mācīšanās modeļus. Zinātnieki un izstrādātāji izmanto šos modeļus un modificē tos jaunos un radošos veidos. Mēs ceram, ka šī demonstrācija var iedvesmot jūs redzēt, kas ir iespējams. (Lai uzzinātu par mākslīgā intelekta sasniegumiem, skatiet sadaļu Vai datori spēs atdarināt cilvēka smadzenes?)

Neironu stils

Jūs nevarat uzlabot savas programmēšanas prasmes, kad nevienam nerūp programmatūras kvalitāte.

Neironu stāstītājs

Neironu stāstītājs ir modelis, kas, piešķirot attēlu, var radīt romantisku stāstu par attēlu. Tā ir jautra rotaļlieta, un tomēr jūs varat iedomāties nākotni un redzēt virzienu, kurā virzās visi šie mākslīgā intelekta modeļi.

Iepriekš minētā funkcija ir "stila maiņas" darbība, kas ļauj modelim pārsūtīt standarta attēlu parakstus uz stāstu stilu no romāniem. Stila maiņu iedvesmoja mākslinieciskā stila neirāls algoritms.

Dati

Šajā modelī tiek izmantoti divi galvenie datu avoti. MSCOCO ir Microsoft datu kopa, kurā ir aptuveni 300 000 attēlu ar katru attēlu ar pieciem parakstiem. MSCOCO ir vienīgais izmantotais pārraudzīto datu kopums, kas nozīmē, ka šie ir vienīgie dati, kuros cilvēkiem bija jāieiet un skaidri jāizraksta katra attēla paraksti.

Viens no galvenajiem ierobežojumiem, kas attiecas uz priekšu neironu tīklu, ir tas, ka tam nav atmiņas. Katra prognoze ir neatkarīga no iepriekšējiem aprēķiniem, it kā tā būtu pirmā un vienīgā prognoze, ko tīkls jebkad ir izdarījis. Bet daudziem uzdevumiem, piemēram, teikuma vai rindkopas tulkošanai, ievadiem jāsastāv no secīgiem un savstarpēji saistītiem datiem. Piemēram, būtu grūti saprast jēgu vienam vārdam teikumā bez apkārtējo vārdu nodrošinātājiem.

RNNs ir atšķirīgi, jo tie pievieno vēl vienu savienojumu kopu starp neironiem. Šīs saites ļauj slēptā slānī esošajiem neironiem aktivizēties, lai atgrieztos sevī nākamajā secības solī. Citiem vārdiem sakot, katrā solī slēptais slānis saņem gan aktivizāciju no slāņa, kas atrodas zem tā, gan arī no iepriekšējā kārtas secībā. Šī struktūra būtībā piešķir atkārtotu neironu tīklu atmiņu. Objektu noteikšanas uzdevumā RNN var izmantot iepriekšējās suņu klasifikācijas, lai palīdzētu noteikt, vai pašreizējais attēls ir suns.

Char-RNN TED

Šī elastīgā slēptā slāņa struktūra ļauj RNN ļoti labi izmantot rakstzīmju līmeņa valodas modeļiem. Char RNN, kuru sākotnēji izveidoja Andrejs Karpatijs, ir modelis, kas ņem vienu failu kā ieeju un apmāca RNN, lai iemācītos paredzēt nākamo rakstzīmi secībā. RNN var ģenerēt rakstzīmes pēc rakstzīmēm, kas izskatās pēc sākotnējiem apmācības datiem. Demonstrācija ir sagatavota, izmantojot dažādu TED sarunu atšifrējumus. Ievadiet modelim vienu vai vairākus atslēgvārdus, un tas ģenerēs fragmentu par atslēgvārdu (-iem) TED sarunas balss / stilā.

Secinājums

Šie modeļi parāda jaunus sasniegumus mašīnu izlūkošanā, kas kļuvuši iespējami dziļas mācīšanās dēļ. Dziļās mācības parāda, ka mēs varam atrisināt problēmas, kuras nekad agrāk nevarējām atrisināt, un mēs vēl neesam sasnieguši šo plato. Dziļu mācību jauninājumu rezultātā nākamajos pāris gados sagaidīsiet vēl daudz aizraujošu lietu, piemēram, automašīnas bez autovadītājiem.