Pastiprināšanas mācīšanās

Autors: Lewis Jackson
Radīšanas Datums: 11 Maijs 2021
Atjaunināšanas Datums: 15 Maijs 2024
Anonim
Aktualitātes mācību saturā: Sociāli emocionālā mācīšanās
Video: Aktualitātes mācību saturā: Sociāli emocionālā mācīšanās

Saturs

Definīcija - ko nozīmē pastiprināšanas mācīšanās?

Pastiprināšanas mācīšanās mākslīgā intelekta kontekstā ir dinamiskas programmēšanas veids, kas trenē algoritmus, izmantojot atalgojuma un soda sistēmu.


Pastiprināšanas mācību algoritms jeb aģents mācās, mijiedarbojoties ar savu vidi. Aģents saņem atlīdzību par pareizu izpildi un sodus par nepareizu izpildi. Aģents iemācās bez cilvēka iejaukšanās, maksimāli palielinot tā atalgojumu un samazinot sodu.

Ievads Microsoft Azure un Microsoft Cloud | Šajā rokasgrāmatā jūs uzzināsit, kas ir mākonis skaitļošana un kā Microsoft Azure var palīdzēt jums migrēt un vadīt savu biznesu no mākoņa.

Techopedia izskaidro pastiprināšanas mācīšanos

Pastiprināšanas mācīšanās ir pieeja mašīnmācībai, kuru iedvesmojusi biheivioristiskā psiholoģija. Tas ir līdzīgi tam, kā bērns iemācās veikt jaunu uzdevumu. Pastiprināšanas mācīšanās ir pretstatā citām mašīnmācīšanās metodēm tādā ziņā, ka algoritmam nav skaidri pateikts, kā veikt uzdevumu, bet tas pats darbojas ar problēmu.

Kā aģents, kas varētu būt pašbraucoša automašīna vai programma, kas spēlē šahu, mijiedarbojas ar savu vidi, saņem atlīdzību par stāvokli atkarībā no tā, kā tas darbojas, piemēram, droši braucot uz galapunktu vai laimējot spēli. Pretēji, aģents saņem sodu par nepareizu rīcību, piemēram, nobraukšanu no ceļa vai par pārbaudes veikšanu.


Aģents laika gaitā, izmantojot dinamisko programmēšanu, pieņem lēmumus, lai maksimāli palielinātu atlīdzību un samazinātu sodu. Šīs pieejas priekšrocība mākslīgajam intelektam ir tāda, ka tā ļauj AI programmai mācīties bez programmētāja, kas precīzi norāda, kā aģentam jāveic uzdevums.