Galveno komponentu analīze (PCA)

Video: PRINCIPAL COMPONENT ANALYSIS (PCA) | SCIKIT LEARN PRACTICE | MACHINE LEARNING WITH PYTHON

Saturs

Definīcija - ko nozīmē galveno komponentu analīze (PCA)?
Ievads Microsoft Azure un Microsoft Cloud | Šajā rokasgrāmatā jūs uzzināsit, kas ir mākonis skaitļošana un kā Microsoft Azure var palīdzēt jums migrēt un vadīt savu biznesu no mākoņa.
Techopedia skaidro galveno komponentu analīzi (PCA)

Definīcija - ko nozīmē galveno komponentu analīze (PCA)?

Galveno komponentu analīze (PCA) ir paņēmiens, ko izmanto, lai mazākā skaitā nekorelētu mainīgo identificētu no lielākas datu kopas, kas pazīstamas kā galvenās sastāvdaļas. Metodi plaši izmanto, lai uzsvērtu variācijas un uztvertu spēcīgus modeļus datu kopā. Kārļa Pīrsona izgudrots 1901. gadā, galveno komponentu analīze ir rīks, ko izmanto paredzamo modeļu un izpētes datu analīzē. Galveno komponentu analīze tiek uzskatīta par noderīgu statistikas metodi un tiek izmantota tādās jomās kā attēlu saspiešana, sejas atpazīšana, neirozinātne un datorgrafika.

Ievads Microsoft Azure un Microsoft Cloud | Šajā rokasgrāmatā jūs uzzināsit, kas ir mākonis skaitļošana un kā Microsoft Azure var palīdzēt jums migrēt un vadīt savu biznesu no mākoņa.

Techopedia skaidro galveno komponentu analīzi (PCA)

Galveno komponentu analīze palīdz vieglāk izpētīt un vizualizēt datus. Tā ir vienkārša neparametriska tehnika informācijas iegūšanai no sarežģītām un mulsinošām datu kopām. Galveno komponentu analīze ir koncentrēta uz maksimālo dispersijas daudzumu ar vismazāko galveno komponentu skaitu. Viena no īpašajām priekšrocībām, kas saistītas ar galveno komponentu analīzi, ir tāda, ka, tiklīdz attiecīgajos datos ir atrasti modeļi, tiek atbalstīta arī datu saspiešana. Var izmantot galveno komponentu analīzi, lai izslēgtu mainīgo skaitu vai kad ir pārāk daudz prognozētāju, salīdzinot ar novērojumu skaitu, vai arī lai izvairītos no daudzkolīniskuma. Tas ir cieši saistīts ar kanonisko korelācijas analīzi un izmanto ortogonālo transformāciju, lai pārveidotu novērojumu kopumu, kas satur savstarpēji saistītus mainīgos lielumus, vērtību kopā, kas pazīstams kā galvenās sastāvdaļas. Galveno komponentu analīzē izmantoto galveno komponentu skaits ir mazāks vai vienāds ar mazāko novērojumu skaitu. Galveno komponentu analīze ir jutīga pret sākotnēji izmantoto mainīgo relatīvo mērogošanu.

Galveno komponentu analīze tiek plaši izmantota daudzās jomās, piemēram, tirgus izpētē, sociālajās zinātnēs un nozarēs, kur tiek izmantotas lielas datu kopas. Šis paņēmiens var arī palīdzēt iegūt sākotnējo datu zemākas dimensijas attēlu. Galveno komponentu analīzei ir vajadzīgas tikai minimālas pūles, lai sarežģītu un neskaidru datu kopumu samazinātu vienkāršotā noderīgās informācijas kopā.