Kāda ir atšķirība starp lielajiem datiem un Hadoop?

Autors: Judy Howell
Radīšanas Datums: 5 Jūlijs 2021
Atjaunināšanas Datums: 23 Jūnijs 2024
Anonim
Kāda ir atšķirība starp lielajiem datiem un Hadoop? - Tehnoloģija
Kāda ir atšķirība starp lielajiem datiem un Hadoop? - Tehnoloģija

Saturs

J:

Kāda ir atšķirība starp lielajiem datiem un Hadoop?


A:

Atšķirība starp lielajiem datiem un atvērtā koda programmatūru Hadoop ir atšķirīga un būtiska. Pirmais ir aktīvs, bieži vien sarežģīts un neviennozīmīgs, savukārt otrais ir programma, kas sasniedz mērķu un uzdevumu kopumu, lai rīkotos ar šo aktīvu.

Lielie dati ir vienkārši lieli datu kopumi, ko uzņēmumi un citas puses apvieno, lai kalpotu noteiktiem mērķiem un darbībām. Lielajos datos var ietilpt daudz dažādu veidu datu dažādos veidos. Piemēram, uzņēmumi varētu ieguldīt daudz darba, apkopojot tūkstošiem datu vienību par pirkumiem valūtas formātos, klientu identifikatoros, piemēram, nosaukumam vai sociālās apdrošināšanas numuram, vai informācijai par produktu modeļa numuru, pārdošanas numuru vai krājumu numuru veidā. To visu vai jebkuru citu lielu informācijas masu var saukt par lielajiem datiem. Parasti tas ir neapstrādāts un nešķirots, līdz tas tiek izmantots dažādu veidu instrumentos un apstrādātājos.

Hadoop ir viens no rīkiem, kas paredzēts lielu datu apstrādei. Hadoop un citi programmatūras produkti strādā, lai interpretētu vai parsētu lielo datu meklēšanas rezultātus, izmantojot īpašus patentētus algoritmus un metodes. Hadoop ir atvērtā koda programma saskaņā ar Apache licenci, kuru uztur globāla lietotāju kopiena. Tas ietver dažādus galvenos komponentus, ieskaitot MapReduce funkciju kopu un Hadoop izplatīto failu sistēmu (HDFS).


MapReduce ideja ir tāda, ka Hadoop vispirms var kartēt lielu datu kopu un pēc tam veikt šī satura samazināšanu konkrētiem rezultātiem. Samazināšanas funkciju var uzskatīt par sava veida izejas datu filtru. Pēc tam HDFS sistēma darbojas, lai izplatītu datus tīklā vai pēc nepieciešamības tos migrētu.

Datu bāzes administratori, izstrādātāji un citi var izmantot dažādas Hadoop funkcijas, lai daudzos veidos apstrādātu lielos datus. Piemēram, Hadoop var izmantot, lai īstenotu tādas datu stratēģijas kā klasterizēšana un mērķauditorijas atlase ar nevienveidīgiem datiem vai dati, kas precīzi neiederas tradicionālajā tabulā vai labi reaģē uz vienkāršiem jautājumiem.