6 lieli mīti par lielo datu pārvaldību

Autors: Eugene Taylor
Radīšanas Datums: 15 Augusts 2021
Atjaunināšanas Datums: 20 Jūnijs 2024
Anonim
GARDĀKĀ ŠAŠLIKA NOSLĒPUMI!
Video: GARDĀKĀ ŠAŠLIKA NOSLĒPUMI!

Saturs


Avots: Dwnld777 / Dreamstime.com

Izņemšana:

Lieli dati ir liels bizness, bet tikai tad, ja tie tiek izmantoti pareizi.

Jau 2014. gada maijā Forrester Research izdeva divus ziņojumus, izdarot noteiktus secinājumus par lielo datu apvidu. Pētījumu firma aptaujāja vairāk nekā 250 mārketinga un biznesa attīstības vadītājus. Saskaņā ar ziņojumu autoru teikto, liela datu retorika ir visu laiku augstākajā līmenī, un tehnoloģiju pārdevēji piedāvā produktus, kas, šķiet, ir neticami.

Gartners piekrīt Forrester Research; būtiska hipe apņem lielos datus. 2014. gada septembra ziņojumā Gartners atceļ piecus lielākos datu mītus, un Gartnera analītiķi piedāvā savu viedokli par neizpratni par lielajiem datiem un ar tiem saistītajām manipulācijām. Kas tad ir lielie datas lielākie mīti? Paskatīsimies.

Mīts: visi ir priekšā mums, pieņemot lielus datus.

Gartners saka, ka interese par lielajiem datiem ir visu laiku augstāka. Neskatoties uz to, niecīgajam 13 procentiem aptaujāto ir darba sistēmas. Iemesls: lielākajai daļai uzņēmumu vēl nav izdomāts, kā no lielām datu krātuvēm iegūt vērtību. Šeit Gartnera aptauja ir optimistiskāka nekā Forrester ziņojumā, kurā tika atklāts, ka tikai 9 procenti aptaujas dalībnieku teica, ka viņi nākamā gada laikā plāno ieviest lieldatu tehnikas. (Lielajiem datiem ir daudz ko piedāvāt. Uzziniet vairāk 5 reālās pasaules problēmās, kuras var atrisināt lielie dati.)

Mīts: mums ir tik daudz datu; mums nav jāuztraucas par katru mazo datu trūkumu.

Gartners ir noraizējies par foajē, kāds mums ir cilvēkiem: "Mums ir tik daudz, mazam, kas slikts, nav nozīmes." Teds Frīdmens, viceprezidents un izcils Gartnera analītiķis, uzskata, ka tas ir nepareizs veids, kā aplūkot situāciju.

"Patiesībā, kaut arī katram atsevišķam trūkumam ir daudz mazāka ietekme uz visu datu kopu nekā tas bija tad, kad bija mazāk datu, ir vairāk trūkumu nekā iepriekš, jo ir vairāk datu," sacīja Frīdmens. "Tāpēc nekvalitatīvu datu kopējā ietekme uz visu datu kopu paliek nemainīga."

Frīdmens piebilst vēl vienu iemeslu bažām. Lielo datu uztveršana bieži ietver datus no ārpuses, kuriem tāpēc nav zināma struktūra un izcelsme. Tas palielina kļūdu iespējamību.

Mīts: Lielo datu tehnoloģija novērsīs vajadzību pēc datu integrācijas.

Ir divas galvenās datu analīzes stratēģijas, kuras var piemērot lieliem datiem: "shēma rakstīšanai" vai "shēma lasīšanai". Vēl nesen vienīgā izmantotā metode bija rakstīšanas shēma. Izlasītā shēma ir pašreizējā traka datu bāzes pārvaldībā. Atšķirībā no rakstīšanas shēmas, kurai nepieciešams strukturēts formāts, dati tiek ielādēti nolasītās shēmas datu bāzēs neapstrādātā formātā. Tad izstrādātāji, izmantojot nestrukturētas datu bāzes platformas, piemēram, Hadoop, saliek atšķirīgos datus izmantojamā formātā. Lasītajai shēmai ir acīmredzamas priekšrocības, bet, kā piemin Gartners, datu integrācijai kādā brīdī ir jānotiek.

Mīts: datu noliktavas izmantošana uzlabotajai analītikai ir bezjēdzīga.

Daudziem informācijas pārvaldniekiem lieki tērēt laiku datu noliktavas izveidošanai, it īpaši, ja jaunieņemtie dati atšķiras no tiem, kas atrodas datu noliktavā. Tomēr Gartners vēlreiz brīdina, ka pat uzlabotā datu analītika izmantos datu noliktavas un jaunus datus, kas nozīmē, ka datu integrētājiem:
  • Pilnveidojiet jaunus datu tipus, lai tie būtu piemēroti analīzei
  • Izlemiet, kuri dati ir atbilstoši, un nepieciešamo datu kvalitātes līmeni
  • Nosakiet, kā apkopot datus
  • Saprotiet, ka datu precizēšana var notikt citās vietās, nevis datu noliktavā

Mīts: datu noliktavu aizstās datu ezeri.

Datu ezeri ir atšķirīgu datu krātuves, nevis datu noliktavas, kur dati ir strukturētā formātā. Datu ezera izveidošana prasa nelielu sākotnēju piepūli (nav nepieciešams formatēt datus), salīdzinot ar datu noliktavām, tāpēc datu ezeri ir interese.

Gartners uzsver, ka datu iegūšanai nav jēgas - jēga ir spēt manipulēt ar sagūstītajiem datiem apzināta lēmumu pieņemšanai. Turklāt ir problemātiski izmantot (nedaudz nepierādītus) datu ezerus, lai atvieglotu lēmumu pieņemšanu.

"Datu noliktavām jau ir iespējas atbalstīt plašu lietotāju loku visā organizācijā," sacīja Gārtnera pētījumu direktors Niks Heudekers. "Informācijas pārvaldības līderiem nav jāgaida, līdz datu ezeri nokļūs." (Uzziniet vairāk par lielu datu pieņemšanu 7 lietās, kuras jums jāzina par lielajiem datiem pirms pieņemšanas.)

Lielie dati darbojas - jaunas datu manipulācijas metodes var nebūt

Iemesls, kāpēc Gartners sacīja, ka "lielākie datu mīti", nevis "mīti par lieliem datiem", kļūst skaidrs pēc ziņojuma lasīšanas. Gartners nenozīmē lielu datu daudzumu. Gartners ir nožēlojams par tiem, kuri uzskata, ka jaunākās metodes manipulēšanai ar lielajiem datiem ir gatavas “galvenajam laikam”.