Kā šodien tiek definēta datu glabāšanas infrastruktūra

Autors: Roger Morrison
Radīšanas Datums: 26 Septembris 2021
Atjaunināšanas Datums: 1 Jūlijs 2024
Anonim
Data Storage Requirements for Machine Learning Infrastructure
Video: Data Storage Requirements for Machine Learning Infrastructure

Saturs


Avots: Interklm / Dreamstime.com

Izņemšana:

Šeit mēs izpētīsim dažas no jaunajām datu glabāšanas metodēm, kuras šodien piedāvā daudzi pārdevēji, piemēram, visu zibspuldzes masīvi, programmatūras definēta krātuve, mērogojama nestrukturēta un failu balstīta krātuve, kā arī datu glabāšanas infrastruktūras aktīva pārvaldība. .

Glabāšanas raksturs mainās. Mūsdienās lēmumus nosaka dati. Uzņēmumiem spēja ātri, efektīvi un paredzami piekļūt saviem datiem var nodrošināt konkurences priekšrocības pārpildītā un graujošā tirgū. Saskaņā ar IDC, pasaule radīs desmit reizes vairāk datu nekā 2016. gadā, ti, kopumā 163 zettabytes. Turklāt, lai arī patērētāji līdz šim tradicionāli ir izveidojuši lielāko daļu datu, 2025. gadā uzņēmumi izveidos 60 procentus no pasaules datiem. Saskaņā ar 2018. gada ziņojumu par infrastruktūras stāvokli datu un glabāšanas pieaugums ir līdz šim lielākais IT virzošais faktors. infrastruktūras izmaiņas, 55 procentiem respondentu minot to kā vienu no trim galvenajiem faktoriem. Faktiski dati un glabāšana ievērojami pārsniedza vajadzību integrēties mākoņa pakalpojumos.


Pārbaudot datu glabāšanu uzņēmumā šodien, mēs redzam vairākas tendences:

  • Dati jāpiekļūst pēc iespējas ātrāk.
  • Datu glabāšanai jābūt ļoti pielāgojamai, lai spētu pielāgoties paātrinātai izaugsmei.
  • Datu glabāšanai jābūt viedai, dažādu veidu datiem saskaņojot ar atbilstošo krātuvi.
  • Uzņēmumiem ir nepieciešama aktīva pārvaldība, uzraudzība un atbalsts, lai nodrošinātu, ka to uzglabāšanas infrastruktūra darbojas droši un paredzami.
  • Uzņēmumi vēlas atbrīvoties no dārgiem autokrāvēju jauninājumiem savā datu infrastruktūrā ik pēc dažiem gadiem.
  • Nestrukturētu datu pieaugums

Nepieciešamība pēc ātruma

Mūsdienās uzņēmumiem ir jāiegūst vajadzīgie dati, kad tie ir nepieciešami. Tas ir vienāds ar ātrumu, un neatkarīgi no tā, vai jūs runājat par automašīnām vai datiem, ātrums maksā naudu. Uzņēmumi vēršas pie visiem zibspuldzes blokiem (AFA), par ko liecina fakts, ka AFA tirgus apjoms 2017. gadā salīdzinājumā ar iepriekšējo gadu pieauga par 37,6 procentiem, padarot to par industriju 1,4 miljardu USD apmērā. Lai gan ir taisnība, ka cietvielu tehnoloģija ir dārgāka nekā tradicionālie diskus, jums, iespējams, nevajadzēs tik daudz no uztvertās jaudas. Integrējot uz izlūkošanu balstītus rīkus AFA glabāšanas infrastruktūrā, uzņēmumi var sasniegt datu samazināšanas koeficientus 2: 1, 4: 1 un pat 10: 1. Daži no šiem samazināšanas rīkiem ir šādi:


  • Datu saspiešana - gan inline saspiešanas, gan uz algoritmiem balstītas dziļas samazināšanas kombinācija palīdz sasniegt 2–4x datu samazināšanas mērķi. Šī jaudīgā saspiešanas kombinācija ir datu bāzu primārā datu saspiešanas forma.
  • Kopiju samazināšana - nodrošina tūlītējas, iepriekš ekstraducētas datu kopijas momentuzņēmumiem, kloniem un replikācijai.
  • Plāns nodrošinājums - novērš atkritumu daudzumu, rezervējot datu ietilpību dinamiskā veidā, lai paliktu priekšā rakstiskajiem datiem.

Tagad apsveriet faktu, ka šīs dedukcijas un modeļa noņemšanas tehnoloģijas palīdz maksimizēt jūsu glabāšanas risinājuma kalpošanas laiku. Šīs programmatūras funkcijas, kuras dēvē par “izvairīšanās no rakstīšanas metodēm”, palīdz samazināt to reižu skaitu, kad dati jāraksta masīvā. Mazāks lietojums palīdz saglabāt jūsu sistēmas izturību un veiktspēju. AFA arī palīdz samazināt kopējās datu centra izmaksas. Kad runa ir par tradicionālo glabāšanu, tajā ir daudz kustīgu detaļu, kuras visas rada daudz siltuma un patērē daudz enerģijas. Visu zibatmiņas disku starpā nav kustības. Kustības bez kustības ir samazinātas elektrības un dzesēšanas izmaksas. (Lai uzzinātu vairāk par enerģijas taupīšanu, skatiet sadaļu Likumu sastādītāji zaļajā virzienā virzās uz datu centriem.)

Programmatūras noteikta krātuve

Mēs esam bijuši liecinieki tam, kā programmatūra pēdējos gados definē daudzus datu centra aspektus, piemēram, servera virtualizāciju un programmatūras definētu tīkla izveidošanu. Programmatūras noteiktā krātuve (SDS) maina daudzu datu centru būtību mūsdienās.Tādā pašā veidā, kā uzņēmumi ir atbrīvojušies no dārgas un neelastīgas serveru aparatūras, tie datu centriem iztīra dārgus patentētus glabāšanas risinājumus par labu programmatūras definētai krātuvei, kas izmanto x86 tehnoloģiju. Tam ir vairākas priekšrocības:

  • Nav nepieciešams īpašs atmiņas kontrolieris, kas darbina patentētu programmatūru.
  • Tas izmanto x86 tehnoloģiju, kuru vairums IT profesionāļu jau pārzina.
  • Uzņēmumi var samazināt savas glabāšanas pēdas lielumu, kas samazina mitināšanas un atdzesēšanas izmaksas.
  • Uzņēmumi var izmantot esošās uzglabāšanas vietas.

SDS ļauj pārdevējiem integrēt aprēķināšanas, glabāšanas un tīkla resursus vienā integrētā sistēmā, ļaujot vienam administratoram pārvaldīt visas šīs šķautnes caur vienu stikla rūti. Gartners prognozē, ka uzņēmumi līdz 2020. gadam spēs samazināt savus serveru un krātuves izdevumus.

Nestrukturētu datu mērogošana

Viens no galvenajiem datu pārsteidzošā pieauguma līmeņa iniciatoriem mūsdienās ir nestrukturētu datu eksplozija. Saskaņā ar pētījumu, kuru sponsorēja Western Digital un kurā piedalījās vairāk nekā 200 tehnoloģiju lēmumu sponsori, 63 procenti ziņoja, ka pārvalda 50 petabaitu (PB) vai lielāku krātuves jaudu, vairāk nekā puse no tiem ietilpst nestrukturētā kategorijā. Viens no vadošajiem krātuves pārdevējiem šodien saka: "Nestrukturēti, uz failiem balstīti dati ir mūsdienu uzņēmuma vainaga dārgakmens, un petabaitu mēroga datu glabāšana ir jauna norma."

Nestrukturētu datu piemērs ir IoT ģenerētie dati. IDC uzskata, ka IOT dati līdz 2020. gadam sastādīs 10 procentus no datu kopuma. Tā rezultātā uzņēmumiem ir nepieciešama jauna mēroga krātuves paaudze, kas izstrādāta, lai glabātu un pārvaldītu nestrukturētus un uz failiem balstītus datus tīmekļa mērogā. Lai arī vērtīgie, nestrukturētie dati bieži neattaisno bloķētās krātuves augstās izmaksas. Nestrukturēti dati rada vajadzību pēc apjoma saglabāšanas, piemēram, ļoti mērogojamiem NAS risinājumiem un programmatūras definētai krātuvei. (Datu centra apvienošana var arī palīdzēt pārvaldīt jūsu datus. Uzziniet vairāk 5 iemeslu dēļ, kādēļ uzņēmumam būtu jāapkopo datu centrs.)

Bez kļūdām, bez stresa - jūsu soli pa solim, kā izveidot programmatūru, kas maina dzīvi, neiznīcinot savu dzīvi

Jūs nevarat uzlabot savas programmēšanas prasmes, kad nevienam nerūp programmatūras kvalitāte.

Aktīvi pārvaldīta datu infrastruktūra

Apsveriet tipisko atbalsta zvanu par neveiksmīgu disku tradicionālajā SAN ierīcē. Uz jūsu zvanu atbild servisa pārstāvis, kura uzdevums ir ņemt jūsu pamatinformāciju par esošo problēmu un pārsūtīt to attiecīgajam tehniskā atbalsta speciālistam vai inženierim. Pārstāvis lūgs parastos - produkta ID numurus, jūsu vārdu, kontaktinformāciju - un atgādinās par jūsu pašreizējā pakalpojumu līguma derīguma termiņu. Kad ir izveidots jūsu klienta profils, sākas jautājumu aizsprosts:

  • Kādu programmatūras vai programmaparatūras versiju jūs izmantojat?
  • Vai pēdējā laikā esat veicis izmaiņas vienībā?
  • Vai jūs varat piekļūt administratīvajai konsolei?
  • Vai diskdziņos mirgo gaismas?
  • Vai jūsu dati šobrīd ir pieejami?

Visbeidzot, jūs pārsūtīsit tehniķim, kurš pieprasa izvilkt žurnālu no vienības un / vai FTP, pēc kura būs nepieciešams laiks, lai žurnāls tiktu pārskatīts. Tā laikā jūsu laiks tiek pavadīts uz pauzes, maksājot jūsu organizācijai vērtīgu produktivitāti. Bet ko tad, ja jūsu pārdevējs zinātu par neveiksmīgo disku pirms jums?

Uzņēmumi ne tikai nevar pieļaut jebkādu dīkstāvi, kad runa ir par to uzglabāšanas infrastruktūru, bet arī nevar atļauties savlaicīgu neefektivitāti attiecībā uz atbalsta personālu. Šī iemesla dēļ daži krātuves pārdevēji piedāvā risinājumus, kas tiek aktīvi uzraudzīti un pārvaldīti caur mākoni. Piesaistot datus, kas nosūtīti no krātuves sistēmām visā pasaulē, krātuves pārdevēji var izmantot jutīgo analītiku, lai paredzētu lielāko daļu problēmu pirms to rašanās. Bieži vien piedziņa ir iestatīta piegādei, pirms klients apzinās problēmu.

Glabāšanas infrastruktūras raksturs patiešām mainās, un līdz ar to ir arī jaunas metodes uzņēmuma datu glabāšanai, piekļuvei un pārvaldībai. Lieki piebilst, ka vēl lielākas izmaiņas datu nozarē ir priekšā.