5 Brīdinājuma signāli par kritisku aprīkojuma kļūmi

Autors: Judy Howell
Radīšanas Datums: 25 Jūlijs 2021
Atjaunināšanas Datums: 23 Jūnijs 2024
Anonim
Superliminal Full Gameplay Walkthrough (No Commentary)
Video: Superliminal Full Gameplay Walkthrough (No Commentary)

Saturs


Izņemšana:

Dīkstāves samazināšana, veicot rūpīgu iepriekšēju plānošanu, varētu nozīmēt atšķirību starp biznesa izaugsmi un kritumu. Tas ir, ja pienāk vidējais laiks starp neveiksmēm.

Nenovērtējiet par zemu, cik daudz mūsdienu korporāciju paļaujas uz kritiskām sistēmām katru dienu. Tāpēc vienīgais veselais saprāts, ka uzņēmumam jāspēj novērtēt aprīkojuma kļūmju risku. Ja nav garantiju par to, kad kāds iekārtas elements var sabojāt, ir jābūt vismaz precīzam aprēķinam, kad to vairs nevar uzskatīt par uzticamu.

Citādi neredzams aprīkojuma elements biznesam var nešķist kritisks, taču, ja neizdodas darboties vienam dzesēšanas ventilatoram, ģenerators atsakās no spoka un ilgiem laikiem rada desmitiem vai pat simtiem tūkstošu lietotāju dārgas problēmas, jūs varat pārliecinieties, ka ārkārtīgi svarīga ir spēja novērtēt, kuri un kādos gadījumos jūsu infrastruktūras komponenti var neizdoties. Tajā skaitā vidējais laiks starp kļūmēm (MTBF) - metode, uz kuru precīzi norāda IT speciālisti aplēses par to, kad kritiskais aprīkojums neizdosies. Šeit mēs apskatīsim, kas beidzot nogalina dažus izplatītus kritisko iekārtu veidus, un kā MTBF var palīdzēt ietaupīt dienu.


Kas ir MTBF?

Katram saražotajam IT aprīkojumam tiek piešķirts unikāls modeļa numurs. Tie, kas spēlē kritisko infrastruktūru, klientiem tiek piegādāti ar MTBF tāmi. Kompleksie aprēķini, lai izstrādātu MTBF aprīkojumam, tiek veikti ilgā testēšanas posmā produktu izpētes un attīstības posmā un ir salīdzinoši specifiski konkrētam modelim.

Ja vēlaties atrast MTBF kādam konkrētam aprīkojumam, to atradīsit detalizētajā specifikāciju lapā, ko piegādājis ražotājs. Varat arī tieši sazināties ar ražotāju.

Maršrutēšana

Uzņēmējdarbības līmeņa maršrutētājam ir daudz daļu, dažas pārvietojas, bet citas - statiskas. Gan barošanas blokiem (PSU), gan dzesēšanas ventilatoriem ir kustīgas daļas, un tiem elementiem, kas parasti ir bojājuma vietas, it īpaši, ja iekārta nav izmitināta relatīvi bez putekļiem izveidotā datu centrā. Par laimi ar dažu administratora ievadi vairums maršrutētāju ziņos a SysLog objektā, lai visus neizdevušos komponentus varētu atzīmēt kā nepiemērotus.


Slēdži

Līdzīgi, nākamais līmenis uzņēmuma tīklā ir komutācijas aparatūra. Kaut arī uzņēmuma līmeņa slēdži mēdz paļauties arī uz ventilatoriem, parasti to ir mazāk nekā maršrutētāja šasijā. Ja ventilatoru virpuļošanas mehānismi ir neskarti, kļūdains slēdzis programmatūras līmenī parasti darbojas nepareizi, vai nu negaidīti atspējojot slēdža pieslēgvietu, vai, kas parasti notiek, ar neparastu rīcību, piemēram, pakešu nomešanu, dažāda līmeņa satiksmes traucējumiem vai nepareizu maiņu. lietotāja definēti iestatījumi, neprasot to darīt.

Tīkla behemota Cisco reklamē vienu no saviem maršrutētājiem kā tādu, kura MTBF ir 188 574 stundas Cisco Catalyst 3750G-24TS modelim. Ja mēs to dalīsim ar 8,765.81277 (stundu skaits gadā), tad mēs redzam, ka šim modelim ir MTBF aplēse aptuveni 21,5 gadi. Šis skaitlis sniedz zināmu pārliecību, ja uzskatāt, ka šim aprīkojumam ir jādarbojas labi 24/7 bez vainas, kaut arī patiesībā tas vienkārši norāda uz tā uzticamību. Pat ja tā, tas lietotājiem sniedz izglītotu minējumu par to, cik ilgi var gaidīt, ka šī iekārta kalpos.

Elastīga jauda

Nepārtrauktās barošanas avoti (UPS), kas piesaistīti lielam skaitam akumulatoru, īsā laikā var nodrošināt rezerves enerģiju uzņēmumā, pirms ģeneratori sāk darboties strāvas padeves pārtraukuma laikā. Atsevišķas specifiskas programmatūras kļūdas var rasties UPS, tāpat kā jebkura cita aprīkojuma gadījumā, taču parasti vislielākās bažas rada baterijas, no kurām tās patērē enerģiju. Ja UPS akumulatoru bieži izslēdz un uzlādē, tā ietilpība samazinās ātrāk un tā darbības laiks dramatiski saīsināsies. Nav pārsteidzoši, ka pilnīgi iespējams sabojāt arī UPS akumulatorus. UPS var ziņot par modemiem un tīkliem, kad rodas kļūdas, taču biežāk nekā vecāks UPS izraisīs skaņas trauksmes signālus, kad rodas pirmā problēma.

Bez kļūdām, bez stresa - jūsu soli pa solim, kā izveidot programmatūru, kas maina dzīvi, neiznīcinot savu dzīvi

Jūs nevarat uzlabot savas programmēšanas prasmes, kad nevienam nerūp programmatūras kvalitāte.

Aizsargāta krātuve

Cietie diski, kurus mēs šodien izmantojam un uz kuriem tik ļoti paļaujamies, aptuveni desmit gadu laikā ir kļuvuši ievērojami uzticamāki. Tomēr tie nebūt nav nekļūdīgi, un, atkarībā no tā, kuram pētījumam jūs varētu ticēt, šķiet, ka tie darbojas pareizi ilgāku laiku atkarībā no vairākiem faktoriem. (Lielu viedokli par to var atrast šeit, The Remarketer.) Ja ir iespējota detalizēta atskaite un disks nodrošina atgriezenisko saiti par kļūdām, korumpēti sektori un lasīšanas / rakstīšanas kļūmes ir atslēga, lai pamanītu, kad disks atrodas krātuves masīvā. neizdodas. Vēl viena izplatīta problēma serveros, kas izmanto vairākus diskus, kas savienoti ar RAID kontrolieri, ir tā, ka pats kontrolieris neizdosies. Diemžēl dažreiz cietie diski vienkārši pārtrauc darbu bez jebkāda brīdinājuma - šī ir problēma, no kuras ir grūti ticami aizsargāties.

Serveri

Papildus serveros iebūvētajiem diskdziņiem un kustīgajām detaļām, piemēram, iepriekšminētajiem dzesēšanas ventilatoriem un PSU, serveru aparatūras komponentos var rasties arī vairākas problēmas. Pārskati programmatūras līmenī (kas parasti attiecas uz BIOS vai citu zema līmeņa aparatūras komponentu diagnostiku) ir atslēga, lai noteiktu, kad lietas nav izdevušās vai, kas ir vēl svarīgāk, liecina par neveiksmes pazīmēm. Viena problēma, kas var nebūt uzreiz acīmredzama, ir tā, kas ietekmē mātesplates. Pilnīgi saprotams, ka mašīnām nepatīk pārāk liels karstums. Bet pat šodien, ja mūsdienīga shēmas plate tiek pakļauta straujam siltuma zudumam vai tā darbojas no ļoti karstas līdz pēkšņi kļūst auksta, var parādīties plaisas, kuru dēļ plātne katastrofāli sabojājas. Tas ir jautājums, kas jāpatur prātā, it īpaši, ja jūs pārvietojat aprīkojumu starp ēkām apkopes logos nepiedodamā laika posmā.

MTBF: Tas var arī neizdoties

Tikpat noderīgi kā MTBF pareģojumi ir svarīgi aprēķināt pieļaujamā riska līmeni ar jebkuru aprīkojumu, uz kuru biznesam jāpaļaujas. Diemžēl pat ar visām ražotāju sniegtajām statistiskajām garantijām vienīgais konkrētais veids, kā garantēt to iekārtu pieejamību, kuras darbina kritiskās sistēmas, ir to divkāršot, lai nodrošinātu noildzes iespēju.

Katru atsevišķu aparatūras elementu, ko izmanto uzņēmumā, veido daudz dažādu komponentu, tāpēc patiesā MTBF ir tālu no triviāla aprēķina. Skaidrs, ka ir kritiski nevis balstīties uz biznesa nākotni, balstoties uz šiem varbūtības mērījumiem, bet gan izmantot tos kā atskaites punktu, lai pieņemtu apzinātus lēmumus attiecībā uz uzņēmējdarbības nepārtrauktību un katastrofu seku novēršanas procedūrām. Galu galā dīkstāves samazināšana, veicot rūpīgu iepriekšēju plānošanu, varētu nozīmēt atšķirību starp veiksmīgu biznesu un neveiksmīgu uzņēmējdarbību.