5 labākā prakse lielu incidentu pārvaldības automatizācijā

Autors: Roger Morrison
Radīšanas Datums: 27 Septembris 2021
Atjaunināšanas Datums: 10 Maijs 2024
Anonim
Как это вообще работает? Разбираем совсем одноразовый мотор 1.0 Ecoboost от Ford
Video: Как это вообще работает? Разбираем совсем одноразовый мотор 1.0 Ecoboost от Ford

Saturs



Avots: Pixtum / iStockphoto

Izņemšana:

Izmantojot viedo automatizācijas stratēģiju, jūs varat padarīt reaģēšanu uz negadījumiem ātrāk un vienkāršāk nekā jebkad agrāk - samazinot dīkstāves un iespējamos drošības pārkāpumus.

Lielāki IT incidenti uzņēmumos notiek katru dienu. Lai arī virsrakstu veido tikai nedaudzas, tādi notikumi kā pārtraukumi un drošības pārkāpumi var nopietni graut darbinieku produktivitāti, negatīvi ietekmēt klientu uztveri un, pats galvenais, radīt zaudējumus.

Tātad, kad runa ir par lielu IT incidentu pārvaldību, vislabāk ir koncentrēties uz ietekmi uz biznesu un apakšējo līniju. Saskaņā ar Ponemona institūta datiem, dīkstāves vidējās izmaksas 2016. gadā bija 8 851 USD minūtē - tas ir vairāk nekā 500 000 USD stundā, un tipiskas dīkstāves vidēji pārsniedz 90 minūtes. Un tās ir tikai tūlītējās izmaksas! Ilgtermiņa ietekme, piemēram, reputācijas bojājumi un klientu noārdīšanās, ir neparedzama un potenciāli katastrofāla.


Lai gan jūs nevarat pilnībā izvairīties no visiem lielākajiem negadījumiem, jūs varat apbruņot savu organizāciju, lai būtu cik vien iespējams gatava rīkoties, lai notiktu, kad tie rodas. Un galvenajai jūsu stratēģijas sastāvdaļai vajadzētu būt automatizācijas iekļaušanai. Organizācijas, kas maksimāli izmanto automatizāciju galvenajos negadījumu novēršanas procesos, ātrāk panāk pakalpojumu atjaunošanu un daudz mazāk kļūdu cilvēku kļūdu dēļ. Tas notiek tāpēc, ka automatizācija tieši ietekmē jūsu spēju samazināt biznesa ietekmes loga ilgumu - vai arī dārgo periodu, kurā lietotāji un biznesa operācijas patiesībā izjūt incidenta ietekmi. (Lai uzzinātu vairāk par automatizāciju, skatiet sadaļu Automatizācija: datu zinātnes un mašīnmācības nākotne?)

Lai maksimāli palielinātu automatizācijas ieguvumus, jums jāpārbauda, ​​kuras darbības jāveic trieciena perioda laikā, un jāizdomā, kā pārcelt visas citas darbības vai nu pirms negadījuma sākuma, vai pēc tam, kad bizness ir atgriezies normālā darbībā. Šeit ir pieci noderīgi veidi, kā sākt.


1. Izstrādāt un definēt procesu

Liela incidenta pārvaldības procesa noteikšana ir precīzi norādīt, ko var plānot, koordinēt vai izpildīt incidenta laikā. Tas var nozīmēt galveno atbalsta komandas locekļu identificēšanu, piemēram, pēc kompetences un grafika, lai jūsu servisa birojs viņus varētu iesaistīt pēc iespējas ātrāk un efektīvāk. Tas nozīmē arī izdomāt, kā jūs nododat attiecīgajai informācijai savu komandu, lai viņi varētu sākt risināt šo problēmu uzreiz, kā arī informējot un atjauninot pareizās ieinteresētās puses.

Automatizācija ir būtiska šī procesa galvenajiem aspektiem. Piemēram, jūs varētu automatizēt atbilstošas ​​informācijas iekļaušanu no monitoringa instrumentiem servisa biļešu biļetēs vai arī informāciju no apkalpošanas dienesta iekļaut paziņojumos par negadījumu risinātājiem. Varat arī dokumentēt visu atgadījumu vienā visaptverošās patiesības avotā, kas ir pieejams visiem. Atcerieties, ka jūs varat praktizēt šo procesu, lai to pareizi pielietotu - lai pārbaudītu savu pieeju, jums nav jāgaida reāls notikums.

2. Sakārtojiet savu infrastruktūru

Šajā trauksmes noguruma dienā un laikmetā ir svarīgi, lai jūs turpinātu bombardēt savas komandas ar neatbilstošiem paziņojumiem un informāciju, kas uz viņiem neattiecas. Filtru lietošana uzraudzības brīdinājumiem ļaus jūsu komandām vieglāk ierasties uz adatas ikdienas trokšņa siena kaudzē. Tas ir galvenais, lai visas jūsu atziņas un datus padarītu patiešām izmantojamus, nevis tikai palielina informācijas pārslodzi.

Labi veidi, kā automatizēt, ir APM risinājuma izmantošana, lai pārmeklētu visas jūsu lietojumprogrammas un sistēmas, lai pirms nopietnu pakalpojumu pārtraukšanas proaktīvi precīzi noteiktu pamatcēloņus jebkuras veiktspējas pasliktināšanās brīdī. Varat arī integrēt monitoringa, servisa galdu, sadarbības lietotnes un tērzēšanas rīkus, lai reālā laikā koplietotu vienotu informāciju.

Bez kļūdām, bez stresa - jūsu soli pa solim, kā izveidot programmatūru, kas maina dzīvi, neiznīcinot savu dzīvi

Jūs nevarat uzlabot savas programmēšanas prasmes, ja nevienam nerūp programmatūras kvalitāte.

3. Precīzi izmēriet MTTR

Kā jūs mēra vidējo remonta laiku (MTTR)? Vai jūs to balstāt uz kopējo laiku, kurā tiek iesaistītas IT komandas, vai uz kopējo laiku, kad bizness faktiski tiek ietekmēts? Ja jūsu atbilde ir pirmā, jums vajadzētu pārdomāt ietekmes loga izmērīšanu, tā vietā izmantojot biznesa perspektīvu. Tas ir daudz precīzāks optimizācijas centienu iemesls, jo jūsu mērķis ir samazināt incidentu ietekmi, nevis vienkārši iesniegt labākus atbildes ziņojumus valdē. (Lai uzzinātu vairāk par dīkstāvi un tās izpildi, pārbaudiet, kāds ir vidējais laiks starp kļūmēm.)

Varat automatizēt, nodrošinot pilnīgu lietojumprogrammu redzamību, lai vajadzības gadījumā ar atpakaļejošu datumu “sāktu pulksteni”, un saglabājiet pilnu izšķirtspējas darbību un komunikāciju reģistru analīzei un auditam, lai uzlabotu savus procesus.

4. Informējiet ieinteresētās personas, bet netraucējot risinājumu

Ieinteresētās personas sagaida efektīvu un savlaicīgu saziņu, vienlaikus arī sagaidot, ka tēmu eksperti joprojām koncentrēsies uz problēmu novēršanu. Lai gan jūs varētu izraudzīties sakaru kontaktpunktu, lai uzraudzītu un iesaistītu biznesa lietotājus, efektīvāka stratēģija būtu izveidot pašapkalpošanās tīmekļa lapu ar statusa atjauninājumiem. Tas ieinteresētajām personām dod iespēju pašiem pārbaudīt sevi, nebombardējot jūsu komandu ar turpmākiem zvaniem un signāliem. Vienkārši atcerieties regulāri atjaunināt ieinteresētās puses, lai viņi vienmēr saņemtu un zinātu sagaidīt jaunāko statusa ziņojumu. Neaizmirstiet, ka saziņai nevajadzētu apstāties tikai tāpēc, ka pakalpojums ir atjaunots! Svarīgi, lai ieinteresētās personas saņemtu kopsavilkumu par notikušo, apgūto un to, kā situāciju novērst nākotnē.

Automatizāciju šajā gadījumā var ieviest, lai ieinteresētajām personām izveidotu automātisku reāllaika statusa lapu, kā arī tērzēšanas rīkā izveidotu slīpsvītru komandas, lai atjauninātu šo lapu.

5. Apkopojiet datus, lai atbalstītu problēmu pārvaldību

Pakalpojuma atjaunošana nenozīmē incidentu pārvaldības beigas! Faktiski dažas no visvērtīgākajām darbībām notiek pēc noregulējuma. Apkopojot diagnostikas un ietekmes datus un veicot cēloņu analīzi, jūs varat veikt pilnīga nopietna incidenta revīziju, kas ietver arī preventīvu pasākumu ieviešanu, lai nākotnē izvairītos no līdzīgiem starpgadījumiem. Turklāt, pat ja atpazīstams incidents atkārtojas, varat izveidot noteiktu procedūru, kāda veida dati jums jāapkopo, un darbības, kas jāveic, lai panāktu izšķirtspēju. Tādā veidā jūsu komandai vienkārši ir jāatsaucas uz kontrolsarakstu un jākoncentrējas uz savu galveno mērķi - pakalpojuma atjaunošanu, nevis jāuztraucas par to, kas viņiem vajadzīgs un kad.

Automatizācija šeit var uztvert un saglabāt izšķirtspējas darbības, ieskaitot tādas lietas kā tērzēšanas atšifrējumi, vienā ierakstu sistēmā analīzei. Turklāt tas palīdzēs izveidot pazīstamu negadījumu vai problēmu katalogu, nostiprināt paraugpraksi katram un tādējādi nākotnē palielināt risināšanas ātrumu.

Noslēgumā: automatizējiet gudrāk, ne vairāk

Esiet brīdināts, ka lielāka automatizācija ne vienmēr ir labāka pieeja! Svarīgāk ir saprast, kad, kur un kā savienot savas IT sistēmas, lai atbalstītu negadījumu pārvaldību. Jūs nevēlaties pievienot nevajadzīgu sarežģītību automatizēto procesu pieauguma dēļ. Atcerieties, ka mērķis ir pēc iespējas vienkāršot un konsolidēt operācijas, lai jūsu komandas justos pilnvarotas efektīvi risināt problēmas. Runa ir par automatizētu automatizācijas ieviešanu, lai atvieglotu labi koordinētu procesu kopumu, zinošu personālu un efektīvu saziņu ar ieinteresētajām personām, lai mazinātu galveno incidentu ietekmi uz uzņēmējdarbību.