Amarengo

Articles and news

Come Creare Resilienza IT

×
  • Salvare l’Articolo

    accedi per Salvare Iscriversi al WSJ

  • Testo di Piccole Dimensioni Medio-Grandi

    concentrandosi sulla difesa, di rilevamento, di bonifica, di ripristino, la diagnosi e la raffinatezza, i Cio possono essere in grado di ridurre l’impatto di costose interruzioni di servizio.

    Nel 2012, un noto fornitore di servizi di streaming video ha subito un’interruzione di otto ore del servizio, interessando circa 20 milioni di utenti. Per sei giorni nel 2011, il sito web di una banca globale ha subito una serie di rallentamenti e interruzioni, rendendo difficile, se non impossibile, per 29 milioni di clienti di banca online. Nello stesso anno, un errore di switch presso un produttore di telefoni cellulari ha provocato un’interruzione della rete globale che ha lasciato milioni di utenti incapaci di inviare o ricevere e-mail.1

    Interruzioni di servizio come queste sono difficilmente rare. In effetti, la maggior parte delle interruzioni IT coinvolgono sistemi interni (non rivolti al cliente) e non fanno mai notizia, anche se potrebbero non essere meno costosi. Un sondaggio di 200 organizzazioni in Nord America stima che l’azienda media perde 425 ore-persona nella produttività dei dipendenti ogni anno a causa dei tempi di inattività IT.

    Il potenziale impatto sulla linea di fondo? Uno studio sui costi dei tempi di inattività del Ponemon Institute stima che il costo medio dei tempi di inattività dei data center in tutti i settori sia di circa $5.600 al minuto. Inoltre, l’incidente medio riportato dura 90 minuti, il che significa che il costo medio per incidente è di circa $505.500.

    Secondo Richard Clark, direttore di Deloitte Consulting LLP, tali costi sconcertanti potrebbero non essere sostenibili, anche nelle organizzazioni più forti. “Il business è cambiato negli ultimi 20 anni e i margini sono ora sottili come un rasoio”, afferma. “Quando i sistemi falliscono e i servizi vengono interrotti, le grandi organizzazioni possono perdere milioni di dollari nel corso di pochi minuti. La sfida che i CIO devono affrontare è trovare un modo conveniente per mantenere online i servizi esistenti – in altre parole, hanno bisogno di strategie efficaci per renderlo resiliente.”

    Sei imperativi di resilienza IT

    Semplicemente definiti, la resilienza IT è la capacità di un’organizzazione di mantenere livelli di servizio accettabili, indipendentemente dalle sfide che si presentano. Poiché così tante cose possono causare interruzioni del servizio-guasti hardware, disastri naturali, attacchi dannosi ed errori dell’operatore, tra gli altri—creare piani efficaci di disaster recovery (DR) e Business continuity (BC) per affrontare le vulnerabilità può essere scoraggiante. Così scoraggiante, infatti, che secondo una stima, il 56 per cento delle aziende nordamericane non hanno politiche di disaster recovery formali e complete in atto.

    “Alcuni CIO e i loro team IT riciclano i piani che potrebbero aver utilizzato in un’altra azienda, o usano un modello boilerplate”, afferma Tyson Thedinger, manager di Deloitte Consulting LLP. “In genere non si prendono il tempo di pensare in modo completo alla resilienza e a come raggiungerla. Di conseguenza, i loro approcci sono spesso incoerenti o ad hoc.”

    Nel 2010, ricercatori di università negli Stati Uniti, nel Regno Unito e in Germania hanno pubblicato un documento in cui hanno proposto un quadro multi-step per affrontare queste sfide. Questo quadro può aiutare i CIO a pensare alla resilienza in modo più deliberato, metodico e costruttivo.

    “Il loro approccio può guidare i CIO e i loro team IT attraverso il processo di creazione di un’efficace strategia di resilienza”, afferma Thedinger. “Può essere applicato a vari componenti dell’IT, dalle reti ai data center alle applicazioni, per gettare le basi necessarie per colmare le lacune nei piani BC e DR esistenti.”

    Il quadro proposto si concentra su sei imperativi fondamentali della resilienza IT:

    Difendere: Secondo Clark, nel contesto della resilienza IT, difendere i sistemi comporta più che semplicemente proteggerli. Significa anche prendere misure che possono ridurre la probabilità di guasto del sistema. Questi potrebbero includere server di bilanciamento del carico per evitare un sovraccarico o fornire sistemi ridondanti che possono impedire singoli punti di errore. “I CIO possono avviare questo processo identificando le vulnerabilità all’interno di sistemi mission critical, come database o server di controllo dei processi, e affrontandole per prime”, afferma Clark. “Le vulnerabilità nei sistemi non critici come la posta elettronica o altri programmi software per ufficio possono essere affrontate nella misura in cui il tempo, il budget e le risorse lo consentono.”

    Rileva: prima sa che un sistema è andato giù, prima può risolvere il problema. Sfortunatamente, alcune organizzazioni non dispongono di strumenti o processi efficaci per avvisare l’IT di interruzioni del servizio. Secondo Thedinger, i CIO dovrebbero prendere in considerazione l’implementazione di una delle tante soluzioni di monitoraggio attualmente disponibili. “Queste soluzioni possono monitorare le prestazioni dei server fisici e le loro applicazioni e servizi specifici”, afferma. “Oltre a segnalare se un sistema va giù, possono aiutare l’IT a capire e risolvere i problemi prima che causino una completa interruzione.”

    Remediate: secondo Clark, un piano dettagliato per affrontare gli effetti di un’interruzione può costituire la pietra angolare della resilienza IT. “Un buon piano di bonifica può aiutare a evitare costose interruzioni”, aggiunge. “Ad esempio, concentrarsi sulla creazione di processi di ‘fail-over’ in sistemi critici—se un server in California diventa disabilitato, un server di backup in Oregon prende il sopravvento quasi istantaneamente. L’obiettivo finale di un piano di bonifica è quello di assicurarsi che quando i sistemi falliscono, può ancora fornire servizi essenziali,” dice Clark.

    Ripristino: se la correzione comporta il mantenimento dei servizi critici in esecuzione durante un’interruzione, il ripristino si concentra sul ritorno dei servizi e delle operazioni ai livelli pre-interruzione. “Un piano di recupero efficace dovrebbe consentire di tornare prontamente a uno stato stazionario e prepararsi per la prossima interruzione del servizio”, afferma Thedinger.

    Diagnostica: la diagnosi di sfide e interruzioni viene affrontata come un” background ” o un processo in corso. Tuttavia, è una componente importante di una metodologia di resilienza IT. “La diagnosi include l’esecuzione di un postmortem in grado di identificare le cause alla radice delle interruzioni”, afferma Thedinger. “Inoltre, i CIO dovrebbero eseguire periodicamente questo stesso processo diagnostico come parte di uno sforzo continuo per comprendere le sfide del sistema, non solo quelle che si traducono in un’interruzione.”

    Perfeziona: in una fase finale, i CIO e i loro team prendono le informazioni raccolte dagli sforzi diagnostici post-mortem e in corso e le usano per migliorare i sistemi e aumentare la resilienza. Dice Thedinger, ” Questo passaggio chiude un ciclo di feedback che è alla base del framework di resilienza, uno che può rendere possibile perfezionare continuamente i piani DR e BC.”

    Una grande disconnessione

    Una strategia di resilienza metodica e strutturata che si concentra su questi sei imperativi può aiutare le aziende a pianificare in modo più efficace l’interruzione dei servizi IT. Tuttavia, mentre i CIO adottano misure per fornire una maggiore resilienza, molti probabilmente incontreranno un masso fin troppo comune sulla strada che potrebbe ostacolare il progresso, afferma Brad Mitchell, leader specializzato e project manager di Deloitte Consulting LLP.

    “Una grande disconnessione nella pianificazione della resilienza è che spesso, non può nemmeno determinare quali applicazioni sono più critiche senza l’aiuto del lato business”, afferma. “In questo momento, molte aziende hanno una bouillabaisse di sistemi, applicazioni e processi. Ha la gestione su alcuni, mentre le singole unità di business possono possedere altri. Molti sistemi potrebbero essere stati ereditati durante le acquisizioni e potrebbero non sapere chi sono i proprietari dell’applicazione e quali funzionalità fornisce l’applicazione.”

    Secondo Mitchell, il risultato netto è che molte organizzazioni IT hanno perso la capacità di capire quanto tempo i sistemi possono essere giù prima che la loro perdita comincia a influenzare negativamente il business. Per alcuni, può essere una questione di secondi. Per gli altri, i giorni possono passare senza alcun impatto evidente sulla linea di fondo. “Fino a quando non si esegue un’analisi dettagliata dell’impatto aziendale del portafoglio di applicazioni dell’organizzazione, si creeranno piani BC / DR basati su informazioni incomplete che potrebbero non affrontare la propensione al rischio dell’organizzazione”, afferma.

    Mentre realizzano le loro strategie di resilienza, i CIO dovrebbero considerare l’opportunità di coinvolgere i decisori in tutta l’azienda per assegnare la proprietà di sistemi e applicazioni. Possono quindi lavorare insieme per determinare i livelli di rischio per ciascuno. “Se un gruppo aziendale desidera che una particolare applicazione sia operativa in ogni momento, indipendentemente da cosa, è possibile calcolare quanto potrebbe costare creare la massima resilienza e fattore che le informazioni nei piani di difesa, rilevamento, bonifica e ripristino”, afferma Mitchell, che avverte che nulla di tutto ciò probabilmente accade durante la notte.

    “Coinvolgere il lato business e quindi creare ed eseguire il tuo piano potrebbe richiedere uno sforzo pluriennale”, afferma Mitchell. “Anche allora, è importante rivisitare e aggiornare continuamente il piano man mano che vengono implementati nuovi sistemi, altri vengono ritirati e le strategie aziendali si evolvono. La creazione di resilienza IT è un viaggio—non ci sono soluzioni rapide.”

    1 “10 Interruzioni devastanti e fallimenti di grandi marchi nel 2011,” febbraio. 1, 2012, Evolven.com

    Contenuti correlati:

    • Ripristino di emergenza: 10 Lezioni da uragano Sandy”

    Lascia un commento

    Il tuo indirizzo email non sarà pubblicato.