Disaster Recovery: come non perdere tutto quando succede il peggio

Non è un semplice backup, è una strategia di sopravvivenza

Molti confondono il backup con il Disaster Recovery. Errore comune, ma pericoloso. Il backup è la copia dei dati; il Disaster Recovery (DR) è l'intero piano d'azione per rimettere in piedi l'azienda dopo che qualcosa di grave è successo.

Immaginate un server che brucia o un attacco ransomware che cripta ogni singolo file della vostra rete. Avere i dati salvati su un disco esterno serve a poco se non sapete come, dove e in quanto tempo ripristinare l'intera infrastruttura operativa.

Proprio così. La misura di sicurezza del disaster recovery consiste esattamente in questo: definire un set di procedure tecniche e organizzative per minimizzare il downtime e prevenire la perdita definitiva di informazioni critiche.

In cosa consiste concretamente la misura di sicurezza del DR?

Se vogliamo andare al sodo, il Disaster Recovery è l'insieme di strumenti che permette a un'organizzazione di recuperare le proprie funzioni IT dopo un evento catastrofico. Parliamo di alluvioni, incendi, errori umani grossolani o, più frequentemente, cyber-attacchi mirati.

Il cuore di questa misura non è il software, ma la pianificazione. Senza un piano scritto e testato, avete solo una speranza, non una strategia.

Per capire come funziona, dobbiamo guardare a due parametri fondamentali che ogni amministratore di sistema ha tatuati nel cervello: l'RPO e l'RTO.

RPO (Recovery Point Objective): indica quanta perdita di dati l'azienda può tollerare. Se fate il backup ogni 24 ore, il vostro RPO è di un giorno. Se perdete i dati alle 23:59, avrete perso quasi tutto il lavoro della giornata. Accettabile? Dipende dal business.
RTO (Recovery Time Objective): è il tempo massimo consentito per tornare operativi. Quanto può stare ferma l'azienda prima che il danno economico diventi irreversibile? Un'ora? Un giorno? Una settimana?

Un dettaglio non da poco: più volete abbassare questi tempi, più l'investimento tecnologico sale.

Le diverse architetture di ripristino

Non esiste un unico modo di implementare il DR. Tutto dipende dal budget e dalla criticità dei servizi. Esistono approcci che vanno dal più economico (e lento) al più costoso (quasi istantaneo).

Il metodo più basilico è il Cold Site. In pratica, avete uno spazio fisico o virtuale predisposto, ma spento. Quando succede il disastro, dovete installare l'hardware, configurare i sistemi e caricare i backup. È lento. Molto lento.

Poi c'è il Warm Site. Qui l'infrastruttura è già pronta e i dati vengono replicati periodicamente. I tempi di attivazione si riducono drasticamente perché non dovete partire da zero, ma serve comunque un intervento manuale per rendere tutto operativo.

La soluzione d'élite è l'Hot Site. È una copia speculare della vostra infrastruttura che gira in tempo reale. Se il sito primario cade, il traffico viene dirottato sul secondario quasi istantaneamente. Zero o quasi zero downtime. Un lusso necessario per chi gestisce servizi critici o transazioni finanziarie.

Il ruolo del Cloud nel Disaster Recovery moderno

Oggi non si parla più solo di server in cantina o in un altro ufficio. Il DRaaS (Disaster Recovery as a Service) ha cambiato le regole del gioco.

Spostare il piano di ripristino sul cloud significa non dover gestire l'hardware fisico del sito di emergenza. I dati vengono replicati in data center remoti e sicuri, spesso distribuiti geograficamente per evitare che un singolo evento naturale colpisca sia il sito principale che quello di backup.

È una scelta intelligente. Permette di scalare le risorse solo quando servono e riduce i costi fissi di mantenimento di un secondo data center fisico.

Perché molti falliscono nonostante abbiano un piano?

Qui arriviamo al punto critico. Molte aziende credono di essere protette perché hanno un contratto con un fornitore di backup. Poi, il giorno del crash, scoprono che i backup erano corrotti o che le procedure di ripristino non funzionavano più perché l'ambiente software era cambiato.

Il segreto per rendere efficace la misura di sicurezza del disaster recovery è il test periodico.

Non potete sapere se un piano funziona finché non provate a farlo fallire. Simulazioni di crash, test di ripristino di singoli database, switch-over verso il sito di DR. Se non lo fate almeno una o due volte l'anno, il vostro piano è solo un pezzo di carta.

Oltre la tecnica: l'aspetto umano

Il disaster recovery non riguarda solo i server. Riguarda le persone.

Chi deve dare l'ordine di attivare il DR? Chi contatta i clienti? Come comunichiamo che siamo offline senza creare il panico? Queste sono domande a cui rispondere prima che scoppi l'incendio.

Un piano serio include una lista di contatti aggiornata, ruoli chiari e responsabilità definite. Se in mezzo al caos tutti aspettano che sia qualcun altro a prendere la decisione, l'RTO salirà vertiginosamente, indipendentemente dalla velocità dei vostri dischi SSD.

Sintesi per non sbagliare

Se state valutando come implementare o migliorare questa misura di sicurezza, ricordatevi che il DR è un investimento sulla continuità aziendale. Non è una spesa IT, ma un'assicurazione.

Partite dall'analisi del rischio: identificate cosa non può assolutamente smettere di funzionare e allocate le risorse lì. Non tutto ha bisogno di un Hot Site, ma tutto ha bisogno di essere recuperabile.

La sicurezza non è l'assenza di problemi, ma la capacità di gestirli senza collassare.