Perché la ridondanza dei dati aumenta la sicurezza del tuo server WordPress

Se il proprio business dipende in parte consistente dall’usabilità di un sito web e dalle applicazioni che vi trovano luogo, sarebbe bene eliminare la maggior parte dei rischi gestionali relativi all’hosting. Lo scopo è di avere la maggior affidabilità in termini di uptime, e questo può avvenire solo con un host che ponga la massima attenzione sulla sicurezza dei dati. Raggiungere una percentuale di funzionamento dei server che corrisponda al 100% è teoricamente possibile, ma realisticamente molto difficile, anche se nel settore industriale e commerciale non mancano esempi virtuosi. In genere, in ogni caso, si parla del 99,9%, ottenuto attraverso complessi sistemi di backup e failover.

Tuttavia, il sistema di backup non garantisce a priori né un elevato uptime né tantomeno una sicurezza intrinseca dei dati e delle informazioni ospitate dal sito. Di default, eseguendo un backup manuale, questo viene conservato all’interno dello stesso server che contiene il sito, in una particolare cartella. In caso di qualsiasi incidente – danneggiamento fisico del server, attacchi informatici, ecc. – il backup viene perso: c’è una buona possibilità che il danneggiamento dei dischi del server comporti un danno tanto per il sito quanto per il backup. Allo stesso modo, se il sito viene attaccato e si perde l’accesso ai server, si perde anche l’accesso ai files di backup.

In questo contesto emerge la cosiddetta ridondanza dei dati. A differenza dei backup, il concetto di ridondanza dei dati – in informatica – è stato ideato per fare in modo che la percentuale di tempo offline del sito si abbassi drasticamente, anche in presenza di guasti al server. Questo sistema si basa sulla copia degli stessi files (cioè del sito e dei suoi backup) su più sistemi fisici diversi. Questi funzionano parallelamente al server principale ed entrano in gioco se questo mostra dei problemi oppure necessita di manutenzione. Qualcosa di estremamente prezioso nel caso di siti ad alto volume di traffico.

I siti fatti con WordPress e i CMS in generale traggono grande beneficio dall’uso della ridondanza dei dati, soprattutto quando i server sono dedicati e offrono i RAID, acronimo di Redundant Array of Independent Disks (insieme ridondante di dischi indipendenti). Un RAID è come una piccola costellazione di dischi rigidi connessi in rete e sottostanti a regole predeterminate grazie a un controllo eseguito via software, che di fatto li rende utilizzabili come un unico computer. I miglioramenti per un sito sviluppato con WordPress sono notevoli in termini di incremento di prestazioni, capacità di memorizzazione e soprattutto maggior affidabilità in caso di potenziali guasti.

Redundant Array of Independent Disks

Nell’ambito dei server, un RAID – acronimo inglese che sta per redundant array of independent disks – è un modo per memorizzare gli stessi dati in luoghi diversi. Si tratta di un’applicazione concreta del principio di ridondanza dei dati su vari dischi rigidi finalizzata a mantenere equilibrate le operazioni di input/output e a migliorare le prestazioni generali di un server. Il concetto su cui si base l’introduzione del RAID sostiene che, dal momento in cui l’esistenza di più dischi rigidi aumenta la probabilità di guasti, all’aumentare della ridondanza aumenta anche la tolleranza ai guasti stessi. Come vedremo a breve, anche nel caso di un hosting specifico, un RAID può rivelarsi una scelta molto oculata.

Codice binario

Per quanto riguarda l’usabilità e la gestione, la rete RAID facilita le operazioni perché ha il vantaggio di apparire al sistema operativo come un unico disco rigido logico. Per questo scopo viene implementata la tecnica del mirroring o striping del disco, che comporta il partizionamento – strisce – dello spazio di memorizzazione di ciascuna unità in unità che vanno da un settore di 512 byte fino a diversi megabyte. Le “strisce” di tutti i dischi sono disposte ordinatamente e di fatto appaiono come un solo volume.

Un RAID può esistere sia sulla base di un software che in un senso prettamente fisico. Nel nostro ambito è quest’ultimo caso ad essere più interessante, perché permette ad un sistema di server di mantenere un uptime del sito estremamente alto ed efficiente.

In un RAID hardware i dischi sono configurati all’esterno del sistema principale e spesso sono anche distribuiti in server farm distanti fra loro. Allo stesso modo avvengono le operazioni di mirroring e striping della memoria. Naturalmente, la differenza fra un hardware e un software è da sottolineare anche in termini di prestazioni: dal momento che non pesa sulla CPU del computer degli hosts, un hardware RAID è anche più efficace. I costi di gestione, tuttavia, sono in genere più alti.

Dal punto di vista tecnico, bisogna comunque considerare che generalmente chi gestisce un RAID installa gli stessi dischi nello stesso momento. La rete intera, quindi, si avvia più o meno contemporaneamente e questo implica che, essendo soggetti alle stesse condizioni di operatività, l’usura sia pressoché simile. Di conseguenza, alla rottura di uno specifico disco è altamente probabile che ne seguano altri. Ovviamente, all’aumentare del livello di ridondanza dei dati – che rispetto ai RAID è definito con numeri dall’1 al 6 – diminuiscono sensibilmente questi rischi.