Steadfast ha fornito server dedicati con configurazioni RAID per almeno un decennio, e mentre il RAID è una tecnologia ampiamente utilizzata, il modo in cui è implementato è cambiato molto con l’avvento dei Solid State Drives (SSD). Molti clienti ci hanno chiesto informazioni sul RAID, che cos’è, come influisce su di loro e come possono ottenere la migliore affidabilità e performance mantenendo un occhio sulla loro linea di fondo. Così, ho pensato di dare un’occhiata ai post del blog che abbiamo fatto in passato e rilasciare una versione aggiornata per includere i progressi moderni. Se avete ancora altre domande, non esitate a contattarci.
Che cos’è RAID?
RAID sta per Redundant Array of Inexpensive Disks. Ciò significa che RAID è un modo di mettere logicamente insieme più dischi in un unico array. L’idea quindi è che questi dischi lavorando insieme avranno la velocità e/o l’affidabilità di un disco più costoso. Ora, l’esatta velocità e affidabilità che otterrete dal RAID dipende dal tipo di RAID che state usando.
Una breve panoramica delle unità a disco rotante e a stato solido
Le unità a disco rotante, gli hard disk meccanici o i dischi rigidi (HDD) sono tipicamente scelti in situazioni in cui esigenze come la velocità e le prestazioni sono seconde al costo. A causa delle limitazioni fisiche e della natura meccanica di molte parti mobili ad alta velocità in essi contenute, gli HDD hanno anche un tasso di fallimento relativamente alto rispetto agli SSD. Il RAID ha lo scopo di aiutare ad alleviare entrambi questi problemi, a seconda del tipo di RAID utilizzato. In genere, un disco rigido meccanico ha una probabilità di guasto del 2,5% ogni anno di funzionamento. Questo è stato dimostrato da molteplici rapporti e nessun produttore o modello specifico ha una variazione drammatica da questo tasso del 2,5%. In breve, se si dà valore ai propri dati, è necessario implementare una metodologia per proteggerli dai guasti delle unità.
Gli SSD sono tipicamente scelti in situazioni in cui la velocità e le prestazioni hanno la priorità sulle considerazioni di costo. Poiché non hanno parti in movimento, la loro capacità di scrivere e leggere dati su di essi è significativamente più veloce che su un HDD (almeno 8-10 volte più veloce.) E il loro tasso di fallimento è di circa lo 0,5% durante ogni anno di funzionamento, il che riduce significativamente il rischio rispetto a un HDD rotante.
A causa della drammatica differenza tra le tecnologie degli HDD e degli SSD, è importante dire che alcune implementazioni RAID che sono ottime per gli HDD non lo sono per gli SSD, e viceversa.
Quali sono i tipi di RAID?
RAID 0 (Striping)
RAID 0 è prendere un qualsiasi numero di dischi e fonderli in un unico grande volume. Questo aumenterà notevolmente la velocità, dato che si legge e scrive da più dischi alla volta. Un singolo file può quindi utilizzare la velocità e la capacità di tutti i dischi dell’array. L’aspetto negativo del RAID 0 però è che NON è ridondante. La perdita di qualsiasi disco individuale causerà la perdita completa dei dati. Questo tipo di RAID è molto meno affidabile che avere un singolo disco.
Sono rare le situazioni in cui si dovrebbe usare RAID 0 in un ambiente server. Potete usarlo per la cache o per altri scopi dove la velocità è importante e l’affidabilità/perdita di dati non ha alcuna importanza. Ma non dovrebbe essere usato per altro. Per esempio, con un tasso di fallimento annuale del 2,5% dei dischi, se avete un array RAID 0 a 6 dischi, avete aumentato il rischio annuale di perdita di dati a quasi il 13,5%.
RAID 1 (Mirroring)
Mentre il RAID 1 è capace di una configurazione molto più complicata, quasi ogni caso d’uso del RAID 1 è quello in cui si ha una coppia di dischi identici che fanno il mirroring/copia dei dati in modo uguale tra i dischi dell’array. Il punto del RAID 1 è principalmente per la ridondanza. Se si perde completamente un disco, si può ancora rimanere in funzione con il disco aggiuntivo.
Nel caso in cui uno dei due dischi si guasti, è possibile sostituire il disco rotto con poco o nessun tempo morto. RAID 1 offre anche l’ulteriore vantaggio di una maggiore prestazione in lettura, dato che i dati possono essere letti da qualsiasi disco dell’array. Gli svantaggi sono che avrai una latenza di scrittura leggermente più alta. Poiché i dati devono essere scritti su entrambe le unità dell’array, avrete solo la capacità disponibile di una singola unità mentre avete bisogno di due unità.
RAID 5/6 (Striping + Parità distribuita)
RAID 5 richiede l’uso di almeno 3 unità (RAID 6 richiede almeno 4 unità). Prende l’idea del RAID 0, e spoglia i dati su più dischi per aumentare le prestazioni. Ma aggiunge anche l’aspetto della ridondanza distribuendo le informazioni di parità tra i dischi. Ci sono molte risorse tecniche su Internet che possono entrare nei dettagli su come questo avviene. Ma in breve, con RAID 5 si può perdere un disco, e con RAID 6 si possono perdere due dischi, e mantenere comunque le operazioni e i dati.
RAID 5 e 6 vi darà prestazioni in lettura significativamente migliorate. Ma le prestazioni in scrittura dipendono in gran parte dal controller RAID utilizzato. Per il RAID 5 o 6, avrete quasi certamente bisogno di un controller hardware dedicato. Questo è dovuto alla necessità di calcolare i dati di parità e scriverli su tutti i dischi. RAID 5 e RAID 6 sono spesso buone opzioni per server web standard, file server e altri sistemi di uso generale dove la maggior parte delle transazioni sono letture, e ti danno un buon valore per i tuoi soldi. Questo perché è necessario acquistare solo un disco aggiuntivo per il RAID 5 (o due dischi aggiuntivi per il RAID 6) per aggiungere velocità e ridondanza.
RAID 5 o RAID 6 non è la scelta migliore per un ambiente di scrittura pesante, come un server di database, poiché probabilmente danneggerà le prestazioni generali.
Vale la pena menzionare che in una situazione RAID 5 o RAID 6, se si perde un disco, si sta andando a sacrificare seriamente le prestazioni per mantenere il vostro ambiente operativo. Una volta sostituito il disco guasto, i dati dovranno essere ricostruiti dalle informazioni di parità. Questo richiederà una quantità significativa delle prestazioni totali dell’array. Questi tempi di ricostruzione continuano a crescere sempre di più ogni anno, dato che le unità diventano sempre più grandi.
RAID 10 (Mirroring + Striping)
RAID 10 richiede almeno 4 unità ed è una combinazione di RAID 1 (mirroring) e RAID 0 (striping). Questo ti darà sia una maggiore velocità che ridondanza. Questo è spesso il livello RAID raccomandato se stai cercando la velocità, ma hai ancora bisogno di ridondanza. In una configurazione a quattro dischi, due dischi in mirroring tengono metà dei dati in striping e altri due fanno il mirroring dell’altra metà dei dati. Questo significa che puoi perdere qualsiasi disco singolo, e quindi eventualmente anche un secondo disco, senza perdere alcun dato. Proprio come il RAID 1, avrete solo la capacità di metà delle unità, ma vedrete migliorare le prestazioni di lettura e scrittura. Avrete anche il tempo di ricostruzione veloce del RAID 1.
Quando dovrei usare il RAID?
Il RAID è estremamente utile se i tempi di attività e la disponibilità sono importanti per voi o la vostra azienda. I backup vi aiuteranno ad assicurarvi da una perdita catastrofica di dati. Ma, il ripristino di grandi quantità di dati, come quando si verifica un guasto al disco, può richiedere molte ore per essere eseguito. Quei backup potrebbero essere vecchi di ore o giorni, costandovi tutti i dati memorizzati o cambiati dall’ultimo backup. Il RAID permette di superare il guasto di uno o più dischi senza perdita di dati e, in molti casi, senza alcun tempo di inattività.
RAID è anche utile se avete problemi di IO del disco, dove le applicazioni sono in attesa sul disco per eseguire dei compiti. Andare con il RAID vi fornirà un throughput aggiuntivo permettendovi di leggere e scrivere dati da più dischi invece che da un singolo disco. Inoltre, se si va con il RAID hardware, la scheda RAID hardware includerà una memoria aggiuntiva da usare come cache, riducendo lo sforzo dell’hardware fisico e aumentando le prestazioni complessive.
Nota: generalmente non consigliamo di usare una scheda RAID hardware per volumi SSD, poiché la cache aggiuntiva non è necessaria a causa della velocità degli SSD stessi.
Quale tipo di RAID dovrei usare?
- No RAID – Buono se si è in grado di sopportare diverse ore di inattività e/o perdita di dati dovuta mentre si ripristina il sito dai backup.
- RAID 0 – Buono se i dati non sono importanti e possono essere persi, ma le prestazioni sono critiche (come con la cache).
- RAID 1 – Buono se stai cercando di ottenere in modo economico una ridondanza di dati aggiuntivi e/o velocità di lettura. (Questo è un buon livello di base per coloro che cercano di ottenere un alto uptime e aumentare le prestazioni dei backup.)
- RAID 5/6 – Buono se si hanno server web, ambienti ad alta lettura, o array di archiviazione estremamente grandi come un singolo oggetto. Questo avrà prestazioni peggiori del RAID 1 in scrittura. Se il tuo ambiente è pesante in scrittura, o non hai bisogno di più spazio di quello consentito su un disco con RAID 1, RAID 1 è probabilmente un’opzione più efficace.
- RAID 10 – Una buona soluzione a tutto tondo che fornisce ulteriore velocità di lettura e scrittura e ulteriore ridondanza.
Software vs Hardware?
RAID software
RAID software è un’opzione inclusa in tutti i server dedicati di Steadfast. Questo significa che non c’è alcun costo per il RAID 1 software, ed è altamente raccomandato se state usando lo storage locale su un sistema. Si raccomanda vivamente che le unità in un array RAID siano dello stesso tipo e dimensione.
Il RAID basato sul software sfrutterà parte della potenza di calcolo del sistema per gestire la configurazione RAID. Se state cercando di massimizzare le prestazioni di un sistema, ad esempio con una configurazione RAID 5 o 6, è meglio usare una scheda RAID basata su hardware quando usate HDD standard.
Hardware RAID
Il RAID basato su hardware richiede un controller dedicato installato nel server. Gli ingegneri Steadfast saranno lieti di fornirvi raccomandazioni su quale assistenza RAID hardware sia la migliore per voi, in base alla configurazione RAID che volete avere. Una scheda RAID basata sull’hardware fa tutta la gestione dell’array RAID, fornendo dischi logici al sistema senza alcun sovraccarico da parte del sistema stesso. Inoltre, il RAID hardware può fornire molti tipi diversi di configurazioni RAID contemporaneamente al sistema. Questo include la fornitura di un array RAID 1 per l’unità di avvio e applicazione e un array RAID-5 per l’array di archiviazione di grandi dimensioni.
Cosa non fa il RAID?
- Il RAID non equivale al 100% di uptime. Niente può farlo. RAID è un altro strumento nella cassetta degli attrezzi per aiutare a minimizzare i tempi di inattività e i problemi di disponibilità. C’è ancora il rischio di un guasto della scheda RAID, anche se è significativamente più basso di un guasto meccanico dell’unità HDD.
- RAID non sostituisce i backup. Nulla può sostituire un’implementazione di backup ben pianificata e testata frequentemente!
- RAID non vi proteggerà contro la corruzione dei dati, l’errore umano o i problemi di sicurezza. Mentre può proteggervi da un guasto del disco, ci sono innumerevoli ragioni per mantenere i backup. Quindi non prendete il RAID come una sostituzione dei backup. Se non avete backup in atto, non siete pronti a considerare RAID come un’opzione.
- RAID non permette necessariamente di aumentare dinamicamente la dimensione dell’array. Se hai bisogno di più spazio su disco, non puoi semplicemente aggiungere un’altra unità all’array. Probabilmente dovrete ricominciare da zero, ricostruendo/riformattando l’array. Fortunatamente, gli ingegneri Steadfast sono qui per aiutarvi a progettare ed eseguire qualsiasi sistema di cui abbiate bisogno per far funzionare la vostra attività.
- RAID non è sempre l’opzione migliore per la virtualizzazione e il failover ad alta disponibilità. In queste circostanze, vorrete considerare le soluzioni SAN, che anche Steadfast fornisce.
Nota dell’editore: Questo post è stato originariamente pubblicato nel marzo del 2010 ed è stato completamente rinnovato e aggiornato per la precisione e la completezza.