(Presque) tout ce que vous devez savoir sur le RAID

Steadfast fournit des serveurs dédiés avec des configurations RAID depuis au moins une décennie, et bien que le RAID soit une technologie largement utilisée, la façon dont elle est mise en œuvre a beaucoup changé avec l’avènement des disques d’état solides (SSD). De nombreux clients nous ont posé des questions sur le RAID, ce qu’il est, comment il les affecte et comment ils peuvent en tirer la meilleure fiabilité et les meilleures performances tout en gardant un œil sur leurs résultats. J’ai donc décidé de jeter un coup d’œil aux articles de blog que nous avons publiés dans le passé et de publier une version mise à jour pour inclure les avancées modernes. Si vous avez encore des questions, n’hésitez pas à nous contacter.

Qu’est-ce que le RAID ?

RAID est l’abréviation de Redundant Array of Inexpensive Disks. Cela signifie que le RAID est une façon de mettre logiquement plusieurs disques ensemble dans une seule matrice. L’idée est alors que ces disques travaillant ensemble auront la vitesse et/ou la fiabilité d’un disque plus cher. Maintenant, la vitesse et la fiabilité exactes que vous obtiendrez du RAID dépendent du type de RAID que vous utilisez.

Un bref aperçu des disques tournants et des disques à état solide

Les disques tournants, les disques durs mécaniques ou les disques durs (HDD) sont généralement choisis dans des situations où les besoins tels que la vitesse et les performances passent après le coût. En raison des limitations physiques et de la nature mécanique des nombreuses pièces mobiles à haute vitesse qu’ils contiennent, les disques durs ont également un taux de défaillance relativement élevé par rapport aux disques SSD. Le RAID est censé contribuer à atténuer ces deux problèmes, en fonction du type de RAID que vous utilisez. En général, un disque dur mécanique a 2,5 % de chances de tomber en panne chaque année de fonctionnement. Cela a été prouvé par de nombreux rapports et aucun fabricant ou modèle spécifique ne présente une variation spectaculaire de ce taux de 2,5 %. En bref, si vous accordez de l’importance à vos données, vous allez devoir mettre en œuvre une certaine méthodologie pour aider à les protéger contre les pannes de disque.

Les disques SSD sont généralement choisis dans des situations où la vitesse et les performances sont prioritaires par rapport aux considérations de coût. Comme ils n’ont pas de pièces mobiles, leur capacité à la fois d’écrire et de lire des données sur eux est nettement plus rapide que sur un disque dur (au moins 8 à 10 fois plus rapide.) Et leur taux de défaillance est d’environ 0,5 % au cours de chaque année de fonctionnement du disque, ce qui réduit considérablement le risque par rapport à un disque dur rotatif.

En raison de la différence spectaculaire entre les technologies des disques durs et des disques SSD, il est important de préciser que certaines implémentations RAID qui sont excellentes pour les disques durs ne le sont pas pour les disques SSD, et vice versa.

Quels sont les types de RAID ?

RAID 0 (Striping)

Le RAID 0 consiste à prendre un nombre quelconque de disques et à les fusionner en un seul grand volume. Cela augmentera considérablement les vitesses, car vous lisez et écrivez à partir de plusieurs disques à la fois. Un fichier individuel peut alors utiliser la vitesse et la capacité de tous les disques de la matrice. L’inconvénient du RAID 0 est qu’il n’est PAS redondant. La perte d’un seul disque entraîne une perte totale des données. Ce type de RAID est très nettement moins fiable que d’avoir un seul disque.

Il y a rarement une situation où vous devriez utiliser le RAID 0 dans un environnement de serveur. Vous pouvez l’utiliser pour le cache ou à d’autres fins où la vitesse est importante et la fiabilité/perte de données n’a pas du tout d’importance. Mais il ne doit pas être utilisé à d’autres fins. À titre d’exemple, avec le taux de défaillance annuel de 2,5 % des disques, si vous avez une matrice RAID 0 de 6 disques, vous avez augmenté votre risque annuel de perte de données à près de 13,5 %.

RAID 1 (mise en miroir)

Bien que le RAID 1 soit capable d’une configuration beaucoup plus compliquée, presque tous les cas d’utilisation du RAID 1 sont ceux où vous avez une paire de disques identiques mettant en miroir/copiant les données de manière égale sur les disques de la matrice. L’intérêt du RAID 1 est principalement la redondance. Si vous perdez complètement un disque, vous pouvez toujours rester opérationnel sur le disque supplémentaire.

Dans le cas où l’un des disques tombe en panne, vous pouvez alors remplacer le disque cassé avec peu ou pas de temps d’arrêt. Le RAID 1 vous offre également l’avantage supplémentaire d’une performance de lecture accrue, car les données peuvent être lues sur n’importe quel disque de la matrice. L’inconvénient est que vous aurez une latence d’écriture légèrement plus élevée. Comme les données doivent être écrites sur les deux disques de la matrice, vous n’aurez que la capacité disponible d’un seul disque alors que vous avez besoin de deux disques.

RAID 5/6 (Striping + Parité distribuée)

Le RAID 5 nécessite l’utilisation d’au moins 3 disques (le RAID 6 nécessite au moins 4 disques). Il reprend l’idée du RAID 0, et répartit les données sur plusieurs disques pour augmenter les performances. Mais il ajoute également l’aspect de la redondance en distribuant les informations de parité sur les disques. Il existe de nombreuses ressources techniques sur Internet qui peuvent vous expliquer en détail comment cela se passe. Mais en bref, avec le RAID 5, vous pouvez perdre un disque, et avec le RAID 6, vous pouvez perdre deux disques, et maintenir vos opérations et vos données.

Les RAID 5 et 6 vous permettront d’améliorer considérablement les performances en lecture. Mais les performances en écriture dépendent largement du contrôleur RAID utilisé. Pour le RAID 5 ou 6, vous aurez très certainement besoin d’un contrôleur matériel dédié. Cela est dû à la nécessité de calculer les données de parité et de les écrire sur tous les disques. RAID 5 et RAID 6 sont souvent de bonnes options pour les serveurs Web standard, les serveurs de fichiers et d’autres systèmes à usage général où la plupart des transactions sont des lectures, et vous offrent un bon rapport qualité-prix. En effet, vous n’avez besoin d’acheter qu’un seul disque supplémentaire pour le RAID 5 (ou deux disques supplémentaires pour le RAID 6) pour ajouter de la vitesse et de la redondance.

Le RAID 5 ou le RAID 6 n’est pas le meilleur choix pour un environnement à forte écriture, comme un serveur de base de données, car il risque de nuire à vos performances globales.

Il convient de mentionner que dans une situation RAID 5 ou RAID 6, si vous perdez un lecteur, vous allez sérieusement sacrifier les performances pour maintenir votre environnement opérationnel. Une fois que vous aurez remplacé le disque défaillant, les données devront être reconstruites à partir des informations de parité. Cela représente une part importante des performances totales de la baie. Ces temps de reconstruction continuent de croître chaque année, à mesure que les disques deviennent de plus en plus grands.

RAID 10 (Mirroring + Striping)

RAID 10 nécessite au moins 4 disques et est une combinaison de RAID 1 (mirroring) et RAID 0 (striping). Cela vous permettra d’obtenir à la fois une vitesse accrue et une redondance. C’est souvent le niveau de RAID recommandé si vous recherchez la vitesse, mais avez besoin de redondance. Dans une configuration à quatre disques, deux disques en miroir contiennent la moitié des données en bande et deux autres disques en miroir contiennent l’autre moitié des données. Cela signifie que vous pouvez perdre un seul disque, voire un deuxième disque, sans perdre de données. Comme pour le RAID 1, vous ne disposerez que de la capacité de la moitié des disques, mais vous bénéficierez de meilleures performances en lecture et en écriture. Vous aurez également le temps de reconstruction rapide du RAID 1.

Quand dois-je utiliser le RAID ?

Le RAID est extrêmement utile si le temps de disponibilité et la disponibilité sont importants pour vous ou votre entreprise. Les sauvegardes vous aideront à vous assurer contre une perte de données catastrophique. Mais, la restauration de grandes quantités de données, comme lorsque vous subissez une panne de disque, peut prendre plusieurs heures. Ces sauvegardes peuvent dater de plusieurs heures ou de plusieurs jours, ce qui vous fait perdre toutes les données stockées ou modifiées depuis la dernière sauvegarde. Le RAID vous permet de surmonter la défaillance d’un ou plusieurs lecteurs sans perte de données et, dans de nombreux cas, sans aucun temps d’arrêt.

Le RAID est également utile si vous rencontrez des problèmes d’entrées-sorties sur le disque, lorsque les applications attendent sur le disque pour effectuer des tâches. Opter pour le RAID vous fournira un débit supplémentaire en vous permettant de lire et d’écrire des données à partir de plusieurs disques au lieu d’un seul. De plus, si vous optez pour le RAID matériel, la carte RAID matérielle comprendra une mémoire supplémentaire qui sera utilisée comme cache, ce qui réduira la pression exercée sur le matériel physique et augmentera les performances globales.

Note : Nous ne conseillons généralement pas d’utiliser une carte RAID matérielle pour les volumes SSD, car le cache supplémentaire n’est pas nécessaire en raison de la vitesse des SSD eux-mêmes.

Quel type de RAID dois-je utiliser ?

  • Non RAID – Bon si vous êtes capable d’endurer plusieurs heures de temps d’arrêt et/ou de perte de données dues pendant que vous restaurez votre site à partir de sauvegardes.
  • Raid 0 – Bon si les données ne sont pas importantes et peuvent être perdues, mais que les performances sont critiques (comme avec le cache).
  • Raid 1 – Bon si vous cherchez à gagner à peu de frais une redondance supplémentaire des données et/ou des vitesses de lecture. (C’est un bon niveau de base pour ceux qui cherchent à obtenir un temps de disponibilité élevé et à augmenter les performances des sauvegardes.)
  • Raid 5/6 – Bon si vous avez des serveurs Web, des environnements à lecture élevée ou des matrices de stockage extrêmement grandes comme un seul objet. Cela donnera de moins bonnes performances que le RAID 1 sur les écritures. Si votre environnement est lourd en écriture, ou si vous n’avez pas besoin de plus d’espace que ce qui est autorisé sur un disque avec RAID 1, RAID 1 est probablement une option plus efficace.
  • Raid 10 – Une bonne solution polyvalente qui fournit une vitesse de lecture et d’écriture supplémentaire ainsi qu’une redondance supplémentaire.

Les logiciels contre le matériel ?

Le RAID logiciel

Le RAID logiciel est une option incluse dans tous les serveurs dédiés de Steadfast. Cela signifie qu’il n’y a AUCUN coût pour le RAID 1 logiciel, et il est fortement recommandé si vous utilisez un stockage local sur un système. Il est fortement recommandé que les disques dans une matrice RAID soient du même type et de la même taille.

Le RAID logiciel va exploiter une partie de la puissance de calcul du système pour gérer la configuration RAID. Si vous cherchez à maximiser les performances d’un système, par exemple avec une configuration RAID 5 ou 6, il est préférable d’utiliser une carte RAID matérielle lorsque vous utilisez des disques durs standard.

Raid matériel

Le RAID matériel nécessite un contrôleur dédié installé dans le serveur. Les ingénieurs de Steadfast seront heureux de vous fournir des recommandations concernant le soin RAID matériel qui est le meilleur pour vous qui est basé sur la configuration RAID que vous voulez avoir. Une carte RAID matérielle fait toute la gestion du ou des réseaux RAID, fournissant des disques logiques au système sans aucune surcharge de la part du système lui-même. De plus, le RAID matériel peut fournir plusieurs types de configurations RAID simultanément au système. Il s’agit notamment de fournir une matrice RAID 1 pour le lecteur de démarrage et d’application et une matrice RAID-5 pour la grande matrice de stockage.

Que ne fait pas le RAID ?

  • Le RAID n’équivaut pas à un temps de disponibilité de 100 %. Rien ne le peut. RAID est un autre outil sur dans la boîte à outils censé aider à minimiser les temps d’arrêt et les problèmes de disponibilité. Il existe toujours un risque de défaillance de la carte RAID, bien qu’il soit nettement inférieur à celui d’une défaillance mécanique du disque dur.
  • Le RAID ne remplace pas les sauvegardes. Rien ne peut remplacer une mise en œuvre de sauvegarde bien planifiée et fréquemment testée !
  • Le RAID ne vous protégera pas contre la corruption des données, les erreurs humaines ou les problèmes de sécurité. S’il peut vous protéger contre une panne de disque, il existe d’innombrables raisons de conserver des sauvegardes. Ne considérez donc pas le RAID comme un substitut aux sauvegardes. Si vous n’avez pas de sauvegardes en place, vous n’êtes pas prêt à considérer le RAID comme une option.
  • Le RAID ne vous permet pas nécessairement d’augmenter dynamiquement la taille de la matrice. Si vous avez besoin de plus d’espace disque, vous ne pouvez pas simplement ajouter un autre lecteur à la matrice. Vous allez probablement devoir repartir de zéro, en reconstruisant/reformatant la matrice. Heureusement, les ingénieurs de Steadfast sont là pour vous aider à architecturer et à exécuter tous les systèmes dont vous avez besoin pour faire fonctionner votre entreprise.
  • Le RAID n’est pas toujours la meilleure option pour la virtualisation et le basculement à haute disponibilité. Dans ces circonstances, vous voudrez examiner les solutions SAN, que Steadfast fournit également.

Note de la rédaction : Ce billet a été publié à l’origine en mars 2010 et a été complètement remanié et mis à jour pour l’exactitude et l’exhaustivité.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *