Steadfast ha estado proporcionando servidores dedicados con configuraciones RAID durante al menos una década, y mientras que RAID es una tecnología ampliamente utilizada, cómo se implementa ha cambiado mucho con la llegada de las unidades de estado sólido (SSD). Muchos clientes nos han preguntado por el RAID, qué es, cómo les afecta y cómo pueden obtener la máxima fiabilidad y rendimiento sin perder de vista sus resultados. Así que he pensado en echar un vistazo a las publicaciones del blog que hemos hecho en el pasado y publicar una versión actualizada para incluir los avances modernos. Si todavía tienes más preguntas, no dudes en ponerte en contacto con nosotros.
¿Qué es RAID?
RAID significa Redundant Array of Inexpensive Disks (matriz redundante de discos baratos). Esto significa que RAID es una forma de juntar lógicamente varios discos en una sola matriz. La idea es que estos discos trabajando juntos tengan la velocidad y/o fiabilidad de un disco más caro. Ahora bien, la velocidad y fiabilidad exactas que conseguirá con el RAID depende del tipo de RAID que esté utilizando.
Una breve visión general de los discos giratorios y las unidades de estado sólido
Los discos giratorios, discos duros mecánicos o discos duros (HDD) se suelen elegir en situaciones en las que las necesidades como la velocidad y el rendimiento quedan en segundo plano frente al coste. Debido a las limitaciones físicas y a la naturaleza mecánica de muchas piezas móviles de alta velocidad que contienen, los HDD también tienen una tasa de fallos relativamente alta en comparación con los SSD. El RAID está pensado para ayudar a aliviar estos dos problemas, dependiendo del tipo de RAID que se utilice. Normalmente, un disco duro mecánico tiene un 2,5% de posibilidades de fallar cada año de su funcionamiento. Esto ha sido probado por múltiples informes y ningún fabricante o modelo específico tiene una variación dramática de esa tasa del 2,5%. En resumen, si usted valora sus datos, va a necesitar implementar alguna metodología que le ayude a protegerlos de los fallos de las unidades.
Las unidades de disco duro se suelen elegir en situaciones en las que la velocidad y el rendimiento tienen prioridad sobre las consideraciones de coste. Como no tienen partes móviles, su capacidad de escribir y leer datos en ellos es significativamente más rápida que en un disco duro (al menos 8-10 veces más rápido). Y su tasa de fallos es de aproximadamente 0,5% durante cada año de funcionamiento, lo que reduce significativamente el riesgo en comparación con un disco duro giratorio.
Debido a la dramática diferencia entre las tecnologías de los HDD y los SSD, es importante señalar que algunas implementaciones de RAID que son excelentes para los HDD no lo son para los SSD, y viceversa.
¿Cuáles son los tipos de RAID?
RAID 0 (Striping)
RAID 0 es tomar cualquier número de discos y fusionarlos en un gran volumen. Esto aumentará en gran medida la velocidad, ya que está leyendo y escribiendo desde varios discos a la vez. Un archivo individual puede utilizar la velocidad y la capacidad de todos los discos de la matriz. La desventaja del RAID 0 es que NO es redundante. La pérdida de cualquier disco individual provocará una pérdida completa de datos. Este tipo de RAID es mucho menos fiable que tener un solo disco.
Rara vez hay una situación en la que se deba utilizar el RAID 0 en un entorno de servidor. Puede utilizarlo para la caché u otros propósitos donde la velocidad es importante y la fiabilidad/pérdida de datos no importa en absoluto. Pero no debería usarse para nada más que eso. Como ejemplo, con la tasa de fallo anual de los discos del 2,5%, si tiene una matriz RAID 0 de 6 discos, ha aumentado su riesgo anual de pérdida de datos a casi el 13,5%.
RAID 1 (Mirroring)
Aunque el RAID 1 es capaz de una configuración mucho más complicada, casi todos los casos de uso del RAID 1 son en los que tiene un par de discos idénticos que reflejan/copian los datos de forma idéntica en las unidades del array. El objetivo del RAID 1 es principalmente la redundancia. Si pierde por completo una unidad, puede seguir funcionando con la unidad adicional.
En el caso de que cualquiera de las unidades falle, puede sustituir la unidad rota sin apenas tiempo de inactividad. El RAID 1 también le ofrece la ventaja adicional de un mayor rendimiento de lectura, ya que los datos pueden leerse en cualquiera de las unidades de la matriz. La desventaja es que tendrá una latencia de escritura ligeramente superior. Dado que los datos deben escribirse en ambas unidades de la matriz, sólo tendrá la capacidad disponible de una sola unidad, pero necesitará dos unidades.
RAID 5/6 (Striping + Paridad Distribuida)
RAID 5 requiere el uso de al menos 3 unidades (RAID 6 requiere al menos 4 unidades). Toma la idea del RAID 0 y divide los datos en varias unidades para aumentar el rendimiento. Pero también añade el aspecto de la redundancia distribuyendo la información de paridad entre los discos. Hay muchos recursos técnicos en Internet que pueden entrar en detalles sobre cómo sucede esto. Pero en resumen, con el RAID 5 puede perder un disco, y con el RAID 6 puede perder dos discos, y seguir manteniendo sus operaciones y datos.
Los RAID 5 y 6 le permitirán mejorar significativamente el rendimiento de lectura. Pero el rendimiento de escritura depende en gran medida de la controladora RAID utilizada. Para el RAID 5 o 6, lo más seguro es que necesite un controlador de hardware dedicado. Esto se debe a la necesidad de calcular los datos de paridad y escribirlos en todos los discos. RAID 5 y RAID 6 suelen ser buenas opciones para servidores web estándar, servidores de archivos y otros sistemas de propósito general en los que la mayoría de las transacciones son de lectura, y le dan un buen valor por su dinero. Esto se debe a que sólo necesita comprar una unidad adicional para el RAID 5 (o dos unidades adicionales para el RAID 6) para añadir velocidad y redundancia.
El RAID 5 o el RAID 6 no es la mejor opción para un entorno de escritura intensa, como un servidor de bases de datos, ya que probablemente perjudicará su rendimiento general.
Cabe mencionar que en una situación de RAID 5 o RAID 6, si pierde una unidad, va a sacrificar seriamente el rendimiento para mantener su entorno operativo. Una vez que se sustituya la unidad que ha fallado, habrá que reconstruir los datos a partir de la información de paridad. Esto supondrá una cantidad significativa del rendimiento total de la matriz. Estos tiempos de reconstrucción aumentan cada año, ya que las unidades son cada vez más grandes.
RAID 10 (Mirroring + Striping)
RAID 10 requiere al menos 4 unidades y es una combinación de RAID 1 (mirroring) y RAID 0 (striping). Esto le permitirá aumentar la velocidad y la redundancia. Suele ser el nivel RAID recomendado si se busca velocidad, pero se necesita redundancia. En una configuración de cuatro unidades, dos unidades duplicadas contienen la mitad de los datos divididos y otras dos duplican la otra mitad de los datos. Esto significa que puede perder cualquier unidad, y posiblemente también una segunda unidad, sin perder ningún dato. Al igual que el RAID 1, sólo tendrá la capacidad de la mitad de las unidades, pero verá mejorado el rendimiento de lectura y escritura. También tendrá el rápido tiempo de reconstrucción del RAID 1.
¿Cuándo debería utilizar el RAID?
El RAID es extremadamente útil si el tiempo de actividad y la disponibilidad son importantes para usted o su negocio. Las copias de seguridad le ayudarán a protegerse de una pérdida de datos catastrófica. Sin embargo, la restauración de grandes cantidades de datos, como cuando se produce un fallo de la unidad, puede llevar muchas horas. Esas copias de seguridad podrían tener horas o días de antigüedad, lo que le costaría todos los datos almacenados o modificados desde la última copia de seguridad. RAID le permite capear el fallo de una o más unidades sin pérdida de datos y, en muchos casos, sin ningún tiempo de inactividad.
RAID también es útil si tiene problemas de IO de disco, donde las aplicaciones están esperando en el disco para realizar tareas. El uso de RAID le proporcionará un rendimiento adicional al permitirle leer y escribir datos desde varias unidades en lugar de una sola. Además, si opta por el RAID por hardware, la tarjeta RAID por hardware incluirá memoria adicional que se utilizará como caché, lo que reducirá la carga del hardware físico y aumentará el rendimiento general.
Nota: Por lo general, no aconsejamos utilizar una tarjeta RAID por hardware para volúmenes SSD, ya que la caché adicional no es necesaria debido a la velocidad de los propios SSD.
¿Qué tipo de RAID debería utilizar?
- Sin RAID – Es bueno si puede soportar varias horas de tiempo de inactividad y/o pérdida de datos debido mientras restaura su sitio a partir de copias de seguridad.
- RAID 0 – Es bueno si los datos no son importantes y pueden perderse, pero el rendimiento es crítico (como en el caso de la caché).
- RAID 1 – Es bueno si busca obtener de forma económica una redundancia de datos adicional y/o velocidades de lectura. (Este es un buen nivel de base para aquellos que buscan lograr un alto tiempo de actividad y aumentar el rendimiento de las copias de seguridad.)
- RAID 5/6 – Es bueno si tiene servidores web, entornos de alta lectura o matrices de almacenamiento extremadamente grandes como un solo objeto. Esto tendrá un rendimiento peor que el RAID 1 en las escrituras. Si su entorno tiene muchas escrituras, o no necesita más espacio del que permite un disco con RAID 1, es probable que RAID 1 sea una opción más eficaz.
- Raid 10 – Una buena solución que proporciona velocidad adicional de lectura y escritura, así como redundancia adicional.
- RAID no equivale a un tiempo de actividad del 100%. Nada puede hacerlo. RAID es otra herramienta en la caja de herramientas destinada a ayudar a minimizar el tiempo de inactividad y los problemas de disponibilidad. Sigue existiendo el riesgo de un fallo de la tarjeta RAID, aunque es significativamente menor que el de una unidad de disco duro mecánica.
- El RAID no sustituye a las copias de seguridad. Nada puede sustituir a una implementación de copias de seguridad bien planificada y probada con frecuencia.
- El RAID no le protegerá contra la corrupción de datos, los errores humanos o los problemas de seguridad. Aunque puede protegerle contra un fallo de la unidad, hay innumerables razones para mantener las copias de seguridad. Por tanto, no tome el RAID como un sustituto de las copias de seguridad. Si no tiene copias de seguridad, no está preparado para considerar el RAID como una opción.
- El RAID no le permite necesariamente aumentar de forma dinámica el tamaño de la matriz. Si necesita más espacio en disco, no puede simplemente añadir otra unidad a la matriz. Es probable que tenga que empezar desde cero, reconstruyendo/reformateando la matriz. Por suerte, los ingenieros de Steadfast están aquí para ayudarle a diseñar y ejecutar cualquier sistema que necesite para mantener su negocio en funcionamiento.
- El RAID no es siempre la mejor opción para la virtualización y la conmutación por error de alta disponibilidad. En esas circunstancias, usted querrá mirar las soluciones SAN, que Steadfast también proporciona.
¿Software vs Hardware?
Raid por software
El RAID por software es una opción incluida en todos los servidores dedicados de Steadfast. Esto significa que no hay ningún costo para el software RAID 1, y es muy recomendable si usted está utilizando el almacenamiento local en un sistema. Es muy recomendable que las unidades en una matriz RAID sean del mismo tipo y tamaño.
El RAID basado en software aprovechará parte de la potencia de cálculo del sistema para gestionar la configuración RAID. Si busca maximizar el rendimiento de un sistema, como por ejemplo con una configuración RAID 5 o 6, es mejor utilizar una tarjeta RAID basada en hardware cuando utilice discos duros estándar.
Raid de hardware
El RAID basado en hardware requiere un controlador dedicado instalado en el servidor. Los ingenieros de Steadfast estarán encantados de proporcionarle recomendaciones con respecto a qué cuidado de RAID de hardware es mejor para usted que se basa en lo que la configuración de RAID que desea tener. Una tarjeta RAID basada en hardware hace toda la gestión de la(s) matriz(s) RAID, proporcionando discos lógicos al sistema sin sobrecarga por parte del propio sistema. Además, el RAID por hardware puede proporcionar muchos tipos diferentes de configuraciones RAID simultáneamente al sistema. Esto incluye proporcionar una matriz RAID 1 para la unidad de arranque y de aplicación y una matriz RAID-5 para la matriz de almacenamiento grande.
¿Qué no hace RAID?
Nota del editor: Este post fue publicado originalmente en marzo de 2010 y ha sido completamente renovado y actualizado para la exactitud y la exhaustividad.