miércoles, 27 de agosto de 2025

RAID de discos duros: qué son y sus principales tipos.

Supongo que ya sabreis, que casi cualquier aparato electrico/electronico contiene una fuente de memoria donde almacena información, con la que, por ejemplo, se puede hacer funcionar dicho artefacto. Esas memorias, tambien pueden permitir a los usuarios almacenar ciertos datos, con el fin de personalizar ciertas programaciones... todo este concepto nos ha llevado a que a día de hoy, podamos guardar y borrar datos, en forma de fotos, videos o documentos, en nuestros ordenadores, telefonos, tablets... y aunque pueda parecer lo mismo, en el mundo de la informatica esta memoria funciona muy distintamente a la de los demas aparatos tecnologicos. Dichas memorias, en informatica, se denominan discos duros y aparte de ser modulos muchismo mas rapidos, de muchisima mas capacidad, pero a las vez mas grandes que sus hononimos digitales, podemos configurarlos de distintas maneras para que funcionen de forma individual o combinada cuando tenemos varias unidades dentro de un mismo ordenador. Es lo que se llama configuración RAID, que paso a continuación a explicaros.

¿Qué es la configuración RAID de discos duros?.

Los discos duros son las unidades de almacenamiento interno que conectas a la placa base de tu ordenador para poder almacenar cosas. Por lo general, la mayoría de usuarios solemos hacer las conexiones de forma directa, simplemente conectando los discos duros a la placa base para que funcionen por separado, cada uno con su propia capacidad de almacenamiento.

 Pero si el método tan sencillo se te queda corto, también puedes recurrir a una configuración RAID. El nombre son las siglas de Redundant Array of Independent Disks o Matriz redundante de discos independientes, y es un método para combinar los discos duros como un matriz que se reconoce como una sola unidad por el sistema operativo. Dicho de forma sencilla, sería como configurar una unidad de almacenamiento formada por varios discos duros.

Lo que hace esta configuración es enlazar los datos en varios discos duros, haciendo que las operaciones de entrada y salida de datos estén mejor balanceadas, lo que al final acaba ayudando a tener un mejor rendimiento.

Es lo que llamamos una forma de almacenar datos distribuida por utilizar varios discos duros, y también redundante porque habrá veces en la que estos datos se escriban en varios discos duros a la vez. Esto dependerá del tipo de RAID que configures, ya que hay otras veces en las que los datos se repartirán en los diferentes tipos duros para que así también se repartan el trabajo entre ellos.

Cada tipo de RAID tiene sus propias características y su forma de funcionar. Por lo general, estas configuraciones suelen utilizarse sobre todo en servidores para mejorar el rendimiento de los discos y evitar la pérdida de los datos almacenados. Pero también suele utilizarse en servidores NAS domésticos, pudiendo elegir entre usar los dos discos duros uno junto al otro para ampliar el almacenamiento o uno duplicando otro para evitar pérdida de datos.

Existen diferentes tipos de configuraciones RAID a las que se puede optar dependiendo de los resultados que se quiera obtener en seguridad y rendimiento. Puedes optar entre más de 15 tipos diferentes, aunque nosotros hoy vamos a centrarnos en decirte únicamente los más populares y comunes junto a sus características y las ventajas que ofrecen.

RAID 0.

Esta es una de las configuraciones básicas de RAID, y una de las principales configuraciones para quien busca velocidad de escritura y lectura por encima de todo, ya que esta velocidad se multiplica exponencialmente debido a la manera en la que se distribuyen los datos en los discos que la forman.

Necesitarás al menos dos discos que pueden ser de diferentes capacidades, aunque la matriz tomará como referencia el de menor capacidad. Por lo tanto, si tienes un disco de 1TB y otro de 500 GB, no se formará una matriz de 1,5 TB, ya que al tomarse como referencia el de menor capacidad, serán 500 + 500 GB, por lo tanto, la matriz tendrá una capacidad de 1 TB.

La información se escribe de forma alterna en cada uno de los discos que forman la matriz. Esto hace que los datos se envíen de forma paralela, y que la velocidad a la que fluyen los datos pueda llegar a ser literalmente el doble que si tuviéramos sólo un disco. La parte negativa es que los datos no se van a duplicar, y al no haber redundancia, si hay un fallo en un disco o en algún archivo interno, perderás los datos sin poder recuperarlos.

RAID 1.

Es otra de las configuraciones básicas de RAID, en la que prima la redundancia de datos. Vas a necesitar al menos dos discos duros para utilizarla, y los datos se almacenan por igual en cada uno de los discos duros. Por lo tanto, si hay algún error en alguno de los discos o en alguno de los archivos, siempre tendrás otra copia a la que recurrir.

Esto también quiere decir que el tamaño de la matriz es el mismo que el disco duro de menor capacidad, ya que los datos tienen que estar siempre por duplicado. Si tienes un disco de 1 TB y otro de 500 GB, la matriz tendrá una capacidad de 500 GB. Esto es así porque es hasta 500 GB que vas a poder tener los datos duplicados, la capacidad de uno de los discos.

 

Además de la seguridad y tranquilidad que te dará tener los datos duplicados, el hecho de que en ambos discos puedan encontrarse los mismos datos hace que cada uno pueda transmitir la información de forma simultánea, por lo que también se va a incrementar exponencialmente la velocidad de escritura y lectura dependiendo de la cantidad de unidades que tengas.

RAID 2. 

Vamos ahora con una configuración muy poco habitual y que es un poco bastante compleja de entender. La configuración RAID 2 es básicamente una RAID 0 pero que agrega la corrección de errores mediante el código Hamming.

Para este tipo de configuraciones necesitamos de al menos tres discos duros. Los dos primeros actúan como una RAID 0 y el tercero actúa como un disco de verificación de los datos.

Una de las singularidades de RAID 2 es la sincronización de los discos duros. En HDD lo que se hace es sincronizar el giro de los discos para que giren en la misma orientación. Mientras que, en los SSD, se empieza siempre en las mismas celdas y sigue un patrón. Debido a estas particularidades técnicas, se impide atender varias solicitudes de manera simultánea.

 
Aquí los datos se dividen a nivel de bit, no a nivel de bloque o paquete, haciendo que este sistema sea muy complejo. Realmente es un sistema muy extraño de ver, por su complejidad y costes.

Presenta otro problema, se requieren de un mínimo de 39 discos, de los cuales 32 serían de almacenamiento a nivel de bits individuales y 7 unidades para corrección de errores.

RAID 3. 

Pasamos a otra de esas configuraciones posibles, pero extremadamente raras por su complejidad. Aquí los datos de distribuyen en los discos duros a nivel de byte, en vez de a nivel de bloque. Se añade un disco duro que únicamente hace la función de paridad.

Esta configuración exige al menos tres unidades de disco duro, dos para almacenamiento y una para paridad. Algo interesante es que los discos duros para almacenamiento actúan como en una configuración RAID 0. La tercera unidad es donde se almacenan los bytes de paridad. Esto permite que, si se pierde un byte de datos por cualquier fallo, se consigue recuperar mediante el disco de paridad.

Como las unidades primarias actúan en RAID 0, se aumenta mucho la velocidad de lectura y escritura. Presenta un problema y es que los discos duros son usados de manera simultánea en todo momento. Esto genera un impedimento de realización de peticiones simultaneas.

RAID 4. 

Tiene bastantes similitudes con la RAID 3, con la salvedad que la unidad de almacenamiento se divide en bloques y no en bytes. Lo que nos ofrece esta configuración es que cada disco duro funcione independiente del resto. La configuración RAID 4 requiere de un total de cuatro discos duros, tres irán destinados a datos y el cuarto será de paridad.


 Este sistema es muy interesante, ya que, si la controladora lo permite, la configuración puede aceptar peticiones de lectura simultánea. Debería también soportar múltiples peticiones de escritura y en teoría, las soporte. Tiene un problema y es que la paridad de un solo disco puede generar cuello de botella.

RAID 5.

Otra de las configuraciones RAID más utilizadas, en la que debes tener un mínimo de 3 discos duros. Su funcionamiento es algo más complejo, pero podemos decir que los datos se distribuyen entre todos los discos que tengas en la matriz salvo en uno, que almacenará una copia de los datos a forma de copia de seguridad.

En cuanto al resto de discos más allá del de copia de seguridad, la información se divide en bloques que se distribuyen de forma equitativa por ellos. Así, se multiplica exponencialmente la velocidad, y cuantos más discos duros tengas mayor será la velocidad, aunque no será 

Salvando las distancias técnicas, es como una especie de mezcla de los dos tipos anteriores, ya que la velocidad se multiplica al repartirse los datos entre los discos, pero si hay algún fallo también tendrás un disco de soporte desde el que puedes recuperar los datos.

Sin embargo hay dos partes negativas. La primera es que el mínimo de discos duros necesarios es de 3 en vez de 2 como la configuración inicial, algo que representa una inversión mayor. Y la segunda es que si dos discos fallan, uno de ellos el que almacena la copia de los datos, sigues pudiendo perder datos aunque otro siga funcionando.

RAID 6. 

Vamos ahora con una versión avanzada o mejorada de la configuración RAID 5. Los discos duros, en este caso no tienen un bloque de paridad, tienen dos bloques de paridad. Así tenemos que el bloque de paridad no está solo en un disco duro, sino que está en dos.

Una configuración peculiar que permite aumentar la tolerancia a fallos de unidades de almacenamiento, permitiendo que dos discos duros fallen de manera simultánea. También lo hace más resistente a posibles fallos en la restauración del disco duro. Aquí también se puede dar la perdida de información, pero requiere que más de dos unidades de almacenamiento fallen.

Para esta configuración RAID 6 se requieren de al menos cuatro unidades de disco duro. Destacar que esta configuración no es óptima si vamos a instalar muchas unidades de almacenamiento, ya que cuantos más discos duros, más probabilidad de fallo.

RAID 5E Y 6E. 

Variante que incluye unidades de disco duro adicionales en estado de preparados (hot spare) o en espera (standby spare). Son unidades disponibles para cualquiera de las unidades principales. Este sistema agrega unidades adicionales que reducen el tiempo de reconstrucción y labores de administración si hay fallos.

Las unidades en espera no conforman parte realmente del conjunto, pero están asociadas. El sistema de gestión, si detecta un fallo, utiliza esta unidad en reserva para reconstruir el sistema. Dicha configuración encarece el sistema pero aumenta la seguridad y reduce el tiempo de reconstrucción.

Otros tipos de RAID.

Más allá de estos RAID principales, también hay otros tipos de RAID que suelen ser combinaciones de los anteriores, pero que pueden ser útiles sobre todo cuando tienes cuatro o más discos duros disponibles para la configuración de la matriz. Estos son los otros tipos más comunes, denominados tambien como anidados:

  • RAID 0+1 o RAID 01: Requiere por lo menos cuatro discos duros, con los que crear al menos dos matrices RAID 0 con cada uno de los pares de discos. Entonces, luego compones una matriz de RAID 1 utilizando las dos matrices de RAID 0, por lo que tienes la velocidad de las 0 pero con los datos duplicados.
  • RAID 1+0 o RAID 10: Es la inversa a la anterior. Tienes que crear dos matrices RAID 1, y combinarlas para crear entre las dos una matriz RAID 0. También requiere de un mínimo de 4 discos duros.
  • RAID 3+0 o RAID 30:  Se basa este sistema en una combinación de dos conjuntos RAID 3 con división de los datos. Los datos se distribuyen entre los diferentes bloques que conforman este sistema. Posteriormente se hace una división en partes más pequeñas y se calcula la paridad mediante la aplicación de un XOR en cada uno. Aquí la información se escribe en todos los discos duros, salvo en el destinado a la paridad.
  • RAID 5+0 o RAID 50: Vas a necesitar al menos nueve discos duros, con los que crearás un mínimo de tres matrices RAID 5. Estas matrices, a su vez, se conectarán entre ellas formando una RAID 0.
  • RAID 6+0 o RAID 60: Se necesitan como mínimo 8 discos, con la posibilidad de que se puedan estropear hasta 4 discos sin perder datos. Obtenemos un alto rendimiento sobre todo en tareas de lectura.Las desventajas son las mismas a las del RAID 6 (rendimiento más bajo en escritura debido a los dos cálculos de paridad, y mayor gasto en hardware).
  • RAID 10+0 o RAID 100: Básicamente este es un conjunto de varias RAID 10 unidos mediante una RAID 0. Destacar que esta configuración se denomina también como RAID Cuadriculada.
  • Linux MD RAID 10: Sistema RAID propio del kernel de Linux denominado de múltiple disco (denominada md; multiple disk o disco múltiple). Lo interesante de este sistema es que igual permite crear una configuración RAID 1+0 convencional o un sistema único RAID 10 con ciertas extensiones.Dicho sistema permite el espejado de ‘k’ bloques en ‘n’ unidades cuando ‘k’ no es divisible por ‘n’. Se hace repitiendo cada bloque ‘k’ veces al escribirlo en un conjunto RAID 0 subyacente de ‘n’ unidades. Supone una equivalencia a una configuración RAID 10 convencional.

Diferencias entre RAID simple/standard  y RAID anidado.

Como hemos podido ver sobre estas líneas, la configuración RAID simple o estándar y la configuración RAID tienen propósitos diferentes y se diferencian principalmente en como queremos guardar la información.

Mientras que la configuración RAID simple utiliza únicamente una sola técnica (duplicación o distribución de datos), la configuración RAID anidada permite combinar diferentes técnicas para así obtener una mayor cantidad de espacio disponible combinando las unidades de almacenamiento y duplicación de datos para evitar su pérdida.

Eso a su vez, va ascociado a una mayor o menor complejidad a la hora de configurar el sistema. Mientras el RAID estándar, al utilizar una sola técnica es mucho más rápido y sencillo de configurar, la configuración múltiple de RAID anidado complica ligeramente la configuración.

Otra importante diferencia entre ambos tipos de RAID es el mínimo de discos duros necesarios. Mientras que RAID estándar requiere de un mínimo de 2 unidades, la configuración anidada requiere de un mínimo de 4 unidades de almacenamiento, por lo que requiere de una mayor inversión económica, tanto en discos duros como en dispositivos que pueda albergar dichas unidades de forma conjunta.

Las diferencias entre RAID estándar y RAID anidado enfocan su finalidad en el día a día. Mientras que RAID estándar es perfecto para usuarios domésticos y pequeñas empresas que no quieren tener una copia de seguridad de todos sus datos y accesible desde cualquier lugar, el RAID anidado está diseñado para entornos empresariales donde no se puede prescindir ni ninguna de las técnicas de RAID estándar.

Configuracion especial JBOD.

Vamos ahora con una configuración que tiene bastantes particularidades con respecto a las configuraciones RAID. Este tipo de configuración es comúnmente soportada por prácticamente cualquier sistema que soporta una RAID.

La configuración JBOD es realmente sencilla, pero no es bastante común su uso. Su principal inconveniente es que carece de redundancia de datos, como sucede en la agrupación RAID 0. Dicha configuración JBOD es el acrónimo de «Just a Bunch of Drives», que traducido sería «solo un montón de discos»

Esta configuración permite que cada unidad de almacenamiento sea independiente. Lo que permite es que, si una unidad sufre daños, solo se pierdan los datos de la unidad estropeada, mientras que el resto de discos duros sigue funcionando sin problemas. Vamos, que en realidad tenemos un gran disco duro virtual a partir de varias unidades de disco duro.


 Como decíamos, este tipo de configuración carece de redundancia de datos y tampoco ofrece mejoras de rendimiento. Simplemente permite crear una gran unidad de almacenamiento y si uno de los discos falla, podríamos seguir usando la unidad virtual creada.

Algo muy interesante es que podemos combinar unidades de almacenamiento de capacidades distintas. Las configuraciones RAID requiere que todos los discos duros sean del mismo tamaño o se ajustará a la capacidad de la unidad más pequeña. Este sistema «suma» las capacidades, permitiendo usar al mismo tiempo un disco de 500 GB, uno de 1 TB y uno de 4 TB, por ejemplo, para tener un disco de 5.5 TB.

¿Que configuraciones RAID puedo hacer en mi ordenador?. 

Cualquier ordenador soporta configuraciones RAID sin problemas, aunque no todas son soportadas a nivel doméstico. Aquí depende de dos factores: el fabricante del chipset y el modelo del mismo. El soporte RAID mayormente depende del chipset y, además, depende de las prestaciones del mismo. Así que puede ser que una placa base de gama alta soporte más configuraciones que una placa base de gama de entrada por el chipset que usa.

Intel ofrece soporte para las configuraciones RAID 0, 1, 5 y 10. AMD por su parte ofrece soporte para configuraciones RAID 0, 1 y 10. Lo normal es que ambos ofrezcan el mismo soporte para todas las gamas de chipset, pero puede no ser así. Esto se puede consultar en la web de Intel, pero no en la web de AMD ya que no ofrece esta información. Por otro lado, en la web del fabricante de la placa base, sabiendo el modelo, en la parte de especificaciones nos dirá que configuraciones RAID soporta tanto en SATA como en PCIe.

El motivo por el cual solo se soportan estas configuraciones está en que las configuraciones RAID 0, 1 y 10 son las consideradas interesantes para el usuario medio. La configuración RAID 5, pese a ser más avanzada, puede ser interesante por la paridad. Respecto al resto de configuraciones, algunas son difíciles de crear y otras muy costosas, dejándose solo para entornos profesionales.

 Otra opción posible es adquirir una controladora especifica. Las controladoras comerciales suelen soportar RAID 0, 1, 5, 6, 10, 50 y 60, e implementar un reducido número de conectores. El problema de las controladoras RAID es que son bastante caras, costando los modelos más económicos sobre los 120-150 euros, haciéndolas poco o nada atractivas.

¿Cuales son los mejores discos duros para hacer RAID?. 

No existen unidades específicas para configuraciones RAID, propiamente dichos. Las unidades de almacenamiento (ya sean SSD o HDD) enfocadas a configuraciones RAID se suelen catalogar como para NAS o Servidor. Estas unidades tienen características especiales, como mayor durabilidad.

Habitualmente, las unidades de almacenamiento para sistemas NAS se catalogan o identifican con el color rojo. Esta etiquetación nace de las unidades WD Red, que ha sido «imitado» por parte de la industria. Por ejemplo, Seagate los denomina como IronWolf, pero utiliza el color rojo para estas unidades de almacenamiento.

En caso de querer generar configuraciones RAID domésticas, como puedan ser del tipo 0, 1 y 5, que no van a tener una gran carga de trabajo, podríamos usar SSD. Solamente deberíamos fijarnos en los valores TBW (TeraBytes Writte) que nos dice la vida útil del SSD en ciclos de escritura. Nos dice la cantidad de información que podemos escribir antes de que presenten fallos.

No hay comentarios:

Publicar un comentario