Guía completa de configuraciones RAID más importantes

configuraciones RAID más importantes

Lo prometido es deuda. Hace unas semanas os comentamos que haríamos una recopilación de la guía de configuraciones RAID más importantes que publicamos dividida en varias partes, algo que sin duda os facilitará cualquier labor de consulta, ya que al condensar toda la información en un artículo sólo necesitáis añadir una página a vuestros favoritos para poder acceder a ella en cualquier momento.

Sin más dilación os dejamos a continuación la guía estructurada en base a una división simple, de forma que su visualización resulta agradable y facilite, de nuevo, la realización de cualquier consulta.

Introducción.

Las configuraciones RAID suscitan muchas dudas incluso entre los usuarios más avanzados, que en ocasiones pueden llegar a sentirse perdidos a la hora de identificar adecuadamente las ventajas y desventajas de las diferentes alternativas que ofrecer dichas configuraciones.

En esta guía os iremos mostrando una a una todos los detalles que debéis conocer de las configuraciones RAID más populares y utilizadas a día de hoy, tanto a nivel particular como profesional, pero antes de entrar directamente en materia aclararemos algunos puntos esenciales.

El primero es, obviamente, concretar qué es una configuración RAID, y la respuesta es bastante sencilla. Las siglas RAID significan «conjunto redundante de discos independientes», o dicho de una manera más sencilla, indican una configuración basada en varias unidades de almacenamiento que trabajan de forma conjunta.

Por otro lado debemos tener claro que dentro de una configuración RAID el modo por el que optemos influye, y mucho, aunque fundamentalmente a dos niveles, rendimiento y seguridad de nuestros datos, un binomio en el que debemos optar en mayo medida por uno u otro de los dos beneficios mencionados.

Hechas estas pequeñas aclaraciones entramos a revisar directamente cada una de las principales modalidades RAID que podemos utilizar comenzando, eso sí, por las dos más comunes y frecuentes, la RAID 0 y la RAID 1.

RAID 0.

Es sin duda una de las más conocidas, y también de las más utilizadas, especialmente a nivel particular.

Este tipo de RAID distribuye los datos entre todas las unidades de almacenamiento que la forman. Su principal ventaja es que ofrece un mayor rendimiento de los datos, es decir, una mayor velocidad de trabajo.

461px-Raid0

Lamentablemente esta gran ventaja tiene también un importante inconveniente, y es que precisamente al carecer de redundancia (control de errores mediante copias redundantes de datos) cualquier fallo o avería en uno de los discos puede suponer una pérdida total de los datos.

¿Es interesante entonces utilizar este modo RAID?

Pues lo cierto es que RAID 0 es una gran opción cuando nuestro objetivo principal es obtener un mayor rendimiento, especialmente si contamos con presupuestos ajustados, ya que con unidades modestas podemos mejorar sensiblemente el rendimiento.

Obviamente a lo dicho debemos, una vez más, plantear el «pero» que expusimos anteriormente, la ausencia de redundancia en la copia de datos.

Con todo, es evidente que este inconveniente tiene una solución bastante simple, como por ejemplo realizar copias de seguridad de nuestros datos en unidades externas de almacenamiento o, porque no, en la nube.

¿Es realmente significativa la mejora de velocidad bajo RAID 0?

De nuevo la respuesta es afirmativa, ya que puede resultar hasta dos veces más rápida que una configuración basada en un solo disco duro.

RAID 1.

También conocido como «mirroring» o «modo espejo», es sin duda una de las configuraciones más populares a día de hoy.

El modo RAID 1 trabaja en espejo, duplicando todos los datos de cada unidad de almacenamiento de forma sincronizada a otra unidad de almacenamiento.

De esta forma si se produce un fallo o avería en alguna de las unidades no perderemos ningún dato. Así, queda claro que la gran ventaja de utilizar una configuración RAID 1 es la seguridad a prueba de fallos que presenta, ya que en caso de que se estropee uno de los discos nuestros datos estarán a salvo en los restantes.

461px-Raid1

Junto a esta debemos exponer otra ventaja que, probablemente, resulta menos visible, pero que está ahí.

Dicha ventaja es que al estar los datos duplicados se disfruta de de un mayor rendimiento de lectura, ya que se pueden leer dos datos diferentes en dos discos diferentes, a pesar de que el conjunto actúa a la hora de escribir como si sólo hubiera un disco.

El lado negativo de este tipo de configuraciones es claro: el gran sacrificio de espacio que supone. Sí, al trabajar en modo espejo se realizan copias redundantes de datos, de forma que si tenemos, por ejemplo, dos HDDs de 1 TB en RAID 1 no disfrutaremos de 2 TB totales de espacio, sino de 1 TB, ya que el segundo TB será utilizado para las grabaciones redundantes.

Esto supone que el rendimiento a nivel de escritura no mejora, ya que los datos deben ser escritos en todas las unidades de almacenamiento que dan vida a la configuración RAID 1.

¿Merece la pena utilizar esta configuración RAID?

Pues todo depende de nuestras necesidades, aunque es evidente que la configuración RAID 1 va dirigida en mayor medida al sector profesional, donde la seguridad e integridad de los datos e información sea primordial.

Con todo también puede ser una solución interesante para usuarios particulares, ya que el coste de montar una configuración RAID 1 no es tampoco nada disparatado.

¿Seguridad o velocidad?

Llegados a este punto la conclusión es clara y la expondremos de la forma más sencilla posible. ¿Buscas seguridad? Lo tuyo es montar un RAID 1. ¿Buscas velocidad y no te importa hacer copias de seguridad periódicas «por si acaso»? Entonces debes optar por RAID 0.

RAID 10 (0+1) y RAID 01.

Como dijimos una RAID 10 es, en esencia, la combinación de una RAID 0 y una RAID 1. La ventaja de utilizar una RAID 10 es que podremos contar con la redundancia de la RAID 1, esto es, las copias de seguridad redundantes, y del buen nivel de rendimiento de una RAID 0.

raid 10 xm2

Como podemos ver en la imagen la RAID 10 se divide en una estructura muy concreta, utilizando cuatro unidades de almacenamiento en las que se establece entre cada par una RAID 1, dando lugar a un subconjunto que es agrupado finalmente en sus cuatro unidades como una RAID 0.

Así, en cada subdivisión RAID 1 podrían fallar tres de los cuatro discos y no perderíamos los datos. Con todo, si no cambiamos los discos que han fallado el restante pasa a ser un punto único de fallo para todo el conjunto.

De esta manera si ese disco falla sí perderemos la totalidad de los datos que tengamos.

Ahora que hemos entrado un poco en materia debemos destacar que hay una variante de esta RAID, conocida como RAID 01. En esta se dividen los datos entre múltiples discos, y después se duplican en espejo los discos distribuidos en un grupo de discos idéntico.

raid 01 02mx

Como podemos ver en la segunda imagen su esencia es idéntica a la RAID 10, sólo que en vez de dos subdivisiones RAID 1 encontramos dos subdivisiones RAID 0. Esta configuración es menos segura que la RAID 10, ya que no tolera dos fallos simultáneos, de tal manera que cuando un disco falla la subdivisión restante pasa a ser un punto único de fallo para todo el conjunto.

¿Merece la pena utilizar estas configuraciones?

Teniendo en cuenta que hablamos de configuraciones RAID con cuatro discos duros queda claro que no resultan la mejor opción para un usuario corriente, sobre todo teniendo en cuenta su complejidad y alto coste de mantenimiento.

Con todo no podemos negarlo, una configuración RAID 10 es una gran elección, ya que nos permite disfrutar de la mejora de rendimiento de una RAID 0 y de la seguridad de una RAID 1.

¿Seguridad o velocidad? No, mejor las dos.

Como vemos en este caso sí se puede tener todo, pero a cambio tenemos que estar dispuestos, como dijimos, a lidiar con las complejidades que ofrece una configuración RAID 10 con cuatro discos duros.

A pesar de lo dicho debemos terminar con un apunte claro, y es que para el sector profesional dicha configuración es, probablemente, la mejor elección.

RAID 5.

En un intento de dar una definición sencilla sobre la RAID 5 podemos decir que esta configuración busca ofrecer un rendimiento similar a una RAID 0, pero con una redundancia más económica que las RAID 1 siendo,  como decimos, el más habitual en el sector empresarial.

800px-Raid5

Dentro de una RAID 5 encontramos un mínimo de tres discos duros, en los cuales los datos se dividen en bloques. Os explico la imagen. Si el equipo quiere leer el dato A1 el encargado de servirlo es el disco cero. Bien, si el equipo necesita también el dato B1 tendría que esperar, ya que el disco está sirviendo el dato A1, pero si necesita el dato B2 éste sí podría ser servido a la vez, ya que se encargaría el disco 1.

Así, podemos realizar operaciones de lectura y escritura de forma solapada, lo que redunda en un mayor rendimiento y una mayor eficiencia.

Bien pero, ¿cómo se protegen los datos? La clave reside en los bloques de paridad, que se utilizan para reconstruir los datos si una unidad del grupo RAID falla.

Así, cada vez que se escribe un bloque de datos (A1, A2, étc) en una RAID 5 se genera un bloque de paridad dentro de la misma división, que como decimos puede ser recuperado y recalculado junto con los demás bloques de datos en caso de fallo.

Dicho de forma simple por si aún estáis confusos, viene a ser una especie de recolecta de «trocitos» de datos de las distintas unidades de almacenamiento.

Evidentemente esto ayuda a reducir considerablemente los costes que la redundancia supone en términos de almacenamiento disponible, lo que a su vez supone un menor coste económico para la empresa.

¿Es interesante utilizar esta configuración?

Como dijimos a nivel empresarial es una solución muy interesante y, de hecho, la más popular actualmente en dicho sector.

Con todo, debemos tener en cuenta si vamos a utilizar unidades SATA de gran capacidad  que este tipo de soluciones de almacenamiento presentan ciclos de trabajo más cortos que otros tipos de unidades, como las SAS.

Junto a esto debemos tener en presente también que en los discos duros SATA de gran tamaño (a partir de 500 GB) los tiempos de reconstrucción son más largos, un hecho que a medio plazo podría producir una degradación del rendimiento del controlador.

Os explico esto último con un ejemplo. Imaginad que tenéis una RAID 5, falla una unidad SATA y la sustituimos, ya que de lo contrario un nuevo fallo en otra unidad nos haría perder todos los datos.

Pues bien, cuando la hayamos sustituido deberemos llevar a cabo un proceso de reconstrucción, donde se tomarán los bloques paridad de cada unidad existente. Este proceso puede alargarse enormemente, así que si realmente vamos a decantarnos por utilizar una RAID 5 la mejo opción son los HDDs SAS.

RAID 6.

Estamos ante una configuración idéntica a una RAID 5, con la salvedad de que utiliza una segunda banda de paridad que se distribuye también entre todos los discos de la RAID,  lo que aumenta a cuatro el número mínimo de unidades de almacenamiento necesarias.

800px-Raid6

Esto nos deja una gran ventaja frente a la RAID 5, y es que dicha segunda banda de paridad actúa como protección ante una posible pérdida de datos en caso de fallo o avería que afecte a una segunda unidad dentro del grupo RAID.

Gracias a lo expuesto el uso de unidades SATA de gran capacidad es más viable en esta configuración.

Como era de imaginar la RAID 6 plantea inconvenientes, siendo uno de los principales su bajo nivel de rendimiento cuando necesitamos realizar la reconstrucción de dos unidades de forma simultánea, ya que dicho rendimiento llega a caer hasta el 20%.

Otro problema que presenta la RAID 6 es la capacidad real de almacenamiento de que podremos disponer. Os lo explico con un ejemplo, si tenemos una RAID 6 con cuatro discos duros el espacio equivalente a dos de ellos se dedica a la paridad.

Esto quiere decir que si utilizamos cuatro discos duros de 1 TB cada uno dispondremos en realidad de 2 TB de espacio, ya que los otros 2 TB se dedican a paridad.

Con todo, si aumentamos el número de discos duros utilizados en esta RAID la proporción de espacio real disponible mejora.

¿Es interesante utilizar esta configuración?

Sí, es una solución interesante, dado que ofrece una mayor protección frente a la pérdida de datos, ya que protege frente a fallos dobles de discos e incluso durante la reconstrucción de un disco, pero debemos tener en cuenta dos aspectos muy importantes.

Por un lado el coste. Una RAID 6 de cuatro discos es, como dijimos, poco eficiente, ya que el espacio de almacenamiento del que podremos disponer será del 50%.

En consecuencia para mejorar la eficiencia de una RAID 6 es recomendable montar al menos 6 unidades de almacenamiento, ya que la paridad se reparte en distintas divisiones entre todos los discos duros que integran la RAID. De esta forma si contamos con 6 discos duros de 1 TB en una RAID 6 dispondremos en realidad de 4 TB de espacio.

Por otro lado a nivel de rendimiento debemos tener en cuenta que una RAID 6 no penaliza en operaciones de lectura, pero sí que notaremos un efecto negativo en las de escritura, como consecuencia de los cálculos adicionales de las labores de paridad.

Podemos concluir que esta RAID va orientada, al igual que la RAID 6, al sector profesional, donde la seguridad de los datos tenga una gran relevancia, tanto como para justificar la mayor inversión que supone frente a una RAID 5.

RAID 50.

Podemos definir una RAID 50, de forma simple y llana, como una configuración que coge bloques de RAID 5 y los distribuye formando una única RAID 0, tal y como podemos ver en la imagen.

800px-RAID_50

Sí, como habrá anticipado más de uno de vosotros esta configuración nos recuerda a la RAID 10, ya que en esencia lo que busca es ofrecer lo mejor de una RAID 5 y una RAID 0.

De esta forma con una RAID 50 podremos disfrutar de la paridad distribuida que ofrece una configuración RAID 5, pero también del buen nivel de rendimiento que caracteriza a una RAID 0.

Gracias a dicha paridad un disco de cada conjunto RAID 5 puede fallar sin que nos expongamos a perder ningún dato. Con todo, si no sustituimos el disco que ha fallado los discos restantes de dicho conjunto se convierten en un punto único de fallo para todo el conjunto.

Esto quiere decir que si falla otro disco dentro del mismo conjunto perderemos todos los datos. El tiempo necesario de recuperación (detectar y responder al fallo de disco y reconstruir el conjunto sobre el nuevo disco) representa un periodo de vulnerabilidad del conjunto RAID.

Para aclarar posibles dudas lo explicamos con un ejemplo. Bajo esta configuración un conjunto de siete discos ofrece la mayor capacidad y eficiencia de almacenamiento, debido al tema de la paridad distribuida que os explicamos al hablar sobre la RAID 5, pero ofrece una tolerancia máxima de tres fallos potenciales de disco, uno por cada conjunto.

¿Merece la pena utilizar esta configuración?

De nuevo nos encontramos ante una solución que resulta interesante para el sector empresarial y profesional, ya que presenta un coste muy elevado, tanto de inicio como de mantenimiento.

En este sentido debemos destacar que, por ejemplo, el conjunto sufre un estrés máximo durante la reconstrucción de un disco fallido, ya que es necesario leer cada bit de información, lo que aumenta la vulnerabilidad de cada conjunto de discos.

A pesar de estas desventajas es importante tener en cuenta que una RAID 50 mejora en gran medida el rendimiento de una RAID 5, especialmente a nivel de escritura, ofreciendo  a su vez una tolerancia a fallos relativamente buena.

Dicho esto podemos concluir que esta configuración resulta recomendable para aquellos que busquen una gran tolerancia a fallos sin renunciar a un alto nivel de capacidad y a un buen rendimiento aunque, eso sí, siempre que estén dispuestos a aceptar su elevado coste.

Artículo AnteriorSiguiente Artículo
Editor de la publicación on-line líder en audiencia dentro del canal de distribución. Al día de todas las tecnologías que pueden marcar tendencia en la industria.