Recuperacion de datos de RAID 5

Para la recuperación de datos de un RAID-5, se debe seguir un proceso diseñado para rescatar o reconstruir la mayor cantidad de archivos, con el menor riesgo de daño lógico o físico posible:

Este proceso de recuperación consta de 6 pasos:

1.- Protección del dispositivo.
2.- Diagnóstico de la falla.
3.- Determinación de los parámetros de operación.
4.- Reparación de emergencia.
5.- Clonado hacia discos «sanos».
6.- Reconstrucción y recuperación de datos.

Si necesita la recuperación de datos de servidores o NAS en RAID-5, solicite ayuda ahora!

Contenidos ocultar

1 Que es un arreglo RAID

2 Que es un RAID-5

3 Ventajas de RAID-5

4 Desventajas de RAID-5

5 Funcionamiento de un RAID-5

6 Síntomas comunes de falla

6.1 Síntomas de falla electrónica (externa o interna):

6.2 Síntomas de fallas mecánicas (internas):

6.3 Síntomas de fallas lógicas:

6.4 Síntomas de daño de firmware:

6.5 Síntomas de daño físico en los platos:

7 Tipos de falla en RAID-5

7.1 Ejemplos de fallas lógicas

7.2 Ejemplos de fallas físicas externas

7.3 Ejemplos de daños físicos internos

7.4 Otras causas de falla

8 Errores frecuentes al intentar la recuperación de datos de RAID-5

9 Daños no recuperables

10 Recuperación de datos de RAID-5

10.1 Protección del dispositivo.

10.2 Diagnóstico de la falla.

10.3 Determinación de los parámetros de operación.

10.4 Reparación de emergencia.

10.5 Clonado o Imagen.

10.6 Reconstrucción y recuperación de datos.

10.6.1 Verificación de integridad

10.6.2 Corrección de errores

10.6.3 Entrega de reporte de recuperación

10.6.4 Cobro y entrega de datos recuperados

11 CUIDADO

Que es un arreglo RAID

RAID (Redundant Array of Inexpensive Disks), describe la tecnología que permite combinar varios dispositivos físicos en una o más unidades lógicas.

RAID nos permite usar dos o más discos para:

– Almacenar grandes cantidades de información (sumando las capacidades de los discos)
– Aumentar el rendimiento (reduciendo el tiempo de acceso)
– Tener tolerancia a fallos (generando paridad de datos), o
– La combinación de los anteriores.

Que es un RAID-5

RAID-5 es un arreglo diseñado para sumar las capacidades de los discos y además, para tener tolerancia a fallos de una unidad.

Un RAID-5 de hardware requiere de al menos 3 discos de la misma capacidad y velocidad, aunque técnicamente puede haber otras combinaciones (RAID-5 de software, Synology Hybrid RAID o SHR, X-RAID2, etc.).

Ventajas de RAID-5

En primer lugar, nos permite acceder a particiones más grandes, al sumar las capacidades de los discos.

Debido al uso de una paridad distribuida, RAID-5 también ofrece tolerancia a fallos de una unidad.

Desventajas de RAID-5

Al dividirse los fragmentos de cada archivo entre los discos miembros, ningún disco físico por si solo contiene archivos completos (por ejemplo, en un RAID-5 de 3 discos, cada disco físico contiene partes de cada archivo y un algoritmo para calcular las partes restantes).

Si un solo disco falla, el servidor se alarma, indicando qué disco falló (al disco que falla se le llama «fuera de línea»).

Aun con un disco dañado, el servidor sigue funcionando en modo «degradado». Esto permite al administrador del sistema sustituir el disco dañado por otro de iguales características.

A continuación, de manera automática o semiautomática, dependiendo de las capacidades del servidor, se reconstruye la paridad para volver a tener la tolerancia a fallos.

Si fallan dos discos, dejamos de tener acceso a los archivos y no se deben agregar discos nuevos para evitar la corrupción de los datos.

Por eso se dice que el RAID-5 solo es tolerante al fallo de una unidad.

Funcionamiento de un RAID-5

A manera de ejemplo, si tenemos 3 discos físicos de 1 Tb, podemos configurarlos en RAID-5 para tener una partición lógica de aproximadamente 2Tb y tolerancia a fallos de una unidad.

Síntomas comunes de falla

Estos síntomas se deben interpretar tomando en cuenta los antecedentes, el historial para la marca y modelo de discos, la experiencia al trabajar con múltiples marcas y modelos de discos, etc.

Ningún síntoma por si solo indica con certeza del tipo de falla al que nos enfrentamos, pero puede darnos pistas importantes para deducirlo.

Es probable que tengamos que hacer más pruebas para descubrir la naturaleza de la falla.

Síntomas de falla electrónica (externa o interna):

– El disco recibe energía pero no hay sonido o vibración perceptibles.
– Se escucha un sonido leve pero el motor no gira.
– Se escucha un sonido de click o un zumbido.
– Algunos componentes de la PCB se calientan en exceso.
– El disco enciende, gira y se apaga.

Síntomas de fallas mecánicas (internas):

– Sonidos de click, de rayado, choque de metal o golpeteo.
– Hay vibración o sonido leves pero el motor se siente trabado.
– El disco emite sonidos electrónicos, como pitidos o tonos musicales.

Síntomas de fallas lógicas:

– No hay acceso a los datos por borrado, formateo o corrupción.
– Se reportan errores de sistema, actualización o de programas.
– Virus, malware, ransomware.
– Daños a la información por sobrescritura de datos.
– Otros daños lógicos.

Síntomas de daño de firmware:

– El disco enciende y se mantiene encendido pero no es detectado.
– El disco es detectado pero con un modelo o capacidad diferentes al especificado en la etiqueta.
– El disco es detectado pero aparecen símbolos sin sentido.

Síntomas de daño físico en los platos:

– El sistema reporta daño de sectores.
– El sistema operativo reporta error de hardware.
– El disco reporta formato RAW.
– El disco pide formato.
. El disco marca error 23.
– El disco marca error de redundancia cíclica.
– El disco marca errores de entrada y salida, E/S o I/O.
– El disco reporta mal estado o errores SMART.
– En el SMART, se ven errores de CRC.
– No es posible acceder a folders o archivos.
– Los archivos aparecen corruptos, incompletos, con símbolos extraños.
– Los archivos y programas no se pueden abrir o ejecutar.
– El sistema se hace muy lento.
– A veces es posible leer pero no escribir, o viceversa.
– Aparecen carpetas FOUND con archivos .chk.

Existen otros síntomas de daño como pueden ser componentes que se calientan en exceso, aceites o líquidos que escurren del interior del disco, etc.

Tipos de falla en RAID-5

Los discos de los arreglos RAID-5 pueden sufrir fallas de tipo lógico, mecánico o electrónico, y estas pueden ser internas o externas.

También es muy probable que una falla de lugar a otras, como cuando un choque del cabezal ocasiona daño de sectores y contaminación, lo que se traduce en una lectura incompleta y daño lógico a los archivos.

Ejemplos de fallas lógicas

– Virus.
– Formateo.
– Borrado.
– Errores de actualización.
– Errores del sistema de archivos.
– Otros daños lógicos.

Ejemplos de fallas físicas externas

– Daños a la tarjeta controladora PCB (quemada, rota o desprogramada).
– Algunos daños de firmware.
– Algunos daños de sectores leves (formato RAW, error de redundancia cíclica).
– Algunos daños de pista cero.
– Otras fallas que se pueden recuperar con ayuda de equipo especial.
– Otros daños que no requieren la apertura del disco en laboratorio.

Ejemplos de daños físicos internos

– Daño de cabezal.
– Daño de motor.
– Daño de servomotor.
– Daño de preamplificadores.
– Daño de sectores grave.
– Daños al área de sistema (SA) o firmware.
– Contaminación por apertura o líquidos.
– Head crash o choque de cabezal leve.
– Head stiction, que es cuando el cabezal se adhiere a la superficie de los platos internos.
– Rotational scoring, que es cuando se daña la superficie de uno o mas platos internos.
– Otros daños físicos internos.

Otras causas de falla

No debemos olvidar que un servidor en RAID es un sistema complejo, cuyo funcionamiento depende de muchos dispositivos interconectados.

Por eso, para hacer un análisis correcto debemos considerar todas las fallas posibles.

Ejemplo de falla lógica:

Una causa de falla común es cuando la tarjeta controladora de RAID tiene alguna configuración especial diferente a la predeterminada.

Si la pila está en mal estado o no sirve y el servidor se apaga o se reinicia, esto puede causar que la tarjeta cambie a su configuración original, y por lo tanto, aunque reconozca los discos físicos, no puede recuperar los parámetros de operación del RAID original.

Si ese fuera el caso, los discos aparecerán como si no tuvieran formato, a pesar de que la información aun existe.

La tarjeta controladora del RAID no puede detectar el arreglo lógico, porque no es su función ni está diseñada para eso.

Errores frecuentes al intentar la recuperación de datos de RAID-5

El desconocimiento de la forma en que trabaja un RAID-5 lleva a cometer errores que son destructivos para la información.

Por ejemplo, al escanear un disco por horas para después encontrar que el cabezal se quemó al tratar de leer sectores dañados en exceso.

Otros errores frecuentes son:

– Intentar la recuperación sin un plan o sin saber como funciona un RAID-0.
– Suponer que la recuperación es algo fácil de hacer o que se puede lograr solo con programas.
– Pensar que las cosas no pueden empeorar o que los datos no se pueden destruir.
– Intentar soluciones mágicas o sacadas de YouTube.
– Fallas al determinar el tipo de RAID y el tipo de daño.
– Problemas para determinar los parámetros de operación.
– Realizar acciones que no son reversibles, como la sobrescritura de datos.
– Agregar discos vacíos al arreglo.
– Cambiar los discos de posición.
– Reinstalar el sistema operativo.
– Mover los discos a otro servidor o NAS.

Es común recibir casos en los que supuestamente se tenía RAID-5, falla un disco y ya no hay acceso a datos.

Esto puede deberse a:

– Errores en la configuración o mal funcionamiento de la tarjeta controladora de RAID.
– Que no se trataba de un RAID-5 (podría ser otro tipo de RAID o discos sin RAID).
– Que ya había fallado un disco y traen el caso cuando falla el segundo disco.
– Se trataba de un RAID de software, SHR o de otro tipo.
– Otros escenarios posibles.

No debemos olvidar que un RAID-5 solo es tolerante a fallos de una unidad, y que los daños en un disco afectan a toda la información.

Daños no recuperables

Son aquellos que afectan especialmente a los datos o que destruyen el medio de almacenamiento:

– Sobrescritura de datos, al formatear, mover los discos de posición o al agregar nuevos discos vacíos.
– Corrupción o destrucción del firmware (externo en el chip o interno en áreas de sistema).
– Daños internos o externos por líquidos.
– Daño grave a la superficie de los platos magnéticos internos, por cualquier causa.
– Contaminación por apertura.
– Contaminación por fragmentos (debris), después de un Head Crash.
– Head crash o choque de cabezal grave.
– Head stiction, si no se recupera con herramienta y cuidados especiales.
– Rotational scoring, cuando hay destrucción de la superficie de uno o más platos magnéticos internos.
– Rotura de los platos magnéticos internos.
– Daño a partes electrónicas o a los platos magnéticos por altas temperaturas o fuego.
– Otros daños físicos internos graves.

Recuperación de datos de RAID-5

Para la recuperación de datos de un RAID-5, debe seguir un proceso diseñado para rescatar o reconstruir la mayor cantidad de archivos, con el menor riesgo de daño lógico o de daño físico posible:

Este proceso de recuperación consta de 6 pasos:

1.- Protección del dispositivo.
2.- Diagnóstico de la falla (y cotización).
3.- Determinación de los parámetros de operación.
4.- Reparación de emergencia.
5.- Clonado hacia discos «sanos».
6.- Reconstrucción y recuperación de datos.

Protección del dispositivo.

Si ya no tiene acceso a sus datos es indispensable que apague el servidor o NAS, pues de no hacerlo se expone cuando menos a la sobrescritura involuntaria de información, lo cual puede ocasionar la destrucción de sus archivos.

Debe marcar los discos con etiquetas adheribles para recordar su posición en el servidor o NAS.

Debe anotar la marca y modelo del servidor, de la tarjeta controladora RAID, o de la unidad NAS, así como de los discos físicos, tipo de interfaz (IDE-SAS-SATA-SCSI-etc.), sistema de archivos y sistema operativo.

Hay que investigar y anotar los antecedentes de la falla (apagones, golpes, vibraciones, alarmas, etc.) y los síntomas (sonidos, errores de sistema, presencia de humo, fuego o líquidos, olor a quemado, etc.).

También debemos saber si hubo algún intento previo de recuperación, y si fue así, solicitaremos un reporte de las acciones que llevaron a cabo, y/o si hubo sobrescritura de datos o sustitución de discos.

No debe utilizar discos en mal estado físico porque esto puede llevar a daños a la superficie de los platos internos, lo que puede causar la destrucción de los datos.

Los dispositivos deben protegerse muy bien contra daños golpes o mojaduras, durante el traslado al laboratorio, y no deben conectarse a ningún equipo de manera individual, ni con adaptadores (USB o de otro tipo), para prevenir mas daño.

Tampoco debe permitir la apertura de los discos fuera de laboratorio, pues no hay partes que pueda ajustar o cambiar y por otro lado, se complica mucho la recuperación por la contaminación y manipulación inadecuadas.

Diagnóstico de la falla.

Antes de conectar cualquier disco debemos saber si estaba alarmado, o si emite algún sonido distinto al de su funcionamiento normal (como pitidos o golpeteo), lo que puede indicar un daño físico interno.

Conocer los antecedentes y síntomas nos ayudará a elegir el método de recuperación adecuado para el caso.

Es muy importante proteger los discos originales contra escritura involuntaria o corto circuito, lo que solo se logra correctamente con equipo especial (bastante costoso), como la PC-3000.

Acerca de la PC-3000

Este hardware de diagnóstico y recuperación protege contra corto circuito y comprueba el voltaje de los componentes de la PCB y el estado del motor.

Nos permite verificar la version de firmware, capacidad, numero de serie, modelo, familia y otros parámetros para diagnosticar, confirmar o descartar fallas probables.

También podemos consultar el estado SMART, editar o reparar el firmware, y reprogramar componentes para hacer reparaciones de emergencia.

Los discos sin falla y sin errores de SMART pasan directamente al paso 5.- CLONADO.

Costo de recuperación de datos

El costo de la recuperación de datos se calcula principalmente por el tipo de falla pues de eso depende el método de recuperación, precio de refacciones e insumos, mano de obra especializada, uso de instalaciones y equipo especial, entre otros.

Los trabajos se inician una vez que se autoriza el presupuesto total, y se divide en dos partes:

– Costo de Diagnóstico (que incluye refacciones e insumos).
– Costo de Recuperación.

Solicite una cotización personalizada para su caso en nuestra página de CONTACTO o llame al 55-4522-9785 para que un especialista le atienda de inmediato.

Determinación de los parámetros de operación.

Si hay acceso a discos en buen estado (o a sus clones) podemos determinar los parámetros de operación, que son las reglas de funcionamiento del RAID.

Los clones o imágenes de disco se analizan para determinar el orden, rotación, paridad, tamaño de sector, desplazamiento, sistema de archivos, sistema operativo, tipo de encriptado, etc.

Reparación de emergencia.

Una vez que sabemos el tipo de falla, que se ha autorizado el presupuesto y se ha pagado el diagnóstico, se pueden hacer cambios de piezas o las reparaciones de emergencia que se requieran (lógicas, físicas, electrónicas, mecánicas, externas o internas), que permitan leer los sectores secuencialmente para generar un archivo de «imagen» o «clon».

Clonado o Imagen.

A manera de ejemplo, podemos imaginar que los archivos son como rompecabezas, y sus fragmentos son las partes que los forman.

Entonces hacer el clonado es el equivalente a reunir todas las piezas de los rompecabezas que forman los archivos.

Acerca de la probabilidad de recuperación de datos de RAID-5

Si la extensión del daño lo permite y la reparación de la falla es exitosa, se puede llegar a lograr la lectura del 100% de los sectores, para tener acceso al 100% de los datos.

Esto es más probable cuando existe algún daño electrónico, pues este tipo de falla rara vez afecta la integridad de los platos magnéticos.

Aun si solo se consigue un clonado o imagen parcial, todavía puede ser posible la recuperación parcial o total de los datos.

En otros casos, cuando hay daño físico de cabezal HSA o de sectores, head crash, head stiction, rotational scoring o sobrescritura, puede ser que la lectura de los sectores sea parcial, y por lo tanto, la recuperación también es parcial y puede verse afectada la integridad de los archivos.

Si dos de los discos de un RAID-5 no se pueden reparar o leer, no es posible la recuperación.

Reconstrucción y recuperación de datos.

Una vez que tenemos las imágenes o clones de los discos, usamos los parámetros de operación para extraer, reconstruir y recuperar los archivos.

Verificación de integridad

Se verifica que la información reconstruida o recuperada sea funcional, pues de nada sirve tener archivos «recuperados» que no funcionan.

Existen varias técnicas y herramientas que nos permiten verificar la integridad de grandes cantidades de archivos con relativa facilidad, por lo que no necesariamente debemos abrir cada uno de ellos, ni instalar los programas con los que fueron creados.

Corrección de errores

Si detectamos que hay archivos que no funcionan, se pueden realizar reparaciones de emergencia para muchos tipos de archivo conocidos (docx, xlsx, jpg, pdf, pst, sql, mdf, ldf, etc.).

Esto no significa que cualquier archivo dañado se pueda reparar, por lo que se debe analizar caso por caso antes de dar un dictamen final.

La reparación de archivos puede ser automática, semiautomática o manual, según sea necesario.

Entrega de reporte de recuperación

En este punto ya podemos emitir un listado de archivos recuperables y el reporte de su estado actual, para que el usuario sepa qué se puede recuperar y en qué estado se encuentra la información.

En algunos casos podemos darle acceso vía Anydesk para la revisión de sus archivos en línea.

Cobro y entrega de datos recuperados

Una vez que se da el visto bueno a la recuperacion de los datos, se realiza el pago por ese concepto para tener acceso a los archivos.

La información recuperada se puede entregar en el dispositivo de su preferencia (no incluido en el costo del servicio).

CUIDADO

El mal funcionamiento o la lentitud de un sistema puede tener muchas causas, como sectores defectuosos o daños físicos en el disco duro.

Todos los daños (lógicos o físicos, externos o internos, electrónicos o mecánicos) son progresivos y destructivos para la información.

La aplicación incorrecta de herramientas como sfc, chkdsk, Scandisk, dism, o de programas de recuperación de datos puede sobrescribir sus archivos, destruyendo la información o dañando el disco duro sin remedio.

La actualización (o la destrucción) del firmware en un RAID también tiene efectos catastróficos para la información.

Si los datos son importantes, lo mejor es acudir a un profesional.

Si tiene dudas acerca del proceso o necesita la recuperación de datos de servidores o NAS en RAID-5, solicite ayuda ahora!