Para la recuperación de datos de un RAID-1, se debe seguir un proceso diseñado para rescatar o reconstruir la mayor cantidad de archivos, con el menor riesgo de daño lógico o físico posible:
Este proceso de recuperación consta de 6 pasos:
1.- Protección del dispositivo.
2.- Diagnóstico de la falla.
3.- Determinación de los parámetros de operación.
4.- Reparación de emergencia.
5.- Clonado hacia discos «sanos».
6.- Reconstrucción y recuperación de datos.
Si necesita la recuperación de datos de servidores o NAS en RAID-1, solicite ayuda ahora!
Que es un arreglo RAID
RAID (Redundant Array of Inexpensive Disks), describe la tecnología que permite combinar varios dispositivos físicos en una o más unidades lógicas.
RAID nos permite usar dos o más discos para:
– Almacenar grandes cantidades de información (sumando las capacidades de los discos)
– Aumentar el rendimiento (reduciendo el tiempo de acceso)
– Tener tolerancia a fallos (generando paridad de datos), o
– La combinación de los anteriores.
Que es un RAID-1
RAID-1 es un arreglo diseñado para tener tolerancia a fallos de una unidad física, pues todos los datos se escriben en ambos discos al mismo tiempo (por eso se le llama «espejo»).
Un RAID-1 de hardware requiere de al menos dos discos de la misma capacidad y velocidad, aunque técnicamente puede haber otras combinaciones (RAID-1 de software, Synology Hybrid RAID o SHR, X-RAID2, etc.).
Ventajas de RAID-1
Si uno de los discos deja de funcionar o no es accesible, el servidor (o NAS) entra en un modo que se conoce como «degradado» y se alarma para indicar qué disco falló.
La ventaja principal es que aun con el servidor degradado, seguimos teniendo acceso a los datos desde cualquiera de los dos discos que aun funcione.
Esto permite que podamos sustituir el disco dañado por otro igual, para que el servidor (automática o manualmente), copie los datos del disco que todavía funciona hacia el disco nuevo, para volver a tener la tolerancia a fallos de una unidad.
Por eso se dice que el RAID-1 es tolerante a fallos de una unidad.
En este tipo de arreglo la velocidad de acceso no cambia, y sigue siendo la misma que la del disco mas lento del grupo.
Desventajas de RAID-1
La principal desventaja es que cualquier error lógico se replica instantáneamente de un disco físico al otro.
Esto puede ser un problema cuando, por ejemplo, borramos y sobrescribimos un archivo, o si existiera una infección de virus o ransomware.
Es muy importante entender que RAID-1 no es lo mismo que tener un respaldo de los datos.
Funcionamiento de un RAID-1
A manera de ejemplo, si tenemos dos discos físicos de 1 Tb, podemos configurarlos en RAID-1 para tener una partición lógica de aproximadamente 1 Tb y tolerancia a fallos de una unidad.
Síntomas comunes de falla
Estos síntomas se deben interpretar tomando en cuenta los antecedentes, el historial para la marca y modelo de discos, la experiencia al trabajar con múltiples marcas y modelos de discos, etc.
Ningún síntoma por si solo indica con certeza del tipo de falla al que nos enfrentamos, pero puede darnos pistas importantes para deducirlo.
Es probable que tengamos que hacer más pruebas para descubrir la naturaleza de la falla.
Síntomas de falla electrónica (externa o interna):
– El disco recibe energía pero no hay sonido o vibración perceptibles.
– Se escucha un sonido leve pero el motor no gira.
– Se escucha un sonido de click o un zumbido.
– Algunos componentes de la PCB se calientan en exceso.
– El disco enciende, gira y se apaga.
Síntomas de fallas mecánicas (internas):
– Sonidos de click, de rayado, choque de metal o golpeteo.
– Hay vibración o sonido leves pero el motor se siente trabado.
– El disco emite sonidos electrónicos, como pitidos o tonos musicales.
Síntomas de fallas lógicas:
– No hay acceso a los datos por borrado, formateo o corrupción.
– Se reportan errores de sistema, actualización o de programas.
– Virus, malware, ransomware.
– Daños a la información por sobrescritura de datos.
– Otros daños lógicos.
Síntomas de daño de firmware:
– El disco enciende y se mantiene encendido pero no es detectado.
– El disco es detectado pero con un modelo o capacidad diferentes al especificado en la etiqueta.
– El disco es detectado pero aparecen símbolos sin sentido.
Síntomas de daño físico en los platos:
– El sistema reporta daño de sectores.
– El sistema operativo reporta error de hardware.
– El disco reporta formato RAW.
– El disco pide formato.
. El disco marca error 23.
– El disco marca error de redundancia cíclica.
– El disco marca errores de entrada y salida, E/S o I/O.
– El disco reporta mal estado o errores SMART.
– En el SMART, se ven errores de CRC.
– No es posible acceder a folders o archivos.
– Los archivos aparecen corruptos, incompletos, con símbolos extraños.
– Los archivos y programas no se pueden abrir o ejecutar.
– El sistema se hace muy lento.
– A veces es posible leer pero no escribir, o viceversa.
– Aparecen carpetas FOUND con archivos .chk.
Existen otros síntomas de daño como pueden ser componentes que se calientan en exceso, aceites o líquidos que escurren del interior del disco, etc.
Tipos de falla en RAID-1
Los discos de los arreglos RAID-1 pueden sufrir fallas de tipo lógico, mecánico o electrónico, y estas pueden ser internas o externas.
También es muy probable que una falla de lugar a otras, como cuando un choque del cabezal ocasiona daño de sectores y contaminación, lo que se traduce en una lectura incompleta y daño lógico a los archivos.
Ejemplos de fallas lógicas
– Virus.
– Formateo.
– Borrado.
– Errores de actualización.
– Errores del sistema de archivos.
– Otros daños lógicos.
Ejemplos de fallas físicas externas
– Daños a la tarjeta controladora PCB (quemada, rota o desprogramada).
– Algunos daños de firmware.
– Algunos daños de sectores leves (formato RAW, error de redundancia cíclica).
– Algunos daños de pista cero.
– Otras fallas que se pueden recuperar con ayuda de equipo especial.
– Otros daños que no requieren la apertura del disco en laboratorio.
Ejemplos de daños físicos internos
– Daño de cabezal.
– Daño de motor.
– Daño de servomotor.
– Daño de preamplificadores.
– Daño de sectores grave.
– Daños al área de sistema (SA) o firmware.
– Contaminación por apertura o líquidos.
– Head crash o choque de cabezal leve.
– Head stiction, que es cuando el cabezal se adhiere a la superficie de los platos internos.
– Rotational scoring, que es cuando se daña la superficie de uno o mas platos internos.
– Otros daños físicos internos.
Otras causas de falla
No debemos olvidar que un servidor en RAID es un sistema complejo, cuyo funcionamiento depende de muchos dispositivos interconectados.
Por eso, para hacer un análisis correcto debemos considerar todas las fallas posibles.
A manera de ejemplo:
Una causa de falla común es cuando la tarjeta controladora de RAID tiene alguna configuración especial diferente a la predeterminada.
Si la pila está en mal estado o no sirve y el servidor se apaga o se reinicia, esto puede causar que la tarjeta cambie a su configuración original, y por lo tanto, aunque reconozca los discos físicos, no puede recuperar los parámetros de operación del RAID original.
Si ese fuera el caso, los discos aparecerán como si no tuvieran formato, a pesar de que la información aun existe.
En ningún caso la tarjeta controladora del RAID puede detectar el arreglo lógico, porque no es su función ni está diseñada para eso.
Errores frecuentes al intentar la recuperación de datos de RAID-1
El desconocimiento de la forma en que trabaja un RAID-1 lleva a cometer errores que son destructivos para la información.
Por ejemplo, al escanear un disco por horas para después encontrar que el cabezal se quemó al tratar de leer sectores dañados en exceso.
Otros errores frecuentes son:
– Intentar la recuperación sin un plan o sin saber como funciona un RAID-1.
– Suponer que la recuperación es algo fácil de hacer o que se puede lograr solo con programas.
– Pensar que las cosas no pueden empeorar o que los datos no se pueden destruir.
– Intentar soluciones mágicas o sacadas de YouTube.
– Fallas al determinar el tipo de RAID y el tipo de daño.
– Problemas para determinar los parámetros de operación.
– Realizar acciones que no son reversibles, como la sobrescritura de datos.
– Agregar discos vacíos al arreglo.
– Cambiar los discos de posición.
– Reinstalar el sistema operativo.
– Mover los discos a otro servidor o NAS.
Es común recibir casos en los que supuestamente se tenía RAID-1 y ya no hay acceso a datos.
Esto puede deberse a:
– Errores en la configuración o mal funcionamiento de la tarjeta controladora de RAID.
– Que no se trataba de un RAID-1 (podría ser otro tipo de RAID o discos sin RAID).
– Que ya había fallado un disco y traen el caso cuando falla el segundo disco.
– Se trataba de un RAID-1 de software, SHR o de otro tipo.
– Otros escenarios posibles.
No debemos olvidar que un RAID-1 degradado no es tolerante a fallos y que los daños en un disco pueden afectar a toda la información.
Daños no recuperables
Son aquellos que afectan especialmente a los datos o que destruyen el medio de almacenamiento:
– Sobrescritura de datos, al formatear, mover los discos de posición o al agregar nuevos discos vacíos.
– Corrupción o destrucción del firmware (externo en el chip o interno en áreas de sistema).
– Uso incorrecto de utilerías de Windows como chkdsk (scandisk), sfc scannow, dism o equivalentes.
– Daños internos o externos por líquidos.
– Daño grave a la superficie de los platos magnéticos internos, por cualquier causa.
– Contaminación por apertura.
– Contaminación por fragmentos (debris), después de un Head Crash.
– Head crash o choque de cabezal grave.
– Head stiction, si no se recupera con herramienta y cuidados especiales.
– Rotational scoring, cuando hay destrucción de la superficie de uno o más platos magnéticos internos.
– Rotura de los platos magnéticos internos.
– Daño a partes electrónicas o a los platos magnéticos por altas temperaturas o fuego.
– Otros daños físicos internos graves.
Recuperación de datos de RAID-1
Para la recuperación de datos de un RAID-1, debe seguir un proceso diseñado para rescatar o reconstruir la mayor cantidad de archivos, con el menor riesgo de daño lógico o de daño físico posible:
Este proceso de recuperación consta de 6 pasos:
1.- Protección del dispositivo.
2.- Diagnóstico de la falla (y cotización).
3.- Determinación de los parámetros de operación.
4.- Reparación de emergencia.
5.- Clonado hacia discos «sanos».
6.- Reconstrucción y recuperación de datos.
Protección del dispositivo.
Si ya no tiene acceso a sus datos es indispensable que apague el servidor o NAS, pues de no hacerlo se expone cuando menos a la sobrescritura involuntaria de información, lo cual puede ocasionar la destrucción de sus archivos.
Debe marcar los discos con etiquetas adheribles para recordar su posición en el servidor o NAS.
Debe anotar la marca y modelo del servidor, de la tarjeta controladora RAID, o de la unidad NAS, así como de los discos físicos, tipo de interfaz (IDE-SAS-SATA-SCSI-etc.), sistema de archivos y sistema operativo.
Hay que investigar y anotar los antecedentes de la falla (apagones, golpes, vibraciones, alarmas, etc.) y los síntomas (sonidos, errores de sistema, presencia de humo, fuego o líquidos, olor a quemado, etc.).
También debemos saber si hubo algún intento previo de recuperación, y si fue así, solicitaremos un reporte de las acciones que llevaron a cabo, y/o si hubo sobrescritura de datos o sustitución de discos.
No debe utilizar discos en mal estado físico porque esto puede llevar a daños a la superficie de los platos internos, lo que puede causar la destrucción de los datos.
Los dispositivos deben protegerse muy bien contra daños golpes o mojaduras, durante el traslado al laboratorio, y no deben conectarse a ningún equipo de manera individual, ni con adaptadores (USB o de otro tipo), para prevenir mas daño.
Tampoco debe permitir la apertura de los discos fuera de laboratorio, pues no hay partes que pueda ajustar o cambiar y por otro lado, se complica mucho la recuperación por la contaminación y manipulación inadecuadas.
Diagnóstico de la falla.
Antes de conectar cualquier disco debemos saber si estaba alarmado, o si emite algún sonido distinto al de su funcionamiento normal (como pitidos o golpeteo), lo que puede indicar un daño físico interno.
Conocer los antecedentes y síntomas nos ayudará a elegir el método de recuperación adecuado para el caso.
Es muy importante proteger los discos originales contra escritura involuntaria o corto circuito, lo que solo se logra correctamente con equipo especial (bastante costoso), como la PC-3000.
Acerca de la PC-3000
Este hardware de diagnóstico y recuperación protege contra corto circuito y comprueba el voltaje de los componentes de la PCB y el estado del motor.
Nos permite verificar la version de firmware, capacidad, numero de serie, modelo, familia y otros parámetros para diagnosticar, confirmar o descartar fallas probables.
También podemos consultar el estado SMART, editar o reparar el firmware, y reprogramar componentes para hacer reparaciones de emergencia.
Los discos sin falla y sin errores de SMART pasan directamente al paso 5.- CLONADO.
Costo de recuperación de datos
El costo de la recuperación de datos se calcula principalmente por el tipo de falla pues de eso depende el método de recuperación, precio de refacciones e insumos, mano de obra especializada, uso de instalaciones y equipo especial, entre otros.
Los trabajos se inician una vez que se autoriza el presupuesto total, y se divide en dos partes:
– Costo de Diagnóstico (que incluye refacciones e insumos).
– Costo de Recuperación.
Solicite una cotización personalizada para su caso en nuestra página de CONTACTO o llame al 55-4522-9785 para que un especialista le atienda de inmediato.
Determinación de los parámetros de operación.
Si hay acceso a discos en buen estado (o a sus clones) podemos determinar los parámetros de operación, que son las reglas de funcionamiento del RAID.
Los clones o imágenes de disco se analizan para determinar el orden, rotación, paridad, tamaño de sector, desplazamiento, sistema de archivos, sistema operativo, tipo de encriptado, etc.
La búsqueda de los parámetros de operación es mejor hacerla de forma manual, con programas como WinHex.
Aunque existen otros programas que pueden obtenerlos de manera semiautomática, la mayoría de las veces no lo hacen correctamente, lo que causa que los archivos «recuperados» estén incompletos, corruptos, o que no funcionen y en ese estado no se pueden reparar.
Reparación de emergencia.
Una vez que sabemos el tipo de falla, que se ha autorizado el presupuesto y se ha pagado el diagnóstico, se pueden hacer cambios de piezas o las reparaciones de emergencia que se requieran (lógicas, físicas, electrónicas, mecánicas, externas o internas), que permitan leer los sectores secuencialmente para generar un archivo de «imagen» o «clon».
Clonado o Imagen.
A manera de ejemplo, podemos imaginar que los archivos son como rompecabezas, y sus fragmentos son las partes que los forman.
Entonces hacer el clonado es el equivalente a reunir todas las piezas de los rompecabezas que forman los archivos.
Para hacer el clonado se utilizan los programas propietarios que se incluyen con las consolas de recuperación.
Acerca de la probabilidad de recuperación de datos de RAID-1
Si la extensión del daño lo permite y la reparación de la falla es exitosa, se puede llegar a lograr la lectura del 100% de los sectores, para tener acceso al 100% de los datos.
Puede ser más probable cuando existe algún daño electrónico, pues este tipo de falla rara vez afecta la integridad de los platos magnéticos.
Aun si solo se consigue un clonado o imagen parcial, todavía puede ser posible la recuperación parcial o total de los datos.
En otros casos, cuando hay daño físico de cabezal HSA o de sectores, head crash, head stiction, rotational scoring o sobrescritura, puede ser que la lectura de los sectores sea parcial, y por lo tanto, la recuperación también es parcial y puede verse afectada la integridad de los archivos.
De manera general, la recuperación de datos de discos en RAID-1 es muy similar a la recuperación de discos individuales, por lo que aun si solo se puede reparar y leer un disco, es posible recuperar información.
Reconstrucción y recuperación de datos.
Una vez que tenemos las imágenes o clones de los discos, usamos los parámetros de operación para extraer, reconstruir y recuperar los archivos.
Para la reconstrucción y recuperación de datos se utilizan versiones profesionales de programas comerciales, tales como R-Studio.
Verificación de integridad
Se verifica que la información reconstruida o recuperada sea funcional, pues de nada sirve tener archivos «recuperados» que no funcionan.
Existen varias técnicas y herramientas que nos permiten verificar la integridad de grandes cantidades de archivos con relativa facilidad, por lo que no necesariamente debemos abrir cada uno de ellos, ni instalar los programas con los que fueron creados.
Corrección de errores
Si detectamos que hay archivos que no funcionan, se pueden realizar reparaciones de emergencia para muchos tipos de archivo conocidos (docx, xlsx, jpg, pdf, pst, sql, mdf, ldf, etc.).
También verificamos y reparamos carpetas FOUND y archivos .chk, que son generados por programas como el antiguo Scandisk, ahora conocido como chkdsk .
Esto no significa que cualquier archivo dañado se pueda reparar, por lo que se debe analizar caso por caso antes de dar un dictamen final.
La reparación de archivos puede ser automática, semiautomática o manual, según sea necesario.
Entrega de reporte de recuperación
En este punto ya podemos emitir un listado de archivos recuperables y el reporte de su estado actual, para que el usuario sepa qué se puede recuperar y en qué estado se encuentra la información.
En algunos casos podemos darle acceso vía Anydesk para la revisión de sus archivos en línea.
Cobro y entrega de datos recuperados
Una vez que se da el visto bueno a la recuperacion de los datos, se realiza el pago por ese concepto para tener acceso a los archivos.
La información recuperada se puede entregar en el dispositivo de su preferencia (no incluido en el costo del servicio).
CUIDADO
El mal funcionamiento o la lentitud de un sistema puede tener muchas causas, como sectores defectuosos o daños físicos en el disco duro.
Todos los daños (lógicos o físicos, externos o internos, electrónicos o mecánicos) son progresivos y destructivos para la información.
La aplicación incorrecta de herramientas como sfc, chkdsk, Scandisk, dism, o de programas de recuperación de datos puede sobrescribir sus archivos, destruyendo la información o dañando el disco duro sin remedio.
Si los datos son importantes, lo mejor es acudir a un profesional.
Si tiene dudas acerca del proceso o necesita la recuperación de datos de servidores o NAS en RAID-1, solicite ayuda ahora!