Backups 3-2-1: la mejor estrategia para asegurar la disponibilidad de los datos

julio 13, 2016 — por Albert Gris0

main

Assoc. Cat. VirtualitzacióCloudOrbalVeeam

Backups 3-2-1: la mejor estrategia para asegurar la disponibilidad de los datos

julio 13, 2016 — por Albert Gris0

Muy fácilmente uno de los fundamentos de nuestro Disaster Recovery Plan será el Backup. Aunque hay que tener siempre en mente que cada proyecto tiene sus peculiaridades, hay un standard bastante asentado a nivel estratégico que se ha mantenido por casi toda la indústria: la regla del 3-2-1. Para mí, su carácter es el de marco en el que empezar a desarrollar nuestra política de Backups.

Y sí, la buena notícia es que “su belleza radica en su sencillez”, como diría Walter Sobchak.

¿En qué se basa? Lo genial de esta estrategia es que formaliza los principios de un backup “comme il faut”: redundancia y dispersión de riesgo. Lo curioso además, es que fue ideado por un fotógrafo, por alguien que explotaba directamente sus datos y por lo tanto era consciente de la criticidad de su disponibilidad. Se articula en tres puntos:

  • Mantener 3 copias de la información (2 copias + origen)
  • En almenos 2 medios distintos
  • 1 de ellas, offsite

Veámoslo con un ejemplo sencillo: un documento en nuestro ordenador. Para empezar, tendríamos que generar dos copias distintas de ese mismo fichero.  Qué sentido tiene tener dos copias disntintas? Hasta ahí, solo estamos garantizando la redundancia de la información, pero recordemos que también hay que garantizar dispersión de riesgo. Para lograrlo, tendremos que guardar los datos en almenos 2 medios/dispositivos distintos. Uniendo las ideas de las dos primeras proposiciones, jugamos con la independencia estadística de fallos en los dispositivos que almacenan nuestros datos:

Tenemos una primera copia, que es el propio documento, en un dispositivo (nuestro ordenador) con una probabilidad de fallo de 1/x. Luego, hemos generado dos copias que almacenamos independientemente en otros dos dispositivos con un probabilidad de fallo de 1/z y 1/y cada uno. En este escenario, la probabilidad de que todos los dispositivos fallen al mismo tiempo es 1/x * 1/y * 1/z = 1/xyz. Efectivamente, la dispersión de riesgo conlleva menor probabilidad de error simultáneo. Finalmente, nada mejor que distanciar lo máximo posible una de las copias respecto su origen. Nada hará más independientes las probabilidades de fallo que si los datos están en localizaciones geográficas distintas, que nos haría cumplir con la última de las proposiciones, una copia offsite.

estrategias_recuperacion_datos1

estrategias_recuperacion_datos2

La posibilidad de almacenar backups en la nube ha facilitado muchísimo la adopción de esta metodología. Supongamos que tenemos nuestro fichero orígen y las dos copias. A partir, de ahí, si una de estas copias la guardamos en algún cloud, ya tendremos una en disco (orígen) y otra en un medio distinto (cloud), que además está offsite. Sería quizás la aplicación más sencilla de este plan. La posibilidad de guardar la tercera copia en una cinta por ejemplo, y esta almacenarla físicamente en una ubicación remota al origen lo complementaría del todo dando 3 copias, en 3 medios distintos,  y con las 3 en ubicaciones geográficas distintas.

Como habréis visto, otra gran ventaja es que esta regla tiene muchas posibilidades de aplicación, desde un escenario muy sencillo que ya da un nivel de disponibilidad aceptable para muchos casos a un nivel mucho más avanzado con más componentes y dependencias que proporciona bajísimas posibilidades de pérdida de información.

Una vez revisadas las características principales de esta metodología, es importante escoger una herramienta de Backup que nos facilite alcanzar el grado de seguridad que necesitamos. Al evaluar distintas opciones, estas reflexiones pueden servir para destacar las funcionalidades que mejor se adapten a nuestras demandas.

Analicemos como una solución como Veeam Backup & Replication cumple con esta metodología:

  • ¿Como generamos 3 copias de manera óptima?
    • Tenemos dos opciones: Por un lado, siempre podemos hacer dos backups con Backup Jobs y nos resultará en 3 copias distintas de la información, 2 backups + origen. Aunque sea una vía perfectamente válida y nos garantice 3 versiones totalmente diferentes, Veeam nos proporciona también los Backup Copy Jobs que nos aportan una gran ventaja: si ejecutamos dos Backup Jobs sobre la misma máquina, resultará en dos snapshots sobre ella. Estos snapshots (si no se usan Snapshots a nivel de cabina de Storage, también soportados por Veeam) suponen un riesgo en el rendimiento de la VM mientras existan y, sobretodo, al consolidarse cuando finaliza el Job de Backup. Con Backup Copy Jobs, generamos un backup a partir de un Backup Job tradicional y luego solo copiaremos el fichero de backup sin tocar la máquina en origen, generando la tercera copia. Los dos “backups” serán iguales pero en ficheros distintos que luego podremos almacenar en diferentes medios.
  • Y lo guardamos en 2 medios distintos…
    • Normalmente, nuestra estrategia de backups nos lleva a tener dos grandes tipos de retenciones: una de “rollback” y otra de “Disaster Recovery”. Aunque lo trataré en más profundidad en otro post, el primer tipo nos sirve para restaurar rápidamente y desde puntos de recuperación típicamente “no-históricos” es decir, muy recientes al possible desastre. Por lo tanto, querremos guardarlos relativamente cerca del origen para poder restaurar con celeridad. Además, al estar cerca y hacerse típicamente sobre discos mecánicos, hará que el tiempo de backup sea relativamente corto y por lo tanto el posible impacto debido al snapshot se reduzca ya que este durará mucho menos. Entonces, este backup nos serviría de semilla para generar otra copia que podríamos guardar en cintas, soportadas desde versión 8 de Veeam, o en Cloud, en ambos casos mediante Backup Copy Jobs.
  • 1 copia offsite
    • Como ya hemos visto, podemos utilizar Backup Copy Jobs para guardar alguna de nuestras copias en un Cloud garantizando la dispersión geográfica. Otra opción sería, en caso de disponer de una segunda ubicación geográfica, utilizar los Backup Copy Jobs con aceleradores WAN que nos permitan mantener niveles de caché entre la transmisión y de esta manera cogestionemos y usemos el mínimo las comunicaciones entre las ubicaciones.
  • Pero con 0 errores!
    • Como con casi todo, sin una prueba empírica satisfactoria no podremos saber si hemos tenido éxito en nuestro objetivo. Hemos cumplido todas las premisas de esta regla del 3-2-1, tenemos bajísimas probabilidades de que no dispongamos de nuestros ficheros de backup… pero sobre el papel. La única manera que tenemos de saber que funcionan solo puede ser restaurándolos. Pero claro, si solo los restauramos cuando tenemos “el desastre”, pues solo nos queda encomendarnos a la suerte, y no es la situación ideal. Veeam aporta métodos de verificación de Backups automáticos y configurables hasta poder testear cualquier parámetro de nuestra aplicación mediante scripts predefinidos o desarrollados por nosotros mismos. Es por esta funcionalidad ya bastante conocida como es SureBackup que en Veeam ya no hablan de la regla del 3-2-1 sino del 3-2-1-0.

Sin más, espero que hayáis visto lo simple y potente que nos resulta esta idea a la hora de empezar a pensar en nuestro plan de backups. Es genial como punto de partida en la elaboración de estas políticas puesto que rápidamente se ponen de relieve las peculiaridades de cada caso y las oportunidades que se tienen, de manera que se puede evolucionar en proyectos mucho más sofisticados poniéndonos a pensar en ello.

Dejar comentario

Tu dirección de correo no será publicada Los campos requeridos están marcados con *

5 × dos =