domingo, 2 de septiembre de 2018

Ideas y Experiencias acerca de un Plan de Recuperación de desastres

Creando Disaster recovery plan (DRP)
¿Que debemos considerar al diseniar nuestro Disaster recovery plan?
a continuacion identificamos ciertos aspectos de los cuales debemos ser concientes y considerar para nuestro DRP.
Cuales son los activos mas importantes enel negocio? En nuestro caso IT cuales son los activos que permiten la continuidad del negocio.
Priorizar es importante, crear yclasificarlos  como critico – importante –pruebas – desarrollo.
Debemos ser concientes de el presupuesto que ocupa la construccion de la inversion de el desarrollo de un Proyecto de un sitio de recuperacion de desastres, pues esto involucra como primera instancia la parte de infraestructura – recurso humano - contratos de servicio redundantes – posiblemente involucrar proveedores outsorcing de soporte de aplicaciones y por su puesto el tiempo invertido enactividades de planificacion, implementacion (desarrollo)  y pruebas .
Y por ultimo (pero no menos importante) la construccion de Estrategias de Backup, la cual es parte escencial de todo operación en el negocio.
Como lei  en un comentario muy acertado por  "Shower Thoughts from a DBA":
“You get paid for Performance, but youkeep your job with recovery. Unless you don’t have backups. if you don’t have backups, better polish up your resume”
PuntosImportantes:
Define tus activos ¿que es importante?

Definir los involucrados (Stakeholders)

Definir RPO & RTO 

Diseño de plan de presupuesto 
Infraestructura 

Construcción de Estrategia de 

Construcción de Estrategia de Recuperacion


¿Que es SLA/OLA y SLA Matrix?

SLA : Service Level Agreement, es uncontrato tecnico de servicio entre el proveedor y el cliente durante unperiodo  de tiempo donde se fijanterminos orientados a la calidad del servicio a prestar.

OLA: Operation Level Agreement SonAcuerdos internos de servicio para cubrir las expectativas de servicio interno con fines de mantener la calidad.
SLA Matrix: Descripcion grafica de los Acuerdos de los SLA (Este termino es meramente descriptivo no definido dentro de ITIL) sin embargo de  utilidad para el trabajo 



¿Que es importante antes de un desastre?
Saber cuanto tiempo puedo estar fuera de servicio, cuantos datos puedo perder…
Definir prioridades :  Segun el SLA Matrix
  (Mision Critica, Importante para el Negocio yPruebas)
Definir Roles y Responsabilidades: ¿Quien es el responsible de declararlo Desastre? ¿Quien es el responsible de el trabajo de Recuperacion?
¿Donde se guarda la informacion tu plan, Lista de servidores, scripts,  contactos?¿Como accesaras en caso de emergencia?


Este es un Ejemplo de Inventario, que incluye el uso de las prioridades definidas anteriormente




¿Quienes son los Involucrados?
Personal de Soporte – servicio al cliente
Ejecutivos C-Level : CTO –CIO (Gerencia)
Equipo de Ingenieria  Infraestructura : (Redes - DevOps – SistemasOperativos – DBAs)
Las personas afectadas por Perdida dedatos / o Outage
 
*  Encargados de Aplicacion o Sistema
*  Key Users Master Users – Usuarios de Sistema
*  Cliente – Interno / Externo  IT Manager




                                              Definición de RTO y RPO

Recovery Time Objective –TiempoObjectivo de Recuperacion

  Es el tiempo total objetivo en el que los servicios deben ser restaurados, desde el punto de disrupcion.

Recovery Point Objective – PuntoObjectivo de Recuperacion

  Es el punto previo en el tiempo (desde elpunto de vista de los datos) en el   cuallos servicios seran restaurados, Esto define la cantidad de datos (aceptable)   queno sean recuperados.

 Recovery Time Objective

¿Cuanto tiempo puedo estar fuera deservicio?
Visto de otra manera, ¿Cuanto tiempo para recuperar el servicio?
¿Cual es la perspectiva de RTO en laempresa?
¿Cual es el origen del desastre?
Es Desastre o es Disrupcion???….
TODO DEPENDE …


Punto Objectivo  de Recuperacion RPO

 segun el giro del negocio,conocer  el segmento economico  al cual pertenece  (banca, produccion de bienes, mercadericas,seguros, bienes perecederos) esto nos puede dar una idea o percepcion decuantos datos se pueden perder.

¿Cuantosdatos puedo Perder?

Depende: Esto varia segun el giro del negocio.

Depende: De la estrategia tecnica.  A veces es mas facil reconstruir que restaurar.

Depende: De los costos operativos, Gerencia, Operaciones, Demand Planners pueden ofrecer una perspectiva numerica.

 con su plan Basico

 que se tiene definido el RPO y el RTO, se puede definer la estrategia.
Y Podemos contestar los siguientesplanteamientos….

 mas importante es que la viabilidadtecnica depende de los factores economicos, geograficos
pero es muy importante considerarlos ytenerlos en cuenta.
•Estrategia de Backups:
  Frecuencia, tipos, lugar de almacenaje,   transporte.

•Estrategias de Alta Disponibilidad:
   Soluciones  de redundancia.
•ParaBases de datos (SQL Server):
•AlwaysOn – Mirroring (casi Deprecated)
•Clustering+ DR Solution HA
•LogShipping
•Replicacion.



Construya su estrategia de Recuperación
Definir una Linea base de recuperación

Realizar Pruebas de recuperación(parcial, total)

Verificacion de Pruebas de backups.

Verificacion de Scripts de automatizacion/ integracion de
Backups,transporte, copia de base de datos.

No hay comentarios:

Publicar un comentario