martes, 8 de marzo de 2016

Plan de Contingencia

Plan de Contingencia


El Plan de Contingencia es el instrumento de gestión para el buen manejo de las Tecnologías de la
Información y de las Comunicaciones. Dicho plan contiene las medidas técnicas, humanas y organizativas necesarias para garantizar la continuidad de las operaciones de la institución. Así mismo, este plan de contingencias sigue el conocido ciclo de vida iterativo "plan-do-check-act", es decir, "planifica-actúa-comprueba-corrige". Surge de un análisis de riesgos, donde entre otras amenazas, se identifican aquellas que afectan a la continuidad de la operación de la entidad. El plan de contingencias deberá ser revisado semestralmente. Así mismo, es revisado/evaluado cuando se materializa una amenaza.
 El Plan de Contingencia permitirá mantener la contingencia operativa frente a eventos críticos de la entidad y minimizar el impacto negativo sobre la misma, los usuarios y clientes, deben ser parte integral para evitar interrupciones, estar preparado para fallas potenciales y guiar hacia una solución adecuada.


PLAN DE CONTINGENCIA DE INFORMÁTICA.


ETAPAS DEL PLAN

·         Análisis de Riesgos
·         Plan de Respaldo
·         Plan de Recuperación
·         Plan de Mantenimiento
·         Plan de Entrenamiento


DEFINICIÓN PLAN DE CONTINGENCIA:


Es un tipo de plan preventivo, predictivo y reactivo. Presenta una estructura estratégica y operativa que ayudará a controlar una situación de emergencia y a minimizar sus consecuencias negativas.

El plan de contingencia propone una serie de procedimientos alternativos al funcionamiento normal de la organización, cuando alguna de sus funciones usuales se ve perjudicada por una contingencia interna o externa.

Esta clase de plan, por lo tanto, intenta garantizar la continuidad del funcionamiento de la organización frente a cualquier eventualidad, ya sean materiales o personales. Un plan de contingencia incluye cuatro etapas básicas: la evaluación, la planificación, las pruebas de viabilidad y la ejecución.

DIAGNOSTICO SITUACIONAL


Actualmente el Hospital Vitarte cuenta con los siguientes Equipos de Cómputo:

Hardware:
·         05 UPS.
·         286 Computadoras.
·         85 Impresoras.
·         09 Escaner.
·         09 Laptop.

Comunicaciones:
·         02 Router.
·         18 Switch.
·         05 Servidores.

 NECESIDAD DE REALIZAR EL MANTENIMIENTO


Es necesario por tanto la identificación previa de cuáles de los procesos son críticos y cuáles son los recursos necesarios para garantizar el funcionamiento de las aplicaciones de gestión.

FINALIDAD

Tener un Plan de Contingencias lo más completo y global posible. Definir las normas y procedimientos necesarios para afrontar cualquier eventualidad que se produzca en los Sistemas de Información y Comunicación del Hospital, de modo que se asegure la continuidad, seguridad y confiabilidad de los mismos.

 OBJETIVO GENERALES


Un Plan de Contingencia y Seguridad de la Información permite prever los riesgos a los que estará sometido el sistema de información que se va a implementar. El objetivo es doble: Por un lado, tomar las medidas necesarias para minimizar la probabilidad de que dichos riesgos se conviertan en una realidad y, por otra parte, si esto ocurriera, posibilitar que el sistema pueda responder sin que ello suponga un grave impacto para su integridad. Este presente Plan de Contingencia y Seguridad, involucra a toda la entidad directa o indirectamente. De este modo, es válido en cuanto se produce con la aprobación de todas las partes implicadas, con la total asunción de responsabilidad que a cada una pudiera corresponderle.

OBJETIVO ESPECÍFICOS


A.      Proteger la vida de las personas inherentes a los servicios informáticos de la entidad.
B.      Prevenir o minimizar la pérdida o la corrupción de archivos de datos críticos para la continuidad de las operaciones de la entidad.
C.      Proteger la propiedad de la entidad y otros activos.
D.      Iniciar un procedimiento de recuperación de los servicios informáticos ante un desastre o posibles fallas ocasionadas.
E.       Proteger al sistema de información de pérdidas irreparables de información procesada.
F.       Garantizar la continuidad de las operaciones de los elementos considerados críticos que componen los Sistemas de Información y/o infraestructura informática.
G.     Alcanzar una alta disponibilidad, es decir, impedir que se produzcan fallas en los sistemas, que dificulten el normal funcionamiento de nuestra Institución.
H.      Definir acciones y procedimientos a ejecutar en caso de fallas de los elementos que componen un
I.        Sistema de Información y/o infraestructura informática.


LOGRO QUE SE ESPERA ALCANZAR


Brindar un óptimo funcionamiento y proteger toda la información que se procesa día a día la misma que es almacenada en los servidores que utiliza el Hospital.

ACTIVIDADES A REALIZAR


El Plan de Contingencia y Seguridad de la Información


Se elabora desde el área de Informática en coordinación con las sedes internas y externas ligadas a la entidad. El Plan de Contingencia está diseñado para ser aplicado tanto en la Sede principal de la entidad como en las Unidades de Negocio de toda la Institución, involucrando al personal y equipos que intervienen en el mantenimiento de la función informática en nuestra institución y contemplen el software base y las aplicaciones informáticas, así como controlar los accesos a áreas de uso restringido y el hardware. Los resultados esperados son establecer los controles necesarios en la función informática y en el uso de las aplicaciones con el fin de garantizar la integridad y confidencialidad de la información y el soporte informático ante cualquier siniestro que pudiera ocurrir.

Esquema General


El Plan de Contingencia implica un análisis de los posibles riesgos a los cuales pueden estar expuestos las instalaciones, equipos de cómputo y la información contenida en los diversos medios de almacenamiento, por lo que en el Plan Contingencia se hará un análisis de los riesgos (Antes), cómo reducir su posibilidad de ocurrencia y los procedimientos a seguir en caso que se presentara el problema (Durante).

Pese a todas las medidas se seguridad con las que cuenta la institución puede ocurrir un desastre, por tanto es necesario que el Plan de Contingencias incluya un Plan de Recuperación de Desastres (Después), el cual tendrá como objetivo, restaurar el Servicio de Cómputo en forma rápida, eficiente y con el menor costo y pérdidas posibles. Si bien es cierto que se pueden presentar diferentes niveles de daños, también se hace necesario presuponer que el daño ha sido total, con la finalidad de tener un Plan de Contingencias lo más completo posible.

Comenzaremos por identificar los tipos de riesgos y los factores para proceder a un plan de recuperación de desastres, así como las actividades previas al desastre, durante y después del desastre.
                                                                                                                                        

Definiciones de Términos Empleados.


·         Contingencia: Interrupción, no planificada, de la disponibilidad de recursos informáticos.
·         Plan de Contingencia: Son procedimientos que definen cómo un negocio continuará o recuperará sus funciones críticas en caso de una interrupción no planeada.
·         Proceso crítico: Proceso considerado indispensable para la continuidad de las operaciones y servicios de la entidad, y cuya falta o ejecución deficiente puede tener un impacto operacional o de imagen significativo para la institución.
·         Impacto: El impacto de una actividad crítica se encuentra clasificado, dependiendo de la importancia dentro de los procesos TI, en:
·         Impacto Alto: Se considera que una actividad crítica tiene impacto alto sobre las operaciones de la entidad cuando ante una eventualidad en ésta se encuentran imposibilitadas para realizar sus funciones normalmente.
·         Impacto Medio: Se considera que una actividad crítica tiene un impacto medio cuando la falla de esta, ocasiona una interrupción en las operaciones de la entidad por un tiempo mínimo de tolerancia.
·         Impacto Bajo: Se considera que una actividad crítica tiene un impacto bajo, cuando la falla de ésta, no tiene un impacto en la continuidad de las operaciones de la entidad.
·          


Análisis e Identificación de Riesgos


En la institución, se ha identificado los siguientes tipos y factores de riesgos:

Tipo de Riesgos Factor de Riesgo


1.       Fallas en el Equipo (Alto).
2.       Fallas por Tensión (Alto).
3.       Accesos no autorizados (Alto).
4.       Acción de Virus (Medio).
5.       Fuego (Medio).
6.       Terremoto (Medio).

En caso de Infección por Acción de Virus (Tipo de Riesgo –Medio)


La entidad cuenta con el antivirus NOD32 para los servidores y para las estaciones de trabajo; asimismo a través de la red se hacen las actualizaciones del antivirus hacia las máquinas correspondientes.

Sin embargo en caso de infección masiva de virus se debe de seguir el siguiente plan de contingencia:

Si la infección es vía red a los Servidores y PCS, proceder de la siguiente forma:

1)      Revisar las alertas que envía el antivirus y ver el tipo de virus que se está propagando detectando el origen del virus. A su vez desconectar de la red el equipo que está infectado y que está reenviando el virus.
2)      Comprobar si tiene carpetas compartidas en forma total y proceder a no compartirlas.
3)      Proceder a limpiar los archivos con la opción de: LIMPIAR o CLEAN INFECTED FILES NO CON DELETED porque esta opción podría borra archivos del sistema operativo, quedando inutilizada la máquina.
4)      Una vez limpio el equipo, proceder a realizar una copia de Seguridad sólo de la Data.
5)      Si no se lograra limpiar en forma satisfactoria, el equipo, porque los archivos del sistema operativo han sido dañados se procederá a formatear el disco reinstalándole el sistema operativo y transfiriendo la data de seguridad, que se tiene en caso de servidores y de los archivos personales en caso de PC y/o Servidor de Archivos si los hubiera; donde se custodia la data de los usuarios.

 Si la infección es por lista de correo proceder de la siguiente forma:


1)      Coordinar con los soporte de las unidades de negocio.
2)      Entrar al Servidor donde está instalado el Correo a los servicios y deshabilitar el Servicio de Message Transfer Agente para que no siga reenviando los correos.
3)      Proceder a eliminar el mensaje que se encuentra en cola y que está infectado.
4)       Proceder a pasar el antivirus con las opciones indicadas.




En Fallas por tensión (Tipo de Riesgo –Alto)


Son fallas que se presentan como parpadeos constantes, de la energía, causando problemas en las instalaciones internas, llegando a malograr equipos de cómputo si no se tiene las siguientes precauciones:

1)      Si hubiere fluctuaciones (flickers), constantes y prolongadas, proceder a apagar los equipos, previo aviso a los usuarios. Como medidas de seguridad ante la prevención se deberá contar con UPS, estabilizadores, pozo a tierra, etc.
2)      Llamar a Servicios Generales para identificar si la falla es del sistema general, o es un problema aislado en el tablero de alimentación de la sala de cómputo. Si la falla es originada en el sistema general, se debe esperar a que se normalice, para proceder a encender los equipos y conectar a los usuarios. Si la falla es originada por algún factor local, deberá, proceder a revisar, los elementos del tablero de la sala de cómputo como son, fusibles, térmicos, cables flojos, o revisar si existe algún equipo que este ocasionando esta falla; si no se detecta localmente se debe de proceder a revisar la conexiones, en la subestación de donde se está independizando a energía, revisar los bornes flojos u otros.
3)      Si aún no se detecta la falla, ubicar si están realizando algún trabajo con equipos de alto consumo, como son máquinas soldadoras, etc. y que se hayan conectado a la red de los equipos de cómputo por equivocación.

 Por corte de Energía Imprevisto:


Es el corte intempestivo del suministro de la energía eléctrica, ocasionado por algún factor externo, como son (corte de la línea de transmisión, accidentes, falla en los sistemas de protección, etc.).Esta falla, tanto en el origen como al final (retorno de la energía) pueden causar daños a los equipos de cómputo por lo que se debe de seguir el siguiente procedimiento:

1)      Se activará la luz de emergencia en el equipo correspondiente.
2)      Revisar la carga del UPS que alimentan los equipos, para los casos de corte de energía y determinar el tiempo que queda de energía auxiliar.
3)      Llamar a Servicios Generales, para identificar si la falla es del sistema general, o es un problema aislado, en el tablero de alimentación de la sala de Cómputo.
4)      Por seguridad utilizar la energía que se tiene en los UPS para apagar los equipos en forma correcta.
5)      Si la falla es originada en el sistema general, se debe esperar a que se normalice, (siempre en coordinación), para proceder a encender los equipos y conectar a los usuarios.
6)      Si la falla es originada por algún factor local, deberá, proceder a revisar, los elementos del tablero de la sala de cómputo como son: fusibles, térmicos, cables flojos, o revisar si existe algún equipo que este ocasionando la falla, si no se detecta localmente se debe de proceder a revisar la conexiones, en la subestación de donde se está independizando la energía, revisar los bornes flojos u otros, Si aún no se detecta la falla ubicar si están realizando algún trabajo con equipos de alto consumo, como son máquinas soldadoras, etc., y que hayan conectado a la red ocasionando un corto circuito, y que no permita, restituir la energía, en forma normal.
7)      Si la falla es en el sistema interconectado (general) se deberá esperar que restituya la energía, más un tiempo de unos 15 minutos más, aproximadamente para que se estabilicé y se puedan levantar los sistemas.
8)      Si la falla es local proceder a la reparación, o reemplazo, de los componentes que causaron la falla, para esto se debe de solicitar el apoyo de Servicios Generales, (se recomienda tener fusibles, y una llave térmica de respaldo de acuerdo a la capacidad de su tablero). Una vez reparada la falla se debe de conectar la energía para ver el comportamiento, de esta y no encender los equipos de cómputo hasta después de 15 minutos aproximadamente después de la restitución de la energía).

En caso de Fuego (Tipo de Riesgo –Medio)


La entidad, a pesar de que cuenta con sistemas de protección, contra incendios, como son, extintores manuales, “conexiones alternas de energía” (en algunas áreas), equipos de bajo consumo, vías de acceso y de evacuación, amplias, etc., sin embargo algún incidente involuntario, puede ocasionar, el inicio de un Incendio para lo cual se deberá proceder de la siguiente manera:

1)       Si el inicio del incendio se produce en horas de labores, deberá de proceder a dar la alarma a todo el personal de la oficina, colindantes, y a los bomberos.
2)       Desconectar las fuentes de alimentación eléctricas (sin riesgo de exponer la vida).
3)       Si el tiempo lo permite y si la fuente del siniestro está lejos pero se puede propagar hacia los equipos principales de computo (servidores) deberá retirar los equipos hacia un lugar seguro, discos o ultimas copias que tenga a la mano y (sin que esto signifique riesgo de exponer su vida).
4)       Se deberá proceder a sofocar el fuego utilizando el extintor correcto para el tipo de fuego.


Aspecto de Seguridad en las Redes


Control de Acceso Físico a las Salas de Cómputo


1)      Solo personal autorizado deberá ingresar a las áreas restringidas donde se encuentra la Sala de Servidores y/o otros lugares donde se encuentren los equipos informáticos; si otras personan ingresan debe ser con autorización y coordinación de la jefatura inmediata y en los tiempos establecidos y/o coordinados.
2)      Se recomienda contar con cámaras de seguridad en las áreas consideradas clave y en caso no se encuentre personal en una de esas áreas deberá estar cerrado por motivos de seguridad; y si dicha persona que está a cargo de las llaves se tendría que ausentar por un tiempo considerable, darle a otra persona a fin que se encargará de velar por el mismo.
3)      Adicionalmente también se deberían contar con detectores de humo, de calor que me indiquen cualquier cambio en los ambientes respectivos ya sea sala de servidores, centro de cómputo, etc. y me permitan posteriormente tomar las medidas necesarias.


Control de Acceso a la Red Vía PC.


1)      Restringir el acceso a las áreas en que están las estaciones de trabajo mediante llaves o bloqueos de las PC.
2)      Solicitar clave de ingreso a la red y a los sistemas que están en red.
3)      Registrar toda la actividad de la estación de trabajo con el visor de sucesos.
4)      Retirar o inutilizar las disqueteras o unidades de almacenamiento, las PCs y/o Servidores donde se tenga información muy importante que ponga en riesgo la seguridad de la institución.

Protección del Servidor


La parte más importante de la red lo conforman los servidores. La concentración de los datos en el servidor, en términos de cantidad e importancia, hace que sea necesario protegerlo de todas las eventualidades. Los controles necesarios serían:

1)      La dependencia en donde se encuentre el servidor no debe ser accesible para nadie, excepto para el administrador de la red y/o la persona responsable del mismo.
2)      No se debe permitir que personas que no han de utilizar el servidor estén cerca de él.
3)      Dada la importancia del servidor y la cantidad de datos que almacenan en él, es necesario efectuar copias de seguridad de los archivos y aplicaciones como configuraciones del servidor. Cabe recordar que las copias de seguridad del servidor de archivos son un elemento especialmente valioso, debiéndose quedar guardados en un lugar cerrado, seguro y con las condiciones ambientales necesarias para su correcto funcionamiento.
4)      Un conjunto de copias de seguridad se debe trasladar regularmente a otro lugar seguro (de preferencia otro local).
5)      El área donde se encuentran los servidores debe estar con la suficiente ventilación necesaria, con la seguridad e instalación correcta de las redes eléctricas ,el orden y limpieza de la infraestructura tecnológica que puede afectar a los servidores o disminuir su tiempo de vida.


ANÁLISIS DE RIESGOS


Para realizar un análisis de los riesgos, se procede a identificar y evaluar los objetos que deben ser protegidos, los daños que éste pueda sufrir, sus posibles fuentes de daño, su impacto dentro de la entidad y su importancia dentro del mecanismo de funcionamiento.

Posteriormente se procede a realizar los pasos necesarios para minimizar o anular la ocurrencia de eventos que posibiliten los daños, y en último término, en caso de ocurrencia de éstos, se procede a fijar un plan de emergencia para su recomposición o minimización de las pérdidas y/o los tiempos de reemplazo o mejoría.


Bienes susceptibles de un daño


Se puede identificar los siguientes bienes afectos a riesgos:
·         Personal.
·         Hardware.
·         Software y Utilitarios.
·         Datos e información.
·         Documentación.
·         Suministro de energía eléctrica.
·         Suministro de telecomunicaciones.


Prioridades


La estimación de los daños en los bienes y su impacto, fija una prioridad con relación a la cantidad de tiempo y los recursos necesarios para la reposición de los Servicios que se pierden en dicho acontecimiento.

Por lo tanto, los bienes que tienen más alta prioridad serán los primeros a considerarse en el procedimiento de recuperación ante un evento de desastre.

Fuentes de daño.


Las posibles fuentes de daño que pueden causar la no operación normal de la institución son:

Acceso no autorizado.

·         Por vulneración de los sistemas de seguridad en operación (Ingreso no autorizado a las instalaciones).
·         Ruptura de las claves de acceso a los sistemas computacionales.
·         Instalación de software de comportamiento errático y/o dañino para la operación de los sistemas computacionales en uso (virus, sabotaje, ejecución de scripts malintencionados)
·         Intromisión no calificada a procesos y/o datos de los sistemas, ya sea por curiosidad o malas intenciones.

Desastres Naturales.

·         Movimientos telúricos que afecten directa o indirectamente a las instalaciones físicas de y/o de operación (equipos computacionales y/o servidores).
·         Por fallas causadas por la agresividad del ambiente
·         Inundaciones causadas por falla en los suministros de agua.

Fallas de Hardware y Equipos de Soporte.

·         Falla en el Servidor de Aplicaciones, Servidor Proxy, Servidor Controlador Dominio y Datos, tanto en su(s) disco(s) duro(s) como en el procesador central.
·         Falla en los Switches.
·         Falla en el Cableado de la Red.
·         Falla en el Router.
·         Falla en el Firewall.
·         Falla en el Aire Acondicionado en la Sala de Servidores.
·         Incendios.
·         Por fallas de red de energía eléctrica pública por diferentes razones ajenas.
·         Por fallas de la comunicación.
·         Por fallas en el tendido físico de la red local.
·         Por fallas en las telecomunicaciones con instalaciones externas.
·         Por fallas de Central Telefónica.
·         Por fallas de líneas de fax.

Por fallas de Personal Clave.


Se considera personal clave a aquel que cumpla una función vital en el flujo de procesamiento de datos u operación de los Sistemas de Información: Personal de Informática, Unidad Informática, supervisores de Red. Pudiendo existir los siguientes inconvenientes: Enfermedad, accidentes, renuncias, abandono de sus puestos de trabajo, otros imponderables.

Expectativa Anual de Daños


Para las pérdidas de información, se deben tomar las medidas precautorias necesarias para que el tiempo de recuperación y puesta en marcha sea menor o igual al necesario para la reposición del equipamiento que lo soporta.


Medidas Preventivas: Control de Accesos


Se debe definir medidas efectivas para controlar los diferentes accesos a los activos computacionales:
·         Acceso físico de personas no autorizadas.
·         Acceso a la Red de PC's y Servidor.
·         Acceso restringido a las librerías, programas, datos, logos de auditoria, etc.

Adecuado Soporte de Utilitarios


Las fallas de los equipos deberá minimizarse mediante el uso de otros equipos, a los cuales también se les debe controlar periódicamente su buen funcionamiento, nos referimos a:
·         UPS de respaldo de actual servidor de Red o de estaciones críticas.
·         UPS de respaldo switches y/o HUB's.
·         PCs en stock ante cualquier eventualidad que pudiera suceder.

Seguridad Física del Personal


Se deberá tomar las medidas para recomendar, incentivar y lograr que el personal comparta sus conocimientos con sus colegas dentro de cada área, en lo referente a la utilización de los software y elementos de soporte relevantes, así como de documentar las incidencias y tener un registro de sus proyectos realizados y plan de trabajo.

Estas acciones permitirán mejorar los niveles de seguridad, permitiendo los reemplazos en caso de desastres, emergencias o períodos de ausencia ya sea por vacaciones o enfermedades.

Seguridad de la Información


La información y programas de los Sistemas de Información que se encuentran en el servidor, o de otras estaciones de trabajo críticas deben protegerse mediante claves de acceso y a través de un plan de respaldo adecuado.



Plan de Respaldo


Objetivo:

Establecer un procedimiento para la administración de las copias de respaldos de información de los diferentes Sistemas de Información que se encuentran en producción y de los servicios de red de la organización.

El Plan de Respaldo trata de cómo se llevan a cabo las acciones críticas entre la pérdida de un servicio o recurso, y su recuperación o restablecimiento. Todos los nuevos diseños de sistemas, proyectos o ambientes, tendrán sus propios Planes de Respaldo.

Respaldo de datos Vitales


Identificar las áreas para realizar respaldos:
·         Sistemas en Red.
·         Sistemas no conectados a Red.
·         Sitio WEB.
·         Correos electrónicos institucionales.

Alcance.

Este procedimiento es aplicable a todos los sistemas de información en producción y los servicios de red de la organización.

Análisis de la Criticidad.


Primeramente se deberá establecer la criticidad de los Sistemas de Información y los Servicios de Red de acuerdo al tipo de información que procesan y almacenan.
Esta tarea deberá ser realizada conjuntamente por Soporte técnico, Desarrollo y Administración de Sistemas.

Esta tarea deberá ser realizada periódicamente, con el objetivo de revisar la criticidad, al menos dos veces por año o por demanda cuando se pone en producción un nuevo sistema de información o servicio de red y éste debe ser incluido en el plan de respaldos.

Este análisis deberá estar enmarcado en los siguientes niveles de criticidad:
ü  Alta: El sistema y/o servicio posee información altamente crítica.
ü  Media: El sistema y/o servicio posee información medianamente crítica.
ü  Baja: El sistema y/o servicio posee información que no es crítica.

Toda la Información No es Crítica.


Normalmente cuando uno plantea que va a respaldar los datos de su PC a una persona en una compañía y le pregunta que es crítico respaldar, casi siempre la respuesta es todo. Pero en realidad esto no es así, uno tiene que definir muy bien cuál es la información crítica, por ejemplo la música que guarde un empleado en su PC no es crítica para las actividades de la empresa. En cambio su correo electrónico, proyectos, informes y papeles administrativos si lo suelen ser y tener un respaldo de estos es clave para el funcionamiento de la empresa en caso de cualquier eventualidad. Lo importante de este punto es que NO TODA LA

INFORMACIÓN ESCRÍTICA y hay que hacer un levantamiento de la que realmente lo es.

Otro punto importante es que dentro de la información crítica hay varios niveles, no es lo mismo perder los correos de un empleado que perder la información de nómina o de pago de los proveedores y siempre es aconsejable darle niveles de prioridad a la información para tener un mejor manejo de ella. Una vez que definamos que información realmente necesitamos respaldar vamos en buen camino y podemos seguir con nuestra política de respaldo.

Normalmente la data o información que es respaldada por las empresas es:

Archivos creados por aplicaciones, como por ejemplo .doc, .odt, .xls, .mdb, .pdf, .ppt entre otros.
·         Archivos de correo electrónico
·         Directorios telefónicos y de contactos
·         Favoritos de los navegadores como Firefox e Internet Explorer
·         Base de datos
·         Configuraciones de los equipos
·         Archivos de CAD, PSD, XCF, etc.
·         Imágenes y Fotografías de proyectos
·         Configuraciones de servicios
·         Sistemas de la empresa

Plan de Respaldo y Responsables


El plan de respaldos contiene información de que sistemas de información y servicios de red serán respaldados, por lo que su periodicidad, tipo de respaldo, etc., estará determinado por la criticidad del sistema de información y/o servicio de red.

Por otro lado se realizarán las tareas de obtención de respaldos tomado en cuenta los horarios en los que el tráfico de datos de la red sea bajo; es decir, cuando no represente una carga excesiva en la red ni represente un trabajo adicional para los servidores de red cuando están trabajando los usuarios (ingresando, operando, realizando transacciones, etc.), por lo que los horarios correctos serán en horas nocturnas donde el tráfico de información es bajo.

El cronograma deberá contemplar claramente los siguientes campos:
ü  Responsable/s: Persona/s quien/es realizo/aron el plan.
ü  Fecha del plan: La fecha en la cual entra en vigencia el plan.
ü  Numero de plan: El número del plan, ejemplo: 7/12/2013
ü  Operador de Respaldos: Nombre y cargo de la persona que asume el rol.
ü  Revisor de Respaldos: Nombre y cargo de la persona que asume el rol.

Designación de Responsables


Se deberá designar formalmente a las personas responsables de la obtención de copias de respaldo, es decir, establecer la persona quien tendrá el rol de Operador de Respaldos, así como también el rol de Revisor de Respaldos, ambos roles se describen a continuación:
Respaldo Local

El respaldo local puede hacerse de varias formas en varios tipos de dispositivos. Los más
Comunes son:

Servidor de respaldo, con un arreglo RAID (múltiples discos en espejo), este servidor se coloca en red con una aplicación que respalde los datos automáticamente cada cierto tiempo, en estos tiempos el almacenamiento en disco duros es bastante económico y no se necesita que el servidor tenga una gran cantidad de recursos para efectuar esta tarea, casi siempre algún servidor que se haya sacado de circulación o inclusive una PC "vieja" puede hacer el trabajo. Claro hay servidores de alto desempeño para este tipo de tareas y la decisión va a depender del presupuesto con que cuenten.

Disco duro Externo en Red o USB, si la entidad no tiene presupuesto para un servidor y no cuenta con muchas estaciones de trabajo, un disco duro en Red o USB puede hacer las veces de sistema de respaldo, estos disco duros no suelen ser muy costosos y hay de todas las capacidades, lo ideal sería tener dos de estos en espejo en caso de que alguno falle. En caso de ser un disco duro USB se tiene que compartir en Red entre las PC de la empresa.

CDs, DVDs, si el respaldo que va a realizar no es tan periódico (1 o 2 veces al mes) puede utilizar un medio como un CD o DVD, en este caso sólo necesita una unidad capaz de grabar en cualquiera de estos medios y hay varias aplicaciones que permiten hacer el respaldo sin ningún problema. Si quiere utilizar el DVD o CD más de una vez se recomienda comprar los que son regrabables. Estos medios no suelen estar recomendados para respaldos muy periódicos, y casi siempre se utilizan para guardar información histórica de la empresa (como facturas, recibos, proyectos antiguos, etc). Además se tiene que tener en consideración el almacenamiento seguro de estos discos en un contenedor cerrado que sólo tengan acceso personas autorizadas y que esté lejos del sol y la humedad. También se tiene que tener un sistema para catalogar y etiquetar que sea eficiente.

Cintas Magnéticas, este fué el sistema de respaldo preferido por muchos y aún muchas empresas lo utilizan, ahora son un poco difícil de conseguir además que su capacidad de almacenamiento es un poco limitada. Al igual que con los CDs y DVDs hay que tomar en cuenta el almacenamiento (lejos de campos magnéticos), etiquetado correcto y la rotación (de la que hablaremos más adelante) y además son medios que son reutilizables.

Respaldo Remoto


El respaldo remoto nos ayuda a protegernos contra desastres como incendios e inundaciones, contra robos y otras eventualidades que puedan ocurrir en el sitio principal de nuestra empresa.

Este tipo de respaldo se puede realizar de varias formas:

Servidor de Respaldos remotos, si nuestra empresa tiene varias sedes separadas geográficamente podemos colocar uno o varios servidores distribuidos entre las sedes para respaldar nuestra información a través de la red con una conexión segura. Así si pasa una eventualidad en alguna de nuestras sedes podemos recuperar la información fácilmente.

Servicios de Respaldo remoto, hay varias empresas que ofrecen el alquiler de servidores dedicados o servicios de respaldos, con este tipo de servicios no se necesitan tener varias sedes, simplemente se alquila el espacio que necesitemos para nuestro respaldo y se puede ir ampliando a medida que se necesite más. Este es uno de los servicios más populares de los que son llamados servicios de Nube donde una empresa ofrece capacidad y sistemas en demanda (on-demand) en la red. Asegurarse que a la hora de alquilar uno de estos servicios que tenga una fuerte política de seguridad y privacidad y que garanticen la integridad de sus datos, los proveedores de estos servicios están en la obligación de tener ciertas garantías de sus datos y de explicar cuáles son los mecanismos que utilizan para garantizarlos, si se rehúsan a explicar esto no confíe en el proveedor.

Uso de los Respaldos


Se establecen dos situaciones:

Uso para propósitos de revisión:
Los medios antes de ser enviados al custodio, la persona con el rol de Revisor de Copias de Respaldo, podrá solicitar el medio, al Operador de Copias de Respaldo, cuando así lo considere (aleatoriamente) para restaurar en otro ambiente que no sea el de producción, con propósitos de revisión y control y poder certificar el proceso de obtención de copias de respaldo.

Uso para restablecer los Sistemas de Información y/o los Servicios de Red:
Para la obtención y utilización de los medios donde se encuentra información de respaldo y con el propósito de restaurar los mismos ante posibles incidentes (Administración de Problemas e Incidentes, Administración del Plan de Contingencias, etc.), solo podrán ser solicitados por el responsable de las copias de seguridad y con la aprobación del Jefe de Área correspondiente.

Análisis de Impacto de los Procesos


Objetivo Principal:

El objetivo principal del Análisis del Impacto de los procesos, es determinar las funciones, procesos e infraestructura de soporte que son críticos para la contingencia operativa de la entidad.

Objetivos Específicos:

Para lograr el objetivo principal se definieron los siguientes objetivos específicos:

·         Identificar las preocupaciones y prioridades de la Alta Dirección de la en el caso que exista una indisponibilidad en los sistemas informáticos producida por una contingencia.
·         Identificar el tiempo máximo en el que un proceso crítico de la entidad deberá ser restaurado para su normal y eficiente continuidad.
·         Identificar el impacto en las aplicaciones que soportan los procesos críticos de la entidad.
·         Proporcionar las bases de una estrategia para la contingencia operativa en caso de un desastre.



Sistemas de Información del Hospital Vitarte


Los principales sistemas existentes en el Hospital Vitarte son:
·         Consultorios Externos.
·         Pacientes
·         Caja
·         Sala de Operaciones
·         Personal
·         SIGA
·         SIAF
·         Tramite Documentario

Principales servicios que deberán ser restablecidos Y/O recuperados (Centro deCómputo Alterno)


Generales
·         Windows.
·         Correo Electrónico.
·         Internet.
·         Antivirus.
·         Herramientas de Microsoft Office.

Software Base
·         Base de Datos Sql
·         Backup de la Información.
·         Ejecutables de las aplicaciones.

Respaldo de la Información
·         Backup de la Base de Datos Sql
·         Backup de la Plataforma de Aplicaciones (Sistemas)
·         Backup de la WEBSITE
·         Backup del Servidor controlador de Dominio.
·         Backup del Servidor de Archivos.

Plan de Recuperación


Objetivos del Plan de Recuperación

Los objetivos del plan de Recuperación son:

·         Determinación de las políticas y procedimientos para respaldar las aplicaciones y/o los datos.
·         Planificar la reactivación dentro de las 5 horas como máximo de producido un desastre, todo el sistema de procesamiento y sus funciones asociadas.
·         Permanente mantenimiento y supervisión de los sistemas y aplicaciones.
·         Establecimiento de una disciplina de acciones a realizar para garantizar una rápida y oportuna respuesta frente a un desastre.
·         Restablecer en el menor tiempo posible el nivel de operación normal del Centro de Procesamiento de la información y/o de los Servidores correspondientes, basándose en los planes de emergencia y de respaldo a los niveles del Centro de Cómputo y de los demás niveles.

 Lista de Verificación Para Un Plan de Recuperación de Desastres


Cuando hablamos de ejecutar una Recuperación de Desastres de nuestra red o de la Continuidad del Negocio, el tiempo y la precisión son de alta importancia. Las metas de una recuperación de desastres y la continuidad del negocio son sensitivos en el tiempo y bastante críticos, por lo que el uso de una Lista de Verificación se convierte en una herramienta ideal cuando nos afrontamos a una situación en donde esos planes son requeridos.

Las siguientes actividades definen una seria de acciones o actividades que deben entrar en juego cuando se requiere ejecutar una recuperación de desastres:
·         Detectar una falla y efectos de desastres lo más rápido posible.
·         Notificar a los responsables que deben tomar acción.
·         Aislar los sistemas afectados para limitar el alcance de las fallas y daños.
·         Reparar o reemplazar sistemas críticos, y trabajar hacia una continuidad en las operaciones normales, si es que las circunstancias lo permiten.

Alcance del plan de recuperación


La responsabilidad sobre el Plan de Recuperación es de la Unidad de Administración y el Personal de Sistemas con una persona encargada de ejecutarlo, la cual debe considerar la combinación de todo su personal, equipos, datos, sistemas, comunicaciones y suministros.

La duración del plan se determinará de acuerdo a las necesidades que se presenten y la capacidad de los equipos de trabajo para procesar la restauración y recuperación de los sistemas. De igual forma se puede crear un comité entre el mismo personal que tenga conocimientos suficientes para determinar si la recuperación puede realizarse con todas las condiciones favorables.

Activación del Plan


La decisión queda a juicio de la Dirección General, determinando la activación del Plan de Desastres, y además indicar el lugar alternativo de ejecución del Respaldo y/o operación de emergencia, basándose en las recomendaciones indicadas por éste.

Duración estimada


Los supervisores de cada área determinarán la duración estimada de la interrupción del servicio, siendo un factor clave que podrá sugerir continuar el procesamiento en el lugar afectado o proceder al traslado del procesamiento a un lugar alternativo.

 Responsabilidades


·         Orden de Ejecución del Plan: Dirección General.
·         Supervisión General de Plan: Propia y/o empresa en convenio para Recuperación.
·         Supervisión del Plan de Recuperación: Supervisor(es) de Área(s).
·         Abastecimiento (HW, SW): Asistente de Administración.
·         Tareas de Recuperación: Personal de tareas afines.

Aplicación del Plan


Se aplicará el plan siempre que se prevea una pérdida de servicio por un período mayor de 48 horas, en los casos que no sea un fin de mes, y un período mayor a 24 horas durante los fines de mes (durante los cierres contables).

Detalla algunas de las causas de la Falla del Servidor. Error Físico de Disco de un Servidor (Sin RAID).


Dado el caso crítico de que el disco presenta fallas, tales que no pueden ser reparadas, se debe tomar las acciones siguientes:

1)      Ubicar el disco malogrado.
2)      Avisar a los usuarios que deben salir del sistema, utilizar mensajes por red y telefonear a los jefes de área.
3)      Deshabilitar la entrada al sistema para que el usuario no reintente su ingreso.
4)      Bajar el sistema y apagar el equipo.
5)      Retirar el disco malo y reponerlo con otro del mismo tipo, formatearlo y darle partición.
6)      Restaurar el último backup en el disco, seguidamente restaurar las modificaciones efectuadas desde esa fecha a la actualidad.
7)      Recorrer los sistemas que se encuentran en dicho disco y verificar su buen estado.
8)      Habilitar las entradas al sistema para los usuarios.

Error de Memoria RAM


En este caso se dan los siguientes síntomas:

1)      El servidor no responde correctamente, por lentitud de proceso o por no rendir ante el ingreso masivo de usuarios.
2)      Ante procesos mayores se congela el proceso.
3)      Arroja errores con mapas de direcciones hexadecimales.
4)      Se debe tomar en cuenta que ningún proceso debe quedar cortado, y se deben tomar las acciones siguientes:
5)      Avisar a los usuarios que deben salir del sistema, utilizar mensajes por red y telefonear a los jefes de área.
6)      El servidor debe estar apagado, dando un correcto apagado del sistema.
7)      Ubicar las memorias malogradas.
8)      Retirar las memorias malogradas y reemplazarlas por otras iguales o similares.
9)      Retirar la conexión del servidor con el concentrador, ésta se ubica detrás del servidor, ello evitará que al encender el sistema, los usuarios ingresen.
10)   Realizar pruebas locales, deshabilitar las entradas, luego conectar el cable hacia el concentrador, habilitar entradas para estaciones en las cuales se realizarán las pruebas.

Probar los sistemas que están en red en diferentes estaciones.
Finalmente luego de los resultados, habilitar las entradas al sistema para los usuarios.

Error Lógico de Datos


La ocurrencia de errores en los sectores del disco duro del servidor puede deberse a una de las siguientes causas:

1)      Caída del servidor de archivos por falla de software de red.
2)      Falla en el suministro de energía eléctrica por mal funcionamiento del UPS.
3)      Bajar incorrectamente el servidor de archivos.
4)      Fallas causadas usualmente por un error de chequeo de inconsistencia física.

En caso de producirse alguna de las situaciones descritas anteriormente; se deben realizar las siguientes acciones:

1)      Verificar el suministro de energía eléctrica. En caso de estar conforme, proceder con el encendido del servidor de archivos; una vez mostrado el prompt de DOS, cargar el sistema operativo de red.
2)      Deshabilitar el ingreso de usuarios al sistema.
3)      Descargar todos los volúmenes del servidor, a excepción del volumen raíz. De encontrarse este volumen con problemas, se deberá descargarlo también.
4)      Cargar un utilitario que nos permita verificar en forma global el contenido del(os) disco(s) duro(s) del servidor.
5)      Al término de la operación de reparación se procederá a habilitar entradas a estaciones para manejo de soporte técnico, se procederá a revisar que los índices en la base de datos estén correctos, para ello se debe empezar a correr los sistemas y así poder determinar si el usuario puede hacer uso de ellos inmediatamente.

Si se presenta el caso de una o varias bases de datos no reconocidas como tal, se debe recuperar con utilitarios.

Recursos de Contingencia Generales


Se debe tener recursos de contingencia tales como:
·         Router (Proveído por el proveedor de Internet y WAN).
·         Tarjeta de Red,Conector RJ45,Jack RJ-45,Testeador.
·         Servidores y Equipos de Comunicación (Switchs, Antenas, Fibra, etc.).
·         Gabinete de Comunicaciones y Servidores.
·         Materiales Y herramientas para cableado Estructurado.
·         UPS y Equipos de aire acondicionado.
·         Backup diario de la información de los Sistemas.
·         Instaladores de las aplicaciones, de Software Base, Sistema Operativo, Utilitarios, etc.
·         Componente de Remplazo (Memoria, Disco Duro, UPS, etc.).

Si existiere problema en las antenas, puede ser por problema de posición al direccionar las antenas, se recomienda mover las antenas y ver si el equipo se reestablece, en caso extremo contar con un Servidor Vpn que haga de respaldo hasta que se solucione el inconventiente.

Contenido del plan de contingencia para la Coordinación Administrativa deTecnologías de Información:


1)      Listas de notificación, números de teléfono, mapas y direcciones.
2)      Prioridades, responsabilidades, relaciones y procedimientos.
3)      Información sobre adquisiciones y compras
4)      Diagramas de las instalaciones
5)      Sistemas, configuraciones y copias de seguridad en cinta o cualquier otro medio.
6)      Medios de comunicación como radios, celulares ante cualquier incidencia.

Procedimientos para las Pruebas del Plan de Contingencias - Niveles de Prueba


Se recomiendan dos niveles de prueba:

·         Pruebas en pequeñas Unidades Orgánicas.
·         Pruebas en a nivel Gerencial.

La premisa es comenzar la prueba en las Unidades Orgánicas más pequeñas, extendiendo el alcance a nivel Gerencial, para finalmente realizar las pruebas entre sedes o con otras instituciones externas.

Métodos para Realizar Pruebas de Planes de Contingencia


Prueba Específica: Consiste en probar una sola actividad, entrenando al personal en una función específica, basándose en los procedimientos estándar definidos en el Plan de Contingencia. De esta manera el personal tendrá una tarea bien definida y desarrollará la habilidad para cumplirla.

Prueba de Escritorio: Implica el desarrollo de un plan de pruebas a través de un conjunto de preguntas típicas (ejercicios).

Las características de la prueba de escritorio son:

1)      La discusión se basa en un formato preestablecido.
2)      Está dirigido al equipo de recuperación de contingencias.
3)      Permite probar las habilidades gerenciales del personal que tiene una mayor responsabilidad.

Comprobación de Plan de Contingencias   


La prueba final debe ser una prueba integrada que involucre secciones múltiples. La capacidad funcional del plan de contingencia radica en el hecho de que tan cerca se encuentren los resultados de la prueba con las metas planteadas.

Si es necesario, el hardware y software necesarios deben activarse o adquirirse, así como ser transportados al sitio alterno; las estrategias básicas para disponer de equipo de reemplazo son:

Acuerdos con proveedores: Se establecen acuerdos de nivel de servicios con los proveedores de software, hardware y medios de soporte; se debe especificar el tiempo de respuesta requerido.
Inventario de equipos: Los equipos requeridos se compran por adelantado y se almacenan en una instalación segura externa (el sitio alterno).

Equipo Compatible Existente:
·         Equipo existente en sitios alternativos.
·         Comprar los equipos cuando se necesitan puede ser mejor financieramente, pero puede incrementar de manera significativa el tiempo de recuperación.
·         Almacenar un equipo sin usar es costoso, pero permite que la recuperación comience más rápidamente.
·         Considerar la posibilidad de un desastre extendido que requiere reemplazos masivos de equipos y retrasos del transporte.
·         Mantener listas detalladas de necesidades de equipo y especificaciones dentro del Plan de Contingencia.

Infraestructura del Ambiente Alterno PROPIO: Para este escenario, se requiere acondicionar un ambiente alterno que pueda ser utilizado como sala de servidores en el momento de la contingencia con las dimensiones apropiadas para facilitar la ubicación de los equipos y mobiliario.

El ambiente alterno contaría con los siguientes recursos:
·         3 mesas para monitores y teclados de los servidores principales
·         2 sillas
·         Switches 24 Ports (10/100)
·         1 Router para la conexión a internet
·         1 UPS
·         1 Teléfono
·         1 Extinguidor Clase A (Gas Carbónico)
·         Útiles de Oficina



Procedimiento de Apagado y Encendido de Servidores.


Pasos a Seguir para el Encendido de Servidores:
·         Identificar el botón de encender el equipo servidor y presionar.
·         Si el servidor se encuentra encendido se ingresa a esta por medio del acceso remoto.
·         Ingresar el usuario y la contraseña del ADMINISTRADOR DE DOMIO.
·         Identificar los servicios que se tienen que levantar para su correcto funcionamiento de las aplicaciones Instaladas (Usualmente está configurado el inicio automático de los servicios cuando inicia el sistema Operativo).

Lista de Personal de Equipo de Respuesta a Desastres.


Ante un desastre a la hora de ocurrir el problema estas son las personas críticas que deberán ubicar según el problema suscitado, para dar el apoyo ante la emergencia suscitada.

Respaldo de datos Vitales

Identificar las áreas para realizar respaldos:
·         Sistemas en Red.
·         Sistemas no conectados a Red.
·         Sitio WEB.
·         Archivos.


Conclusión.


El presente Plan de Contingencia, tiene como fundamental objetivo el salvaguardar la infraestructura de la Red y Sistemas de Información del Hospital Vitarte, extremando las medidas de seguridad para protegernos y estar preparados a una contingencia de cualquier tipo.

Las principales actividades requeridas para la implementación del Plan de Contingencia son: Identificación de Riesgos, Evaluación de riesgos, Asignación de prioridades a las aplicaciones, Establecimiento de los requerimientos de recuperación, Elaboración de la documentación, Verificación e implementación del plan, Distribución y mantenimiento del plan.

El plan de Contingencia de la entidad está sujeto a la infraestructura física y las funciones que realiza en Centro de Procesamiento de Datos más conocido como Sala de Servidores.

Lo único que realmente permitirá a entidad reaccionar adecuadamente ante procesos críticos, es mediante la elaboración, prueba y mantenimiento de un Plan de Contingencia.


Recomendaciones.

Se enuncian las siguientes recomendaciones:

A.      Programar las actividades propuestas en el presente Plan de Contingencias.

B.      Hacer de conocimiento general el contenido del presente Plan de Contingencia, con la finalidad de instruir adecuadamente al personal de la entidad.

C.      Adicionalmente al Plan de Contingencia se debe desarrollar reglas de control y pruebas para verificar la efectividad de las acciones en caso de la ocurrencia de los problemas y tener la seguridad de que se cuenta con un método seguro.

D.      Se debe tener una adecuada seguridad orientada a proteger todos los recursos informáticos desde el dato más simple hasta lo más valioso que es el talento humano; pero no se puede caer en excesos diseñando tantos controles y medidas que desvirtúen el propio sentido de la seguridad, por consiguiente, se debe hacer un análisis de costo/beneficio evaluando las consecuencias que pueda acarrear la pérdida de información y demás recursos informáticos, así como analizar los factores que afectan negativamente la productividad de la entidad.

E.       Autorizar el manejo de la información por perfiles y a los usuarios correspondientes. Dar niveles de acceso a la información.

F.       Tener componentes de reserva y/o en stock para poder reemplazar los equipos en el momento adecuado, como componentes de servidor como discos duros, lectoras, router, etc. que se puede necesitar ante cualquier eventualidad.

G.     En el caso de las antenas que comunicaban sedes, si estas dejasen de funcionar es recomendable tener otra vía de comunicación como un enlace VPN, para ello se requiere un aceptable ancho de banda.


H.      Hacer los backups correspondientes de información según prioridad como contingencia de eventos imprevistos que afectasen la información.

No hay comentarios.:

Publicar un comentario