CONCEITOS E DEFINIÇÕES
- Ativos de informação: Entendem-se os meios de armazenamento, transmissão e processamento, os sistemas de informação, bem como os locais onde se encontram esses meios e as pessoas que a eles têm acesso;
- Continuidade de Negócios: Capacidade da empresa, tanto tática, quanto estratégica, de se planejar e responder a incidentes e interrupções de negócios, de forma a manter suas operações em um nível aceitável, previamente definido, minimizando seus impactos e recuperando perdas de ativos da informação das atividades críticas;
- Desastre: Evento repentino e não planejado que causa perda para toda ou parte da organização e gera sérios impactos em sua capacidade de entregar serviços essenciais ou críticos por um período de tempo superior ao tempo objetivo de recuperação;
- Incidente: Evento que tenha causado algum dano, colocado em risco, algum ativo de informação crítico ou interrompido a execução de alguma atividade crítica por um período de tempo inferior ao tempo objetivo de recuperação;
- Data center: Todo espaço nos quais ficam os Ativos de Informação, bem como suas estruturas auxiliares como No-Break, Banco de Baterias e Gerador de Energia Elétrica;
APRESENTAÇÃO
O Plano de Continuidade de Negócios (PCN) assegura à empresa a continuidade de seus negócios em caso de paralisação decorrente de sinistro de um ou mais processos considerados críticos, devendo estabelecer cenários de situações inesperadas ou incidentes, quer sejam operacionais, desastres ou crises. O plano de continuidade atuará como resposta aos resultados da Análise de Impacto nos Negócios e Análise de Riscos, tendo o dever de gerencia-los, dando a devida atenção para:
- Alternativas estratégicas, táticas e operacionais para responder à interrupção;
- Prevenção de novas perdas ou indisponibilidade de atividades prioritárias;
- Detalhes sobre como e em que circunstâncias a empresa irá se comunicar com as partes interessadas;
OBJETIVO
Almeja-se com este Plano de Continuidade de Negócios (PCN), promover estratégias e medidas de proteção eficazes e rápidas para os processos críticos de TI, a fim de garantir sua preservação após a ocorrência de um desastre, até a retomada em tempo hábil. O PCN atuará como resposta aos resultados da Análise de Impacto nos Negócios e Análise de Riscos, provendo quais as ações serão realizadas em cada etapa do plano.
O processo de elaboração do PCN baseou-se em normas e pesquisas de outras instituições, dentro das melhores práticas para a construção de um Sistema de Gestão de Continuidade de Negócios. As atividades foram desenvolvidas pelos colaboradores e gestores, de forma colaborativa, com reuniões presenciais para alinhamento do plano com as políticas institucionais.
Este plano divide-se em outras 4 (quatro) etapas, as quais são:
- Plano de Administração de Crises (PAC) - Define funções e responsabilidades das equipes envolvidas com o acionamento das ações de contingência, antes durante e após a ocorrência;
- Plano de Contingência (PC) - Define as necessidades e ações mais imediatas. Deve ser utilizado somente quando todas as prevenções tiverem falhado;
- Plano de Recuperação de Desastres (PRD) - Determina o planejamento para que, uma vez controlada a contingência e passada a crise, sejam retomados os níveis originais de operação;
- Plano de Continuidade Operacional (PCO) - Seu objetivo é restabelecer o funcionamento dos principais ativos que suportam as operações da instituição, reduzindo o tempo de queda e os impactos provocados por um eventual incidente;
Dentre os objetivos do Plano, destacam-se os seguintes procedimentos:
- Identificar todos os processos de negócio de TI, definindo atividades críticas e classifica-las.
- Identificar e documentar os riscos que possam comprometer a continuidade das atividades críticas;
- Identificar ameaças, vulnerabilidades e estimar os riscos;
- Identificar controles existentes;
- Identificar, documentar e avaliar os possíveis impactos à continuidade das atividades críticas, caso tais riscos se concretizem;
- Determinar e calcular o tempo e o custo de parada e da recuperação do negócio;
- Definir, implementar e manter um processo formal e documentado para a Análise de Impacto nos Negócios;
- Avaliação dos impactos de não realização das atividades críticas ao longo do tempo;
- Fixação dos prazos de forma priorizada para a retomada das atividades, em um nível mínimo de execução tolerável, levando em consideração o tempo em que os impactos da interrupção tornem-se inaceitáveis;
- Identificação de interdependências e recursos que suportam as atividades, incluindo fornecedores, terceiros e demais partes interessadas relevantes;
- Determinar estratégias de continuidade de negócios adequada para proteger, estabilizar, continuar, retomar e recuperar as atividades prioritárias, bem como suas interdependências e recursos de apoio (Plano de Administração de Crises);
- Estabelecer níveis adequados de autoridade e competência, no intuito de assegurar a comunicação efetiva às partes interessadas, bem como assegurar a continuidade das atividades críticas (Plano de Continuidade Operacional);
- Viabilizar a continuidade e a recuperação das atividades críticas, em caso de interrupção (Plano de Recuperação de Desastres e Contingencia);
- Realizar treinamentos e avaliações do PCN periodicamente para garantir a manutenção e o bom funcionamento dos planos de continuidade;
- Realizar testes para garantir a eficiência da continuidade de negócios;
- Promover a conscientização dos colaboradores;
- Identificar oportunidades para melhorar a continuidade de negócios.
MODELO DO PLANO (PDCA)
Os planos aqui definidos seguirão o Modelo “PLAN-DO-CHECK-ACT” (PDCA) para planejar, estabelecer, implementar, operar, monitorar, analisar criticamente, manter e melhorar continuamente a eficácia do Sistema.
Modelo PDCA: O modelo PDCA ajudará na melhoria contínua do Plano de Continuidade de Negócios:
- PLAN (estabelecer) - Seguir uma política de continuidade de negócios, objetivos, metas, controles, processos e procedimento pertinentes para a melhoria da continuidade de negócios, de forma a ter resultados alinhados com os objetivos.
- Do (Implementar e operar) - Implementar e operar a política de continuidade de negócios, controles, processos e procedimentos.
- CHECK (Monitorar e analisar criticamente) - Monitorar e analisar criticamente o desempenho em relação aos objetivos e política de continuidade de negócios, reportar os resultados para a direção para análise crítica, definir e autorizar ações de melhorias e correções.
- ACT (Manter e Melhorar) - Manter e melhorar o PCN, tomando ações corretivas e preventivas, baseadas nos resultados da análise crítica da direção e reavaliando o escopo, as políticas e objetivos de continuidade de negócios.
Para cada uma das etapas, deverá ser feito Planos de Ações, e estes deverão ser elaborados assim que dar-se os ocorridos, com base na sua temporalidade e impacto. Estes devem formar um log ou registro de ações, para que para cada acontecimento seja possível verificar o que foi feito em outros momentos similares.
REVISÕES
A revisão do Plano será realizada nas seguintes situações:
- Em no máximo 2 (dois) anos;
- Nos momentos em que o Grupo B2 julgar necessário;
- Em função dos resultados dos testes realizados;
- Após ocorrência de algum evento ou mudança significativa nos ativos de informação, nas atividades ou em algum de seus componentes.
INVOCAÇÃO DO PLANO
O presente plano será acionado quando houver ocorrência de algum desastre, na ocorrência de um risco não conhecido ou caso uma vulnerabilidade tenha grande probabilidade de ser explorada. Também poderá ser acionado o plano quando ocorrer a necessidade de testes ou por determinação do Grupo B2.
PRICIPAIS RISCOS
O PCN foi elaborado para ser acionado quando houver alguma ocorrência de desastres que apresentem riscos à continuidade do negócio ou serviços essenciais. Abaixo segue o quadro que define estes riscos, bem como aponta quais os parâmetros para reportar as possíveis causas das ocorrências.
EVENTO DE DESASTRE | EVENTO DE DESASTRE POSSÍVEIS CAUSAS |
01- Interrupção de energia elétrica | Causada por fator externo a rede elétrica do prédio ou de sua localidade com duração da interrupção superior a 12 horas. Causada por fator interno que comprometa a rede elétrica do prédio com curto-circuito, incêndio e infiltrações. |
02 - Indisponibilidade de rede/circuitos | Rompimento de fibra ótica decorrente de execução de obras publicas, desastres ou acidentes. |
03 - Falha humana | Qualquer ato causado por negligencia, imprudência e/ou imperícia. |
04 - Ataques internos (funcionários insatisfeitos) | Ataque aos ativos do DataCenter ou aos Servidores internos |
05 - Incêndio | |
06 - Desastres Naturais | |
07 - Falha de hardware | Falha que necessite reposição de peça ou cujo reparo ou aquisição Dependa de orçamento. |
08 - Ataque cibernético | Ataque virtual que comprometa o desempenho, os dados ou configuração dos serviços essenciais. |
PAPÉIS E RESPONSABILIDADES
ATRIBUIÇÕES
- COMITÊ DE SEGURANÇA DA INFORMAÇÃO
- Avaliar o plano periodicamente e decidir pelo seu acionamento quando da ocorrência de desastres, respondendo em nível institucional pela execução do plano e demais ocorrências relacionadas.
- EQUIPE DE INSTALAÇÕES/AMBIENTE/SERVIDORES/APLICAÇÕES
- Responsável pelas instalações físicas que abrigam as estações de trabalho e servidores locais.
- Avaliar os danos e supervisionar os reparos para um local secundário, no caso de a localização primária sofrer destruição ou danos.
- O líder desta equipe administrará, manterá e reavaliará o Plano de Recuperação de Desastre.
- Avaliar os danos específicos de infraestrutura de rede interna, incluindo WAN, LAN e quaisquer outra infraestrutura externa junto aos prestadores de serviço.
- Fornecer a infraestrutura de servidores físicos e virtuais necessárias para que a equipe responsável execute suas operações e processos essenciais durante um desastre.
- Garantir que as aplicações essenciais funcionem como exigido para atender aos objetivos de negócios em caso de e durante um desastre. Eles serão os principais responsáveis por assegurar e validar o desempenho das aplicações essenciais e podem ajudar outras equipes de TI.
- EQUIPE DE OPERAÇÕES
- Fornecer aos funcionários as ferramentas de que necessitam para desempenhar suas funções da forma mais rápida e eficiente possível.
- São responsáveis em provisionar ferramentas para que, no caso de um desastre, os colaboradores possam trabalhar remotamente com as ferramentas específicas à sua atuação.
- O líder desta equipe administrará e manterá o Plano de Continuidade Operacional
- EQUIPE DE COMUNICAÇÃO
- Responsável por todas as comunicações durante um desastre. Especificamente, eles se comunicarão com os funcionários, clientes e com quem mais se fizer necessário.
- O líder desta equipe administrará e manterá o Plano de Administração de Crise.
- EQUIPE DE BACKUP
- Analisar as perdas e mapear a quantidade de dados perdidos, tempo de recuperação desses dados e formular estratégias de recuperação de dados de acordo com as políticas pré-estabelecidas.
- EQUIPE DE SEGURANÇA DA INFORMAÇÃO
- Promover mecanismos de segurança, tanto nas estações de trabalho, quanto nos acessos remotos, em caso de acionamento do PCN. Resguardar aplicações e dados, evitando que desdobramentos de segurança afetem o acionamento da continuidade.
- Analisar as perdas e mapear a quantidade de dados perdidos, tempo de recuperação desses dados e formular estratégia de recuperação de dados.
PROCESSOS E SISTEMAS CRITICOS
Processos e sistemas críticos podem ser definidos como um processo de trabalho que, uma vez paralisado por um tempo superior ao definido pelos gestores de negócio, irá afetar sensivelmente as operações, gerando impacto aos clientes. Esse impacto é definido pela seguinte formula: MTD = RTO + WRT.
- MTD (Maximum Tolerable Downtime): Define a quantidade total de tempo que um processo de negócios pode ser interrompido sem causar quaisquer consequências inaceitáveis. Esse valor deve ser definido pelo Comitê de Desastres. Diferentes funções de negócio terão diferentes MTD’s;
- RTO (Recovery Time Objective): Determina a quantidade máxima tolerável de tempo necessária para colocar todos os sistemas críticos novamente on-line (por exemplo, restaurar dados de backup ou consertar uma falha);
- WRT (Work Recovery Time): Determina a quantidade de tempo tolerável necessária para verificar o sistema e/ou a integridade dos dados (verificar os bancos de dados e logs, por exemplo). Quando todos os sistemas afetados pelo desastre são verificados e / ou recuperados, o ambiente está pronto para retomar a produção novamente;
PROCESSO CRITICO | MTD | RTO | WRT |
Defeito de Hardware | 4 h | 3 h | 1 h |
Danos, perda ou corrupção dos servidores, computadores e sistemas operacionais | 4 h | 3 h | 1 h |
Falha no Backup | 10 h | 8 h | 2 h |
Falha humana (imprudência, negligencia e/ou imperícia) | 3 h | 2 h | 1 h |
Falha no equipamento interno | 2 h | 1 h | 1 h |
Falha estrutural (danos físicos ao edifício/escritório) | 3 h | 2 h | 1 h |
Absenteísmo de funcionários essenciais | 1 h | 1 h | 1 h |
ANALISE DE IMPACTO DE NEGOCIOS (BIA)
Uma análise de impacto de negócios (BIA) prevê as consequências da interrupção de uma função e processos de negócios e reúne informações necessárias para desenvolver estratégias de recuperação.
Cenários potencias de perda devem ser identificados durante uma avaliação de risco. As operações também podem ser interrompidas pela falha de um fornecedor de bens ou serviços.
A BIA deve identificar os impactos operacionais e financeiros resultantes da interrupção das funções e processos empresariais. Os possíveis cenários e impactos a considerar no caso de interrupção do processo / negocio, incluem:
- Vendas e renda perdida;
- Penalidades contratuais;
- Insatisfação ou deserção do cliente;
- Danos físicos ao edifício;
- Danos ou quebras de máquinas, sistemas ou equipamentos;
- Acesso restrito a um local ou edifico;
- Paralisação dos serviços públicos (por exemplo, queda de energia elétrica);
- Danos, perda ou corrupção dos servidores, computadores, sistemas operacionais, aplicativos e dados;
- Absenteísmo de funcionários essenciais;
TEMPO E DURAÇÃO DA INTERRUPÇÃO
A análise de impacto de negócios existe para definir parâmetros sobre o prazo requerido na recuperação dos serviços (indisponibilidade máxima aceitável/objetivo para o tempo de recuperação) e o momento requerido para suas copias de segurança (objetivo para Ponto de recuperação / perda máxima de dados). Parâmetros estes que serão calculados após a elaboração de questionários e tabulação de levantamento de riscos.
Os questionários são pensados para obter informações para a elaboração dos:
- Sistemas /processos críticos de negócios sob responsabilidade da empresa;
- Levantar o investimento e custeio para implantação das alternativas para evitar a interrupção e /ou recuperar as operações;
- Impactos a serem considerados;
- Grau de criticidade dos sistemas/processos críticos;
- Tempo objetivado e tempo máximo de paralisação, bem como o seu ponto positivo;
- Decidir sobre as alternativas, recursos e seus custos com base em análise de custo x benefício;
CONDUÇÃO DA BIA
Para que se dê uma condução correta da BIA, primeiramente se faz necessário a análise da criticidade e após, a avaliação de todos os impactos (financeiro, legal, operacional, administrativo imagem e recursos humanos).
A tabela abaixo serve como referência para que se identifique as ameaças, seus impactos, qual o valor sobre o negócio, sua importância e qual o procedimento será adotado para correção desta ameaça.
A revisão desta tabela deve ser feita anualmente, ou sempre que houver mudanças significativas das atividades, devendo, nesse caso, o Grupo B2 solicitar a revisão.
Ameaças | Impacto | Valor | Importância | Procedimento |
Defeito de Hardware | Direto | Alto | 1 | |
Danos, perda ou corrupção dos servidores, computadores e sistemas operacionais | Direto | Alto | 1 | |
Falha no Backup | Direto | Alto | 1 | |
Perda de dados vitais ao negocio | Direto | Alto | 1 | |
Ataques à Sistemas | Direto | Alto | 2 | |
Falha humana (imprudência, negligencia e/ou imperícia) | Direto | Alto | 2 | |
Desatualização de Softwares | Indireto | Médio | 3 | |
Falha no equipamento interno | Direto | Médio | 3 | |
Falha estrutural (danos físicos ao edifício/escritório) | Indireto | Baixo | 4 | |
Absenteísmo de funcionários essenciais | Direto | Baixo | 4 |
RELATORIO DA BIA
Para verificação do nível de criticidade do risco, será utilizada a seguinte formula: AMEAÇA + IMPORTANCIA = IMPACTO DE NEGOCIO.
Para cálculo desta formula, serão utilizados os seguintes parâmetros de pontuação:
- Importância 1 – 15 pontos para cada processo;
- Importância 2 – 10 pontos para cada processo;
- Importância 3 – 07 pontos para cada processo;
- Importância 4 – 03 pontos para cada processo;
O resultado desta formula, sinaliza o grau de impacto da não implementação de contingência e/ou sua demora, no caso de desastre ou paralização do serviço.
Resultado | Severidade | Impacto da não implementação de contingencia |
70 a 100 | Critico | Alto |
40 a 70 | Moderado | Médio |
10 a 40 | Leve | Baixo |
PLANO DE ADMINISTRAÇÃO DE CRISES - (PAC)
Este plano especifica as ações ante os cenários de desastres. As ações incluem administrar, gerir, eliminar ou neutralizar os impactos inerente ao relacionamento entre os envolvidos e/ou afetados, até a superação da crise.
OBJETIVO
O objetivo do PAC é garantir a comunicação, gerenciar as crises e viabilizar uma compreensão linear a todos os envolvidos das ações antes, durante e após a ocorrência de um desastre.
São objetivos específicos do PAC:
- Garantir a segurança à vida das pessoas;
- Orientar os funcionários e demais colaboradores sobre as condutas que serão tomadas;
- Informar aos clientes com esclarecimentos condizentes com o ocorrido em tempo hábil;
- Minimizar transtornos sobre os desdobramentos de incidente e estimular o esforço em conjunto para a superação da crise;
EXECUÇÃO DO PLANO
Na ocorrência de um desastre será necessário entrar em contato com as áreas afetadas para informa-las de seu efeito na continuidade dos serviços e tempo para recuperação. O plano deve incluir ações para redirecionar as chamadas telefônicas recebidas para um segundo número. A equipe de comunicação será responsável por contatar os clientes e demais prejudicados e passar as informações pertinentes.
A comunicação ocorrerá da seguinte forma:
- COMUNICAR AS AUTORIDADES: Deve-se comunicar as autoridades competentes em caso de desastre que envolva risco às pessoas, fornecendo informações de localização, natureza, magnitude e impacto do desastre.
- Policia Militar - 190
- SAMU – 192
- Corpo de Bombeiros – 193
- Defesa Civil – 199
- COMUNICAR OS SETORES RESPONSAVEIS: Além da comunicação aos responsáveis, deverá informar também:
- Natureza, impacto e abrangência da catástrofe;
- Ações de contingência em andamento;
- Processos / sistemas e serviços cobertos pelo plano de continuidade (serviços essenciais);
- COMUNICAR FORNECEDORES / PRESTADORES DE SERVIÇOS;
- COMUNICAR COLABORADORES EXTERNOS;
- COMUNICAR TODAS AS PARTES ACIMA QUANDO OCORRER O RETORNO DAS OPERAÇÕES À NORMALIDADE;
ENCERRAMENTO DO PAC
Uma vez validado o retorno das funções essências do sistema e sua total estabilidade, bem como a estabilidade do datacenter, se esse for o caso, a Equipe de comunicação entrará em contato com todos os envolvidos descritos neste plano, provendo as informações de retorno e o status dos serviços essenciais, devendo emitir um parecer relatando as atividades realizadas para restabelecimento dos serviços.
PLANO DE CONTIGENCIA – (PC)
OBJETIVO
Este plano visa estabelecer uma recuperação após um desastre, com o objetivo de assegurar o reestabelecimento dos sistemas essenciais e suas respectivas atividades.
Tem como principal objetivo listar os procedimentos definidos para permitir que serviços de processamento e armazenamento de dados continuem a operar, mesmo que com um certo grau de degradação.
DEFINIÇÃO DA ESTRATEGIA
O plano de contingência, tem como definição três pilares macros, aos quais se baseiam:
- PESSOAS: trata dos recursos humanos envolvidos nas atividades em contingência;
- ORGANIZAÇÃO: trata a disponibilidade e segurança dos recursos estruturais organizacionais para suportar as atividades necessárias em contingência;
- TECNOLOGIA: trata dos recursos de hardware e software apoiados em tecnologias e complementam para atender a contingência;
Seguindo esta linha, temos como referência quatro grupos, distribuídos da seguinte forma:
- Contingência de infraestruturas físicas: Compreende as situações de catástrofe, naturais ou não, tais como inundações, desabamentos, incêndios, falhas no fornecimento de energia, entre outros. Em termos gerais, são ocorrências que impeçam o acesso e/ou utilização das instalações, como também danos físicos relevantes a instalações e/ou equipamentos, intencionais ou não;
- Contingência de pessoas: São aquelas onde os colaboradores chave não estão presentes por motivos de greves, doenças, licenças e etc;
- Contingencia de Infraestruturas Tecnológicas: Compreende as situações de inacessibilidade, falha ou perda de quaisquer recursos de TI, tais como hardware, software, telecomunicações, rede e segurança;
- Contingência de serviços: Externos Compreende as situações de não prestação de serviço contratado considerado critico aos processos;
ETAPAS DA CONTIGENCIA
Para que a contingência siga seu fluxo, são recomendadas que essas etapas estejam presentes. São elas:
- Diagnostico: consiste na identificação dos pontos fracos que poderiam ser foco de problemas para o setor de TI da empresa;
- Analise de riscos: a partir das vulnerabilidades, deve-se considerar as possíveis ameaças e os fatores que possam levar à concretização desses riscos, como o ataque de vírus e a ausência de um antivírus corporativo;
- Definição de prioridades: identificar os processos vitais da empresa e apontar quais os sistemas que precisam ser recuperados primeiro ou preferencialmente em casos de problemas;
- Determinação de estratégias: esse é o caminho para se definir como cada sistema deve ser recuperado (usando softwares ou aplicações), quando e quem são os responsáveis por isso.
ENCERRAMENTO DO PLANO DE CONTIGENCIA
O plano será encerrado assim que todos os serviços estiverem estáveis e o funcionamento dos sistemas essenciais operando normalmente.
A equipe responsável pelo retorno deve emitir um parecer relatando as atividades realizadas, que por sua vez deverá fornecer um comunicado de retorno as atividades.
PLANO DE RECUPERAÇÃO DE DESASTRES – (PRD)
Este plano descreve os cenários de inoperância e seus respectivos procedimentos, para que, uma vez definindo as atividades prioritárias para restabelecer o nível de operação dos serviços, controlada a contingência e passada a crise, a organização retorne aos seus níveis normais de operação.
Para garantir o retorno das operações depois da ocorrência de uma crise ou desastre, são objetivos do plano de recuperação:
- Avaliar danos aos ativos e conexões do DataCenter e prover meios para sua recuperação;
- Evitar desdobramento de outros incidentes;
- Reestabelecer o DataCenter dentro do prazo tolerável.
EXECUÇÃO DO PLANO DE RECUPERAÇÃO
Para que o plano transcorra como planejado, deve-se executar os seguintes passos:
- A equipe responsável pelos BACKUPS e SERVIDORES, deverá identificar e listar todos os ativos danificados da ocorrência do desastre;
- A equipe de rede deverá identificar as interrupções de conexões e acessos gerados após o desastre, informando se a abrangência está na rede local, WAN ou com o provedor de serviços;
- Os responsáveis pelo PRD deverão mapear quais os serviços foram descontinuados contendo as informações de perda de ativo e de conexão;
- O comitê responsável pelo PRD, após o mapeamento das perdas e impactos elaborará um cronograma de recuperação das aplicações, levando em consideração as seguintes aplicações para recuperação:
- Substituição dos ativos e equipamentos;
- Reconfiguração de ativos e equipamentos;
- Teste de ambiente;
SUBSTITUIÇÃO DOS ATIVOS E EQUIPAMENTOS
Em caso de perda de ativos, deverá ser imediatamente informado a necessidade de aquisição de ativos perdidos que não puderem ser recuperados. A equipe irá mensurar quanto tempo a aquisição irá impactar cada serviço, comunicando se há alguma solução alternativa a ser tomada enquanto é realizada a aquisição. As informações pertinentes à alteração do tempo de recuperação dos serviços serão passadas às equipes de PCO e PAC.
RECONFIGURAÇÃO DE ATIVOS E EQUIPAMENTOS
A equipe responsável deverá verificar que as configurações dos ativos reparados ou substituídos estão em funcionamento pleno. Caso não estejam, prover cronograma estimado para configurar estes ativos.
TESTE DE AMBIENTE
O ambiente principal (local e/ou DataCenter), deverá ser testado antes da recuperação dos dados, a fim de garantir que o processo de recuperação ocorra conforme o planejado. Os testes e recuperações deverão:
- Garantir os mesmos níveis de capacidade e disponibilidade dos serviços essenciais antes do desastre;
- Garantir a integridade dos dados, que podem estar corrompidos ou defasados;
- Validar todas as configurações anteriores;
- Suportar o retorno dos sistemas de acordo com a demanda;
- Verificar a integridade dos dados e restaurar os backups, caso necessário.
ENCERRAMENTO DO PLANO
O plano será encerrado assim que os procedimentos de recuperação forem realizados por todas as equipes. Ao termino de todos os procedimentos, as informações de recuperação de serviços serão consolidadas em parecer especifico, informando o horário de reestabelecimento de cada serviço, equipamentos adquiridos e/ou realocados, se for o caso, fornecedores que tiveram de ser acionados procedimentos de recuperação realizados, entre outras informações relevantes.
PLANO DE CONTINUIDADE OPERACIONAL – (PCO)
Este plano descreve os cenários de inoperância e seus respectivos procedimentos alternativos planejados, definindo as atividades prioritárias para garantir a continuidade dos serviços e restabelecer o funcionamento dos principais ativos que suportam as operações de TI, reduzindo o tempo de queda e os impactos provocados por um eventual desastre.
OBJETIVO
Garantir ações de continuidade durante e depois da ocorrência de uma crise ou desastre, tratando-se apenas de ações de contingência, destinados a manter a continuidade dos processos de negócios e serviços vitais. É através deste, que as equipes de processos saberão como agir na falta ou na falha de algum componente que o suporte, garantindo assim a continuidade do processo, reduzindo os seus impactos.
Prover meios para manter o funcionamento dos principais serviços de TI e a continuidade das operações e sistemas essências.
Estabelecer controles, regras e procedimentos alternativos que possibilitem a continuidade das operações de TI durante uma crise ou cenário de desastre.
Definir os formulários, checklist e relatórios a serem entregues pelas equipes ao executar a contingencia.
EXECUÇÃO DO PLANO
Identificada a ocorrência de um incidente, crise ou desastre, a equipe de operações e backups deve verificar a dimensão do impacto, extensão e possíveis desdobramentos do ocorrido. Após a avaliação de impacto de desastre, a equipe responsável deverá preencher um questionário para avaliação e decisão sobre o acionamento do plano e início das ações de contingência. Este questionário deve ser divulgado para todas as equipes envolvidas.
Dado o aval para o acionamento do plano pelos responsáveis, será convocada uma reunião de emergência com os lideres com o intuito de:
- Coordenar prazos e orquestrar as ações de contingência;
- Informar as equipes de ações de contingência com a priorização dos serviços essências;
PROCEDIMENTOS DE RETOMADA
Para que se tenha a retomada do negócio, será necessário a verificação das seguintes etapas:
- Estimar o impacto de perda de dados;
- Identificar ativos afetados;
- Mapear ativos a serem recuperados;
- Estimar volume dos dados a serem recuperados;
- Tempo de recuperação e possíveis perdas operacionais;
- Implantar procedimento de recuperação;
- Testar procedimentos realizados;
- Repassar os procedimentos aos servidores e verificar melhorias.
ENCERRAMENTO DO PLANO
O plano será encerrado assim que for validado o funcionamento dos sistemas essências, bem como o DataCenter, se esse for o caso, relatando a sua estabilidade e a sua normalidade. Após esse processo, será emitido um parecer da equipe responsável, informando o que ensejou o acionamento do plano, as atividades realizadas e os recursos que foram utilizadas para então, comunicar a todos os setores a estabilidade do sistema.