Business Continuity Plan (BCP)

v1.23






Índice

Introdução    1

Âmbito e Objetivos    2

Lista de Siglas Relacionadas    3

Incidentes    4

O que pode acontecer?    4

Cronograma    5

Riscos associados à execução deste plano    5

Plano de Contingência    6

Ataque Informático    6

Incêndio ou terramoto    6

Falha nos backups    6

Falha humana    7

Sem acesso de internet    7

Falha física de hardware    7

Falha no fornecimento de eletricidade    7

Plano de Gestão de Crises    8

Equipa e estrutura de responsabilidades    8

Critérios    9

Sinais de Alerta    9

Responsável de Comunicação    10

Contatos de Emergência    10

Notificações    10

Avaliação do Incidente e análise do impacto    11

Comunicação    12

Testar a Eficácia do Plano    12

Plano de recuperação de desastres    13

Plano de Business Continuity Management    13



  1. Introdução

Este documento tem como objetivo descrever e documentar os vários procedimentos associados ao Plano de Continuidade de Negócio em caso de incidentes que impeçam o correto funcionamento do negócio (Business Continuity Plan - BCP) a nível do World VDS da Amplitude Net, de forma a que, no caso de acontecer um incidente grave, seja possível:

  • Estabelecer a comunicação com os clientes de forma ágil e transparente, para responder às expectativas;

  • Minimizar os dados e processos perdidos;

  • Minimizar a duração de uma paralisação das operações de negócio associadas ao TI;

  • Assegurar que as operações críticas possam recomeçar o processamento normal dentro de um espaço de tempo razoável;

  • Reduzir as perdas financeiras em casos de desastres;

  • Proteger dados pessoais;

  • Facilitar a coordenação eficaz de tarefas da recuperação;

  • Reduzir a complexidade do esforço de recuperação.


Os critérios mais importantes para a prevenção de incidentes graves são:

  • Probabilidade de ocorrência: estimativa (em %) de acontecer um determinado incidente;

  • Consequência: impacto negativo que a causa exerce sobre diversos atores, como clientes, consumidores, parceiros, no que diz respeito a impacto financeiro, de proteção de dados, de perda de tempo, de perda de serviço;

  • Perigosidade: intensidade do impacto negativo se o incidente ocorrer, por forma a ordenar os incidentes.




  1. Âmbito e Objetivos

Este plano incide sobre a infraestrutura de armazenamento de dados da solução World VDS.

O World VDS é uma ferramenta de comunicação para gestão remota de conteúdos em ecrãs, da Amplitude Net.

É composto por software instalado numa cloud, os respetivos conteúdos (tipicamente carregados pelo cliente) e os ecrãs onde serão disponibilizados os conteúdos de forma remota, que terão players físicos ou embebidos.

Este plano irá focar-se na componente cloud, visto ser a parte da solução que está do lado da Amplitude Net.

A cloud utilizada é fornecida pela empresa Oni Telecom.


O objetivo é definir linhas orientadoras do que fazer em caso de ocorrerem imprevistos (incidentes) que impactem de forma negativa a solução. Essas linhas orientadoras estão compiladas em protocolos, que deverão ser acionados nessas circunstâncias, de modo a recuperar a situação normal o mais rápido possível, com o menor impacto possível - seja financeiro, de serviço e humano.



  1. Lista de Siglas Relacionadas

Neste capítulo é apresentada a lista de termos relacionados com o BCP. Embora alguns dos mesmos não se encontrem no presente documento, poderão vir a aparecer em comunicações ou análises efetuadas no decorrer das ações previstas, pelo que também são apresentadas.


  • BCP – Business Continuity Plan (Plano de Continuidade de Negócio)

  • BIA (business impact analysis)

  • RTO – Recovery Time Objective

  • MSAD – Machado, Sarmento Advogados







  1. Incidentes

  • O que pode acontecer?

Os servidores de dados, alojados na Oni Telecom, podem ser visados por vários problemas, por exemplo: ataque informático, incêndio, falha física de hardware, interrupção no acesso à internet por parte da operadora e falha nos serviços de backup. Ainda que a possibilidade de acontecer seja baixa, o impacto seria tão grande que é necessário mitigar esses riscos.


Como esses incidentes impactam o negócio?

A tabela seguinte refere os possíveis incidentes e como poderão impactar.

Incidente

Probabilidade

Consequência

Perigosidade *

Ataque informático

2%

Muito grave.

Possibilidade de encriptação dos dados.

5

Falha nos backups

1%

Muito grave.

Possibilidade de perda dos últimos dados dos N últimos backups com falha.

5

Incêndio ou terramoto

0,001%

Muito grave.

Possibilidade de destruição dos discos com os dados.

5

Sem acesso de internet

2%

Grave.

Impossibilidade de acesso remoto ao World VDS.

4

Falha física de hardware

1%

Grave.

A própria operadora tem um sistema de recuperação, através da clonagem dos dados em vários discos.

4

Falha humana

0,1%

Grave.

Desligamento de um cabo, derrame de algum líquido.

4

Falha no Fornecimento de electricidade

0,01%

Grave.

Impossibilidade de acesso ao World VDS.

4







  1. Cronograma


  1. Riscos associados à execução deste plano

Mesmo um plano de mitigação de riscos tem os seus próprios riscos associados, por exemplo, o responsável de uma determinada área, protocolo ou tarefa não está disponível.


Risco

Avaliação do risco

Consequência

Medidas de prevenção

Responsável não está disponível

Elevado

Plano de Continuidade não é executado, logo incidente não é resolvido

Ter até 2 sub-responsáveis

Sem acesso de internet

Moderado

Atraso na resolução do incidente.

Ter pelo menos dois acessos à internet.

Equipa não se lembrar dos protocolos

Moderado

Atraso na resolução do incidente.

Formação. acesso ágil à documentação.





  1. Plano de Contingência

O plano de contingência contém os protocolos que deverão ser executados quando um dos incidentes anteriores acontece, de modo a interromper o incidente, dar respostas e combater a situação adversa.

 

Processo de execução do Plano de Contingência

  1. Ataque Informático

Responsável: Responsável pela rede e infraestrutura da AmplitudeNet

Protocolo: Disaster Recovery Plan (DRP)

  1. Incêndio ou terramoto

Responsável: Responsável pela rede e infraestrutura da AmplitudeNet

Protocolo: Disaster Recovery Plan (DRP)

  1. Falha nos backups

Responsável: Responsável pela rede e infraestrutura da AmplitudeNet

Protocolo: Disaster Recovery Plan (DRP)

  1. Falha humana

Responsável: Responsável pela rede e infraestrutura da AmplitudeNet

Protocolo: Disaster Recovery Plan (DRP)

  1. Sem acesso de internet

Responsável: Responsável pela rede e infraestrutura da AmplitudeNet

Protocolo: Disaster Recovery Plan (DRP)

  1. Falha física de hardware

Responsável: Responsável pela rede e infraestrutura da AmplitudeNet

Protocolo: Disaster Recovery Plan (DRP)

  1. Falha no fornecimento de eletricidade

Responsável: Responsável pela rede e infraestrutura da AmplitudeNet

Protocolo: Disaster Recovery Plan (DRP)

 

 

  1. Plano de Gestão de Crises

Descreve um conjunto de ações, funções e responsabilidades, e define o que será feito para contornar a crise como um todo e sobreviver à crise (incidente grave).

  1. Equipa e estrutura de responsabilidades

A equipa para gestão da crise é composta por:

  • Órgão de administração da Amplitude Net;

  • Responsável servidor / líder RD da Amplitude Net;

  • Responsável pela comunicação da Amplitude Net;

  • Machado, Sarmento Advogados (MSAD).


O órgão de administração da AmplitudeNet deverá garantir a salvaguarda da resiliência operacional da instituição, designadamente a recuperação célere do negócio em caso de perturbações na atividade.

A competência pela implementação da política de BCP pode, contudo, ser delegada num comité criado para o efeito ou em outra unidade de estrutura ou responsável que se julgue adequado, o que não afasta, contudo, a responsabilidade última do órgão de administração.

O órgão de administração deve também promover e incentivar a sensibilização dos recursos humanos para a prevenção e preparação para eventuais situações de perturbação da atividade, o que pode ser conseguido através da atribuição clara de uma prioridade elevada à política de BCP, nomeadamente através da afetação, a esta política, de recursos humanos e financeiros em quantidade e qualidade suficientes para assegurar uma implementação abrangente e robusta. 

A política de BCP deve prever uma estrutura de responsabilidades clara, no âmbito da qual se define expressamente a divisão de atribuições entre os colaboradores que participam na estratégia de recuperação, quando ativada em caso de desastre. Assim, os colaboradores da instituição devem compreender, inequivocamente, as funções que lhes estão atribuídas numa situação de emergência.  

Os colaboradores que integram a referida estrutura de responsabilidades devem ser qualificados, devendo as instituições proporcionar-lhes um nível de formação específica adequada e continuamente atualizada. Em especial, os colaboradores devem estar completamente familiarizados com as infraestruturas alternativas que existam, as quais devem estar totalmente operacionais e com os postos de trabalho alternativos preparados e plenamente disponíveis.


O responsável de comunicação deve criar, manter, atualizar e testar, em articulação com as entidades relevantes, uma política de comunicação com todos os interessados, de modo a assegurar os fluxos de informação necessários à recuperação de processos e continuidade do negócio em caso de crise, assegurando as obrigações perante clientes e outras contrapartes, bem como o cumprimento de deveres de reporte às autoridades de supervisão.  


  1. Critérios

Na tabela seguinte estão definidos os critérios que serão usados para determinar se uma crise ocorreu;

Incidente

Critério

Ocorrências

Ataque informático

Não há acesso normal a algum serviço, máquina virtual ou servidor.

>5 min

Incêndio ou terramoto

Não há acesso normal a algum serviço, máquina virtual ou servidor. Empresa provedora do serviço cloud comunica.

>5 min

Falha nos backups

Empresa provedora do serviço cloud comunica.

Amplitude Net não consegue recuperar determinado(s) backup(s).

2 tentativas

Falha humana

Empresa provedora do serviço cloud comunica.

Não há acesso normal a algum serviço, máquina virtual ou servidor.

Queixa por parte de um cliente.

>5 min

Sem acesso de internet

Empresa provedora do serviço cloud comunica.

Não há acesso normal a algum serviço, máquina virtual ou servidor.

Queixa por parte de um cliente.

>5 min

Falha física de hardware

Empresa provedora do serviço cloud comunica.

Não há acesso normal a algum serviço, máquina virtual ou servidor.

Queixa por parte de um cliente.

>5 min

Falha no Fornecimento de electricidade

Empresa provedora do serviço cloud comunica.

Não há acesso normal a algum serviço, máquina virtual ou servidor.

Queixa por parte de um cliente.

>15 min


  1. Sinais de Alerta

A AmplitudeNet usa o Zabbix, um sistema de monitorização remota de redes e aplicações. Assim permite detetar sinais de alerta precoces de várias situações de crise.

Quando não há acesso normal a algum serviço, máquina virtual ou servidor por um período superior a 1 minuto, a equipa de suporte técnico é avisada, o que permite ter um Recovery Time Objective (RTO) muito rápido.


  1. Responsável de Comunicação

A AmplitudeNet disponibiliza um responsável de comunicação para a gestão de comunicação da crise/incidentes.


  1. Contatos de Emergência

Lista dos principais contatos de emergência:

Empresa

Responsável

Contato

AmplitudeNet

Responsável de Incidentes

220 111 325

Clientes

Responsável

Contato

Cliente 1

Responsável de projeto


Cliente 2

DRH


Cliente 3

DMKT


Cliente 4

Project Owner






  1. Notificações

Seguidamente listamos quem precisará de ser notificado em caso de crise e como essa notificação será feita.


Sujeito

Responsável

AmplitudeNet

Responsável pela rede e infraestrutura da AmplitudeNet

AmplitudeNet

Responsável de comunicação da AmpitudeNet

AmplitudeNet

Restante equipa

Cliente

Interlocutor do cliente

Oni Telecom

Responsável dos Data Centers

Oni Telecom

Assistente Data Center Porto

Oni Telecom

Assistente Data Center Maia

MSAD

Partner da sociedade de advogados

MSAD

Responsável pelo RGPD

MSAD

Advogado geral


  1. Avaliação do Incidente e análise do impacto

A avaliação do incidente depende de cada tipo de incidente. Ao fazer-se um business impact analysis (BIA) poderemos identificar as ameaças e fazer a análise de cada uma delas.


Incidente

Tipo

Gravidade potencial

Ataque informático

Sem acesso temporário + Perda de dados*

Média

Capacidade de recuperação para um estado normal até 6h

Incêndio ou terramoto

Sem acesso temporário + Perda de dados

Média

Capacidade de recuperação para um estado normal até 6h

Falha nos backups

Perda de dados

Baixa

Capacidade de recuperação para um estado normal até 6h

Falha humana

Sem acesso temporário

Baixa

Capacidade de recuperação para um estado normal até 6h

Sem acesso de internet

Sem acesso temporário

Baixa

Capacidade de recuperação para um estado normal até 6h

Falha física de hardware

Sem acesso temporário

Baixa

Capacidade de recuperação para um estado normal até 6h


Falha no Fornecimento de electricidade

Sem acesso temporário

Baixa

Capacidade de recuperação para um estado normal até 6h


*A Perda de dados é até 4 horas, pois é esta a frequência do procedimento de backups incrementais.


  1. Comunicação

A estratégia de comunicação passa pelo contato pessoal com o interlocutor do(s) cliente(s) afetado(s) e envio de e-mail a comunicar:

  • a consciência do incidente;

  • o pedido de desculpas pelo incómodo;

  • a proatividade da equipa na resolução da situação.

E, posteriormente, um e-mail a comunicar o fecho com a resolução do incidente.


  1. Testar a Eficácia do Plano

A AmplitudeNet deve assegurar a realização de testes, simulações, treinos e/ou outros procedimentos de preparação da ativação do plano de continuidade e de verificação da sua qualidade, em situações de risco mínimo a extremo, e a auditoria independente e atualização do BCP, pelo menos anualmente e sempre que necessário. 

O protocolo de teste da eficácia deste plano passa por, anualmente:

  1. avaliar a existência dos riscos atuais;

  2. avaliar a existência de novos riscos;

  3. simular cada um dos riscos;

  4. executar este plano.

Este protocolo deverá ser um processo vivo, isso significa partilhar com os colaboradores da AmplitudeNet, implementar formação, fazer simulações e analisar os resultados para melhorar o plano. É um processo de melhoria contínua.

 

 

  1. Plano de recuperação de desastres

Serve para recuperar os danos causados à empresa, e aos clientes, por causa da crise, uma vez que esteja controlada.

Está descrito no documento ``Disaster Recovery Plan”.



  1. Plano de Business Continuity Management

Este plano refere toda a operacionalização da Gestão de Continuidade, documentando todas as ações e objetivos dela.


Quem

Empresa

Quando

Incidência

Ação

Objetivo

Resultado