Skip to main content

A alta disponibilidade é um dos indicadores mais importantes para sistemas de missão crítica. Por isso, é fundamental que os componentes vitais para o funcionamento do negócio sejam protegidos contra falhas operacionais. Com o objetivo de evitar prejuízos por conta de paralisações de serviço e perda de dados, as empresas de setores essenciais costumam elaborar planos de disaster recovery, ou recuperação de desastres. Neste artigo, apresentamos os principais pontos que devem ser abordados nesses programas. Confira!

O que é um plano de recuperação de desastres

A recuperação de desastres é um dos documentos que compõem o plano de continuidade do negócio, conjunto de ações e estratégias definidas para garantir que os serviços essenciais de uma empresa sejam mantidos durante uma emergência, até que retorne a situação normal. Nesse contexto, o plano de recuperação de desastres (DR, na sigla em inglês) envolve uma série de procedimentos a serem adotados quando acontecem acidentes ou calamidades, com o objetivo de preservar ou recuperar a infraestrutura de tecnologia de uma organização.

Para definir as estratégias de DR, o ponto de partida é a indicação de duas métricas fundamentais: 

Objetivo de ponto de recuperação (RPO)

Trata-se de uma métrica relativa à perda de dados aceitável pela organização. É medida pelo intervalo tolerado entre o último ponto de recuperação gravado em backup e o momento da interrupção do serviço.

Objetivo de tempo de recuperação (RTO)

Este indicador avalia em quanto tempo a recuperação deve acontecer, ou seja, qual é o intervalo máximo aceitável entre o desastre e a restauração do serviço. Na prática, o RTO define um prazo-alvo para a indisponibilidade.

Quais são os riscos a serem mapeados?

Antes de definir a estrutura do plano de DR, é importante identificar quais são os eventuais desastres que podem atingir a operação de uma empresa. Esses incidentes podem ser provocados por catástrofes naturais, por falhas humanas ou por ataques intencionais visando causar danos. Isso inclui uma série de eventos, como por exemplo ciberataques, falhas no fornecimento de energia elétrica, acidentes industriais, terrorismo, epidemias ou pandemias e calamidades (furacões, terremotos, enchentes, incêndios e outros).

Diante desses possíveis cenários, é importante realizar uma análise de riscos detalhada. Nela devem constar as ameaças potenciais, incluindo instalações e pessoas que possam ser afetadas, e os impactos previsíveis caso elas aconteçam. Outra ferramenta disponível é a análise de impacto no negócio (em inglês, business impact analysis), usada para examinar os efeitos desses riscos na operação. Essa segunda etapa inclui avaliações de áreas como segurança, reputação, finanças, gestão da qualidade e outras.

Para reforçar a proteção, as empresas contam com diferentes estratégias. Entre elas, destacam-se a replicação automática de dados para locais off-site em intervalos regulares, cold sites e hot sites e soluções de nuvem para armazenamento e acesso contínuo a sistemas e bases de dados.

Como elaborar um plano de disaster recovery

O documento do plano de DR deve incluir todas as ações necessárias para minimizar os efeitos dos desastres na operação. Também devem ser indicadas as pessoas, equipes e áreas responsáveis por cada procedimento. Outro ponto a ser considerado é a forma de replicação dos dados (síncrona ou assíncrona). De modo geral, essas iniciativas são divididas em etapas, tais como:

Gerenciamento de crise

São as ações iniciais a serem tomadas, logo após o desastre ocorrer.

Manutenção da continuidade operacional

São as rotinas necessárias para garantir que os serviços continuem funcionando.

Recuperação de serviços

É o momento em que os equipamentos e dados afetados voltam a estar disponíveis, possibilitando a retomada da operação normal.

Os modelos mais recentes de recuperação de desastres utilizam tecnologias de replicação em ambientes virtualizados, o que traz maior eficiência de custos e segurança operacional.  Esses sistemas são acionados no caso da ocorrência de incidentes, de acordo com o que foi definido no plano.

Em resumo

Empresas que se baseiam em sistemas de missão crítica dependem de um alto grau de confiabilidade no apoio aos seus centros de operação. Pensando nisso, a BYNE oferece uma solução completa  com a arquitetura em alta disponibilidade (HA), para tornar muito mais ágil a comunicação das empresas, garantindo o melhor tempo de resposta em caso de incidentes.,

Com os recursos do BYNE ControlONE, ajudamos nossos clientes a aumentar a eficiência de seus centros de operação, facilitando a comunicação entre operadores e equipes de campo. Conheça nossa solução