"Sua empresa sobrevive 48 horas sem servidor?" Para a maioria das empresas brasileiras, a resposta honesta é "não". Sistemas críticos parados significam vendas perdidas, contratos descumpridos, multas regulatórias e — em casos graves — clientes perdidos pra sempre.
Disaster Recovery (DR) é a disciplina de garantir que, quando o pior acontecer, sua operação volte ao ar em tempo aceitável e sem perda significativa de dados. DRaaS (Disaster Recovery as a Service) é o modelo onde um provedor de cloud cuida disso pra você. Este guia mostra como funciona, quanto custa em Real e como montar plano DR realista em 30 dias.
O que é Disaster Recovery (e por que não é só backup)
Backup ≠ Disaster Recovery. Backup é cópia de dados. DR é a capacidade de voltar a operar. A diferença prática:
- Backup: seu banco de dados está copiado no S3. Bom. Mas pra voltar ao ar, você precisa: provisionar servidor novo, instalar SO, instalar PostgreSQL, restaurar backup, redirecionar DNS, testar — tempo total realista 4-12 horas.
- DR completo: ambiente espelho já provisionado em outra região. Em caso de incidente, faz failover (manual ou automático), DNS atualiza, operação volta — tempo total 5-60 minutos.
Backup é pré-requisito de DR. DR é backup + infraestrutura de standby + automação de failover + processo testado.
RPO e RTO: as 2 métricas que definem o seu DR
RPO — Recovery Point Objective
Quanto de dado posso perder? Se o desastre é às 14h e meu último backup é das 12h, perdi 2 horas de dado. RPO = 2h.
RTO — Recovery Time Objective
Quanto tempo posso ficar fora do ar? Se incidente é às 14h e voltei às 17h, fiquei 3 horas down. RTO = 3h.
Cada empresa define seus alvos por sistema:
| Sistema | RPO típico | RTO típico | Estratégia DR |
|---|---|---|---|
| E-commerce de alto volume | < 5 min | < 30 min | Multi-site ativo + replica síncrona |
| ERP corporativo | < 15 min | < 2 horas | Hot standby + replica assíncrona |
| Site institucional | 1 dia | 4-8 horas | Backup diário + restore |
| Sistema interno não-crítico | 1 semana | 1-3 dias | Backup semanal + processo manual |
4 estratégias DR (do mais barato ao mais robusto)
1. Backup & Restore (RPO horas, RTO horas)
Como funciona: backup periódico em destino separado. Em caso de desastre, provisiona ambiente novo e restaura.
Custo: baixo — só backup ativo.
Quando usa: sistemas não-críticos onde algumas horas de downtime são aceitáveis.
2. Pilot Light (RPO < 1h, RTO 1-4h)
Como funciona: mantém apenas a parte mínima do ambiente "acesa" no DR site (geralmente o banco de dados replicado). Em incidente, "liga" o resto rapidamente.
Custo: médio — paga DB standby + storage.
Quando usa: ERPs, sistemas internos importantes mas não 24/7 críticos.
3. Warm Standby (RPO < 15min, RTO < 1h)
Como funciona: ambiente DR rodando em capacidade reduzida. Em incidente, escala pra capacidade plena e assume tráfego.
Custo: alto — ambiente paralelo permanente, embora menor.
Quando usa: aplicações críticas que toleram alguns minutos de downtime.
4. Multi-Site Active/Active (RPO ~0, RTO ~0)
Como funciona: tráfego dividido entre 2+ regiões simultaneamente. Se uma cai, a outra absorve sem interrupção.
Custo: muito alto — duplica (ou mais) infraestrutura.
Quando usa: bancos, e-commerce gigante, plataformas de pagamento, telecom.
DRaaS: como o "as a Service" muda o jogo
Montar DR do zero exigia: 2º datacenter (ou contrato em outra região), software de replicação licenciado, time pra manter, drills periódicos. Custo CapEx + OpEx alto.
DRaaS terceiriza tudo isso. Você assina serviço, define RPO/RTO desejado, e o provedor cuida de:
- Replicação contínua dos dados pro DR site
- Provisionamento da infra DR
- Orquestração do failover (manual via painel ou automático)
- Testes periódicos sem afetar produção
- Failback (voltar pra produção primária depois que ela se recuperar)
DRaaS no Brasil pode ser oferecido em modelos "site" (replica completa em datacenter diferente) ou "hibrido" (produção local + DR em cloud nacional). Audaks oferece DRaaS combinando VPS e Backup em Nuvem com replicação programada e failover assistido pela equipe.
Quanto custa DR no Brasil (cenário real)
Cenário: empresa média com 3 servidores produção (16 vCPU total, 64 GB RAM total), 1 banco PostgreSQL gerenciado (8 vCPU/32 GB), 1 TB de dados.
| Estratégia DR | Custo mensal estimado | RPO/RTO |
|---|---|---|
| Backup & Restore (cloud nacional) | R$ 400 — 800 | RPO 24h / RTO 4-12h |
| Pilot Light (cloud nacional) | R$ 1.200 — 2.000 | RPO 1h / RTO 1-4h |
| Warm Standby (cloud nacional) | R$ 3.500 — 5.500 | RPO 15min / RTO < 1h |
| Active/Active multi-site | R$ 8.000+ | RPO ~0 / RTO ~0 |
| DRaaS gerenciado (Audaks) | R$ 1.800 — 4.500 | Configurável conforme tier |
Comparando com perda potencial: e-commerce médio fatura R$ 30-100 mil/dia. Um dia de downtime sem DR pode pagar 5-20 anos de serviço DR. ROI claro.
Como montar plano DR realista em 30 dias
Semana 1 — Inventário e classificação
Lista tudo que roda em produção. Pra cada sistema, define: criticidade (1-5), RPO aceitável, RTO aceitável, dependências (esse sistema precisa do quê pra funcionar?).
Semana 2 — Estratégia por sistema
Mapeia cada sistema pra uma das 4 estratégias DR. Sistemas críticos vão pra Warm Standby ou Active/Active. Sistemas auxiliares vão pra Backup & Restore.
Semana 3 — Implementação técnica
Configura replicação de banco (PostgreSQL: streaming replication, logical replication; MySQL: binlog replication, GTID). Configura backup em destino separado. Provisiona infra DR conforme estratégia.
Semana 4 — Documentação e drill
Documenta runbook (passo a passo do failover) acessível offline (não pode estar só no Confluence se Confluence cair). Faz drill real — derruba algo de propósito, mede tempo de recovery, ajusta o que falhou.
Sem drill, plano DR é ficção. A regra: testa pelo menos a cada 6 meses. Sem teste, é normal descobrir no incidente que o plano não funciona.
Erros comuns que destroem o plano DR
- Backup junto com produção: backup no mesmo datacenter, mesma rede, mesma conta cloud que produção. Ransomware criptografa tudo.
- Não testar restore: backup que nunca foi testado de restauração tem alta taxa de falha quando precisa.
- RPO/RTO definido por achismo: sem alinhar com finance/produto/negócio, vira número arbitrário.
- DR site na mesma região: incidente regional (apagão SP, alagamento) derruba os dois sites.
- Esquecer dependências: sistema A faz failover ok, mas depende do B que não tem DR. Sistema fica down de qualquer jeito.
- Documentação só no Wiki interno: se Wiki cai junto, ninguém sabe o que fazer.
Perguntas frequentes sobre DR e DRaaS
Backup em cloud já é DR?
Não. Backup é base mas não é suficiente. DR completo inclui infra de standby, automação de failover, runbook documentado e drills periódicos. Empresa que só tem backup leva horas pra voltar — em e-commerce de alto volume, isso é vendas perdidas demais.
Posso usar AWS sa-east-1 + sa-east-2 como DR?
AWS hoje só tem uma região no Brasil (sa-east-1). Pra DR cross-region você teria que ir pra us-east-1 ou outra — custo de tráfego internacional, latência alta, e pode ferir LGPD. Cloud nacional brasileira tem datacenters geo-redundantes em SP que servem como DR sem sair do país.
Quanto tempo leva pra implementar DR?
30 dias para plano básico funcional. 90 dias para plano completo testado. 6-12 meses pra atingir maturidade (drills regulares, automação completa, RPO/RTO baixos consistentes).
DR vale pra empresa pequena?
Vale escalar pra criticidade. Empresa pequena com sistema crítico pra operação (ERP que se cair fecha a empresa) precisa de DR mesmo barato (Backup & Restore + runbook). Não precisa do mesmo nível de empresa de grande porte, mas ter zero plano DR é receita pra desastre.
O que é DRaaS por suas siglas?
DRaaS = Disaster Recovery as a Service. Modelo onde o provedor de cloud cuida da infraestrutura DR, replicação e ferramentas de failover. Cliente paga mensalidade e foca em definir RPO/RTO + testar.
Próximo passo
Se sua empresa hoje só tem backup (ou nem isso), comece pelo plano básico. A Audaks oferece backup corporativo em nuvem com retenção configurável e replicação geográfica como ponto de partida, e DRaaS gerenciado para empresas que precisam de RTO < 1h. Conversamos com sua equipe sobre RPO/RTO desejado e devolvemos proposta de DR em até 5 dias úteis.
