A mais recente falha na região US-East da Amazon Web Services (AWS), a quarta em cinco anos, provocou interrupções em serviços de alcance global, de assistentes domésticos a portais governamentais. O problema, identificado como uma falha no sistema de resolução de DNS, afetou pilares da operação da AWS como DynamoDB, EC2, Lambda e IAM, gerando […]
A mais recente falha na região US-East da Amazon Web Services (AWS), a quarta em cinco anos, provocou interrupções em serviços de alcance global, de assistentes domésticos a portais governamentais. O problema, identificado como uma falha no sistema de resolução de DNS, afetou pilares da operação da AWS como DynamoDB, EC2, Lambda e IAM, gerando impactos em plataformas de consumo, bancos, ferramentas corporativas e órgãos públicos.
Embora a empresa tenha informado que o incidente foi mitigado em poucas horas, os efeitos se estenderam por dias, afetando milhões de usuários e revelando um ponto sensível na economia digital: a dependência excessiva de um único provedor de nuvem e, mais especificamente, de uma única região de data centers.
Segundo análise da consultoria Forrester, o episódio expõe a fragilidade estrutural da nuvem moderna e o chamado risco de concentração, quando múltiplas empresas, de diversos setores, dependem do mesmo fornecedor e de serviços interconectados. No caso da AWS, a interrupção em um componente aparentemente isolado, como o DynamoDB, desencadeou uma reação em cadeia que afetou aplicações de análise de dados, aprendizado de máquina e busca.
Leia também: Migração de virtualização para OpenShift acelera negócios da Red Hat no Brasil
Os analistas lembram que, embora a AWS adote o modelo de responsabilidade compartilhada, o qual define limites entre a infraestrutura do provedor e o que cabe ao cliente, a prática mostra que, quando falhas atingem serviços centrais, até aplicações bem arquitetadas ficam vulneráveis. “Empresas acabam esperando a correção da AWS, mesmo seguindo as boas práticas indicadas por ela”, escreveram os especialistas.
O modelo, apontam, transfere parte da responsabilidade operacional para o cliente, mas não elimina o impacto coletivo de uma interrupção em larga escala. “A crença de que grandes provedores são ‘grandes demais para falhar’ é um erro recorrente”, observam os autores do estudo.
A Forrester destaca que a adoção em massa da nuvem, especialmente da AWS, criou um ecossistema de interdependência que torna as falhas pontuais potencialmente sistêmicas. A combinação entre SaaS, desenvolvimento terceirizado e visibilidade limitada das dependências técnicas amplifica o impacto de cada pane. “Essa concentração de risco é uma característica da nuvem atual, não uma exceção”, alertam.
O relatório orienta líderes de tecnologia a adotar medidas imediatas para reduzir a exposição a falhas de infraestrutura e fortalecer a continuidade dos negócios. Entre as recomendações:
Além da dimensão técnica, a Forrester recomenda uma revisão profunda da gestão de risco com provedores de nuvem e SaaS. A consultoria sugere mapear todas as dependências de serviços externos, renegociar cláusulas contratuais que definam responsabilidades durante falhas e testar planos de recuperação dos parceiros.
Mesmo iniciativas regulatórias, como o Digital Operational Resilience Act (DORA) da União Europeia, são consideradas insuficientes, por focarem no cliente e não exigirem dos grandes provedores melhorias estruturais. “Cumprir regras não é o mesmo que ser resiliente”, afirmam os analistas.
A Forrester conclui que os líderes de tecnologia devem encarar a nuvem não como um ambiente infalível, mas como um ecossistema de riscos interligados que exige governança constante, diversificação de fornecedores e cultura de prevenção.
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!