Muitas pessoas estão insatisfeitas com o desempenho de suas implementações multicloud atualmente, e isso é totalmente justificado. Abaixo estão algumas áreas a serem investigadas em busca de soluções.

É quarta-feira e a equipe de contabilidade está finalizando as vendas do mês e realizando o processamento do fim do mês em uma plataforma multicloud que foi implementada há quatro meses. Eles estão inserindo pedidos de vendas em um provedor de nuvem e usando um aplicativo de contabilidade em outro provedor. Conectando ambas as nuvens está um sistema de segurança compartilhado e um gerenciador de API, juntamente com outros serviços.
O que costumava ser resolvido rapidamente no mês passado, agora está demorando quase um dia para ser concluído. Recebe uma ligação irritada do CFO perguntando o que está acontecendo com o desempenho do seu multicloud este mês.
Diferentes níveis de estresse afetam o desempenho das implementações multicloud e em nuvem. Enquanto houve pouco estresse no processamento do mês anterior, este mês está apresentando um nível de estresse médio que está causando sérios problemas de desempenho.
Para aqueles que lidam com a identificação e resolução de problemas de desempenho, é essencial compreender que todos os elementos interdependentes na nuvem precisam funcionar em harmonia para garantir um bom desempenho. Quando um componente não contribui de forma eficaz para a “cadeia de fornecimento de desempenho em nuvem”, surgem problemas, que podem ser causados por questões como latência de rede, banco de dados, memória I/O ou armazenamento. O resultado é sempre o mesmo: o desempenho geral será afetado.
No exemplo mencionado, a falta de qualquer componente poderia ter desencadeado uma série de eventos que prejudicaram o desempenho geral. Isso resultou em problemas no processamento mensal, mesmo com um aumento gradual no nível de estresse.
Claro, o desempenho geral é determinado pelo componente mais lento, o que é válido também na computação em nuvem. Isso pode ocasionar problemas como lentidão na rede, bancos de dados, falta de recursos da CPU ou execução inadequada de aplicações. Esses problemas são frequentemente referidos como “gremlins da nuvem”, que arquitetos e desenvolvedores passam dias, às vezes meses, tentando resolver. Muitas vezes, esses problemas são difíceis de identificar. Onde você está nesse processo?
Uma ótima solução consiste em utilizar uma eficaz ferramenta de gestão e operações na nuvem, de preferência uma que possa oferecer visibilidade operacional. Em vez de lidar com enormes quantidades de informações detalhadas (muitas vezes consideradas como distrações), você passa a compreender o contexto dos dados. Uma ferramenta eficaz geralmente aponta a localização do problema de desempenho e até mesmo pode identificar a causa principal.
A rede pode apresentar um problema de latência, que é simples de identificar. A ferramenta também pode detectar o problema em uma VPN mal configurada que transfere dados entre provedores de nuvem. Esse tipo de questão é comum em implementações multicloud, uma vez que a comunicação entre nuvens é crítica e as conexões entre elas precisam ser gerenciadas de forma mais eficiente. De fato, em diversos casos em que fui chamado para resolver problemas de desempenho recentemente, a causa principal foi relacionada a falhas na rede de comunicação entre nuvens.
Outras questões comuns em implementações multicloud envolvem problemas de desempenho do banco de dados em um único provedor de nuvem, resultando em latência em várias aplicações. Às vezes, as aplicações são erroneamente responsabilizadas, levando a correções de código serem solicitadas. Posteriormente, quando se percebe que as correções de código não resolveram o problema, o banco de dados é identificado como a causa. O ensinamento principal é que é essencial diagnosticar antes de tentar corrigir.
É evidente que a lista é extensa. A implementação de plataformas multicloud é complexa e distribuída. Os aplicativos e dados presentes nessas plataformas também tendem a ser complexos, o que pode levar a problemas de desempenho frequentes. Recomenda-se investir em tecnologias de cloudops cross-cloud eficazes, capazes de operar em diferentes provedores e diagnosticar rapidamente questões comuns. Algumas dessas tecnologias podem até oferecer serviços de autocorreção para resolver problemas de forma proativa. Essas ferramentas se mostram vantajosas ao resolver o primeiro problema, pagando por si mesmas.