
O veredicto foi dado. A maioria dos problemas de tecnologia em nuvem podem ser atribuídos a erros humanos. Quais valiosas lições aprendemos com isso?

Muitas vezes fico surpreso com a forma como a mídia apresenta problemas na computação em nuvem. Por exemplo, manchetes como “A Nuvem Deixa a Desejar”. Esses títulos podem chamar a atenção, mas são enganosos. A tecnologia da nuvem sempre cumpriu o que prometeu. O principal motivo das falhas na nuvem continua sendo o erro humano, algo que não mudou ao longo das gerações dessa tecnologia.
Como frequentemente mencionado anteriormente, a maioria dos problemas tecnológicos segue um padrão comum: equívocos, falta de liderança e, frequentemente, carência de conhecimento e experiência. À medida que avançamos com projetos significativos de inteligência artificial generativa na nuvem, é o momento de avaliar e buscar maneiras de aprimorar nosso desempenho.
Principais motivos que levam ao insucesso.
As causas das falhas são diversas e as quatro principais que identifico são:
Arquitetura mal planejada. Com frequência, as empresas adotam a computação em nuvem sem um planejamento adequado ou compreensão suficiente. Isso pode resultar em problemas sérios de desempenho ou confiabilidade. Ou, mais comumente, sistemas mal otimizados na nuvem que consomem de 5 a 10 vezes mais recursos financeiros do que o necessário. Já enfrentamos esses desafios exaustivamente aqui, e não vou me deter neles.
Acordos de nível de serviço (SLAs) mal definidos são frequentemente a razão pela qual os padrões de desempenho esperados não são alcançados. Em muitos casos, a falta de clareza nos SLAs entre a organização e o provedor de serviços de nuvem resultou em problemas após a implementação. Embora os SLAs possam ser complexos, é crucial revisá-los com atenção para evitar surpresas desagradáveis. Em minha experiência, os provedores de nuvem geralmente cumprem os termos dos acordos, mas as expectativas dos usuários nem sempre estão alinhadas com o que é entregue devido a falta de atenção prévia aos detalhes do contrato.
Má administração de recursos em nuvem e custos sobrepostos podem resultar em problemas financeiros e de desempenho. O finops surgiu para lidar com essa questão. Em muitos casos, os problemas surgem devido ao desalinhamento entre as expectativas dos usuários em relação aos custos e o que é realmente entregue quando os recursos não são gerenciados adequadamente.
Texto parafraseado: A falta de processos adequados de segurança e conformidade, juntamente com a tecnologia de suporte insuficiente, faz com que muitas pessoas desinformadas acreditem que os provedores de serviços em nuvem são responsáveis por todas as medidas de segurança necessárias. No entanto, devido ao modelo de responsabilidade compartilhada, os clientes também têm a responsabilidade de proteger seus aplicativos e dados na nuvem. Isso requer um entendimento profundo de questões como identidade e gestão de acesso (IAM), criptografia e estratégias de monitoramento, o que muitas empresas não possuem o conhecimento necessário para lidar. Como resultado, violações de segurança ocorrem com frequência, resultando em ampla cobertura negativa na mídia.
Como obter melhores resultados
Não defendo a idolatria da tecnologia de computação em nuvem, pois reconheço que também pode cometer erros. No entanto, é importante destacar que, na maioria das vezes, as falhas estão ligadas a decisões equivocadas, falta de experiência e, principalmente, à escassez de profissionais qualificados.
Eu acredito que a escassez de habilidades é um reflexo da atual situação do mercado de computação em nuvem em dois aspectos distintos. Primeiramente, a tecnologia está se tornando cada vez mais complexa, com soluções altamente heterogêneas e diversas variáveis em jogo. Em segundo lugar, a quantidade de profissionais qualificados, como arquitetos de computação em nuvem, engenheiros de segurança e engenheiros de banco de dados, está crescendo a um ritmo mais lento do que a demanda.
Quando as empresas contratam candidatos menos capacitados, que cometem erros graves, os problemas costumam ser identificados apenas meses ou até anos depois. A princípio, muitos aspectos podem funcionar adequadamente durante a implementação, mas as fragilidades acabam sendo reveladas posteriormente. É nesse momento que podem surgir desafios, como grandes faturas de serviços em nuvem ou violações de dados.
Assim sendo, considerando que se trata essencialmente de um desafio humano e não de uma questão tecnológica, é crucial direcionar o foco para as pessoas, apesar de muitos não estarem dispostos a admitir isso. É necessário investir em treinamento estratégico, contratação criteriosa e ser seletivo quanto à confiança depositada naqueles responsáveis por tomar decisões importantes sobre a utilização da tecnologia, incluindo a tecnologia de nuvem.
Pode ser realizado, porém é essencial agir de forma proativa e estar disposto a investir. Muitas empresas falham nesse ponto, especialmente aquelas que enxergam a tecnologia da informação como um gasto. Ao tentar economizar dinheiro, acabam por incorrer em custos muito maiores do que os valores economizados. É importante considerar o custo real dos erros, juntamente com o acúmulo da chamada dívida técnica.
A principal questão reside em entender a relevância de todos esses aspectos. Muitas das situações que estou mencionando ocorrem quando a empresa não coloca a liderança de TI como prioridade. Embora seja possível criticar erros táticos, como a falta de investimento adequado na contratação e retenção de talentos, isso é uma questão que vem de cima, como a maioria dos problemas e soluções. Precisamos melhorar nesse aspecto.