Cloud

Como aprimorar o rendimento da inteligência artificial generativa em nuvem.

Encontrar problemas pode ser desafiador, porém resolvê-los pode ser uma tarefa simples. Ao adotar uma postura proativa e seguir as melhores práticas, é possível evitar a insatisfação dos usuários e proteger a reputação da empresa.

Speed, fast, performance
Imagem: xsix/Flickr

Na segunda-feira, ao chegar ao escritório, você se depara com uma série de e-mails de membros da equipe de desenvolvimento do sistema, que solicitam falar com você imediatamente. O motivo é que o sistema de gerenciamento de inventário habilitado para IA, lançado há uma semana, está causando frustração entre os novos usuários. As respostas estão demorando minutos, ao invés de segundos, as remessas estão atrasadas e os representantes de serviço estão demorando para responder às perguntas dos clientes. Como resultado, as vendas online estão 20% abaixo do esperado devido aos atrasos de desempenho. Parece que há um problema de desempenho a ser resolvido.

Você seguiu todas as diretrizes corretamente. Está utilizando exclusivamente GPUs para treinamento e inferências, realizou todos os testes de desempenho recomendados, alocou mais espaço de memória do que o necessário e está utilizando o armazenamento mais rápido disponível. Mesmo assim, você tem uma conta de nuvem que ultrapassa os US$ 100 mil por mês. Como é possível que o desempenho falhe?

Baixe agora mesmo o guia do comprador da empresa especializada em computação de alta performance.

Eu tenho ouvido com mais frequência sobre essa situação em que os primeiros usuários de sistemas de inteligência artificial generativa na nuvem estão começando a implementar seu primeiro ou segundo sistema. É um momento empolgante à medida que os provedores de nuvem destacam suas capacidades de inteligência artificial generativa, e você basicamente replicou as configurações arquiteturais que viu na última grande conferência de tecnologia na nuvem. Você está seguindo o exemplo e adotando o que considera ser arquiteturas comprovadas e melhores práticas.

Problemas de desempenho que estão surgindo.

Identificar as causas principais dos modelos malfeitos pode ser desafiador, porém a solução costuma ser simples de colocar em prática. Em geral, os problemas de desempenho surgem de um único elemento que restringe o funcionamento global do sistema de Inteligência Artificial, como um gateway API lento, um componente de rede deficiente ou até mesmo uma seleção inadequada de bibliotecas utilizadas na compilação mais recente. A correção é simples, mas a identificação do problema é muito mais complexa.

RELACIONADO:  O serviço GenAI Bedrock da Amazon AWS agora inclui a funcionalidade de inferência entre regiões.

Vamos falar sobre os princípios básicos.

Atrasos elevados em sistemas de inteligência artificial gerativa podem impactar aplicações que requerem processamento em tempo real, como processamento de linguagem natural ou geração de imagens. A latência pode ser causada por uma conexão de rede abaixo do ideal ou pela alocação ineficiente de recursos. Com base na minha experiência, sugiro começar por resolver esses problemas.

Os modelos de Inteligência Artificial Generativa podem exigir muitos recursos. É crucial otimizar o uso de recursos na nuvem pública para garantir uma eficiência no desempenho e redução de custos. Isso inclui a implementação de recursos de auto-escalonamento e a seleção dos tipos de instâncias adequados para atender às demandas da carga de trabalho. Ao revisar o desempenho, é importante verificar se os recursos estão sendo totalmente utilizados ou se há sinais de problemas de eficiência. Muitas organizações negligenciam a prática de monitoramento, mas é essencial para identificar e resolver problemas de desempenho. É recomendável ter uma estratégia de observabilidade em relação ao gerenciamento de sistemas de IA, o que facilitará o diagnóstico de problemas de baixo desempenho por meio de ferramentas específicas.

A tarefa de ajustar a capacidade de trabalho da inteligência artificial generativa para atender às variações na demanda pode ser um desafio, levando frequentemente a problemas. A falta de eficiência nas configurações de auto-escalonamento e a má distribuição da carga de trabalho podem prejudicar a capacidade de expandir os recursos de maneira eficaz.

Administrar os procedimentos de treinamento e aplicação de modelos de inteligência artificial generativa exige a implementação de fluxos de trabalho que facilitem o treinamento e a aplicação eficaz de modelos. Essa tarefa deve ser realizada utilizando a escalabilidade e a flexibilidade proporcionadas pela computação em nuvem pública.

RELACIONADO:  Todos na área de computação em nuvem estão buscando rapidamente uma estratégia inteligente.

Problemas de eficiência na aplicação de inferência costumam ser os responsáveis, e apesar da tendência ser investir recursos e dinheiro no problema, seria mais eficaz ajustar o modelo primeiro. A maioria dos conjuntos de ferramentas de IA inclui opções de ajuste que podem orientar sobre a configuração adequada para o seu caso específico.

Outros temas para pesquisar.

Os processos de treinamento de modelos de IA generativa podem ser demorados e dispendiosos, especialmente quando lidam com grandes conjuntos de dados e arquiteturas complexas. A alocação ineficiente de recursos de processamento paralelo e armazenamento pode prolongar o tempo necessário para treinar o modelo.

Lembre-se de que estamos utilizando GPUs em várias situações, as quais não são acessíveis para a compra ou aluguel. O treinamento do modelo deve ser o mais eficiente possível e ocorre somente quando há a necessidade de atualização dos modelos. Existem alternativas disponíveis para acessar as informações requeridas, como a geração aumentada de recuperação (RAG).

O RAG é uma técnica empregada no processamento de linguagem natural (NLP) que mescla a busca por informações com a inovação na produção de texto. Essa abordagem visa superar as restrições dos modelos de linguagem convencionais, os quais frequentemente enfrentam dificuldades na exatidão dos fatos, e proporciona acesso a informações externas e atualizadas.

Você pode melhorar a capacidade de realizar inferências ao ter acesso a outras fontes de informação que possam confirmar e fornecer dados atualizados ao modelo, conforme necessário. Com isso, o modelo não precisa ser reajustado ou atualizado com frequência, resultando em custos menores e desempenho aprimorado.

Por fim, é essencial assegurar a segurança e conformidade dos sistemas de inteligência artificial generativa em nuvens públicas. A proteção dos dados, o controle de acesso e a conformidade com regulamentos podem ter impacto no desempenho caso não sejam tratados de forma adequada. É comum perceber que a governança da conformidade é muitas vezes negligenciada durante os testes de desempenho.

RELACIONADO:  Como definir as configurações de e-mail no PrestaShop.

Práticas ideais para o gerenciamento de performance em Inteligência Artificial.

Minha sugestão é direta e está ligada à maioria das práticas recomendadas que você já conhece.

  • Treine. Esteja informado sobre as opiniões dos profissionais que suportam suas soluções de inteligência artificial em relação ao controle de desempenho. Garanta que alguns colaboradores estejam participando regularmente de programas de capacitação.
  • Observação. Já falei sobre isso, mas possuo um sistema de monitoramento de áudio em funcionamento. Esse sistema conta com ferramentas de monitoramento essenciais que podem detectar problemas de desempenho antes que os usuários os percebam. Se isso não for feito, será tarde demais e sua credibilidade estará comprometida.
  • Paráfrase do texto: Muitas organizações não realizam testes de desempenho em seus sistemas de inteligência artificial em nuvem, apesar de serem importantes para a implantação. É incorreto acreditar que sempre se pode alocar mais recursos, sendo essencial realizar esses testes sem exceções.
  • Paráfrase: É importante lidar com o desempenho de forma proativa e contínua, em vez de esperar por problemas surgirem para agir. Se você está apenas reagindo a questões de desempenho, já está em desvantagem.

Paráfrase: A medida que os sistemas de inteligência artificial mais criativos se tornam mais comuns, seja na nuvem ou localmente, surgirão desafios de desempenho que podem ser subestimados atualmente. A importância está em agir antecipadamente, em vez de esperar por problemas inesperados que possam surgir.

Artigos relacionados

Leave a Reply

Your email address will not be published. Required fields are marked *

Verifique também
Close
Back to top button