Você necessita de unidades de processamento gráfico para sistemas de inteligência artificial generativa?

Existe um grande interesse em placas de vídeo para o uso de inteligência artificial generativa, e isso se deve a várias razões positivas. No entanto, em certas situações, eles podem ser superestimados e ter um custo muito elevado.

Frequentemente, examino as tendências em busca de padrões nas perguntas dos repórteres. Eles costumam estar mais familiarizados com o mercado do que eu e são uma fonte valiosa de informações. Por exemplo, tenho recebido ligações sobre possíveis problemas que podem surgir devido à escassez de unidades de processamento gráfico (GPU).
Primeiramente, se essa situação ocorrer, é provável que não perdure por muito tempo. Em seguida, é importante explorar outras alternativas viáveis. O principal desafio é a preocupação e a tristeza decorrentes do receio de que as empresas não consigam aproveitar os benefícios da revolução gerativa de IA caso não tenham acesso a esses processadores, seja para utilização em sistemas locais, em nuvem ou sob demanda.
Questão incorreta?
Eu reconheço que os sistemas de inteligência artificial generativa são complicados e demandam muitos recursos de processamento. Muitas pessoas acreditam que esses sistemas precisam de hardware altamente especializado, como GPUs ou até mesmo processadores mais avançados, como os utilizados na computação quântica, para realizar tarefas que antes só podiam ser feitas pela imaginação humana.
Essas suposições são sempre precisas? Este é mais um sistema especializado que requer componentes especializados a preços bastante elevados?
As GPUs foram inicialmente criadas para processar gráficos em jogos de vídeo, porém se tornaram fundamentais na área de IA devido à sua arquitetura altamente paralela, permitindo a execução de múltiplas operações ao mesmo tempo. Essa característica se encaixa perfeitamente com as necessidades das redes neurais, que desempenham um papel crucial na AI generativa. Este é um aspecto técnico que os desenvolvedores de sistemas de IA generativa, como você, devem levar em consideração de forma cuidadosa.
As Unidades de Processamento de Tensor (TPUs) são chips personalizados desenvolvidos pelo Google para o TensorFlow, uma estrutura de aprendizado de máquina de código aberto. As TPUs são otimizadas para processos de aprendizado de máquina, especialmente para o treinamento de redes neurais. Embora não sejam tão problemáticas em termos de custo quanto as GPUs, as TPUs são frequentemente comparadas a elas.
Quem desenvolve e implementa esses sistemas reconhece que, independentemente do framework de inteligência artificial utilizado, a maior parte do trabalho e tempo é dedicada ao treinamento exaustivo dos modelos com grandes volumes de dados. Por exemplo, os modelos GPT-4 da OpenAI ou o BERT da Google possuem bilhões de parâmetros, e treiná-los sem o uso de processadores especializados seria inviável devido ao tempo necessário.
São os processadores especializados sempre requeridos?
As unidades de processamento gráfico (GPUs) melhoram consideravelmente a performance, porém isso ocorre com um custo significativo. Além disso, para aqueles preocupados com a pegada de carbono, as GPUs consomem quantidades substanciais de energia e geram calor considerável. Vale a pena o investimento no aumento de desempenho proporcionado pelas GPUs?
CPUs são os processadores mais frequentemente utilizados em computadores, presentes em diversos dispositivos, como o que você está utilizando para acessar este artigo. Elas têm a capacidade de realizar diversas tarefas e possuem menos núcleos em comparação com as GPUs.
Contudo, possuem sistemas de controle avançados e capacidade para realizar diversas instruções. Essa flexibilidade possibilita que lidem com tarefas de inteligência artificial, como situações que demandam diferentes tipos de IA, inclusive a IA generativa.
CPUs podem ser utilizados para experimentar novas estruturas de rede neural ou testar algoritmos. Elas são adequadas para executar modelos de menor escala ou menos complexos, atendendo às necessidades atuais de muitas empresas.
Qual é o valor exato que você deve desembolsar?
CPUs são uma opção econômica tanto para organizações menores e indivíduos com recursos limitados quanto para empresas maiores, podendo ser a escolha mais vantajosa em termos de investimento inicial e consumo de energia.
Além disso, a inteligência artificial está progredindo. Com os progressos recentes em algoritmos de IA, novas inovações estão surgindo, como o SLIDE (Sub-Linear Deep Learning Engine). Essa tecnologia promete treinar redes neurais profundas de forma mais eficiente em CPUs do que em GPUs em certas situações, através do uso de técnicas de hashing e da redução dos custos de acesso à memória.
Além disso, leve em conta os arrays de portões programáveis de campo (FPGAs). Esses processadores podem ser programados após a fabricação para desempenhar funções específicas, como inteligência artificial, de forma mais eficiente. Adicionalmente, as unidades de processamento associativo (APUs) são especializadas em identificação de padrões e podem lidar com tarefas de memória associativa, acelerando o funcionamento de certos tipos de aplicações de rede neural.
Existem muitas situações em que os processadores que não são GPU são mais lucrativos. Por que sempre se escolhe GPUs como a resposta quando se trata de inteligência artificial generativa ou inteligência artificial em geral? Talvez não seja necessário.
Eu acredito que as empresas irão desembolsar quantias excedentes de dinheiro por considerarem que o investimento resultará em melhor desempenho, seja através da utilização de recursos de processamento de GPU em ambientes de nuvem pública, localmente ou em dispositivos de borda.
O destaque aqui não é restringir o uso de GPUs, mas avaliar qual é a necessidade real para a sua situação específica. Muitas aplicações de inteligência artificial generativa serão implementações pequenas e táticas que realmente não exigirão o custo e o impacto ambiental das GPUs.
Os arquitetos de sistemas, arquitetos de nuvem e arquitetos de Inteligência Artificial generativa têm a missão principal de identificar a solução mais eficiente. Eles buscam determinar qual configuração tecnológica resultará no menor custo e maior benefício para o negócio. A Inteligência Artificial generativa pode representar um novo campo de atuação, no qual podemos tomar decisões mais acertadas e práticas, sem nos deixar levar apenas pela moda.