Todas as pessoas que utilizam o DALL-E para gerar imagens ou permitem que o ChatGPT redija seus textos estão consumindo uma grande quantidade de recursos de nuvem. Quem arcará com esses custos?

A inteligência artificial é exigente em recursos para todas as plataformas, inclusive nuvens públicas. A maioria das tecnologias de IA necessita de muitos cálculos de inferência, o que aumenta as demandas por processamento, rede e armazenamento, bem como os custos de energia, infraestrutura e impacto ambiental.
O surgimento de sistemas de inteligência artificial generativa, como o ChatGPT, colocou em destaque essa preocupação mais uma vez. Com a tecnologia se tornando cada vez mais popular e sendo amplamente adotada por empresas, governos e indivíduos, é possível que o consumo de energia cresça significativamente.
A Inteligência Artificial tem sido possível desde os anos 1970, porém inicialmente não teve grande impacto no mercado devido aos altos custos envolvidos na implementação de um sistema completo de IA. Na época, projetar sistemas com IA exigia um investimento significativo em hardware, software e espaço de data center, chegando a mais de $40 milhões. Infelizmente, muitos desses projetos de IA, incluindo o mencionado, nunca foram concluídos devido a problemas nos casos de negócios.
A chegada da nuvem revolucionou a situação. O que antes era de difícil acesso, agora se tornou mais acessível economicamente graças às nuvens públicas. O crescimento da nuvem tem acompanhado o avanço da inteligência artificial nos últimos 10 a 15 anos, e atualmente estão intimamente interligados.
Sustentabilidade e custo dos recursos em serviços de computação em nuvem.
Não é necessário realizar uma extensa pesquisa para antecipar os próximos acontecimentos neste cenário. A procura pelos serviços de inteligência artificial, como os sistemas generativos de IA que estão despertando interesse no momento, assim como outros sistemas de IA e machine learning, irá aumentar significativamente. Essa tendência será liderada por empresas em busca de uma vantagem inovadora, como a implementação de cadeias de suprimentos inteligentes, e até mesmo por estudantes universitários que desejam utilizar um sistema generativo de IA para escrever seus trabalhos acadêmicos.
A crescente procura por inteligência artificial resulta em uma maior necessidade dos recursos utilizados por esses sistemas, como nuvens públicas e os serviços associados a elas. Esta demanda provavelmente será suprida com a construção de mais centros de dados que alojam servidores com alto consumo de energia e equipamentos de rede.
Os provedores de serviços de nuvem pública são semelhantes a outros fornecedores de serviços públicos, podendo aumentar os preços conforme a demanda cresce, de forma semelhante ao aumento sazonal nas contas de energia doméstica. Portanto, é comum reduzir o consumo, por exemplo, ajustando o termostato do ar condicionado para 74 graus em vez de 68 durante o verão.
No entanto, aumentos nos custos da computação em nuvem podem não ter o mesmo impacto nas empresas. Muitas empresas podem perceber que os sistemas de inteligência artificial (IA) são essenciais e indispensáveis para conduzir certos processos de negócios críticos. Em algumas situações, elas podem tentar cortar gastos internos, como reduzir o quadro de funcionários, para compensar o investimento em sistemas de IA. É amplamente conhecido que os sistemas de IA generativa em breve irão substituir muitos profissionais da área de informação.
Quais são as possíveis ações a serem tomadas?
Se a necessidade de recursos para operar sistemas de inteligência artificial resultar em aumento nos custos de computação e na emissão de carbono, o que podemos fazer? Uma possibilidade seria explorar formas mais eficientes de utilização de recursos pela inteligência artificial, como processamento, rede e armazenamento.
A utilização de amostragem em um processo de pipelining pode otimizar o treinamento em aprendizado profundo ao diminuir a quantidade de dados processados. Estudos realizados pelo MIT e IBM indicam que é possível reduzir os recursos exigidos para executar uma rede neural em grandes conjuntos de dados ao adotar essa estratégia. No entanto, essa abordagem também pode resultar em uma limitação da precisão, o que pode ser adequado para certos cenários empresariais, mas não para todos.
Outra técnica que já está sendo aplicada em diversos ambientes tecnológicos é a computação em memória, a qual pode otimizar o desempenho da inteligência artificial ao realizar os cálculos diretamente na memória, evitando a necessidade de transferir dados de um lado para o outro. Isso resulta em uma significativa aceleração do processo.
Outras estratégias estão em desenvolvimento, como a alteração dos processadores físicos e a utilização de coprocessadores para acelerar cálculos de inteligência artificial, além de modelos de computação avançada, como a computação quântica. É provável que haja diversos anúncios de grandes provedores de serviços de nuvem pública sobre tecnologias capazes de solucionar essas questões.
Qual é a ação necessária?
A ideia transmitida não é sugerir a exclusão da IA para reduzir os custos de computação em nuvem ou para preservar o meio ambiente. A IA é uma ferramenta essencial na área da computação que a maioria das empresas pode utilizar para obter benefícios significativos.
Estou recomendando que você participe de um projeto de desenvolvimento de sistemas de inteligência artificial com um entendimento preciso dos custos e do impacto na sustentabilidade, os quais estão intimamente relacionados. Você precisará avaliar os prós e contras, levando em consideração o valor que poderá agregar ao negócio em comparação com os custos e riscos envolvidos. Isso não é algo inédito.
Acredito que a inovação, seja na área da memória, computação quântica ou em algo ainda inexplorado, tem o potencial de solucionar em grande parte esse problema. Tanto as empresas de tecnologia de inteligência artificial quanto as de computação em nuvem estão empenhadas em tornar a IA mais sustentável e acessível, o que é uma ótima perspectiva.