Uma versão mais compacta e veloz do 1.5 Flash está disponível por metade do valor, oferecendo o dobro da capacidade de taxa e menor tempo de resposta em prompts simples do que a versão anterior.

O Google anunciou que o modelo Gemini 1.5 Flash-8B AI está pronto para uso comercial, sendo considerado o mais econômico em termos de inteligência dentro da linha Gemini.
No dia 3 de outubro, foi divulgada a disponibilidade do gemini-1.5-flash-8B. Os programadores têm acesso gratuito a ele por meio do Google AI Studio e da API Gemini. O gemini 1.5 Flash-8B apresenta um custo reduzido em 50% em relação ao 1.5 Flash, além de oferecer limites de taxa duplicados. Destaca-se também a menor latência em prompts curtos.
Uma nova versão experimental chamada Gemini 1.5 Flash-8B foi introduzida em setembro. Esta variante é uma versão menor e mais rápida do 1.5 Flash original. O desempenho do Flash-8B é muito semelhante ao do modelo 1.5 Flash lançado em maio, conforme observado em diversos testes, e ele se destaca em tarefas como chat, transcrição e tradução de linguagem de contexto longa, de acordo com o Google.
A estabilidade do lançamento do Gemini 1.5 Flash-8B é avaliada com base nas seguintes taxas:
- $0.0375 por cada conjunto de 1 milhão de fichas de entrada em comandos com menos de 128 KB.
- $0.15 por cada milhão de unidades de saída em comandos com menos de 128K de tamanho.
- $0.01 por cada 1 milhão de unidades de alertas em cache com menos de 128K.
Desenvolvedores que possuem conta paga começarão a ser cobrados a partir de 14 de outubro. O aumento de preço, aliado aos esforços da Google para diminuir os custos dos desenvolvedores com os modelos 1.5 Flash e 1.5 Pro, demonstram o comprometimento da empresa em assegurar que os desenvolvedores tenham a liberdade de criar produtos e serviços inovadores, impulsionando o avanço do mundo, afirmou a Google.