De acordo com os analistas, o serviço de nuvem de banco de dados vetorial pode ser atraente para desenvolvedores devido às vantagens de desempenho e custo em comparação com os bancos de dados tradicionais, especialmente para cargas de trabalho relacionadas à inteligência artificial.

Zilliz, uma empresa com sede em São Francisco, apresentou uma atualização de seu serviço de banco de dados na nuvem, o Zilliz Cloud. A companhia afirma que essa nova versão proporciona um desempenho aprimorado e reduz o custo total em comparação com a versão anterior.
O Zilliz Cloud é baseado no Milvus, um sistema de gerenciamento de banco de dados vetorial. A equipe fundadora da Zilliz é composta por engenheiros que contribuíram para o desenvolvimento do Milvus.
De acordo com a empresa, a atualização mais recente do Zilliz Cloud apresenta um desempenho 10 vezes superior ao banco de dados original de vetores Milvus. Enquanto a versão original do banco de dados de vetores Milvus utiliza o índice de grafos Hierarchical Navigable Small World (HNSW), a nova versão emprega um novo Motor de Busca Cardinal em conjunto com uma pesquisa filtrada aprimorada.
HNSW é amplamente utilizado como referência em bancos de dados vetoriais, sendo adotado por muitos concorrentes, como Weaviate e Pinecone. É um dos índices de gráficos mais populares para a criação de bases de dados vetoriais.
A popularidade dos índices baseados em gráficos se deve à capacidade de localizar os vizinhos mais próximos em conjuntos de dados complexos de forma eficiente, o que leva a um melhor desempenho e custos reduzidos.
Outro modelo de índice gráfico é Vamana. Outros tipos de índices encontrados em bancos de dados vetoriais são o Índice de Arquivos Invertidos (IVF).
Milvus é compatível com 11 variedades de índices, como FLAT, IVF_FLAT, IVF_SQ8, IVF_PQ, HNSW, BIN_FLAT, BIN_IVF_FLAT, DiskANN, GPU_IVF_FLAT, GPU_IVF_PQ e ScaNN.
Outras funcionalidades da atualização mais recente da Nuvem Zilliz abrangem a inclusão da métrica de similaridade cosseno, busca por intervalo e upsert.
A métrica de similaridade do cosseno é comumente aplicada em processamento de texto, em que a orientação dos vetores de incorporação é crucial, enquanto a distância entre eles não é relevante.
Uma pesquisa por intervalo é empregada em um banco de dados vetorial para restringir os resultados da busca de acordo com a proximidade entre um vetor de consulta e os vetores do banco de dados.
A função upsert em um banco de dados baseado em vetores é utilizada para inserir um novo vetor no índice ou atualizá-lo caso um vetor com o mesmo ID já exista.
Além de disponibilizar um cliente Milvus unificado que, segundo a Zilliz, melhora a experiência do programador, a atualização do Zilliz Cloud pode se integrar com ferramentas de análise de dados, machine learning e plataformas de streaming como Apache Spark, Apache Kafka e Airbyte.
Mesmo com os benefícios da nova edição, Doug Henschen, principal analista da Constellation Research, prevê que várias empresas continuarão a utilizar suas bases de dados tradicionais para funcionalidades como incorporações vetoriais e pesquisa vetorial.
“Um obstáculo para empresas como Zilliz é a falta dos dados transacionais da empresa em sua posse, conforme destacado por Holger Mueller, outro analista sênior da Constellation Research.”
“Se as empresas precisam garantir a facilidade de acesso aos dados transacionais ou se necessitam de uma solução para a atualização eficiente de registros, caso contrário, elas serão obrigadas a recorrer aos bancos de dados já utilizados, como Oracle, AWS, IBM e Microsoft”, comentou Mueller.
A concorrência é ainda mais acirrada para Zilliz devido à presença de concorrentes como Pinecone, que também disponibilizam seus produtos como serviços na nuvem, explicou Henschen.
Entretanto, o especialista mencionou que equipes e profissionais especializados em inteligência artificial podem obter benefícios em termos de desempenho e custo ao utilizar um banco de dados vetorial específico, desde que esse recurso contenha todas as funcionalidades necessárias para atender às suas necessidades operacionais.
O Zilliz Cloud pode ser acessado em diversas nuvens públicas, como AWS, Google Cloud Platform e Microsoft Azure.