Os modelos de inteligência artificial que utilizam dados no local em que estão armazenados, ao invés de centralizá-los, requerem medidas mais robustas de privacidade e segurança, como demonstrado pela estrutura RoPPFL.

A inovação da aprendizagem Federada representa um avanço significativo no aprimoramento do treinamento em Inteligência Artificial por meio de um modelo colaborativo. Este novo método está mudando a abordagem convencional da aprendizagem automática, abandonando os métodos tradicionais de treinamento centralizado em favor de um sistema mais descentralizado. Com dados dispersos, é crucial utilizá-los como dados de treinamento onde quer que estejam disponíveis.
Essa abordagem não é algo novo, pois já era explorada nos anos 90. A aprendizagem Federada possibilita o treinamento conjunto de modelos de machine learning em diferentes dispositivos ou servidores, utilizando seus dados compartilhados sem a necessidade de transferi-los ou centralizá-los. A preocupação principal é com a segurança e a privacidade dos dados.
Também no InfoWorld: 14 algoritmos de Inteligência Artificial amplamente utilizados e suas aplicações.
Aqui estão os princípios básicos da aprendizagem federada:
- Reformulação: Em vez de centralizar os dados, a aprendizagem federada distribui o modelo diretamente para a fonte de dados, permitindo o uso dos dados no local em que estão armazenados. Por exemplo, ao monitorar as operações em um robô de fraturação, não é preciso transferir os dados para um repositório centralizado, pois eles são utilizados diretamente no robô. Isso representa um caso prático de aplicação.
- Preservação da privacidade é aprimorada pela abordagem da Aprendizagem Federada, que mantém os dados nos dispositivos individuais dos usuários, como smartphones, tablets, computadores, veículos ou smartwatches. Esse método reduz a divulgação de informações confidenciais, pois os dados são transferidos diretamente do dispositivo para o modelo de Inteligência Artificial.
- A aprendizagem colaborativa é um modelo que pode adquirir conhecimento a partir de vários conjuntos de dados em dispositivos ou servidores distintos de forma orgânica.
- O uso eficaz de informações: A inteligência artificial é especialmente benéfica em áreas desafiadoras que possuem uma grande quantidade de dados, os quais podem estar dispersos ou ser sensíveis. Ela maximiza a utilização das informações disponíveis, respeitando as políticas de privacidade inerentes aos conjuntos de dados distribuídos em questão.
Esses elementos são benéficos para a inteligência artificial, proporcionando maior segurança e privacidade. Além disso, evitamos a duplicação de dados em diferentes locais, algo comum na atualidade na criação de novos sistemas de IA, como a IA generativa.
A organização denominada RoPPFL
A aprendizagem Federada apresenta a promissora possibilidade de criar modelos colaborativos em diversos dispositivos ou servidores sem a necessidade de centralizar as informações. No entanto, questões de segurança e privacidade ainda são uma preocupação, especialmente em relação ao vazamento de dados locais e a ameaça de ataques de intoxicação de modelos de IA por usuários maliciosos.
Como podemos resolver a situação? Quando surgir um novo desafio, é importante desenvolver soluções específicas com nomes e siglas interessantes. Permita-me mostrar o framework de Aprendizado Federado Robusto e Preservação de Privacidade (RoPPFL), uma alternativa para lidar com os problemas comuns da aprendizagem federada em ambientes de computação de borda.
O RoPPFL é um framework que combina técnicas de privacidade diferencial local (LDP) e agregação ponderada robusta (RoWA). O LDP preserva a privacidade dos dados ao adicionar ruído calibrado às atualizações do modelo, dificultando a inferência de pontos de dados individuais por parte de possíveis atacantes, um tipo comum de ataque de segurança contra sistemas de inteligência artificial.
A RoWA fortalece a capacidade de resistência do sistema contra ataques de envenenamento ao incorporar melhorias nos modelos com base em sua similaridade, reduzindo os efeitos de possíveis intervenções maliciosas. Por outro lado, o RoPPFL emprega uma estrutura de aprendizado federado hierárquico, que divide o treinamento de modelos em várias etapas, envolvendo um servidor na nuvem, nós periféricos e dispositivos clientes, como smartphones.
Maior proteção da privacidade e segurança.
O RoPPFL é um avanço positivo para um arquiteto de nuvem que lida constantemente com essa questão. Atualmente, 80% do meu trabalho envolve inteligência artificial generativa, por isso estou mencionando isso, apesar de ser um termo acadêmico específico.
Este modelo aborda os desafios simultâneos relacionados à segurança e à privacidade, ao utilizar dispositivos de borda, como smartphones e outros dispositivos pessoais, como fontes de dados de treinamento para sistemas de IA que requerem uma grande quantidade de dados. Ele pode integrar a privacidade diferencial local com um método de agregação exclusivo. O framework RoPPFL possibilita a criação e o sucesso do paradigma de treinamento colaborativo de modelos, sem comprometer a proteção e a privacidade dos dados, que estão em risco devido ao uso da IA.
Os responsáveis pelo artigo mencionado são os mesmos responsáveis pelo desenvolvimento do framework. Portanto, recomendamos a leitura do artigo se você deseja aprofundar seus conhecimentos sobre esse assunto.
Eu sugiro trazer isso à tona, pois é importante considerar alternativas mais eficientes para desenvolver, construir e operar sistemas de inteligência artificial que utilizam nossos dados de forma invasiva. É necessário encontrar maneiras de desenvolver esses sistemas de IA (sejam eles baseados em nuvem ou não) de forma segura e ética, evitando causar danos.
Diante da atual prática em que as empresas estão implementando sistemas de inteligência artificial generativa sem considerar as questões importantes inicialmente, é necessário refletir sobre a forma como desenvolvemos, implementamos e garantimos a segurança dessas soluções para que se tornem amplamente utilizadas. É provável que muitos desenvolvedores que trabalham com sistemas de IA baseados em dados distribuídos não estejam familiarizados com esse framework. Essa é apenas uma das diversas ideias atuais e futuras que é essencial compreender.