Glossário

Aprendizagem federada

Descobre a aprendizagem federada: uma abordagem de IA centrada na privacidade que permite o treino descentralizado de modelos entre dispositivos sem partilhar dados em bruto.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A Aprendizagem Federada é uma técnica de Aprendizagem Automática (AM) que permite que os modelos sejam treinados em vários dispositivos ou servidores descentralizados com amostras de dados locais, sem trocar os próprios dados brutos. Esta abordagem aborda questões críticas relacionadas com a privacidade dos dados, segurança e direitos de acesso, permitindo a colaboração na formação de modelos utilizando dados que não podem ou não devem ser recolhidos centralmente. Ao contrário da formação centralizada tradicional, em que os dados são agregados, a Aprendizagem Federada leva o processo de formação para o local dos dados, muitas vezes em dispositivos de IA Edge.

Conceitos fundamentais da aprendizagem federada

A Aprendizagem Federada funciona através de um processo colaborativo e iterativo gerido por um coordenador central (servidor):

  1. Distribuição de modelos: O servidor central inicializa um modelo global (como um modelo Ultralytics YOLO para a Deteção de Objectos) e distribui-o pelos dispositivos clientes ou silos de dados participantes.
  2. Treino local: Cada cliente treina o modelo recebido utilizando os seus dados locais durante algumas iterações. Como os dados nunca deixam o cliente, a privacidade é mantida. Este treinamento local normalmente usa técnicas padrão de Deep Learning (DL).
  3. Agregação de actualizações: Os clientes enviam apenas as actualizações do modelo (por exemplo, pesos ou gradientes aprendidos) para o servidor central, e não os dados subjacentes. Estas actualizações são frequentemente protegidas utilizando técnicas como a privacidade diferencial ou a agregação segura.
  4. Atualização do modelo global: O servidor agrega as actualizações recebidas (por exemplo, calculando a média) para melhorar o modelo global.
  5. Iteração: Este ciclo repete-se, melhorando gradualmente o modelo global com os conhecimentos adquiridos por todos os clientes participantes, sem comprometer a privacidade dos dados em bruto. A IA Google fornece informações sobre a sua investigação e aplicações de Aprendizagem Federada.

Embora relacionada com a Formação Distribuída, a Aprendizagem Federada assume especificamente que os dados não são IID (não são distribuídos de forma idêntica e independente), são descentralizados por conceção e enfatizam a preservação da privacidade como um princípio fundamental.

Aplicações da aprendizagem federada

A Aprendizagem Federada é particularmente útil em cenários que envolvem dados sensíveis ou distribuídos:

  • Previsão de teclado inteligente: Os teclados para telemóveis (como o Gboard da Google) utilizam a Aprendizagem Federada para melhorar as sugestões de texto preditivo com base nos padrões de digitação do utilizador em muitos dispositivos, sem enviar as teclas digitadas individualmente para servidores centrais. Isto melhora a experiência do utilizador ao mesmo tempo que protege a privacidade.
  • Cuidados de saúde: Os hospitais podem colaborar para treinar modelos de diagnóstico, como os da Análise de Imagens Médicas, utilizando dados de pacientes distribuídos entre instituições. Isto permite modelos mais robustos treinados em diversas populações sem violar as normas de confidencialidade dos pacientes, como a HIPAA. Lê mais sobre a aprendizagem federada para a informática dos cuidados de saúde. Ultralytics explora áreas semelhantes nas suas soluções de IA nos cuidados de saúde.

Benefícios da aprendizagem federada

  • Aumenta a privacidade dos dados: Os dados brutos permanecem nos dispositivos locais, reduzindo significativamente os riscos de privacidade associados a violações de dados ou utilização indevida.
  • Reduz os custos de comunicação: Apenas as actualizações de modelos, que são normalmente mais pequenas do que os conjuntos de dados em bruto, são transmitidas, poupando largura de banda.
  • Acesso a dados diversos: Permite o treino em conjuntos de dados grandes e heterogéneos distribuídos por utilizadores ou organizações, potencialmente conduzindo a modelos mais robustos e generalizáveis, menos propensos ao Overfitting.
  • Conformidade regulamentar: Ajuda as organizações a cumprir as rigorosas regulamentações de privacidade e governança de dados (por exemplo, GDPR, CCPA).

Desafios da aprendizagem federada

  • Gargalos de comunicação: A comunicação frequente entre o servidor e vários clientes pode ser lenta e dispendiosa, especialmente em redes pouco fiáveis.
  • Heterogeneidade do sistema: Os clientes têm muitas vezes diferentes capacidades de hardware, conetividade de rede e disponibilidade de energia, o que complica a formação síncrona. Estruturas como o TensorFlow Federated têm como objetivo gerir esta situação.
  • Heterogeneidade estatística: Os dados entre clientes são muitas vezes não-ID, o que significa que não seguem a mesma distribuição, o que pode desafiar a convergência e o desempenho do modelo.
  • Preocupações de segurança: Embora aumente a privacidade, o sistema pode ainda ser vulnerável a ataques adversários específicos que visam actualizações de modelos ou o processo de agregação, exigindo medidas robustas de segurança dos dados. As comunidades de ML que preservam a privacidade, como a OpenMined, trabalham para resolver estas questões.

Apesar desses desafios, a Aprendizagem Federada representa um avanço significativo na Inteligência Artificial (IA) de preservação da privacidade. Plataformas como o Ultralytics HUB podem facilitar a implantação de modelos e o gerenciamento de modelos, incluindo aqueles potencialmente desenvolvidos usando abordagens federadas. Podes explorar várias opções de implementação de modelos na documentação Ultralytics . Para mais informações sobre a combinação de FL com outras técnicas, consulta a publicação do blogue Active Learning speeds up computer vision development.

Lê tudo