Glossario

Apprendimento federato

Scopri l'apprendimento federato: un approccio all'intelligenza artificiale incentrato sulla privacy che consente l'addestramento decentralizzato dei modelli tra i dispositivi senza condividere i dati grezzi.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'apprendimento federato è una tecnica di Machine Learning (ML) che consente di addestrare modelli su più dispositivi o server decentralizzati che contengono campioni di dati locali, senza scambiare i dati grezzi. Questo approccio risolve i problemi critici legati alla privacy dei dati, alla sicurezza e ai diritti di accesso, consentendo la collaborazione per l'addestramento dei modelli utilizzando dati che non possono o non devono essere raccolti a livello centrale. A differenza della formazione centralizzata tradizionale, in cui i dati vengono aggregati, l'apprendimento federato porta il processo di formazione nel luogo in cui si trovano i dati, spesso sui dispositivi Edge AI.

Concetti fondamentali dell'apprendimento federato

L'apprendimento federato opera attraverso un processo collaborativo e iterativo gestito da un coordinatore centrale (server):

  1. Distribuzione del modello: Il server centrale inizializza un modello globale (come il modelloYOLO di Ultralytics per il rilevamento degli oggetti) e lo distribuisce ai dispositivi client o ai silos di dati partecipanti.
  2. Formazione locale: Ogni client addestra il modello ricevuto utilizzando i propri dati locali per alcune iterazioni. Poiché i dati non lasciano mai il client, la privacy viene mantenuta. L'addestramento locale utilizza in genere tecniche standard di Deep Learning (DL).
  3. Aggregazione degli aggiornamenti: I client inviano al server centrale solo gli aggiornamenti del modello (ad esempio, i pesi o i gradienti appresi) e non i dati sottostanti. Questi aggiornamenti sono spesso protetti utilizzando tecniche come la privacy differenziale o l'aggregazione sicura.
  4. Aggiornamento del modello globale: il server aggrega gli aggiornamenti ricevuti (ad esempio facendo una media) per migliorare il modello globale.
  5. Iterazione: Questo ciclo si ripete, migliorando gradualmente il modello globale con le conoscenze apprese da tutti i clienti partecipanti senza compromettere la privacy dei dati grezzi. Google AI fornisce informazioni sulla ricerca e sulle applicazioni dell'Apprendimento Federato.

Sebbene sia correlato alla formazione distribuita, l'apprendimento federato presuppone in particolare che i dati siano non-IID (non distribuiti in modo identico e indipendente), decentralizzati e che la conservazione della privacy sia un principio fondamentale.

Applicazioni dell'apprendimento federato

L'apprendimento federato è particolarmente utile in scenari che coinvolgono dati sensibili o distribuiti:

  • Previsione intelligente della tastiera: Le tastiere per cellulari (come Gboard di Google) utilizzano l'apprendimento federato per migliorare i suggerimenti di testo predittivo in base ai modelli di digitazione dell'utente su molti dispositivi, senza inviare le singole battute ai server centrali. Questo migliora l'esperienza dell'utente e protegge la privacy.
  • Assistenza sanitaria: Gli ospedali possono collaborare per addestrare modelli diagnostici, come quelli per l'analisi delle immagini mediche, utilizzando i dati dei pazienti distribuiti tra le varie istituzioni. Questo permette di ottenere modelli più robusti addestrati su popolazioni diverse senza violare le norme sulla riservatezza dei pazienti come l'HIPAA. Per saperne di più sull'apprendimento federato per l'informatica sanitaria. Ultralytics esplora aree simili nelle sue soluzioni di AI in ambito sanitario.

Vantaggi dell'apprendimento federato

  • Maggiore privacy dei dati: I dati grezzi rimangono sui dispositivi locali, riducendo in modo significativo i rischi per la privacy associati a violazioni o abusi dei dati.
  • Riduzione dei costi di comunicazione: Vengono trasmessi solo gli aggiornamenti del modello, che di solito sono più piccoli dei dataset grezzi, risparmiando larghezza di banda.
  • Accesso a dati diversi: Permette l'addestramento su grandi set di dati eterogenei distribuiti tra gli utenti o le organizzazioni, portando potenzialmente a modelli più robusti e generalizzabili, meno inclini all'overfitting.
  • Conformità normativa: Aiuta le organizzazioni a rispettare le severe normative sulla governance dei dati e sulla privacy (ad esempio, GDPR, CCPA).

Le sfide dell'apprendimento federato

  • Colli di comunicazione: La comunicazione frequente tra il server e i numerosi client può essere lenta e costosa, soprattutto nel caso di reti inaffidabili.
  • Eterogeneità del sistema: I client hanno spesso capacità hardware, connettività di rete e disponibilità di energia diverse, il che complica la formazione sincrona. Framework come TensorFlow Federated mirano a gestire questo aspetto.
  • Eterogeneità statistica: I dati dei vari clienti spesso non sono IID, cioè non seguono la stessa distribuzione, il che può mettere a dura prova la convergenza del modello e le prestazioni.
  • Problemi di sicurezza: Pur migliorando la privacy, il sistema può comunque essere vulnerabile ad attacchi avversari specifici che mirano agli aggiornamenti del modello o al processo di aggregazione, il che richiede solide misure di sicurezza dei dati. Le comunità di ML che preservano la privacy, come OpenMined, lavorano per risolvere questi problemi.

Nonostante queste sfide, l'apprendimento federato rappresenta un progresso significativo nell'Intelligenza Artificiale (IA) che rispetta la privacy. Piattaforme come Ultralytics HUB possono facilitare la distribuzione e la gestione dei modelli, compresi quelli potenzialmente sviluppati con approcci federati. Puoi esplorare le varie opzioni di distribuzione dei modelli nella documentazione di Ultralytics . Ulteriori discussioni sulla combinazione di FL con altre tecniche sono disponibili nel post del blog Active Learning speeds up computer vision.

Leggi tutto