El Aprendizaje Federado es una técnica de Aprendizaje Automático (AM ) que permite entrenar modelos a través de múltiples dispositivos descentralizados o servidores que contienen muestras de datos locales, sin intercambiar los propios datos brutos. Este enfoque aborda preocupaciones críticas en torno a la privacidad de los datos, la seguridad y los derechos de acceso, permitiendo la colaboración en el entrenamiento de modelos utilizando datos que no pueden o no deben recopilarse de forma centralizada. A diferencia del entrenamiento centralizado tradicional, en el que los datos se agregan, el Aprendizaje Federado lleva el proceso de entrenamiento a la ubicación de los datos, a menudo en dispositivos Edge AI.
Conceptos básicos del aprendizaje federado
El Aprendizaje Federado funciona mediante un proceso colaborativo e iterativo gestionado por un coordinador central (servidor):
- Distribución de modelos: El servidor central inicializa un modelo global (como un modeloYOLO de Ultralytics para la Detección de Objetos) y lo distribuye a los dispositivos cliente o silos de datos participantes.
- Entrenamiento local: Cada cliente entrena el modelo recibido utilizando sus datos locales durante unas pocas iteraciones. Como los datos nunca salen del cliente, se mantiene la privacidad. Este entrenamiento local suele utilizar técnicas estándar de Aprendizaje Profundo (AD).
- Agregación de actualizaciones: Los clientes sólo envían al servidor central las actualizaciones del modelo (por ejemplo, los pesos o gradientes aprendidos), no los datos subyacentes. Estas actualizaciones suelen estar protegidas mediante técnicas como la privacidad diferencial o la agregación segura.
- Actualización del modelo global: El servidor agrega las actualizaciones recibidas (por ejemplo, promediando) para mejorar el modelo global.
- Iteración: Este ciclo se repite, mejorando gradualmente el modelo global con el conocimiento aprendido a través de todos los clientes participantes, sin comprometer la privacidad de los datos brutos. Google AI proporciona información sobre su investigación y aplicaciones del Aprendizaje Federado.
Aunque está relacionado con el Entrenamiento Distribuido, el Aprendizaje Federado supone específicamente que los datos no son IID (no están distribuidos de forma idéntica e independiente), están descentralizados por diseño y hacen hincapié en la preservación de la privacidad como principio básico.
Aplicaciones del aprendizaje federado
El Aprendizaje Federado es especialmente útil en escenarios con datos sensibles o distribuidos:
- Predicción de teclado inteligente: Los teclados de los teléfonos móviles (como el Gboard de Google) utilizan el Aprendizaje Federado para mejorar las sugerencias de texto predictivo basándose en los patrones de escritura del usuario en muchos dispositivos, sin enviar las pulsaciones individuales a servidores centrales. Esto mejora la experiencia del usuario al tiempo que protege su privacidad.
- Sanidad: Los hospitales pueden colaborar para entrenar modelos de diagnóstico, como los de Análisis de Imágenes Médicas, utilizando datos de pacientes distribuidos entre instituciones. Esto permite obtener modelos más robustos entrenados en poblaciones diversas sin violar las normas de confidencialidad de los pacientes, como la HIPAA. Más información sobre el Aprendizaje Federado para la Informática Sanitaria. Ultralytics explora áreas similares en sus soluciones de IA en Sanidad.
Ventajas del aprendizaje federado
- Mayor privacidad de los datos: Los datos sin procesar permanecen en los dispositivos locales, lo que reduce significativamente los riesgos de privacidad asociados a la violación o el uso indebido de los datos.
- Costes de comunicación reducidos: Sólo se transmiten las actualizaciones del modelo, que suelen ser más pequeñas que los conjuntos de datos brutos, lo que ahorra ancho de banda.
- Acceso a datos diversos: Permite el entrenamiento en grandes conjuntos de datos heterogéneos distribuidos entre usuarios u organizaciones, lo que puede dar lugar a modelos más robustos y generalizables, menos propensos al Sobreajuste.
- Cumplimiento normativo: Ayuda a las organizaciones a cumplir las estrictas normativas sobre gobernanza de datos y privacidad (por ejemplo, GDPR, CCPA).
Retos del aprendizaje federado
- Cuellos de botella en la comunicación: La comunicación frecuente entre el servidor y numerosos clientes puede ser lenta y costosa, especialmente con redes poco fiables.
- Heterogeneidad del sistema: Los clientes suelen tener distintas capacidades de hardware, conectividad de red y disponibilidad de energía, lo que complica el entrenamiento síncrono. Marcos como TensorFlow Federated pretenden gestionar esto.
- Heterogeneidad estadística: Los datos de los clientes a menudo no son IID, es decir, no siguen la misma distribución, lo que puede dificultar la convergencia y el rendimiento del modelo.
- Problemas de seguridad: Aunque mejore la privacidad, el sistema puede seguir siendo vulnerable a ataques adversarios específicos dirigidos a las actualizaciones del modelo o al proceso de agregación, lo que requiere medidas sólidas de seguridad de los datos. Las comunidades de ML que preservan la privacidad, como OpenMined, trabajan para resolver estos problemas.
A pesar de estos retos, el Aprendizaje Federado representa un avance significativo en la Inteligencia Artificial (IA) que preserva la privacidad. Plataformas como Ultralytics HUB pueden facilitar el Despliegue de Modelos y la gestión de modelos, incluidos los potencialmente desarrollados mediante enfoques federados. Puedes explorar varias opciones de despliegue de modelos en la documentación de Ultralytics . Puedes encontrar más información sobre la combinación de FL con otras técnicas en la entrada del blog El aprendizaje activo acelera el desarrollo de la visión por ordenador.