Glosario

Aprendizaje Federado

Descubre el aprendizaje federado: un enfoque de la IA centrado en la privacidad que permite el entrenamiento descentralizado de modelos a través de dispositivos sin compartir datos brutos.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Aprendizaje Federado es un enfoque de aprendizaje automático que permite entrenar algoritmos a través de conjuntos de datos descentralizados ubicados en dispositivos periféricos o servidores, sin intercambiar los datos en sí. Este método es especialmente valioso cuando la privacidad de los datos, la seguridad de los datos, la gobernanza de los datos o el acceso a los datos distribuidos son preocupaciones primordiales. Al acercar el algoritmo a los datos, en lugar de los datos al algoritmo, el Aprendizaje Federado desbloquea el potencial para aprovechar grandes cantidades de datos que, de otro modo, permanecerían en silos, allanando el camino para modelos de IA más sólidos y que preserven la privacidad.

Conceptos básicos del aprendizaje federado

En el corazón del Aprendizaje Federado se encuentra el principio del entrenamiento distribuido. A diferencia del aprendizaje automático centralizado tradicional, en el que todos los datos de entrenamiento se agregan en una ubicación, el Aprendizaje Federado opera directamente en los dispositivos donde se generan y almacenan los datos. Este proceso suele implicar los siguientes pasos:

  1. Entrenamiento local: Cada dispositivo o cliente (por ejemplo, un smartphone, el servidor de un hospital) entrena un modelo local en su propio conjunto de datos. Este entrenamiento suele realizarse mediante técnicas estándar de aprendizaje automático, como el aprendizaje profundo con algoritmos como el descenso de gradiente.
  2. Agregación de modelos: Tras el entrenamiento local, cada dispositivo envía actualizaciones a un servidor central. Estas actualizaciones no son los datos en bruto en sí, sino parámetros del modelo (por ejemplo, weights and biases de una red neuronal) que representan lo que el modelo ha aprendido de los datos locales.
  3. Actualización del modelo global: El servidor central agrega estas actualizaciones del modelo, a menudo utilizando técnicas como el Promedio Federado, para crear un modelo global mejorado. Este modelo agregado se beneficia del aprendizaje de todos los dispositivos participantes.
  4. Distribución del modelo: A continuación, el modelo global actualizado se distribuye a los dispositivos, y el proceso se repite durante varias rondas. Este proceso iterativo refina el modelo global a lo largo del tiempo, mejorando su rendimiento y generalización.

Este enfoque colaborativo permite crear modelos potentes, al tiempo que se mantiene la privacidad de los datos y se minimizan los riesgos asociados a la centralización de información sensible. Para profundizar en los aspectos técnicos, Google AI ofrece una visión completa de la investigación y las aplicaciones del Aprendizaje Federado.

Aplicaciones del aprendizaje federado

El aprendizaje federado está encontrando aplicaciones en diversos campos, sobre todo cuando la sensibilidad y la distribución de los datos son consideraciones clave. Dos ejemplos destacados son:

  • Sanidad: En la sanidad, los datos de los pacientes son muy sensibles y a menudo están distribuidos por varios hospitales y clínicas. El Aprendizaje Federado permite el entrenamiento colaborativo de modelos de análisis de imágenes médicas para tareas como la detección y el diagnóstico de enfermedades, sin comprometer la seguridad de los datos de los pacientes. Por ejemplo, las iniciativas de investigación han explorado el uso del Aprendizaje Federado para mejorar la segmentación de tumores cerebrales utilizando datos de múltiples instituciones, como se detalla en documentos como"Federated Learning for Healthcare Informatics".
  • Dispositivos móviles: Los teléfonos inteligentes generan grandes cantidades de datos personales, como patrones de uso, entradas de texto y datos de localización. El aprendizaje federado se utiliza para entrenar modelos para tareas como la predicción de la siguiente palabra, las recomendaciones personalizadas y el análisis del comportamiento del usuario directamente en sus dispositivos. Este enfoque mejora la experiencia del usuario al tiempo que mantiene los datos personales en el dispositivo, mejorando la privacidad de los datos. Google Un ejemplo bien conocido es el trabajo de la empresa 's sobre la aplicación del Aprendizaje Federado al entrenamiento de modelos lingüísticos para teclados Android , descrito en su entrada del blog sobre Aprendizaje Federado.

Estos ejemplos ponen de relieve la versatilidad del Aprendizaje Federado para permitir aplicaciones de IA que respeten la privacidad de los datos y aprovechen las fuentes de datos distribuidas. Plataformas como Ultralytics HUB pueden facilitar el despliegue de modelos entrenados mediante enfoques federados, garantizando una integración eficaz en diversos sistemas.

Ventajas del aprendizaje federado

El aprendizaje federado ofrece varias ventajas convincentes:

  • Mayor privacidad: Al mantener los datos localizados y compartir sólo las actualizaciones de los modelos, el Aprendizaje Federado reduce significativamente el riesgo de filtración de datos y violación de la privacidad. Esto es crucial en sectores como la sanidad y las finanzas, donde el cumplimiento de la normativa y la confianza de los usuarios son primordiales.
  • Mayor acceso a los datos: El Aprendizaje Federado permite la utilización de vastos conjuntos de datos distribuidos geográficamente o aislados institucionalmente. Esto desbloquea el potencial para entrenar modelos más robustos y generalizables aprovechando diversas fuentes de datos que antes eran inaccesibles para el entrenamiento centralizado.
  • Costes de comunicación reducidos: En el aprendizaje automático tradicional basado en la nube, la transferencia de grandes conjuntos de datos a un servidor central puede ser costosa y consumir mucho ancho de banda. El Aprendizaje Federado minimiza la transferencia de datos realizando el cálculo localmente, reduciendo la sobrecarga de comunicación y mejorando la eficiencia, especialmente en escenarios de computación de borde.
  • Mejor personalización de los modelos: El Aprendizaje Federado puede facilitar el desarrollo de modelos más personalizados aprovechando los datos locales de los dispositivos individuales. Esto puede conducir a experiencias de usuario más personalizadas, ya que los modelos pueden adaptarse a comportamientos y preferencias específicos del usuario sin comprometer la privacidad.

Retos del aprendizaje federado

A pesar de sus ventajas, el Aprendizaje Federado también presenta varios retos:

  • Cuellos de botella en la comunicación: Aunque el Aprendizaje Federado reduce la transferencia de datos, la comunicación de las actualizaciones del modelo entre los dispositivos y el servidor central puede seguir siendo un cuello de botella, especialmente con un gran número de dispositivos o en redes con un ancho de banda limitado. Se está investigando para desarrollar estrategias de comunicación más eficientes.
  • Heterogeneidad de los datos: Los datos de los distintos dispositivos pueden ser altamente no IID (Independientes e Idénticamente Distribuidos), lo que significa que pueden variar significativamente en términos de distribución, volumen y calidad. Esta "heterogeneidad de datos" puede dificultar el entrenamiento de un modelo global que funcione bien en todos los dispositivos. Se están desarrollando técnicas como el Aprendizaje Federado personalizado para abordar este reto.
  • Problemas de seguridad: Aunque el Aprendizaje Federado mejora la privacidad de los datos, no es inmune a los riesgos de seguridad. Las propias actualizaciones de los modelos pueden filtrar información sobre los datos subyacentes, y el sistema puede ser vulnerable a ataques como el envenenamiento de modelos o los ataques de puerta trasera. La investigación en seguridad de datos y técnicas de preservación de la privacidad, como la privacidad diferencial, es crucial para mitigar estos riesgos.
  • Heterogeneidad de sistemas y dispositivos: Los sistemas de Aprendizaje Federado deben funcionar en una amplia gama de dispositivos con distintas capacidades informáticas, conectividad de red y disponibilidad. Gestionar esta heterogeneidad de dispositivos y garantizar un rendimiento sólido en entornos diversos es un importante reto de ingeniería.

Abordar estos retos es un área activa de investigación, y los avances en curso amplían continuamente las capacidades y la aplicabilidad del Aprendizaje Federado en diversos dominios. A medida que la IA sigue evolucionando, el Aprendizaje Federado está preparado para desempeñar un papel cada vez más importante en la creación de soluciones de aprendizaje automático colaborativas y que preserven la privacidad.

Leer todo