Glosario

TPU (Tensor Unidad de Procesamiento)

Descubre cómo las Unidades de Procesamiento Tensor (TPU) aceleran tareas de aprendizaje automático como el entrenamiento, la inferencia y la detección de objetos con una eficacia inigualable.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Una Unidad de Procesamiento Tensor TPU) es un acelerador de aprendizaje automático diseñado a medida y desarrollado por Google específicamente para cargas de trabajo de redes neuronales. Estos procesadores especializados, un tipo de circuito integrado de aplicación específica (ASIC), están diseñados para acelerar y ampliar drásticamente las operaciones de aprendizaje automático, especialmente para tareas de inferencia y entrenamiento. Las TPU están diseñadas para manejar los complejos cálculos matemáticos que intervienen en la inteligencia artificial (IA), ofreciendo mejoras significativas de rendimiento sobre las Unidades Centrales de Procesamiento (CPU) y, a menudo, sobre las Unidades de Procesamiento Gráfico (GPU) para determinados tipos de modelos de aprendizaje automático. Son especialmente eficaces para los cálculos a gran escala habituales en el aprendizaje profundo.

¿Qué es un TPU?

Una TPU se construye desde cero para satisfacer las demandas únicas del aprendizaje automático (AM). A diferencia de los procesadores de propósito general, como las CPU o incluso las GPU, que se encargan de una gama más amplia de tareas, las TPU están diseñadas para sobresalir en los cálculos de tensor , las operaciones matemáticas fundamentales de las redes neuronales (NN). Los tensores son matrices multidimensionales que representan datos en modelos de ML, y las TPU están optimizadas para realizar multiplicaciones matriciales a gran escala y otras operaciones de álgebra tensor a gran velocidad y con eficiencia energética. Esta especialización permite a las TPU ejecutar tareas de ML mucho más rápidamente que las CPU y, en muchos casos, de forma más eficiente que las GPU, especialmente cuando se trabaja con marcos como TensorFlow para el que se optimizaron inicialmente. Compatibilidad con otros marcos como PyTorch lo que amplía sus posibilidades de uso. Puedes obtener más información sobre los detalles en la Introducción TPU Google Cloud.

Aplicaciones de los TPU

Las TPU se utilizan ampliamente en diversas aplicaciones, en particular las impulsadas por los servicios Google y, cada vez más, en dominios más amplios de IA y ML accesibles a través de plataformas como Google Cloud. Entre las aplicaciones clave se incluyen:

  • Entrenamiento de modelos a gran escala: Las TPU destacan en el entrenamiento de modelos masivos de aprendizaje profundo que requieren una inmensa potencia computacional y configuraciones de entrenamiento distribuidas. Por ejemplo, Google utiliza las TPU internamente para entrenar modelos sofisticados para servicios como Google Search y Google Translate, manejando enormes conjuntos de datos y arquitecturas complejas.
  • Inferencia de grandes volúmenes: Para aplicaciones que requieren una inferencia rápida y eficiente sobre grandes volúmenes de datos, las TPU proporcionan una aceleración significativa. Esto es crucial para servicios en tiempo real como el procesamiento del lenguaje natural (PLN ) en chatbots o tareas de visión por ordenador (CV) como la detección de objetos a gran escala en Google Fotos.
  • Investigación y Desarrollo: Los investigadores aprovechan las TPU a través de plataformas en la nube y entornos como Kaggle (consulta la guía de integración deUltralytics en Kaggle) para acelerar los experimentos y desarrollar modelos de IA punteros, como los utilizados en el análisis de imágenes médicas o las simulaciones científicas.
  • Computación Edge: Las versiones más pequeñas, conocidas como TPUs Edge, llevan las capacidades de inferencia ML directamente a los dispositivos, permitiendo aplicaciones en IoT y robótica que requieren baja latencia y procesamiento offline. Más información sobre los principios de la computación de borde.

TPUs vs GPUs vs CPUs

Aunque tanto las TPU como las GPU y las CPU pueden procesar cálculos, están diseñadas para fines distintos y destacan en tareas diferentes:

  • CPU (Unidad Central de Proceso): El cerebro de un ordenador estándar, diseñado para tareas informáticas de propósito general. Maneja las operaciones del sistema, ejecuta las instrucciones del programa secuencialmente y gestiona diversas cargas de trabajo, pero es relativamente lenta para los cálculos paralelos masivos necesarios en el aprendizaje profundo. Más información sobre la comparaciónCPU vs GPU .
  • GPU (Unidad de Procesamiento Gráfico): Diseñadas originalmente para renderizar gráficos, las GPU cuentan con miles de núcleos optimizados para el procesamiento paralelo. Esto las hace muy eficaces para entrenar y ejecutar muchos modelos ML, ofreciendo un buen equilibrio entre rendimiento y flexibilidad en diversas tareas, como la detección de objetos con los modelosYOLO Ultralytics . Los principales proveedores son NVIDIA y AMD.
  • TPU (Unidad de ProcesamientoTensor ): Diseñada específicamente como procesador tensorial para cargas de trabajo de redes neuronales. Las TPU ofrecen el máximo rendimiento y eficiencia energética para operaciones tensor a gran escala, especialmente dentro del ecosistema de Google(TensorFlowy PyTorch en Google Cloud). Puede que sean menos flexibles que las GPU para la computación paralela en general, pero pueden ofrecer ventajas sustanciales en coste y velocidad para tareas específicas de ML a gran escala alojadas en plataformas como Google Cloud Platform.

En resumen, las TPU representan un avance significativo en el hardware diseñado específicamente para las demandas del aprendizaje automático moderno, ofreciendo un mayor rendimiento y eficiencia para aplicaciones específicas de IA, en particular trabajos de entrenamiento e inferencia a gran escala. Complementan a otros aceleradores como las GPU, proporcionando opciones en función de la carga de trabajo específica, la escala y el ecosistema de software. Puedes explorar las opciones de entrenamiento, incluidos los recursos en la nube, a través de plataformas como Ultralytics HUB, que ofrece capacidades racionalizadas de entrenamiento y gestión de modelos. Para leer más sobre las tendencias de la IA, visita el Blog deUltralytics .

Leer todo