Glosario

Backbone

Explora el papel de una columna vertebral en el aprendizaje profundo. Descubre cómo Ultralytics utiliza columnas vertebrales optimizadas para una extracción de características y una detección de objetos rápidas y precisas.

Una columna vertebral es el componente fundamental de extracción de características de una arquitectura de aprendizaje profundo, que actúa como el motor principal que transforma los datos sin procesar en representaciones significativas. En el contexto de la visión por computadora, la columna vertebral suele comprender una serie de capas dentro de una red neuronal que procesa imágenes de entrada para identificar patrones jerárquicos. Estos patrones van desde características simples de bajo nivel, como bordes y texturas, hasta conceptos complejos de alto nivel, como formas y objetos. La salida de la columna vertebral, a menudo denominada mapa de características, sirve como entrada para los componentes posteriores que realizan tareas específicas como la clasificación o la detección.

El papel de la columna vertebral

La función principal de una red troncal es «ver» y comprender el contenido visual de una imagen antes de tomar cualquier decisión específica. Actúa como un traductor universal, convirtiendo los valores de los píxeles en un formato condensado y rico en información. La mayoría de las redes troncales modernas se basan en redes neuronales convolucionales (CNN) o transformadores de visión (ViT) y, a menudo, se entrenan previamente con conjuntos de datos masivos como ImageNet. Este proceso de preentrenamiento , un aspecto fundamental del aprendizaje por transferencia, permite al modelo aprovechar las características visuales aprendidas previamente, lo que reduce significativamente los datos y el tiempo necesarios para entrenar un nuevo modelo para una aplicación específica.

Por ejemplo, cuando se utiliza Ultralytics , la arquitectura incluye una columna vertebral altamente optimizada que extrae de manera eficiente características multiescala. Esto permite que las partes posteriores de la red se centren por completo en localizar objetos y asignar probabilidades de clase sin necesidad de volver a aprender a reconocer estructuras visuales básicas desde cero.

Columna vertebral frente a cuello frente a cabeza

Para comprender plenamente la arquitectura de los modelos de detección de objetos, es esencial distinguir la columna vertebral de los otros dos componentes principales: el cuello y la cabeza.

Backbone: El «extractor de características». Aísla la información visual esencial de la imagen de entrada. Entre los ejemplos más populares se incluyen las redes residuales (ResNet), desarrolladas originalmente por Microsoft , y CSPNet, optimizada para la eficiencia computacional.
Cuello: El «agregador de características». Situado entre la columna vertebral y la cabeza, el cuello refina y combina características de diferentes escalas. Una estructura común utilizada aquí es la red piramidal de características (FPN), que mejora la capacidad del modelo para detect de diferentes tamaños.
Cabeza: El «predictor». El cabezal de detección procesa las características agregadas desde el cuello para generar el resultado final, como cuadros delimitadores y etiquetas de clase.

Aplicaciones en el mundo real

Las redes troncales son los silenciosos caballos de batalla detrás de muchas aplicaciones industriales y científicas de IA. Su capacidad para generalizar datos visuales las hace adaptables a diversos sectores.

Diagnóstico médico: En el ámbito sanitario, las redes troncales analizan imágenes médicas complejas, como radiografías, tomografías computarizadas y resonancias magnéticas. Al realizar el análisis de imágenes médicas, estas redes pueden extraer anomalías sutiles indicativas de enfermedades. Por ejemplo, los modelos especializados aprovechan las potentes redes troncales para la detección de tumores, identificando signos tempranos de cáncer que podrían pasar desapercibidos para el ojo humano. Organizaciones como la Sociedad Radiológica de Norteamérica (RSNA) abogan por estas herramientas de aprendizaje profundo para revolucionar la atención al paciente.
Sistemas autónomos: En las industrias automotriz y robótica, las redes troncales procesan las señales de vídeo de las cámaras a bordo para interpretar el entorno. La IA en la automoción se basa en estos robustos extractores de características para detect , leer señales de tráfico e identificar peatones en tiempo real. Una red troncal fiable garantiza que el sistema pueda distinguir entre obstáculos estáticos y vehículos en movimiento, un requisito de seguridad fundamental para las tecnologías de conducción autónoma desarrolladas por empresas como Waymo.

Aplicación con Ultralytics

Arquitecturas de última generación como YOLO11 y la innovadora YOLO26 integran potentes estructuras por defecto. Estos componentes están diseñados para una latencia de inferencia óptima en diversas plataformas de hardware , desde dispositivos periféricos hasta GPU de alto rendimiento .

El siguiente Python muestra cómo cargar un modelo con una estructura preentrenada utilizando el ultralytics paquete. Esta configuración aprovecha automáticamente la columna vertebral para la extracción de características durante la inferencia.

from ultralytics import YOLO

# Load a YOLO26 model, which includes a pre-trained CSP backbone
model = YOLO("yolo26n.pt")

# Perform inference on an image
# The backbone extracts features, which are then used for detection
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting detection
results[0].show()

Al utilizar una estructura preentrenada, los desarrolladores pueden realizar ajustes precisos en sus propios conjuntos de datos personalizados utilizando la Ultralytics . Este enfoque facilita el rápido desarrollo de modelos especializados, como los que se utilizan para detectar paquetes en logística, sin los enormes recursos computacionales que normalmente se requieren para entrenar una red neuronal profunda desde cero.

Backbone

Entrene los modelosYOLO Ultralytics para agilizar los flujos de trabajo en todos los sectores

Solución de licencias empresariales flexible para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

El papel de la columna vertebral

Columna vertebral frente a cuello frente a cabeza

Aplicaciones en el mundo real

Aplicación con Ultralytics

Leer más en esta categoría

12 casos de uso de imágenes aéreas impulsados por la visión artificial

¿Qué es la estimación de profundidad monocular? Una visión general

Una mirada al uso deYOLO Ultralytics para la detección de amenazas mediante IA

Únase a la comunidad Ultralytics