Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Campo receptivo

Descubra cómo el campo receptivo define lo que ve una red neuronal. Aprenda cómo Ultralytics optimiza el contexto espacial para detect de todos los tamaños de forma eficaz.

En el ámbito de la visión por ordenador (CV) y el aprendizaje profundo , el campo receptivo se refiere a la región específica de una imagen de entrada que una neurona concreta de una red neuronal (NN) «ve» o analiza. Conceptualmente, funciona de manera similar al campo de visión del ojo humano o la lente de una cámara. Determina la cantidad de contexto espacial que un modelo puede percibir en una capa determinada. A medida que los datos avanzan a través de una red neuronal convolucional (CNN), el campo receptivo suele expandirse, lo que permite al sistema pasar de identificar pequeños detalles locales, como bordes o esquinas, a comprender estructuras globales complejas, como objetos o escenas completas.

La mecánica de los campos receptivos

El tamaño y la profundidad del campo receptivo vienen dictados por la arquitectura de la red. En las capas iniciales, las neuronas suelen tener un campo receptivo pequeño, centrándose en un pequeño grupo de píxeles para capturar texturas de grano fino. A medida que la red se profundiza, operaciones como las capas de agrupamiento y las convoluciones escalonadas reducen eficazmente la resolución de los mapas de características. Este proceso permite a las neuronas posteriores agregar información de una porción mucho mayor de la entrada original.

Las arquitecturas modernas, incluida la vanguardista Ultralytics , están diseñadas para equilibrar estos campos meticulosamente. Si el campo receptivo es demasiado estrecho, el modelo puede no reconocer objetos grandes porque no puede percibir la forma completa. Por el contrario, si el campo es excesivamente amplio sin mantener la resolución, el modelo podría pasar por alto objetos pequeños. Para solucionar esto, los ingenieros suelen utilizar convoluciones dilatadas (también conocidas como convoluciones atrous ) para ampliar el campo receptivo sin reducir la resolución espacial, una técnica vital para tareas de alta precisión como la segmentación semántica.

Aplicaciones en el mundo real

La optimización del campo receptivo es fundamental para el éxito de diversas soluciones de IA.

  • Conducción autónoma: en la IA para automoción, los sistemas de percepción deben track simultáneamente detalles track y obstáculos grandes. Un vehículo necesita un campo receptivo pequeño para identificar semáforos lejanos , al tiempo que requiere un campo receptivo grande para comprender la trayectoria de un camión cercano o la curvatura del carril de la carretera. Esta percepción multiescala garantiza una mayor seguridad y una mejor toma de decisiones de la IA.
  • Diagnóstico médico: al aplicar la IA en el ámbito sanitario, los radiólogos se basan en modelos para detectar anomalías en las exploraciones. Para identificar tumores cerebrales, la red requiere un amplio campo receptivo que le permita comprender la simetría y la estructura generales del cerebro. Sin embargo, para detect en mamografías, el modelo se basa en capas tempranas con campos receptivos pequeños sensibles a cambios sutiles en la textura.

Distinguir conceptos relacionados

Para comprender plenamente el diseño de redes, resulta útil diferenciar el campo receptivo de términos similares:

  • Campo receptivo frente a núcleo: El tamaño del núcleo (o filtro) define las dimensiones de la ventana deslizante (por ejemplo, 3x3) para una sola operación de convolución. El campo receptivo es una propiedad emergente que representa el área de entrada acumulada total que afecta a una neurona. Una pila de múltiples núcleos 3x3 dará como resultado un campo receptivo mucho mayor que 3x3.
  • Campo receptivo frente a mapa de características: un mapa de características es el volumen de salida producido por una capa, que contiene las representaciones aprendidas. El campo receptivo describe la relación entre un único punto de ese mapa de características y la imagen de entrada original.
  • Campo receptivo frente a ventana contextual: Aunque ambos términos se refieren al alcance de los datos percibidos, «ventana contextual» se utiliza normalmente en el procesamiento del lenguaje natural (NLP) o el análisis de vídeo para denotar un intervalo temporal o secuencial (por ejemplo, límite de tokens). El campo receptivo se refiere estrictamente al área espacial en datos en forma de cuadrícula (imágenes).

Uso práctico en código

Los modelos más avanzados, como el nuevo YOLO26, utilizan redes piramidales de características (FPN) para mantener campos receptivos eficaces para objetos de todos los tamaños. El siguiente ejemplo muestra cómo cargar un modelo y realizar la detección de objetos, aprovechando automáticamente estas optimizaciones arquitectónicas internas . Los usuarios que deseen entrenar sus propios modelos con arquitecturas optimizadas pueden utilizar la Ultralytics para una gestión fluida de los conjuntos de datos y el entrenamiento en la nube.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora