Glosario

Reconocimiento de imágenes

Descubre cómo el reconocimiento de imágenes permite a la IA clasificar y comprender imágenes, impulsando la innovación en sanidad, comercio minorista, seguridad y mucho más.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El reconocimiento de imágenes es una rama crucial de la inteligencia artificial (IA) y la visión por ordenador (VC ) que permite a las máquinas identificar e interpretar la información visual de imágenes o vídeos. Va más allá de simplemente ver píxeles; implica comprender el contenido, como objetos, personas, escenas y acciones representadas dentro de los datos visuales. Esta tecnología constituye la base de innumerables aplicaciones, permitiendo a los sistemas "ver" y dar sentido al mundo de forma similar a los humanos.

Cómo funciona el reconocimiento de imágenes

En su esencia, el reconocimiento de imágenes se basa en gran medida en el aprendizaje automático (AM), en particular en algoritmos de aprendizaje profundo (AD). Las redes neuronales convolucionales (CNN ) son un componente fundamental, diseñado para aprender de forma automática y adaptativa jerarquías espaciales de características a partir de imágenes. El proceso suele implicar el entrenamiento de un modelo en vastos conjuntos de datos de imágenes etiquetadas, como el famoso conjunto de datos ImageNet, donde cada imagen está etiquetada con información sobre su contenido, a menudo organizada utilizando estructuras como la jerarquía WordNet. Durante el entrenamiento, el modelo aprende a asociar patrones y características visuales específicos (como bordes, texturas, formas) con diferentes etiquetas o categorías. Arquitecturas como ResNet tienen un rendimiento significativamente avanzado en estas tareas. Una vez entrenado, el modelo puede analizar imágenes nuevas no vistas y predecir los objetos o conceptos presentes en ellas. La comprensión de estos conceptos puede profundizarse mediante recursos como la Especialización en Aprendizaje Profundo. Aunque ImageNet es clave para la clasificación, conjuntos de datos como COCO también son vitales para tareas de comprensión visual más amplias. Un entrenamiento eficaz del modelo requiere una planificación y ejecución cuidadosas.

Distinciones con los términos afines

Aunque está relacionado con otras tareas de visión por ordenador, el reconocimiento de imágenes se utiliza a menudo como un término más amplio que engloba varias capacidades específicas. Es importante distinguirlo de tareas más limitadas:

El reconocimiento de imágenes a veces puede referirse específicamente a la clasificación de imágenes, pero a menudo implica la capacidad más amplia de comprender el contenido de las imágenes, lo que puede implicar la detección o la segmentación en función de las necesidades de la aplicación.

Aplicaciones en el mundo real

El reconocimiento de imágenes impulsa una amplia gama de aplicaciones en diversas industrias:

El campo está en constante evolución, impulsado por la investigación compartida en lugares como la Conferencia sobre Visión por Ordenador y Reconocimiento de Patrones (CVPR) y organizaciones como la Fundación de Visión por Ordenador (CVF). Lee ideas prácticas en el Blog deGoogle Cloud AI.

Herramientas y formación

El desarrollo de aplicaciones de reconocimiento de imágenes suele implicar el uso de bibliotecas y marcos especializados. Entre las tecnologías clave se incluyen:

Leer todo