Glosario

Extracción de características

Descubre el poder de la extracción de características en el aprendizaje automático con Ultralytics YOLO11 . Aprende técnicas de detección y análisis eficaces.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La extracción de características es un proceso fundamental en el aprendizaje automático (AM) y la visión por ordenador, que sirve de puente crucial entre los datos brutos, a menudo complejos, y los algoritmos diseñados para aprender de ellos. Consiste en transformar datos no estructurados o de alta dimensión, como imágenes o texto, en un conjunto estructurado de características numéricas (un vector de características) que represente eficazmente las características importantes de los datos originales. Los objetivos principales son reducir la complejidad de los datos(reducción de la dimensionalidad), resaltar los patrones relevantes, eliminar el ruido o la información redundante y, en última instancia, hacer que los datos sean más adecuados para los modelos de ML, lo que conduce a un mejor rendimiento, tiempos de entrenamiento más rápidos y una mejor generalización.

Cómo funciona la extracción de rasgos

Los métodos de extracción de características varían según el tipo de datos. En el caso de las imágenes, las técnicas pueden consistir en identificar bordes, esquinas, texturas o histogramas de color mediante algoritmos disponibles en bibliotecas como OpenCV. En el aprendizaje profundo moderno, especialmente en las Redes Neuronales Convolucionales (CNN ) utilizadas en modelos como Ultralytics YOLOla extracción de características suele aprenderse automáticamente. Las capas de convolución de la red aplican filtros a la entrada, creando mapas de características que capturan jerárquicamente patrones cada vez más complejos, desde texturas simples a partes de objetos. Para los datos de texto en el Procesamiento del Lenguaje Natural (PLN), la extracción puede implicar el cálculo de frecuencias de términosTF) o la generación de incrustaciones de palabras, vectores densos que representan los significados y las relaciones de las palabras. Otras técnicas generales de reducción de la dimensionalidad aplicables a diversos tipos de datos son el Análisis de Componentes Principales (ACP) y la Incrustación Estocástica de Vecinos t-distribuida (t-SNE).

Extracción de rasgos vs. Ingeniería de rasgos

Aunque está relacionada, la extracción de características es distinta de la ingeniería de características. La extracción de características se centra específicamente en transformar los datos brutos en características, a menudo utilizando algoritmos establecidos o aprendizaje automatizado (como en las CNN). La ingeniería de rasgos es un término más amplio que engloba la extracción de rasgos, pero también incluye la creación de nuevos rasgos a partir de los existentes, la selección de los rasgos más relevantes y la transformación de los rasgos en función de la experiencia en el dominio y los requisitos del modelo. Los modelos de aprendizaje profundo han automatizado significativamente la parte de extracción de características para tareas como el reconocimiento de imágenes y la detección de objetos, reduciendo la necesidad de elaboración manual de características que era habitual en el ML tradicional.

Aplicaciones en el mundo real

La extracción de características forma parte integral de innumerables aplicaciones de IA:

  1. Análisis de imágenes médicas: En el análisis de resonancias magnéticas o tomografías computarizadas para la detección de tumores, la extracción de características ayuda a identificar patrones, texturas y formas relevantes indicativos de anomalías, distinguiéndolos del tejido normal. Modelos como YOLOv8 pueden entrenarse en conjuntos de datos como el de los tumores cerebrales, donde las características extraídas son clave para identificar las regiones tumorales.
  2. Análisis del Sentimiento: Para determinar el sentimiento (positivo, negativo, neutro) de las opiniones de los clientes, la extracción de características PLN convierte el texto en representaciones numéricas (p. ej., incrustaciones) que captan el significado semántico, lo que permite a los modelos clasificar el sentimiento con eficacia. Explora más casos de uso del análisis de sentimientos.

La extracción eficaz de características es esencial para construir sistemas de IA robustos y eficientes. Plataformas como Ultralytics HUB agilizan el proceso de entrenamiento de modelos que realizan de forma inherente una potente extracción de características para tareas que van desde la detección a la segmentación de imágenes. Un preprocesamiento adecuado de los datos suele preceder a la extracción de características para garantizar la calidad de los datos.

Leer todo