Glosario

Ingeniería de funciones

Aumenta la precisión del aprendizaje automático con la ingeniería experta de características. Aprende técnicas para crear, transformar y seleccionar características impactantes.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La ingeniería de características es el proceso de seleccionar, manipular y transformar datos brutos en características que puedan utilizarse en modelos de aprendizaje automático. Es un paso crucial en el proceso de aprendizaje automático, porque la calidad de las características influye directamente en el rendimiento de los modelos. Una ingeniería de características eficaz puede mejorar significativamente la precisión, la eficacia y la capacidad de generalización de un modelo. Requiere conocimiento del dominio, creatividad y una buena comprensión de los algoritmos de aprendizaje automático.

Definición e importancia de la ingeniería de características

La ingeniería de características es algo más que limpiar los datos; se trata de elaborar las variables de entrada adecuadas para que los algoritmos de aprendizaje automático funcionen eficazmente. Implica crear nuevas características a partir de los datos existentes, seleccionar las más relevantes y transformarlas para que representen mejor el problema subyacente. El objetivo es proporcionar a los modelos características que sean informativas, relevantes y fácilmente comprensibles, permitiéndoles aprender patrones y hacer predicciones precisas. Las características de alta calidad pueden simplificar los modelos, acelerar el entrenamiento y mejorar la interpretabilidad de los modelos. En esencia, la ingeniería de características es el arte de hacer que los datos sean digeribles para los modelos de IA, salvando la distancia entre los datos brutos y la entrada lista para la máquina.

Técnicas de ingeniería de rasgos

Bajo el paraguas de la ingeniería de rasgos se engloban numerosas técnicas, cada una de ellas diseñada para extraer o refinar información a partir de datos brutos. Las técnicas más comunes son:

  • Escalado y Normalización de Rasgos: Métodos como la estandarización y la normalización ajustan el rango de valores de las características. Esto es crucial para los algoritmos sensibles a las escalas de las características, como los algoritmos basados en el descenso de gradiente utilizados en el aprendizaje profundo, ya que garantizan una convergencia más rápida y evitan que las características con valores más grandes dominen el proceso de aprendizaje. Más información sobre las técnicas de normalización.
  • Extracción de características: Consiste en transformar automáticamente los datos brutos en características numéricas que puedan ser procesadas por modelos de aprendizaje automático. En visión por ordenador, por ejemplo, la extracción de características puede convertir los píxeles de una imagen en representaciones significativas de formas, texturas o bordes.
  • Selección de características: Elegir las características más relevantes de un conjunto de datos reduce la dimensionalidad, simplifica los modelos y mejora la generalización. Técnicas como la selección univariante de características o la eliminación recursiva de características ayudan a identificar y retener las variables más impactantes, descartando las irrelevantes o redundantes. Explora las técnicas de reducción de la dimensionalidad para gestionar datos de alta dimensión.
  • Tratamiento de los datos omitidos: Las estrategias para tratar los valores omitidos, como la imputación (rellenar los valores omitidos con medidas estadísticas como la media o la mediana) o crear indicadores binarios de omisión, son cruciales para mantener la integridad de los datos y la solidez del modelo. El preprocesamiento de datos suele incluir pasos para tratar los datos omitidos.
  • Codificación de variables categóricas: Los modelos de aprendizaje automático suelen requerir datos numéricos. Las variables categóricas (p. ej., colores, categorías) deben convertirse en representaciones numéricas mediante técnicas como la codificación de un punto o la codificación de etiquetas.

Aplicaciones reales de la ingeniería de características

La ingeniería de características se aplica en diversos ámbitos para mejorar el rendimiento de los sistemas de IA y ML. He aquí un par de ejemplos:

  1. Análisis de imágenes médicas: En el análisis de imágenes médicas, la ingeniería de características desempeña un papel fundamental en la mejora de la precisión diagnóstica. Por ejemplo, en la detección de tumores cerebrales, se pueden diseñar características a partir de resonancias magnéticas para resaltar las características del tumor, como el tamaño, la forma y la textura. Estas características de ingeniería, cuando se utilizan con modelos como Ultralytics YOLO para la detección de objetos, pueden mejorar significativamente la precisión de la localización y clasificación de tumores. Puedes explorar las aplicaciones relacionadas de la IA en la sanidad.
  2. Análisis de Sentimientos: En el análisis de sentimientos, utilizado para determinar el tono emocional de un texto, la ingeniería de características es crucial para procesar datos textuales. Las técnicas incluyen la extracción de características del texto, como incrustaciones de palabras, n-gramas (secuencias de palabras) y puntuaciones TF-IDF (frecuencia de términos-frecuencia inversa de documentos). Estas características textuales se introducen en modelos para clasificar con precisión el sentimiento expresado en reseñas, artículos o mensajes de redes sociales.

Ingeniería de características y Ultralytics

Aunque Ultralytics YOLO destaca en tareas como la detección de objetos y la segmentación de imágenes, la ingeniería de características sigue siendo relevante en el contexto más amplio de la construcción de soluciones de IA completas. Por ejemplo, al desplegar Ultralytics YOLO para una aplicación personalizada, como los sistemas de alarma de seguridad, la ingeniería de características podría implicar el preprocesamiento de datos de vídeo para mejorar la calidad de la imagen o la extracción de características contextuales relevantes para mejorar la precisión de la detección de amenazas. Además, plataformas como Ultralytics HUB pueden agilizar el proceso de gestión de conjuntos de datos y modelos, permitiendo a los usuarios centrarse más en la ingeniería de características para optimizar sus aplicaciones de IA.

La ingeniería de características es un proceso iterativo, que a menudo requiere experimentación y refinamiento para lograr resultados óptimos. Es una habilidad crítica para cualquiera que trabaje con aprendizaje automático, ya que influye directamente en la eficacia y eficiencia de los sistemas de IA.

Para comprender mejor los conceptos relacionados, consulta el amplio GlosarioUltralytics .

Leer todo