Glosario

Ingeniería de funciones

Domina la ingeniería de características para mejorar el rendimiento de los modelos de aprendizaje automático. Aprende técnicas, aplicaciones reales y consejos para mejorar la precisión.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La ingeniería de características es un proceso crucial en el aprendizaje automático (AM) que consiste en transformar los datos brutos en un formato que mejore el rendimiento de los modelos de AM. Es el arte y la ciencia de seleccionar, crear y transformar variables, conocidas como características, que se utilizan como entradas para estos modelos. El objetivo es crear características que capten la información esencial de los datos, facilitando al modelo el aprendizaje de patrones y la realización de predicciones precisas. Una ingeniería de características eficaz puede mejorar significativamente la capacidad de un modelo para generalizar de los datos de entrenamiento a los datos no vistos, mejorando en última instancia su precisión y eficacia.

Importancia de la ingeniería de características

La ingeniería de características es vital porque la calidad y la relevancia de las características influyen directamente en el rendimiento de un modelo de aprendizaje automático. Las características bien diseñadas pueden simplificar la estructura subyacente de los datos, facilitando a los modelos el discernimiento de patrones y relaciones. Esto puede dar lugar a predicciones más precisas, tiempos de entrenamiento más rápidos y una reducción de la complejidad de los modelos. En muchos casos, las características correctas pueden marcar la diferencia entre un modelo que funcione mal y otro que consiga resultados de vanguardia. Esto es especialmente importante en tareas complejas como la detección de objetos, en las que los datos de píxeles en bruto pueden no ser directamente informativos.

Técnicas de ingeniería de rasgos

En la ingeniería de rasgos se utilizan habitualmente varias técnicas:

  • Crear características de interacción: Esto implica combinar dos o más características para crear una nueva característica que capte las interacciones entre variables. Por ejemplo, en un modelo de predicción de precios inmobiliarios, multiplicar el número de habitaciones por el tamaño de la casa podría crear una característica más informativa que cualquiera de las dos variables por separado.
  • Tratamiento de los valores perdidos: Los datos que faltan pueden imputarse utilizando varios métodos, como rellenarlos con la media, la mediana o la moda de los valores observados, o utilizando técnicas más sofisticadas como la imputación predictiva.
  • Escalado de rasgos: Esto implica escalar las características a un rango similar, lo que puede ser crucial para los algoritmos sensibles a la escala de las características de entrada, como los que utilizan cálculos de distancia. Entre los métodos habituales se incluyen la estandarización y la normalización. Más información sobre estas técnicas en preprocesamiento de datos anotados.
  • Codificación de variables categóricas: Las características categóricas, como los colores o las categorías, deben convertirse a un formato numérico que los modelos de ML puedan procesar. Las técnicas incluyen la codificación de un solo punto, la codificación de etiquetas y la codificación de objetivos.
  • Binning o Discretización: Las características continuas pueden convertirse en categóricas dividiendo el rango de valores en intervalos. Esto puede ser útil para captar relaciones no lineales en los datos.
  • Selección de características: No todas las características son igual de informativas. Los métodos de selección de rasgos, como los métodos de filtro, envoltura e incrustación, ayudan a identificar los rasgos más relevantes, reduciendo la dimensionalidad y mejorando el rendimiento del modelo. Más información sobre la reducción de la dimensionalidad en el sitio web Ultralytics .

Ingeniería de rasgos vs. Extracción de rasgos

Aunque tanto la ingeniería como la extracción de características pretenden mejorar el rendimiento del modelo trabajando con características, difieren en su enfoque. La extracción de características implica la creación automática de nuevas características a partir de los datos brutos, a menudo mediante algoritmos. Por ejemplo, en el procesamiento de imágenes, una Red Neuronal Convolucional (CNN) puede aprender a extraer bordes o texturas de las imágenes. La ingeniería de características, por otra parte, suele implicar la creación o transformación manual de características basadas en el conocimiento del dominio y la comprensión de los datos.

Aplicaciones en el mundo real

He aquí dos ejemplos de ingeniería de rasgos en aplicaciones IA/ML del mundo real:

  1. Detección de fraudes: En la detección de fraudes con tarjetas de crédito, los datos brutos de la transacción pueden incluir el importe de la transacción, la hora, la ubicación y el vendedor. La ingeniería de rasgos podría implicar la creación de nuevos rasgos, como la diferencia de tiempo entre transacciones consecutivas, el importe medio de la transacción durante un periodo, o un rasgo binario que indique si una transacción se produjo en un lugar inusual. Estas características de ingeniería pueden mejorar significativamente la capacidad de un modelo para detectar transacciones fraudulentas.
  2. Mantenimiento Predictivo: En la fabricación, predecir los fallos de los equipos puede ahorrar costes significativos. Los datos brutos de los sensores pueden incluir lecturas de temperatura, presión y vibración. La ingeniería de características podría implicar la creación de características como la velocidad de cambio de la temperatura, la media móvil de los niveles de vibración o el tiempo transcurrido desde el último mantenimiento. Estas características pueden ayudar a un modelo a predecir cuándo es probable que falle una máquina, permitiendo un mantenimiento oportuno. Más información sobre la IA en la fabricación en el sitio web Ultralytics .

Ingeniería de características y Ultralytics

Ultralytics ofrece potentes herramientas y recursos para las tareas de visión por ordenador, incluidas las que se benefician de la ingeniería de características. Por ejemplo, los modelos de detección de objetos de Ultralytics YOLO pueden mejorarse mediante una cuidadosa ingeniería de características a partir de los datos de la imagen. Utilizando técnicas como la creación de características de interacción o el tratamiento de valores perdidos, los usuarios pueden mejorar la precisión y eficacia de sus modelos. Además, Ultralytics proporciona una plataforma fácil de usar, Ultralytics HUB, que simplifica el proceso de entrenamiento y despliegue de modelos, facilitando la experimentación con diferentes enfoques de ingeniería de características. Explora los últimos avances enUltralytics YOLO modelos para ver cómo puede aplicarse la ingeniería de características en proyectos de visión por ordenador de vanguardia.

Para saber más sobre la ingeniería de rasgos y conceptos relacionados, puedes explorar recursos como la página de Wikipedia sobre ingeniería de rasgos y la documentación de scikit-learn sobre preprocesamiento de datos.

Leer todo