Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Etiquetado de Datos

Aprenda los fundamentos del etiquetado de datos para el aprendizaje automático. Descubra tipos clave como la detección de objetos y cómo acelerar los flujos de trabajo utilizando Ultralytics .

El etiquetado de datos es el proceso fundamental de identificar datos sin procesar, como imágenes, fotogramas de vídeo, texto o audio, y añadir etiquetas informativas o metadatos para proporcionar contexto. En el ámbito del aprendizaje automático (ML), los algoritmos no pueden comprender de forma inherente el mundo físico; necesitan un «maestro» que los guíe. Esta guía se presenta en forma de conjuntos de datos etiquetados que se utilizan durante el aprendizaje supervisado. Las etiquetas sirven como verdad fundamental, representando las respuestas correctas que el modelo se esfuerza por predecir. Ya sea para entrenar un clasificador simple o una arquitectura compleja como Ultralytics , la precisión, la coherencia y la calidad de estas etiquetas son los principales determinantes del éxito de un modelo.

Etiquetado de datos frente a anotación de datos

Aunque los términos se utilizan a menudo de forma intercambiable en conversaciones informales, existe una sutil distinción que vale la pena señalar. El «etiquetado de datos» se refiere generalmente al acto general de asignar una categoría o etiqueta a un dato (por ejemplo, etiquetar un correo electrónico como «spam»). Por el contrario, la anotación de datos suele ser más específica de la visión artificial (CV), e implica la delimitación precisa de objetos mediante cuadros delimitadores, polígonos o puntos clave. Sin embargo, en la mayoría de los flujos de trabajo de operaciones de aprendizaje automático (MLOps), ambos términos describen la creación de datos de entrenamiento de alta calidad.

Tipos de claves en la visión artificial

El método de etiquetado cambia en función de la tarea que debe realizar el modelo. Los tipos más comunes son:

Aplicaciones en el mundo real

La utilidad del etiquetado de datos se extiende prácticamente a todos los sectores que emplean IA.

  1. Vehículos autónomos: los coches autónomos se basan en enormes conjuntos de datos en los que cada vehículo, peatón, señal de tráfico y marcador de carril está meticulosamente etiquetado. Estos datos etiquetados permiten al sistema de percepción navegar por entornos complejos de forma segura. Las empresas de vehículos autónomos invierten mucho en el etiquetado a nivel de píxeles para garantizar el cumplimiento de las normas de seguridad.
  2. Agricultura de precisión: En la agricultura moderna, la IA se utiliza para detect enfermedades en los cultivos o supervisar las etapas de crecimiento. Los agricultores utilizan modelos entrenados con imágenes etiquetadas de hojas «sanas» frente a hojas «enfermas» para automatizar el tratamiento, reducir el uso de productos químicos y aumentar el rendimiento.

El flujo de trabajo del etiquetado

La creación de un conjunto de datos etiquetados suele ser la parte más laboriosa de un proyecto de IA. El proceso suele implicar un enfoque «Human-in-the-Loop» (HITL), en el que los anotadores humanos verifican las etiquetas para garantizar una alta precisión. Los flujos de trabajo modernos aprovechan herramientas como la Ultralytics , que simplifica la gestión de conjuntos de datos y permite a los equipos colaborar en las anotaciones. También se pueden emplear técnicas avanzadas como el aprendizaje activo, en el que un modelo preetiqueta los datos y los humanos solo corrigen las predicciones de baja confianza, lo que acelera significativamente el proceso.

El siguiente ejemplo muestra cómo utilizar un modelo YOLO26 preentrenado para generar automáticamente etiquetas (etiquetado automático) para una nueva imagen, que luego pueden ser corregidas por personas:

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Save the detection results to a text file in standard YOLO format
# This file can now be used as a starting point for data labeling
results[0].save_txt("bus_labels.txt")

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora