Узнайте, как полунадзорное обучение сочетает помеченные и непомеченные данные для повышения точности модели. Научитесь реализовывать рабочие процессы SSL с помощью Ultralytics .
Полунадзорное обучение (SSL) — это стратегическая парадигма в машинном обучении (ML), которая служит мостом между двумя традиционными методами обучения. В то время как надзорное обучение полностью полагается на полностью аннотированные наборы данных, а ненадзорное обучение пытается найти закономерности в данных без каких-либо меток, SSL работает путем объединения небольшого количества меченых данных со значительно большим пулом немеченых данных. Этот подход особенно ценен в реальных сценариях компьютерного зрения (CV), где сбор исходных изображений, таких как видеозаписи с камер безопасности или спутников, является относительно недорогим, но процесс маркировки данных человеческими экспертами является дорогостоящим, медленным и трудоемким. Эффективно используя структуру, скрытую в немеченых примерах, SSL может значительно повысить точность и обобщаемость модели без необходимости в исчерпывающем бюджете на аннотацию.
Основная цель SSL — распространить информацию, содержащуюся в небольшом наборе помеченных примеров, на более крупный непомеченный набор. Это позволяет нейронной сети обучаться границам принятия решений, которые проходят через области данных с низкой плотностью, что приводит к более надежной классификации или обнаружению.
Две популярные техники лежат в основе большинства полуконтролируемых рабочих процессов:
Следующий Python демонстрирует простой рабочий процесс псевдомаркировки с использованием ultralytics . Здесь мы обучаем модель YOLO26 на небольшом наборе данных, а затем используем ее для генерации меток для каталога немеченых изображений.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)
# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)
Полунадзорное обучение преобразует отрасли, в которых данных много, но экспертных знаний мало.
Для эффективного внедрения решений на основе искусственного интеллекта крайне важно понимать, чем SSL отличается от аналогичных стратегий:
По мере увеличения размера моделей глубокого обучения (DL) эффективность использования данных становится первостепенной задачей. Современные фреймворки, такие как PyTorch и TensorFlow предоставляют вычислительный бэкэнд для этих сложных циклов обучения . Кроме того, такие инструменты, как Ultralytics , упрощают жизненный цикл управления наборами данных. Используя такие функции, как автоматическая аннотация, команды могут проще внедрять полуконтролируемые рабочие процессы, быстро превращая необработанные данные в готовые к производству веса моделей. Эта эволюция в MLOps гарантирует, что барьер для входа в создание высокоточных систем видения продолжает снижаться.