Глоссарий

Контрастное обучение

Открой для себя силу контрастного обучения, самоконтролируемой техники для надежного представления данных с минимальным количеством меченых данных.

Контрастное обучение - мощная техника в машинном обучении (ML), особенно заметная в самоподдерживающемся обучении (SSL). Вместо того чтобы в значительной степени полагаться на тщательно промаркированные данные, она позволяет изучать значимые представления, обучая модель различать похожие и непохожие точки данных. Основная идея проста: подтягивай представления "похожих" примеров ближе друг к другу в пространстве встраивания, а представления "непохожих" примеров отодвигай дальше друг от друга. Такой подход позволяет моделям изучать богатые характеристики на огромных объемах немаркированных данных, которые затем можно адаптировать для различных последующих задач путем тонкой настройки.

Как работает контрастное обучение

Обычно процесс включает в себя следующие шаги:

Дополнение данных: Начни с немаркированной точки данных (например, изображения). Создай две или более дополненных версий этой точки данных. Эти дополненные версии образуют "положительную пару", потому что они происходят из одного источника и должны считаться похожими. К распространенным методам дополнения данных относятся произвольное кадрирование, изменение цвета, поворот или добавление шума.
Отрицательная выборка: Выбери из набора данных (или текущей партии) другие точки данных, которые отличаются от исходной точки данных. Они образуют "отрицательные пары" с дополнениями исходной точки данных.
Кодирование: Пропусти положительные и отрицательные образцы через кодирующую нейронную сеть (NN), часто это конволюционная нейронная сеть (CNN) для изображений или трансформатор для текста или изображений(Vision Transformer (ViT)). Эта сеть преобразует входные данные в более низкоразмерные представления, известные как эмбеддинги.
Вычисление потерь: Примени функцию контрастных потерь, например InfoNCE (Noise Contrastive Estimation) или Triplet Loss. Эта функция вычисляет балл, основанный на расстояниях между вкраплениями. Она поощряет, чтобы вкрапления положительных пар были близки (низкое расстояние/высокое сходство), а вкрапления отрицательных пар были далеко друг от друга (высокое расстояние/низкое сходство).
Оптимизация: Используй алгоритмы оптимизации вроде стохастического градиентного спуска (SGD) или Адама для обновления весов кодера на основе вычисленных потерь, итеративно улучшая качество выученных представлений с помощью обратного распространения.