Глоссарий

Вкрапления

Узнай, что такое вкрапления и как они помогают искусственному интеллекту, фиксируя семантические связи в данных для NLP, рекомендаций и компьютерного зрения.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

В сфере машинного обучения (ML) и искусственного интеллекта вкрапления - это мощная техника представления данных, таких как слова, предложения, изображения или другие объекты, в виде плотных числовых векторов в многомерном пространстве. Это преобразование учится на основе данных, позволяя алгоритмам улавливать семантический смысл, контекст или характеристики входных данных. Ключевое преимущество заключается в том, что похожие элементы отображаются на близлежащие точки в этом "пространстве встраивания", позволяя машинам понимать сложные взаимосвязи и закономерности более эффективно, чем традиционные разреженные представления.

Что такое эмбеддинги?

По сути, эмбеддинги - это выученные, низкоразмерные, плотные векторные представления дискретных переменных (например, слов) или сложных объектов (например, изображений). В отличие от методов вроде одноточечного кодирования, которые создают высокоразмерные разреженные векторы, где каждый элемент независим, эмбеддинги улавливают нюансы взаимосвязей. Например, при встраивании слов слова с похожими значениями или используемые в похожих контекстах, такие как "собака" и "щенок", будут иметь векторы, которые математически близки друг к другу (например, с помощью косинусного сходства). Эта близость в пространстве встраивания отражает семантическое сходство. Эти векторы обычно состоят из вещественных чисел и могут иметь от десятков до тысяч измерений, в зависимости от сложности данных и модели.

Как работают эмбеддинги

Обычно вкрапления генерируются с помощью нейросетевых (NN) моделей, обученных на больших наборах данных. Например, распространенная техника встраивания слов включает в себя обучение модели для предсказания слова на основе окружающих его слов (контекста) в предложениях. Во время этого процесса обучения сеть настраивает свои внутренние параметры, включая векторы вкрапления для каждого слова, чтобы минимизировать ошибки предсказания. Полученные векторы неявно кодируют синтаксическую и семантическую информацию, полученную из обширного корпуса текстов. Количество измерений в пространстве встраивания - важнейший гиперпараметр, влияющий на способность модели улавливать детали в сравнении с ее вычислительными затратами. Визуализация этих высокоразмерных пространств часто требует применения методов снижения размерности, таких как t-SNE или PCA, которые можно просмотреть с помощью таких инструментов, как TensorFlow Projector.

Применение вкраплений

Встраивания являются основополагающими для многих современных приложений ИИ:

  • Обработка естественного языка (NLP): Вкрапления слов и предложений позволяют решать такие задачи, как анализ настроения, машинный перевод и классификация текстов. Они позволяют моделям понимать аналогии (например, "король" - "мужчина" + "женщина" ≈ "королева"), выполняя векторную арифметику. К классическим моделям относятся Word2Vec и GloVe, а современные подходы вроде BERT генерируют контекстно-зависимые вкрапления, используя архитектуры трансформеров.
  • Системы рекомендаций: Пользователи и предметы (например, фильмы или продукты) встраиваются в одно и то же пространство. Рекомендации делаются путем поиска предметов, вкрапления которых близки к вкраплениям пользователя, что отражает его предпочтения. Такие компании, как Netflix, в значительной степени полагаются на технику встраивания.
  • Компьютерное зрение (КВ): Изображения или патчи изображений могут быть преобразованы во вкрапления для таких задач, как поиск изображений (нахождение визуально похожих изображений) или кластеризация. Такие модели, как Ultralytics YOLO могут использоваться не только для обнаружения объектов или сегментации изображений, но и их внутренние слои потенциально могут служить мощными экстракторами признаков для генерации вкраплений, представляющих содержимое изображения.

Вкрапления по сравнению с другими техниками репрезентации

Вкрапления имеют преимущества перед более простыми методами представления:

  • Одномоментное кодирование: Представляй категории в виде разреженных бинарных векторов. Эти векторы ортогональны (несхожи) и не отражают никаких семантических отношений между категориями. Кроме того, размерность линейно растет с увеличением количества уникальных элементов, что становится неэффективным для больших словарей.
  • Bag-of-Words (BoW): Представляет текст на основе частоты слов, игнорируя грамматику и порядок слов. Несмотря на свою простоту, он не может эффективно передать семантический смысл по сравнению с вкраплениями.
  • TF(Term Frequency-Inverse Document Frequency): Взвешивает слова на основе их частоты в документе по отношению к их частоте в корпусе. Он измеряет важность слов, но по своей сути не отражает семантическое сходство, как это делают вкрапления.

Заключение

Встраивания представляют собой значительный прогресс в том, как машины обрабатывают и понимают сложные данные. Сопоставляя элементы с осмысленными векторными представлениями, они позволяют проводить сложный анализ и обеспечивают работу широкого спектра приложений ИИ, особенно в NLP и рекомендательных системах. По мере того как модели и методы обучения будут развиваться, вкрапления, вероятно, займут еще более центральное место в построении интеллектуальных систем. Платформы вроде Ultralytics HUB облегчают обучение и развертывание моделей, которые часто опираются на эти мощные представления, делая продвинутый ИИ более доступным. Для дальнейшего обучения изучи документациюUltralytics .

Читать полностью