Глоссарий

Машина опорных векторов (SVM)

Узнай, как машины с опорными векторами (SVM) преуспевают в классификации, регрессии и обнаружении выбросов при работе с высокоразмерными данными.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Машина опорных векторов (SVM) - это мощный и универсальный алгоритм машинного обучения с супервизией, который используется для классификации, регрессии и обнаружения выбросов. SVM особенно эффективны в высокоразмерных пространствах и широко используются, когда между классами существуют четкие границы разделения. Они работают, находя наилучшую гиперплоскость, которая отчетливо классифицирует точки данных в разные категории.

Ключевые понятия машин опорных векторов

По своей сути SVM нацелена на поиск гиперплоскости, которая наилучшим образом разделяет точки данных разных классов в пространстве признаков. Гиперплоскость выбирается таким образом, чтобы максимизировать маржу, которая представляет собой расстояние между гиперплоскостью и ближайшей точкой данных из каждого класса. Эти ближайшие точки данных называются векторами поддержки, и они играют решающую роль в определении оптимальной гиперплоскости.

В случаях, когда данные не поддаются линейному разделению, SVM используют технику, которая называется "трюк с ядром". Трюк с ядрами заключается в отображении исходных данных в более высокоразмерное пространство, в котором возможно линейное разделение. Распространенные функции ядра включают линейную, полиномиальную и радиальную базисную функцию (RBF).

Преимущества машин с опорными векторами

SVM обладают рядом преимуществ, которые делают их популярным выбором в машинном обучении:

  • Эффективность в высокоразмерных пространствах: SVM хорошо работают даже тогда, когда количество измерений больше, чем количество образцов.
  • Эффективность использования памяти: Поскольку в функции принятия решения используются только опорные векторы, SVM эффективны с точки зрения памяти.
  • Универсальность: Можно задавать различные функции ядра, что позволяет адаптировать SVM к различным типам данных и проблем.
  • Надежность: Благодаря максимизации маржи SVM менее склонны к переборчивости по сравнению с другими алгоритмами классификации.

Реальные применения машин с опорными векторами

SVM имеют широкий спектр применения в различных областях:

  • Классификация изображений: SVM можно использовать для задач классификации изображений, таких как идентификация объектов или паттернов на изображениях. Например, они используются в приложениях для распознавания лиц, чтобы различать разных людей на основе их черт лица.
  • Категоризация текста и гипертекста: SVM эффективны в задачах классификации текста, включая анализ настроения, обнаружение спама и категоризацию тем. Они могут классифицировать документы на основе наличия и частоты встречаемости определенных слов или фраз.
  • Биоинформатика: В биоинформатике SVM используются для классификации белков, анализа экспрессии генов и классификации рака на основе профилей экспрессии генов.
  • Распознавание рукописного текста: SVM могут распознавать рукописные символы, что делает их полезными в таких приложениях, как оцифровка рукописных документов.

Векторные машины с поддержкой по сравнению с другими алгоритмами

Хотя SVM очень мощные, важно понимать, как они сравниваются с другими алгоритмами машинного обучения (ML):

  • SVM против логистической регрессии: И SVM, и логистическая регрессия используются для классификации. Однако логистическая регрессия моделирует вероятность исхода, а SVM находит наилучшую гиперплоскость для разделения классов. SVM обычно предпочтительнее, когда существует четкая граница разделения или когда приходится иметь дело с высокоразмерными данными.
  • SVM против нейронных сетей: Нейронные сети, особенно глубокие нейронные сети, могут моделировать сложные нелинейные зависимости, но требуют большого количества данных и вычислительных ресурсов. SVM более эффективны для небольших наборов данных и обеспечивают лучшее обобщение с меньшим риском перебора при правильной настройке.
  • SVM против Random Forest: Случайные леса - это ансамблевые методы, которые строят несколько деревьев решений и объединяют их выходы. Хотя случайные леса хорошо справляются с нелинейными данными, SVM с соответствующими ядрами могут работать лучше в случаях с четкими границами классов.

Заключение

Машины опорных векторов - надежный и универсальный инструмент в наборе средств машинного обучения, особенно эффективный для задач классификации. Их способность работать с высокоразмерными данными в сочетании с гибкостью, которую обеспечивают различные функции ядра, делает их подходящими для широкого спектра приложений. Понимание сильных сторон и ограничений SVM может помочь практикующим специалистам выбрать правильный алгоритм для своих конкретных нужд, обеспечивая оптимальную производительность и результаты. Узнай больше об алгоритмах машинного обучения и их применениях на странице глоссарияUltralytics . Чтобы узнать об эволюции моделей обнаружения объектов и Ultralytics YOLO , посетите раздел The Evolution of Object Detection and Ultralytics' YOLO Models.

Читать полностью