Глоссарий

Кривая операционной характеристики получателя (ROC)

Узнай, как ROC-кривые и AUC оценивают производительность классификаторов в AI/ML, оптимизируя TPR против FPR для таких задач, как обнаружение мошенничества и медицинская диагностика.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

В машинном обучении, особенно в задачах бинарной классификации, кривая Receiver Operating Characteristic (ROC) - это важный графический инструмент, используемый для оценки эффективности модели классификации при различных пороговых настройках. Она иллюстрирует диагностическую способность системы бинарного классификатора при изменении порога дискриминации. ROC-кривая строится из соотношения истинно положительных результатов (TPR) и ложноположительных результатов (FPR), где TPR находится на оси y, а FPR - на оси x. Это делает его неоценимым помощником в понимании компромисса между выгодой от правильного определения положительных случаев и издержками от неправильной классификации отрицательных случаев как положительных.

Понимание ROC-кривой

ROC-кривая строится на основе двух ключевых показателей: коэффициента истинных положительных результатов (TPR) и коэффициента ложных положительных результатов (FPR).

  • Показатель истинных положительных результатов (TPR), также известный как Sensitivity или Recall, измеряет долю реальных положительных результатов, которые были правильно идентифицированы. Высокий показатель TPR означает, что модель хорошо справляется с выявлением положительных случаев.
  • Коэффициент ложных срабатываний (FPR), также известный как специфичность, измеряет долю реальных отрицательных результатов, которые ошибочно классифицируются как положительные. Низкий показатель FPR желателен, он указывает на то, что модель делает меньше ложных срабатываний.

Построив график этих показателей друг против друга при различных пороговых значениях, ROC-кривая визуализирует спектр производительности классификатора. Кривая, расположенная ближе к левому верхнему углу, указывает на лучшую модель, подразумевая более высокий TPR и более низкий FPR при различных пороговых значениях. Идеальный классификатор имел бы точку в левом верхнем углу (1,1), представляющую 100% TPR и 0% FPR.

Площадь под кривой (AUC)

Ключевой итоговой метрикой, полученной из ROC-кривой, является площадь под кривой (AUC). AUC представляет собой единое скалярное значение, которое отражает общую эффективность классификатора, независимо от выбранного порога. AUC, равная 1, означает идеальный классификатор, в то время как AUC, равная 0,5, говорит о производительности не лучше случайного угадывания. Как правило, чем выше AUC, тем лучше способность модели различать положительные и отрицательные классы. Подробнее об AUC и его значении в машинном обучении ты можешь узнать на странице нашего глоссария, посвященной Area Under the Curve (AUC).

Приложения в искусственном интеллекте и ML

ROC-кривые и AUC широко используются в различных приложениях AI и ML, особенно там, где критически важен баланс между истинно положительными и ложноположительными результатами. Вот несколько примеров:

  • Медицинская диагностика: в анализе медицинских изображений ROC-кривые необходимы для оценки диагностических тестов при таких заболеваниях, как рак. Например, при использовании Ultralytics YOLO для обнаружения опухолей в медицинской визуализации ROC-анализ может помочь определить оптимальный порог для классификации изображений как содержащих опухоли (положительные) или нет (отрицательные). Хорошо работающая модель, на которую указывает высокий показатель AUC, обеспечивает правильную идентификацию реальных случаев опухолей (высокий TPR) и при этом минимизирует ложные тревоги, которые могут привести к ненужному лечению (низкий FPR).
  • Обнаружение мошенничества: В системах финансовой безопасности ROC-кривые используются для оценки эффективности моделей обнаружения мошенничества. Здесь положительный случай может представлять собой мошенническую транзакцию, а отрицательный - легитимную. ROC-кривая помогает точно настроить модель так, чтобы отлавливать как можно больше мошеннических транзакций (высокий TPR), не слишком выделяя легитимные транзакции как мошеннические (низкий FPR), что может доставить неудобства клиентам.

ROC-кривая в сравнении с точностью, прецизионностью и запоминанием

Хотя такие метрики, как точность, прецизионность и отзыв, также используются для оценки классификаторов, ROC-кривая дает более тонкое представление о производительности, особенно при работе с несбалансированными наборами данных. В отличие от точности, которая может вводить в заблуждение в несбалансированных сценариях, ROC-кривая и AUC фокусируются на компромиссе между TPR и FPR, предлагая более полное понимание дискриминационной способности модели в разных рабочих точках. Чтобы углубиться в оценку моделей, изучи наш гид по метрикам производительностиYOLO .

Для дальнейшего чтения о ROC-кривых такие ресурсы, как документация scikit-learn по ROC-кривым и статьи в Википедии о ROC-кривых, могут предоставить больше технической и теоретической базы.

Читать полностью