Глоссарий

Данные испытаний

Усовершенствуй ML-модели с помощью тестовых данных для беспристрастной оценки и улучшения обобщения, что крайне важно для приложений ИИ в здравоохранении и сельском хозяйстве.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Тестовые данные играют важнейшую роль в оценке моделей машинного обучения, предоставляя объективную меру того, насколько хорошо модель работает на невидимых данных. Это важный компонент в жизненном цикле разработки любого приложения машинного обучения.

Что такое тестовые данные?

Тестовые данные - это подмножество данных, используемых для окончательной оценки работы модели после ее обучения и валидации. В отличие от тренировочных данных, которые используются для обучения модели, и валидационных данных, которые настраивают ее параметры, тестовые данные предназначены для оценки прогностических возможностей модели.

Чтобы получить полное представление о том, как тестовые данные вписываются в жизненный цикл машинного обучения, обратись к подробной статье Training Data.

Важность в машинном обучении

Данные тестирования жизненно важны по нескольким причинам:

  • Непредвзятая оценка: Тестовые данные гарантируют, что модель не просто запомнила тренировочные данные - распространенная проблема, известная как overfitting.
  • Обобщение модели: Она помогает определить, насколько хорошо модель будет работать на новых, невидимых данных, что крайне важно для реальных приложений.
  • Метрики производительности: Тестовые данные используются для вычисления основных показателей производительности, таких как точность, прецизионность, отзыв и F1-Score.

Приложения в искусственном интеллекте и ML

Тестовые данные используются в различных приложениях машинного обучения, например:

  • ИИ в здравоохранении: Моделям нужны надежные тестовые данные, чтобы обеспечить точность в таких ответственных приложениях, как диагностика заболеваний. Узнай больше об искусственном интеллекте в здравоохранении.
  • ИИ в сельском хозяйстве: Тестирование моделей на разнообразных данных помогает улучшить такие задачи, как мониторинг урожая и обнаружение вредителей. ИИ в сельском хозяйстве обеспечивает более глубокое понимание.

Разница с данными проверки

Хотя и валидационные, и тестовые данные оценивают производительность модели, они служат разным целям. Валидационные данные используются в процессе обучения для точной настройки параметров модели, а тестовые - только в конце, чтобы оценить конечную модель. Подробнее об этом можно узнать из обзора "Валидационные данные".

Примеры из реальной жизни

Автономные транспортные средства

В разделе AI in Self-Driving данные тестов гарантируют, что модели самоуправляемых автомобилей точно обнаруживают и реагируют на дорожные знаки, пешеходов и другие транспортные средства, способствуя безопасности и эффективности.

Розничная торговля и управление запасами

В розничной торговле тестовые данные используются для проверки моделей ИИ, которые отслеживают и управляют запасами. Такие модели, как Ultralytics YOLO могут радикально улучшить процессы инвентаризации, обеспечивая обнаружение объектов в реальном времени.

Заключение

Тестовые данные - это фундаментальная часть разработки надежных и прочных моделей ИИ. Обеспечивая беспристрастную оценку и повышая обобщенность моделей, они способствуют успешному внедрению приложений ИИ в различных отраслях. Чтобы глубже изучить важность оценки моделей, почитай об ИИ и его преобразующем влиянии.

Читать полностью