용어집

정확성

머신 러닝에서 정확도의 중요성, 계산, 불균형한 데이터 세트의 한계, 모델 성능을 개선하는 방법에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

정확도는 모든 클래스에 걸쳐 모델 예측의 전반적인 정확도를 측정하는 머신 러닝(ML)의 기본 지표입니다. 정확도는 평가된 총 인스턴스 수 중 올바르게 분류된 인스턴스의 비율을 나타냅니다. 예를 들어, 모델이 100개의 인스턴스 중 90개를 올바르게 예측하면 정확도는 90%입니다. 정확도는 모델 성능을 평가하는 데 유용한 출발점이지만, 특히 불균형 데이터 세트를 다룰 때는 모델의 효율성을 보다 포괄적으로 이해하려면 다른 메트릭을 고려하는 것이 중요합니다.

머신 러닝에서 정확도의 중요성

정확도는 보이지 않는 데이터에 대한 모델의 일반화 능력을 나타내는 중요한 지표로, 머신 러닝의 주요 목표입니다. 정확도가 높다는 것은 모델이 데이터의 기본 패턴을 효과적으로 학습했으며 보이지 않는 새로운 인스턴스에 대해 신뢰할 수 있는 예측을 할 수 있음을 의미합니다. 의료 이미지 분석자율 주행 차량과 같은 많은 실제 애플리케이션에서 정확한 예측은 안전, 신뢰성 및 정보에 입각한 의사 결정을 보장하는 데 있어 가장 중요합니다.

정확도 계산

정확도는 올바른 예측 수를 모델의 총 예측 수로 나누어 계산합니다. 올바른 예측에는 정탐(긍정적인 사례를 올바르게 식별)과 정네거티브(부정적인 사례를 올바르게 식별)가 모두 포함됩니다. 진성 긍정과 진성 부정의 수가 많을수록 정확도가 높아집니다.

정확도의 한계

정확도는 중요한 지표이지만, 특히 불균형한 데이터 세트를 다룰 때는 한계가 있습니다. 이러한 경우 모델은 다수 클래스를 주로 예측하여 높은 정확도를 달성하지만 소수 클래스에 대해서는 저조한 성능을 보일 수 있습니다. 이는 모델의 전반적인 성능이 특정 문제 해결에 대한 효과를 반영하지 못할 수 있으므로 오해의 소지가 있을 수 있습니다.

예를 들어, 2%의 사례만 양성인 희귀 질환을 탐지하기 위한 데이터 집합을 생각해 보겠습니다. 항상 '음성'을 예측하는 모델은 98%의 정확도를 달성할 수 있지만, 질병에 걸린 개인을 식별하는 데는 전혀 쓸모가 없을 것입니다. 이러한 시나리오에서는 정확도, 회수율, F1 점수와 같은 메트릭을 통해 특히 소수 집단에서 모델의 성능을 보다 미묘하게 평가할 수 있습니다.

실제 애플리케이션에서의 정확도

정확도는 AI와 머신러닝의 다양한 실제 애플리케이션에서 매우 중요한 역할을 합니다. 다음은 두 가지 구체적인 예시입니다:

  1. 소매업의 이미지 분류: 소매업에서는 이미지 분류 모델을 사용하여 이미지를 기반으로 의류 품목과 같은 제품을 자동으로 분류합니다. 이미지 분류의 정확도가 높으면 제품에 정확한 태그가 지정되어 고객에게 표시되므로 검색 결과, 개인화된 추천, 전반적인 쇼핑 환경이 개선됩니다. Ultralytics YOLOv8 는 이러한 이미지 분류 모델을 개발하는 데 중요한 역할을 해왔으며, 최첨단 성능과 사용 편의성을 제공합니다.
  2. 자율 주행의 물체 감지: 자율주행차에서 물체 감지 모델은 도로 위의 보행자, 차량 및 기타 물체를 식별하는 데 사용됩니다. 정확한 물체 감지는 안전한 주행과 충돌 회피를 위해 매우 중요합니다. 이러한 모델의 정확도는 차량이 주변 환경을 인식하고 정보에 입각한 결정을 내리는 능력에 직접적인 영향을 미치며 궁극적으로 승객과 다른 도로 사용자의 안전을 보장합니다. Ultralytics YOLO 모델은 높은 정확도와 실시간 성능으로 인해 자율 주행 업계에서 널리 채택되고 있습니다.

모델 정확도 향상

머신러닝 모델의 정확도를 높이기 위해 몇 가지 기술을 사용할 수 있습니다:

  • 데이터 전처리: 데이터 정리, 결측값 처리, 이상값 해결을 통해 데이터 품질을 크게 개선하고 결과적으로 모델 정확도를 높일 수 있습니다.
  • 특징 엔지니어링: 피처 엔지니어링을 통해 관련 피처를 선택하고 새로운 피처를 생성하면 모델의 기본 패턴 학습 능력을 향상시킬 수 있습니다.
  • 알고리즘 선택: 특정 작업과 데이터 세트에 적합한 알고리즘을 선택하는 것이 중요합니다. 다양한 알고리즘을 실험하고 성능을 비교하면 정확도를 높일 수 있습니다.
  • 하이퍼파라미터 튜닝: 하이퍼파라미터를 최적화하면 모델의 성능을 미세 조정하고 정확도를 향상시킬 수 있습니다. 이를 위해 그리드 검색 및 무작위 검색과 같은 기술을 사용할 수 있습니다.
  • 교차 검증: k-배 교차 검증과 같은 기술을 사용하면 보이지 않는 데이터에 대한 모델의 일반화 능력을 평가하여 보다 신뢰할 수 있는 정확도를 추정하는 데 도움이 됩니다.
  • 앙상블 방법: 앙상블 방법을 사용하여 여러 모델의 예측을 결합하면 개별 모델보다 더 높은 정확도를 얻을 수 있습니다.

실무자는 이러한 기술을 사용하여 머신러닝 모델의 정확도를 높이고 보다 안정적이고 효과적인 AI 시스템을 구축할 수 있습니다. 이러한 시스템은 컴퓨터 비전, 자연어 처리, 딥 러닝과 같은 분야의 발전에 기여합니다.

정확도 및 Ultralytics 허브

Ultralytics HUB는 물체 감지 작업에서 탁월한 정확도를 자랑하는 Ultralytics YOLO 모델을 훈련하고 배포할 수 있는 사용자 친화적인 플랫폼을 제공합니다. Ultralytics HUB를 통해 사용자는 데이터 세트를 쉽게 업로드하고, 다양한 구성으로 모델을 훈련하고, 훈련 중 정확도를 모니터링할 수 있습니다. 이 플랫폼은 예측을 시각화하고, 모델 성능을 분석하고, 다양한 환경에 모델을 배포할 수 있는 도구도 제공합니다. Ultralytics HUB를 활용하면 사용자는 머신러닝 워크플로우를 간소화하고 물체 감지 애플리케이션에서 높은 정확도를 달성할 수 있습니다. 자세한 내용은 Ultralytics HUB 설명서에서 확인할 수 있습니다.

모두 보기