용어집

데이터 분석

데이터 분석이 데이터 품질을 최적화하고, 인사이트를 발견하고, 현명한 의사 결정을 지원함으로써 어떻게 AI와 ML의 성공을 이끄는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

데이터 분석은 데이터 또는 통계를 체계적으로 컴퓨터로 조사하는 것을 말합니다. 여기에는 데이터를 검사, 정리, 변환, 모델링하여 유용한 정보를 발견하고 결론을 도출하며 정보에 입각한 의사결정을 지원하는 프로세스가 포함됩니다. 인공지능(AI)머신러닝(ML) 분야에서 데이터 분석은 데이터 세트를 준비하고, 탐색적 데이터 분석(EDA)과 같은 기술을 통해 데이터 특성을 이해하고, 의미 있는 특징을 추출하고, 모델 성능을 평가하는 데 기본이 됩니다. 이러한 엄격한 분석은 궁극적으로 다음과 같은 정교한 모델을 포함하여 더욱 강력하고 안정적인 AI 시스템을 구축하는 데 기여합니다. Ultralytics YOLO 와 같은 정교한 모델을 포함하여 더욱 안정적인 AI 시스템을 구축하는 데 기여합니다.

AI와 머신 러닝에서 데이터 분석의 관련성

데이터 분석은 성공적인 AI 및 ML 프로젝트의 토대가 됩니다. 복잡한 모델을 학습시키기 전에 원시 데이터를 철저히 분석해야 합니다. 여기에는 오류와 불일치를 해결하기 위한 데이터 정리, 알고리즘에 적합한 데이터 포맷을 위한 데이터 전처리와 같은 중요한 단계가 포함됩니다. Seaborn과 같은 도구를 사용한 데이터 시각화를 통해 강화되는 EDA와 같은 기술은 데이터의 기본 패턴, 구조, 이상값, 잠재적 편향성을 밝혀내는 데 도움이 됩니다. 이러한 측면에 대한 깊은 이해는 적절한 모델을 선택하고, 데이터 품질을 보장하며, 효과적인 학습을 달성하는 데 매우 중요하며, 이는 종종 Ultralytics HUB와 같은 플랫폼 내에서 관리됩니다.

또한 모델 학습 이후에도 데이터 분석은 필수적입니다. 모델 성능을 평가하려면 정확도 또는 평균 정밀도(mAP)와 같은 메트릭을 사용하여 기준 데이터에 대한 예측 결과를 분석해야 합니다. YOLO 성능 메트릭에 대한 자세한 내용은 가이드에서 확인할 수 있습니다. 이 분석 프로세스는 모델의 약점을 정확히 찾아내고, 오류 유형(종종 혼동 행렬을 사용하여 시각화)을 이해하며, 하이퍼파라미터 튜닝이나 다양한 모델 아키텍처 탐색과 같은 방법을 통해 개선 방향을 안내하는 데 도움이 됩니다. 다음과 같은 프레임워크 PyTorchTensorFlow와 같은 프레임워크와 데이터 조작을 위한 Pandas와 같은 라이브러리는 이 과정에서 흔히 사용되는 도구입니다.

데이터 분석 대 관련 개념

데이터 분석은 다른 여러 용어와 비슷하지만 다른 점이 있습니다:

  • 데이터 마이닝: 주로 대규모 데이터 세트에서 이전에 알려지지 않은 새로운 패턴과 관계를 발견하는 데 중점을 둡니다. 데이터 분석에는 종종 알려진 데이터 측면을 분석하거나 특정 가설을 테스트하는 것이 포함되지만, 탐색적 발견도 포함될 수 있습니다. 컴퓨터 비전에서 데이터 마이닝의 역할에 대해 자세히 알아보세요.
  • 머신 러닝(ML): 알고리즘을 사용하여 데이터(종종 데이터 분석을 통해 준비 및 분석된 데이터)를 학습하여 명시적인 프로그래밍 없이 예측 또는 의사 결정을 내립니다. 분석은 ML 모델이 사용하는 인사이트와 준비된 데이터를 제공합니다. ML은 AI를 달성하기 위한 방법이고, 데이터 분석은 데이터에 적용되는 프로세스입니다.
  • 빅 데이터: 매우 크고 복잡한 데이터 세트를 말합니다. 데이터 분석은 "빅 데이터"에 해당하는지 여부에 관계없이 데이터에서 가치와 인사이트를 추출하는 프로세스입니다. 빅 데이터 분석은 이러한 대규모 데이터 세트에 특별히 분석 기법을 적용합니다.
  • 데이터 시각화: 데이터와 정보를 그래픽으로 표현한 것입니다. 데이터를 탐색하고 결과를 효과적으로 전달하기 위해 데이터 분석의 광범위한 프로세스에서 사용되는 핵심 도구입니다. TensorBoard 통합 가이드에서 예시를 참조하세요.
  • 비즈니스 인텔리전스(BI): 일반적으로 대시보드와 보고서를 통해 과거 데이터를 사용하여 비즈니스 의사 결정에 정보를 제공하는 설명적 분석(무슨 일이 일어났는지)에 더 중점을 두는 경우가 많습니다. 데이터 분석에는 설명적 분석, 진단적 분석, 예측적 분석, 처방적 분석이 포함될 수 있습니다. 자세한 내용은 Gartner의 IT 용어집에서 확인하세요.

실제 AI/ML 애플리케이션

데이터 분석은 수많은 AI 애플리케이션의 발전을 촉진하는 데 중요한 역할을 합니다:

  1. 의료 이미지 분석: AI 모델이 엑스레이나 MRI와 같은 의료 스캔에서 이상 징후를 감지하기 전에 데이터 분석이 광범위하게 사용됩니다. 원시 이미지는 사전 처리(정규화, 크기 조정)되고 정리됩니다. 탐색적 분석은 뇌종양 데이터 세트와 같은 데이터 세트 내에서 이미지 품질이나 환자 인구 통계의 변화를 이해하는 데 도움이 됩니다. 분석은 관련 기능을 식별하고 전문가 주석과 비교하여 진단 모델의 성능(정확도, 민감도, 특이도)을 평가하여 임상 사용을 위한 개선 사항을 안내하는 데 도움이 됩니다. NIH 생물의학 데이터 과학 이니셔티브와 같은 리소스에서 그 중요성을 강조합니다. 의료 영상에서 종양 탐지에 YOLO 모델을 어떻게 사용할 수 있는지 알아보세요.
  2. AI 기반 리테일 재고 관리: 소매업체는 데이터 분석을 통해 재고 수준을 최적화하고 낭비를 줄입니다. 여기에는 과거 판매 데이터 분석, 계절별 트렌드 파악, 고객 구매 패턴 이해(예측 모델링) 등이 포함됩니다. 또한, 분석된 시각적 데이터를 사용하여 학습된 모델을 기반으로 하는 컴퓨터 비전(CV) 시스템을 통해 실시간으로 선반 재고를 모니터링할 수 있습니다. 데이터 분석은 감지 정확도를 분석하고 재고 데이터를 판매 실적과 연결하여 이러한 시스템의 효율성을 평가함으로써 보다 스마트한 보충 전략을 가능하게 합니다. 리테일용Google Cloud AI의 업계 솔루션을 살펴보세요. Ultralytics 더 스마트한 리테일 재고 관리와 AI를 통한 리테일 효율성 달성을 위한 AI 인사이트를 제공합니다.

데이터 분석은 의료부터 농업, 제조에 이르기까지 다양한 영역에서 효과적인 AI 및 ML 시스템을 구축, 개선 및 검증하는 데 필요한 중요한 인사이트를 제공합니다. 데이터 분석에서 모델 배포에 이르는 프로세스를 간소화할 수 있는 플랫폼이 바로 Ultralytics HUB입니다.

모두 보기