용어집

데이터 시각화

강력한 시각화 기술과 도구를 사용하여 복잡한 AI/ML 데이터를 실행 가능한 인사이트로 전환하세요. 자세한 내용은 Ultralytics 에서 확인하세요!

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

데이터 시각화는 복잡한 정보와 원시 데이터를 차트, 그래프, 지도와 같은 시각적 컨텍스트로 변환하는 작업입니다. 이를 통해 인간의 두뇌가 기초 데이터를 더 쉽게 이해할 수 있고 의미 있는 인사이트를 추출하는 데 도움이 됩니다. 인공지능(AI)과 머신러닝(ML)에서 데이터 시각화는 데이터 집합을 탐색하고, 학습 중 모델 동작을 이해하고, 성능을 평가하고, 결과를 효과적으로 전달하는 데 매우 중요합니다. 잠재적으로 압도적인 수치 데이터를 직관적인 시각적 표현으로 변환하여 원시 숫자나 텍스트 보고서에서 가려질 수 있는 패턴, 추세, 이상 징후 및 관계를 강조합니다.

핵심 개념 및 기술

데이터 시각화의 주요 목표는 데이터를 명확하게 표현하고 이해를 돕는 것입니다. 이는 다음과 같은 다양한 그래픽 방법을 사용하여 달성할 수 있습니다:

  • 막대 차트: 여러 카테고리의 수량을 비교합니다.
  • 선 그래프: 시간 또는 연속 간격에 따른 추세를 표시합니다.
  • 분산형 차트: 두 숫자 변수 간의 관계와 상관관계를 드러냅니다.
  • 히트맵: 값이 색상 강도로 표시되는 행렬 데이터를 표시하는 것으로, 상관 관계 행렬이나 신경망의 활성화를 시각화하는 데 자주 사용됩니다. 히트맵에 대한Ultralytics 가이드를 참조하세요.
  • 히스토그램: 단일 숫자 변수의 분포를 표시합니다.
  • 박스 플롯: 사분위수를 통해 데이터의 분포를 요약합니다.

올바른 시각화 기법을 선택하는 것은 데이터의 유형과 전달하고자 하는 구체적인 인사이트에 따라 크게 달라집니다. 또한 효과적인 시각화를 위해서는 색상 팔레트, 배율, 축, 레이블과 같은 디자인 요소를 신중하게 고려하여 보는 사람에게 오해를 주지 않고 정확하게 표현할 수 있어야 합니다. Matplotlib과 Seaborn 같은 인기 있는 Python 라이브러리는 데이터 과학에서 일반적으로 사용되는 다양한 정적, 애니메이션, 대화형 시각화를 만들 수 있는 강력한 도구를 제공합니다. 시각적 표시의 기본 원칙을 준수하는 것은 영향력 있는 데이터 스토리텔링의 핵심입니다.

AI 및 머신 러닝의 중요성

데이터 시각화는 AI/ML 프로젝트 수명 주기 전반에 걸쳐 필수 불가결한 요소입니다:

실제 AI/ML 애플리케이션

  1. 의료 이미지 분석: 의료 AI에서 시각화는 복잡한 의료 스캔을 해석하는 데 도움이 됩니다. 뇌종양 데이터 세트와 같은 데이터 세트에 대해 학습된 개체 감지 모델은 잠재적인 이상 징후를 식별하는 경계 상자를 출력할 수 있습니다. 이러한 상자를 MRI 또는 CT 스캔에 직접 오버레이하여 시각화하면 영상의학과 전문의가 모델의 결과를 빠르게 평가하여 진단에 도움을 줄 수 있습니다. 또한, 이미징 기능을 기반으로 환자 결과 클러스터를 시각화하면 질병의 하위 유형을 식별하는 데 도움이 될 수 있습니다. 의료 분야의 AI는 이러한 시각적 보조 도구에 크게 의존합니다. 국립 생물의학 영상 및 생명공학 연구소(NIBIB)에서 더 많은 응용 사례를 살펴볼 수 있습니다.
  2. 자율 주행 차량 개발: 자율 주행 자동차 시스템은 방대한 양의 센서 데이터를 처리합니다. 시각화는 개발 및 테스트 과정에서 광범위하게 사용됩니다. 엔지니어는 환경의 3D 시뮬레이션에서 LiDAR 포인트 클라우드, 레이더 시그니처, 카메라 피드를 시각화합니다. 다음과 같은 모델에서 감지된 물체(자동차, 보행자, 자전거 타는 사람)를 식별합니다. YOLO 와 같은 모델에서 식별된 물체(자동차, 자전거)는 경계 상자, 추적 경로 및 신뢰 점수와 함께 표시되므로 개발자는 다양한 시나리오에서 인식 시스템의 정확성과 안전성을 검증할 수 있습니다. 차량용 AI 솔루션의 사례를 살펴보고 Mobileye와 같은 기업의 업계 접근 방식에 대해 알아보세요.

관련 용어와 구별하기

  • 데이터 분석: 유용한 정보를 발견하고 의사 결정을 지원하기 위해 데이터를 검사, 정리, 변환 및 모델링하는 전체 프로세스를 포함하는 광범위한 분야입니다. 데이터 시각화는 데이터 분석에서 결과를 제시하거나 데이터를 탐색하는 데 사용되는 구성 요소 또는 도구이지만, 분석에는 통계 모델링, 가설 테스트 및 기타 비시각적 방법도 포함됩니다. 데이터 분석의 기본 사항에 대해 자세히 알아보세요.
  • 이미지 처리: 이 분야는 디지털 이미지를 조작하여 이미지를 향상시키거나 픽셀 데이터에서 직접 정보를 추출(예: 필터링, 가장자리 감지, 대비 조정)하는 데 중점을 둡니다. 시각화에는 이미지 표시가 포함될 수 있지만, AI/ML의 데이터 시각화는 이미지 자체를 변형하기보다는 추상적인 데이터(모델 성능 메트릭 또는 특징 관계 등)를 표현하거나 모델 해석(감지 등)을 이미지에 오버레이하는 작업을 주로 합니다. 이 컴퓨터 비전과 이미지 처리 블로그 게시물에서 차이점에 대해 읽어보세요.
  • 탐색적 데이터 분석(EDA): EDA는 데이터 집합을 분석하여 주요 특성을 파악하는 과정으로, 주로 시각적 방법을 사용합니다. 데이터 시각화 기법은 패턴을 발견하고, 이상 징후를 발견하고, 가설을 테스트하고, 가정을 확인하는 데 사용되는 주요 도구입니다. 주석이 달린 데이터 전처리 가이드에서는 컴퓨터 비전 데이터 세트와 관련된 EDA 개념을 다룹니다.
모두 보기