이미지 분류 알아보기 Ultralytics YOLO : 최첨단 도구를 사용하여 의료, 농업, 소매업 등을 위한 맞춤형 모델을 학습합니다.
이미지 분류는 시각적 콘텐츠를 기반으로 전체 이미지에 하나의 레이블 또는 카테고리를 할당하는 컴퓨터 비전(CV) 의 기본 작업입니다. 이는 인공지능(AI)의 핵심 기능으로, 기계가 사람이 장면이나 사물을 인식하는 방식과 유사하게 이미지를 이해하고 분류할 수 있게 해줍니다. 머신러닝(ML), 특히 딥러닝(DL) 기술을 기반으로 하는 이미지 분류는 다음과 같은 질문에 답하는 것을 목표로 합니다: "이 이미지의 주요 피사체는 무엇인가?"라는 질문에 답하는 것입니다. 이 작업은 더 복잡한 시각적 이해 문제를 위한 빌딩 블록 역할을 합니다.
이 과정에는 일반적으로 라벨이 지정된 이미지의 대규모 데이터 세트에 대해 CNN(Convolutional Neural Network)이라는 특수한 유형의 신경망인 모델을 훈련하는 것이 포함됩니다. 수천 개의 카테고리에 걸쳐 수백만 개의 이미지가 포함된 ImageNet과 같은 유명한 데이터 세트는 일반적으로 강력한 모델을 훈련하는 데 사용됩니다. 훈련 과정에서 모델은 다양한 카테고리를 특징짓는 텍스처, 모양, 가장자리, 색상 분포 등의 특징과 패턴을 식별하는 방법을 학습합니다. 다음과 같은 프레임워크 PyTorch 및 TensorFlow 와 같은 프레임워크는 이러한 딥 러닝 모델을 구축하고 훈련하는 데 필요한 도구와 라이브러리를 제공합니다. CIFAR-100 또는 MNIST와 같은 다양한 Ultralytics 분류 데이터세트를 탐색하여 자신만의 프로젝트를 시작할 수 있습니다. 궁극적인 목표는 훈련된 모델이 이전에 볼 수 없었던 새로운 이미지에 대한 클래스 레이블을 정확하게 예측하는 것입니다. 기본 메커니즘에 대한 더 깊은 기술적 이해를 위해 시각 인식을 위한 컨볼루션 신경망에 대한 스탠포드 CS231n 과정과 같은 리소스에서 포괄적인 자료를 제공합니다.
이미지 분류는 전체 이미지에 하나의 중요한 레이블을 할당하는 데 중점을 둡니다. 따라서 다른 일반적인 컴퓨터 비전 작업과 구별됩니다:
각 작업마다 이미지 콘텐츠에 대한 세부 수준이 다르기 때문에 이러한 차이를 이해하는 것은 특정 문제에 적합한 기법을 선택하는 데 매우 중요합니다.
이미지 분류는 시각적 정보를 분류하는 데 효과적이기 때문에 다양한 영역에서 널리 사용되고 있습니다:
물체 감지로 유명한 Ultralytics YOLO 모델은 이미지 분류 작업에서도 강력한 성능을 발휘합니다. 다음과 같은 최첨단 아키텍처 Ultralytics YOLO11 와 같은 최첨단 아키텍처는 직관적인 Ultralytics Python 패키지 또는 코드가 필요 없는 Ultralytics HUB 플랫폼을 사용하여 분류를 위해 쉽게 훈련하거나 미세 조정할 수 있습니다. 이러한 도구는 모델 훈련 팁과 이미지 분류에 Ultralytics YOLO11 사용하는 방법에 대한 가이드와 같은 명확한 설명서를 포함한 포괄적인 리소스를 제공합니다. 더 많은 연습이 필요하다면 PyTorch 분류 튜토리얼을 살펴보거나 Kaggle 이미지 분류 경연 대회에 참가해 보세요. 최신 연구 발전에 대한 최신 정보를 얻으려면 코드가 있는 논문과 같은 리소스가 매우 유용합니다. 표준 벤치마크에서 YOLO 모델 성능을 비교할 수도 있습니다.