1400만 개 이상의 이미지로 컴퓨터 비전의 발전을 촉진하고 AI 연구, 모델 및 애플리케이션을 지원하는 획기적인 데이터 세트인 ImageNet에 대해 알아보세요.
ImageNet은 컴퓨터 비전(CV) 연구 및 개발에 널리 사용되는 매우 큰 규모의 기초 데이터 세트입니다. 1,400만 개가 넘는 이미지로 구성되어 있으며, 어떤 물체가 사진에 찍혔는지를 나타내기 위해 수동으로 주석을 달고 WordNet 계층 구조에 따라 정리되어 있습니다. 20,000개 이상의 카테고리(싱셋)를 갖춘 ImageNet은 특히 이미지 분류 및 이미지 인식과 같은 작업을 위한 머신러닝(ML) 모델 훈련 및 평가를 위한 풍부하고 다양한 리소스를 제공합니다. 방대한 규모와 상세한 주석은 이 분야를 발전시키는 데 결정적인 역할을 해왔습니다. Ultralytics 모델과 함께 데이터 세트를 사용하는 방법에 대한 자세한 내용은 ImageNet 데이터 세트 설명서 페이지에서 확인할 수 있습니다.
ImageNet의 도입은 특히 컴퓨터 비전 분야에서 딥 러닝(DL)의 중추적인 순간이었습니다. ImageNet 이전에는 크고 다양하며 레이블이 잘 지정된 데이터 세트의 부족이 큰 병목 현상이었습니다. ImageNet은 컨볼루션 신경망(CNN)과 같이 훨씬 더 깊고 복잡한 모델을 훈련할 수 있게 해주어 획기적인 발전을 가져왔습니다. 2010년부터 2017년까지 매년 열린 ILSVRC(ImageNet 대규모 시각 인식 챌린지)는 이미지넷의 하위 집합을 사용했으며 이미지 분류 및 물체 감지 알고리즘을 평가하는 표준 벤치마크가 되었습니다. ImageNet에서 최첨단 결과를 달성한 AlexNet 및 ResNet과 같은 모델은 최신 CV 아키텍처에 큰 영향을 미쳤습니다.
ImageNet의 주요 애플리케이션은 새로운 컴퓨터 비전 모델과 알고리즘을 평가하는 표준 벤치마크 역할을 하고 있습니다. 벤치마킹 외에도 사전 학습 모델에도 광범위하게 사용됩니다.
ImageNet은 방대하고 분류 작업에 탁월하지만, 다른 데이터 세트는 다른 용도로 사용됩니다. 예를 들어 COCO 데이터 세트 (Common Objects in Context)는 개체 감지, 분할 및 캡션에 널리 사용되며, ImageNet에 비해 적은 수의 개체 범주에 대해 인스턴스 마스크 및 경계 상자와 같은 보다 상세한 주석을 제공합니다. 마찬가지로 Open Images V7은 많은 수의 객체 클래스에 대한 바운딩 박스를 제공합니다. 데이터 세트의 선택은 종종 분류, 감지 또는 분할과 같은 특정 컴퓨터 비전 작업에 따라 달라집니다. 다양한 컴퓨터 비전 데이터 세트를 탐색하면 프로젝트에 가장 적합한 데이터 세트를 선택하는 데 도움이 됩니다.