이미지넷은 이미지 인식 연구를 발전시키기 위해 설계된 컴퓨터 비전 분야의 기초 데이터 세트입니다. 주로 명사, 동사, 형용사, 부사 등 의미 있는 각 개념을 '신셋'이라고 부르는 어휘 데이터베이스인 WordNet 계층 구조( English)에 따라 구성됩니다. ImageNet은 전체 WordNet 동의어를 매핑하는 것을 목표로 하고 있으며, 현재 20,000개 이상의 동의어에 대해 약 1,400만 개의 이미지를 제공하고 있습니다. 이 방대한 컬렉션은 특히 이미지 분류 및 객체 감지와 같은 작업에서 머신러닝 모델을 훈련하고 평가하는 데 매우 귀중한 리소스입니다.
ImageNet의 탄생은 특히 컴퓨터 비전 작업에서 딥 러닝 혁명의 중추적인 순간이었습니다. ImageNet 이전에는 라벨링된 이미지 데이터의 규모와 다양성이 강력한 모델을 훈련하는 데 큰 제약이었습니다. ImageNet은 연구자들이 컨볼루션 신경망(CNN)과 같이 훨씬 더 깊고 복잡한 모델을 훈련할 수 있도록 꼼꼼하게 주석이 달린 대규모 데이터 세트를 제공함으로써 이 문제를 해결했습니다. 2010년부터 2017년까지 매년 열린 ImageNet 대규모 시각 인식 챌린지(ILSVRC)는 물체 감지 및 이미지 분류 알고리즘을 평가하는 벤치마크가 되었습니다. ImageNet에서 우승한 모델은 종종 새로운 최첨단 결과를 설정하고 최신 컴퓨터 비전 아키텍처의 개발에 큰 영향을 미쳤습니다.
이미지넷의 영향력은 인공 지능과 머신 러닝의 수많은 애플리케이션으로 확장되고 있습니다:
이미지넷은 이 분야를 발전시키는 데 중요한 역할을 해왔지만, 그 한계와 편견을 해결하고 AI의 시각적 이해의 범위를 넓히는 보다 포괄적이고 균형 잡힌 데이터 세트를 향한 지속적인 진화를 인식하는 것이 중요합니다. Ultralytics HUB와 같은 리소스를 통해 사전 학습된 모델과 맞춤형 데이터 세트를 사용할 수 있으며, 실제 컴퓨터 비전 문제를 해결하기 위해 ImageNet과 같은 데이터 세트가 마련한 토대를 기반으로 합니다.