Ultralytics YOLO11 을 통해 머신 러닝에서 특징 추출의 힘을 알아보세요. 효율적인 탐지 및 분석을 위한 기술을 배워보세요.
특징 추출은 머신러닝(ML) 과 컴퓨터 비전(CV)에서 중요한 과정으로, 복잡한 원시 데이터를 알고리즘이 효과적으로 처리할 수 있는 형식으로 변환하는 중요한 단계입니다. 여기에는 이미지, 오디오 또는 텍스트와 같은 비정형 또는 고차원 데이터를 일반적으로 특징 벡터로 표현되는 정형화된 숫자 특징 집합으로 변환하는 작업이 포함됩니다. 이러한 특징은 노이즈와 중복성을 제거하면서 원본 데이터의 본질적인 특성을 포착하는 것을 목표로 합니다. 주요 목표는 차원 축소를 통해 데이터 복잡성을 줄이고, 관련 패턴을 강조하며, 데이터를 ML 모델에 더 적합하게 만드는 것입니다. 이는 종종 모델 정확도 향상, 모델 학습 속도 향상, 보이지 않는 데이터에 대한 일반화 향상으로 이어집니다.
특징 추출을 위한 구체적인 기술은 처리되는 데이터 유형에 따라 크게 달라집니다.
이미지 데이터: 기존 컴퓨터 비전에서는 가장자리, 모서리, 텍스처( 가버 필터와 같은 기술 사용) 또는 색상 히스토그램과 같은 특정 특징을 감지하기 위해 알고리즘을 수동으로 설계하는 방법을 사용했습니다. OpenCV와 같은 라이브러리는 이러한 고전적인 기법을 구현하기 위한 도구를 제공합니다(OpenCV 공식 사이트). 그러나 최신 딥 러닝(DL)에서는 특히 다음과 같은 모델에 사용되는 컨볼루션 신경망(CNN)이 사용됩니다. Ultralytics YOLO와 같은 모델에서는 특징 추출이 자동으로 학습되는 경우가 많습니다. 네트워크의 컨볼루션 레이어는 입력 이미지에 필터를 적용하여 초기 레이어의 단순한 선과 텍스처부터 더 깊은 레이어의 객체 부분과 전체 객체에 이르기까지 점점 더 복잡한 패턴을 계층적으로 캡처하는 특징 맵을 생성합니다. 이를 적용한 다양한 컴퓨터 비전 작업을 살펴볼 수 있습니다.
텍스트 데이터: 자연어 처리(NLP) 작업의 경우, 특징 추출에는 단어 중요도를 나타내는 용어 빈도 역 문서 빈도TF를 계산하거나 Word2Vec 또는 GloVe와 같은 모델을 사용하여 단어 임베딩을 생성하는 등의 방법이 포함될 수 있습니다. 이러한 임베딩은 단어 간의 의미 관계를 포착하는 밀도 높은 벡터입니다. BERT 및 Transformers와 같은 고급 모델은 텍스트에서 직접 문맥 표현을 학습합니다.
일반 기법: 주성분 분석(PCA) 및 t-분산 확률 이웃 임베딩(t-SNE) 과 같은 방법은 다양한 데이터 유형에 적용할 수 있는 범용 차원 축소 기법입니다. 고차원 데이터를 저차원 공간으로 변환하는 동시에 중요한 분산 또는 이웃 구조를 보존하는 것을 목표로 하며, 이는 특징 추출의 한 형태로 간주될 수 있습니다. Scikit-learn은 이러한 기법의 구현을 제공합니다.
특징 추출을 특징 엔지니어링과 혼동하는 경우가 많지만, 두 개념은 별개의 개념입니다.
딥러닝 모델은 이미지 인식 및 객체 감지와 같은 작업의 특징 추출 프로세스를 대부분 자동화하지만, 최적의 성능을 달성하기 위해서는 적절한 데이터 증강이나 입력 정규화와 같은 특징 엔지니어링 원칙이 여전히 중요합니다.
특징 추출은 수많은 AI 및 ML 애플리케이션의 기본입니다:
의료 이미지 분석: 암과 같은 질병을 발견하기 위해 엑스레이, CT, MRI와 같은 의료 스캔을 분석할 때, 이미지에서 특정 특징을 추출합니다. 여기에는 조직 내의 텍스처 패턴, 잠재적 이상 징후(예: 뇌종양 데이터 세트에서 발견된 종양)의 모양과 크기, 강도 변화 등이 포함될 수 있습니다. 이렇게 추출된 특징은 SVM이나 신경망과 같은 분류기에 입력되어 질병의 존재 여부나 단계를 예측합니다. 이는 방사선과와 같은 간행물에서 논의된 바와 같이 방사선 전문의의 진단에 도움이 됩니다: 인공 지능. 최신 시스템은 다음을 사용할 수 있습니다. Ultralytics YOLO11 를 사용하여 의료 이미지 분석과 같은 작업에 필요한 기능을 암시적으로 추출합니다.
감정 분석: 고객 리뷰나 소셜 미디어 게시물과 같은 텍스트 데이터에 표현된 감정(긍정, 부정, 중립)을 파악하려면 원시 텍스트에서 특징을 추출해야 합니다. 여기에는 긍정 단어와 부정 단어의 빈도수(Bag-of-Words)를 계산하거나, TF 점수를 사용하거나, 다음을 통해 제공되는 것과 같이 사전 학습된 언어 모델을 사용하여 정교한 문장 임베딩을 생성하는 방법이 포함될 수 있습니다. Hugging Face. 이러한 기능은 텍스트의 감정 어조를 정량화하여 ML 모델이 고객 피드백을 이해하는 데 중요한 전반적인 감정을 분류할 수 있도록 합니다.
다음과 같은 최첨단 객체 감지 모델 Ultralytics YOLOv8 및 YOLO11 같은 최신 객체 탐지 모델은 신경망(NN) 아키텍처 내에서 암시적으로 특징 추출을 수행합니다. 초기 레이어(종종 백본의 일부)는 강력하고 학습된 특징 추출기 역할을 합니다. 입력 데이터가 이 계층을 통과하면 계층적 특징이 자동으로 식별되어 특징 맵에 표시됩니다. 이 프로세스는 대부분 자동화되어 있지만, 특징 추출을 이해하면 효과적인 데이터 전처리 단계를 설계하고, 하이퍼파라미터 튜닝을 수행하고, 모델 동작을 해석하는 데 도움이 되며, 데이터 세트 및 실험 관리를 위해 Ultralytics 설명서 또는 Ultralytics HUB와 같은 플랫폼에서 제공되는 도구를 사용할 수도 있습니다. 이러한 기술은 프레임 전반에서 객체 식별을 유지하기 위해 외관 특징을 추출할 수 있는 객체 추적과 같은 다운스트림 작업에도 사용됩니다. 다음과 같은 프레임워크 PyTorch 와 TensorFlow 와 같은 프레임워크는 이러한 모델을 구축하고 훈련하기 위한 기본 인프라를 제공합니다.