용어집

특성 엔지니어링

모델 성능 향상을 위한 기능 공학(Feature Engineering)을 탐구하세요. 스케일링(Scaling) 및 데이터 증강(Augmentation)과 같은 기법을 학습하여 Ultralytics 정확도를 높이기 위해 최적화하세요.

특징 공학은 원시 데이터를 기계 학습 모델의 성능을 향상시키는 의미 있는 입력값으로 변환하는 과정입니다. 이는 도메인 지식을 활용하여 알고리즘이 데이터 내 패턴을 더 잘 이해하도록 돕는 변수(특징으로 알려짐)를 선택, 수정 또는 생성하는 것을 포함합니다. 컨볼루션 신경망(CNN)과 같은 현대적인 딥러닝 아키텍처는 특징을 자동으로 학습할 수 있지만, 명시적인 특징 공학은 여전히 많은 워크플로우에서 중요한 단계로 남아 있습니다. 특히 구조화된 데이터를 다루거나 에지 디바이스에서 모델 효율성을 최적화하려는 경우에 그러합니다. 입력 데이터를 정제함으로써 개발자는 종종 더 단순한 모델로도 높은 정확도를 달성할 수 있으며, 이로 인해 막대한 계산 자원의 필요성을 줄일 수 있습니다.

AI에서 피처 엔지니어링의 역할

인공지능(AI)의 맥락에서 원시 데이터는 즉시 처리할 준비가 된 경우가 거의 없습니다. 이미지는 크기 조정이 필요할 수 있고, 텍스트는 토큰화가 필요할 수 있으며, 표 형식 데이터는 종종 누락된 값이나 관련 없는 열을 포함합니다. 피처 엔지니어링은 원시 정보와 알고리즘이 요구하는 수학적 표현 사이의 간극을 메웁니다. 효과적인 엔지니어링은 모델이 놓칠 수 있는 핵심 관계를 부각시킬 수 있습니다. 예를 들어 "거리"와 "시간"을 결합하여 "속도" 특징을 생성하는 것이죠. 이 과정은 데이터 전처리와 밀접하게 연관되어 있지만, 전처리가 정리와 형식화에 초점을 맞추는 반면 특징 공학은 예측력을 높이기 위한 창의적 강화에 관한 것입니다.

컴퓨터 비전 작업에서 특징 공학은 크게 발전했습니다. 전통적인 방법은 가장자리와 모서리를 식별하기 위해 스케일 불변 특징 변환(SIFT)과 같은 기술자를 수동으로 제작하는 것이었습니다. 현재는 YOLO26과 같은 딥러닝 모델이 숨겨진 계층 내에서 자동화된 특징 추출을 수행합니다. 그러나 데이터셋 준비 과정에서 엔지니어링은 여전히 핵심적인 역할을 수행합니다. 예를 들어 합성 데이터 생성이나 모자이크 및 믹스업과 같은 데이터 증강 기법을 적용하여 훈련 중 모델이 더 다양한 특징 변형에 노출되도록 하는 작업이 이에 해당합니다.

일반적인 기법과 응용 분야

특징 공학은 특정 문제와 데이터 유형에 맞춤화된 다양한 전략을 포괄합니다.

차원 축소: 주성분 분석(PCA)과 같은 기법은 필수 정보를 유지하면서 변수 수를 줄여 고차원 데이터셋에서 과적합을 방지합니다.
범주형 변수 인코딩: 알고리즘은 일반적으로 수치형 입력을 요구합니다. 원핫 인코딩과같은 기법은 범주형 레이블(예: "빨강", "파랑")을 모델이 처리할 수 있는 이진 벡터로 변환합니다.
정규화 및 스케일링: 특징을 표준 범위로 스케일링하면 더 큰 규모를 가진 변수(예: 주택 가격)가 더 작은 범위의 변수(예: 방 개수)를 압도하지 않도록 보장하며, 이는 신경망에서 기울기 기반 최적화에 매우 중요합니다.
분할 및 이산화: 연속형 값을 구간(예: 연령대)으로 그룹화하면 모델이 특이값을 더 효과적으로 처리하고 비선형 관계를 포착하는 데 도움이 될 수 있습니다.

실제 사례

특징 공학은 복잡한 문제를 해결하기 위해 다양한 산업 분야에서 적용됩니다.

제조업에서의 예측 유지보수: 스마트 제조 환경에서 센서는 기계의 원시 진동 및 온도 데이터를 수집합니다. 엔지니어들은 온도의 "변화율"이나 진동 강도의 "이동 평균"을 나타내는 특징을 생성할 수 있습니다. 이러한 공학적으로 설계된 특징들은 이상 탐지 모델이 단순히 현재 센서 측정값에 반응하는 대신 장비 고장을 며칠 전에 예측할 수 있게 합니다.
신용 위험 평가: 금융 기관은 대출 적격성을 평가하기 위해 특징 공학을 활용합니다. 단순히 원시적인 "소득" 수치만 보는 대신, "부채 대비 소득 비율"이나 "신용 이용률"과 같은 파생된 특징을 생성할 수 있습니다. 이러한 파생된 특징들은 차주의 재정 건전성에 대한 보다 세밀한 관점을 제공하여, 더 정확한 위험 분류를 가능하게 합니다.

코드 예시: 사용자 정의 기능 보강

컴퓨터 비전 분야에서 우리는 이미지를 보강하여 다양한 환경 조건을 시뮬레이션함으로써 특징을 "설계"할 수 있습니다. 이는 다음과 같은 모델에 도움이 됩니다. YOLO26 더 잘 일반화합니다. 다음 예제는 간단한 그레이스케일 변환을 적용하는 방법을 보여줍니다. ultralytics 도구로, 모델이 색상에만 의존하기보다는 구조적 특징을 학습하도록 강제합니다.

import cv2
from ultralytics.data.augment import Albumentations

# Load an example image using OpenCV
img = cv2.imread("path/to/image.jpg")

# Define a transformation pipeline to engineer new visual features
# Here, we convert images to grayscale with a 50% probability
transform = Albumentations(p=1.0)
transform.transform = A.Compose([A.ToGray(p=0.5)])

# Apply the transformation to create a new input variation
augmented_img = transform(img)

# This process helps models focus on edges and shapes, improving robustness

특성 엔지니어링

산업 전반의 워크플로우를 간소화하기 위한 Ultralytics YOLO 모델 교육

혁신을 강화하는 유연한 엔터프라이즈 라이선스 솔루션

Ultralytics YOLO 몇 초 만에 AI 모델 훈련하기

AI에서 피처 엔지니어링의 역할

일반적인 기법과 응용 분야

실제 사례

코드 예시: 사용자 정의 기능 보강

관련 용어와의 차이점

이 카테고리에서 더 읽어보기

컴퓨터 비전으로 구현된 12가지 항공 이미지 활용 사례

단안 깊이 추정이란 무엇인가? 개요

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 커뮤니티 가입