용어집

기능 엔지니어링

피처 엔지니어링으로 모델 성능 향상: AI 및 머신러닝에서 더 나은 패턴, 정확도, 예측을 위해 데이터를 변환하세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

피처 엔지니어링은 머신러닝과 인공 지능의 중요한 프로세스로, 원시 데이터를 예측 모델의 성능을 향상시키는 의미 있는 피처로 변환하는 작업을 포함합니다. 피처 엔지니어링을 효과적으로 수행하면 머신러닝 모델은 패턴을 더 쉽게 인식하고 정확도를 높이며 결과를 더 효과적으로 예측할 수 있습니다.

기능 엔지니어링 이해

피처 엔지니어링은 모델의 성능을 개선하기 위해 새로운 피처를 만들거나 기존 피처를 변경하는 작업을 포함합니다. 이 과정에는 종종 해당 분야에 대한 전문 지식이 필요하며, 해당 분야의 지식을 사용하여 모델의 출력에 영향을 미칠 피처를 선택하거나 생성합니다. 피처 엔지니어링은 직관과 실험에 크게 의존하는 예술과 과학이 혼합된 분야입니다.

기능 엔지니어링의 주요 단계는 다음과 같습니다:

  • 데이터 정리: 데이터에서 노이즈와 불일치를 제거하여 모델이 잘못된 패턴을 학습하는 것을 방지합니다.
  • 기능 생성: 기존 데이터를 기반으로 새로운 피처를 생성하는 작업입니다. 여기에는 피처의 조합, 피처의 일부 추출 또는 새로운 데이터 포인트 생성이 포함될 수 있습니다.
  • 기능 변환: 모델 요구 사항에 맞게 피처를 수정하는 작업입니다. 여기에는 모델에 적절하게 맞도록 피처를 정규화하거나 스케일링하는 기술이 포함됩니다.

데이터 준비에 대한 포괄적인 이해는 데이터 수집 및 주석에 대한 가이드를 참조하세요.

피처 엔지니어링의 응용

기능 엔지니어링은 다양한 애플리케이션에 큰 영향을 미칠 수 있습니다:

실제 애플리케이션

  1. 재무: 재무 건전성 예측에서 피처 엔지니어링은 이동 평균이나 변동성 지수와 같은 피처를 만드는 데 도움이 됩니다. 이러한 기능은 원시 가격 데이터보다 더 많은 인사이트를 제공하여 위험 관리 및 사기 탐지에 도움을 줄 수 있습니다. 금융 분야에서의 AI 적용에 대한 인사이트는 금융의 AI에서 확인할 수 있습니다.

  2. 헬스케어: 의료 진단에서는 나이, 병력, 라이프스타일 특성과 같은 공학적인 특징을 질병 위험 평가를 위한 예측 모델에 제공할 수 있습니다. 이는 의료 분야의 AI에서 광범위하게 살펴볼 수 있습니다.

기술 예시

  • 텍스트 분석: n-그램 생성 및 용어 빈도 역 문서 빈도(TF-IDF)는 텍스트 데이터에서 유용한 정보를 추출하기 위해 자연어 처리(NLP)에서 널리 사용되는 피처 엔지니어링 방법입니다.

기능 엔지니어링이 모델 학습이라는 큰 구조에 어떻게 들어맞는지 이해하는 것은 필수적입니다. 학습 데이터 관리 프로세스를 살펴보고 데이터가 모델에 어떻게 공급되는지 알아보세요.

관련 개념

피처 엔지니어링은 새로운 피처를 생성하기보다는 기존 데이터 피처를 선택하는 데 중점을 두는 피처 추출과 밀접한 관련이 있지만, 피처 추출과는 구별됩니다.

또한 피처 엔지니어링과 함께 데이터 증강 기술을 사용하면 데이터 세트를 확장하고 가변성을 도입하는 데 도움이 될 수 있습니다.

마지막으로, 기능 엔지니어링과 차원 고려 사항이 모두 모델 성능과 일반화에 영향을 미칠 수 있으므로 편향성-변이성 트레이드오프를 이해하는 것이 중요합니다.

도구 및 리소스

Ultralytics 허브와 같은 도구는 기능 엔지니어링을 머신러닝 워크플로에 통합할 수 있는 강력한 플랫폼을 제공하여 AI 모델을 원활하게 배포하고 관리할 수 있도록 지원합니다.

기능 엔지니어링은 강력한 AI 시스템을 구축하는 데 있어 계속해서 중요한 단계입니다. 데이터를 신중하게 선택하고 변환함으로써 조직은 보다 정확하고 신뢰할 수 있는 예측을 달성하여 원시 데이터를 실행 가능한 인사이트로 전환할 수 있습니다.

모두 보기