용어집

하이퍼파라미터 조정

최고의 성능을 위해 머신러닝 모델을 최적화하는 하이퍼파라미터 튜닝을 마스터하세요. 기술, 예제 및 모범 사례를 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

하이퍼파라미터 튜닝은 모델의 하이퍼파라미터에 대해 다양한 값을 체계적으로 실험하여 주어진 작업에서 최상의 성능을 내는 조합을 찾는 프로세스입니다. 학습 중에 학습되는 모델 파라미터와 달리 하이퍼파라미터는 학습이 시작되기 전에 설정되며 학습 과정 자체의 측면을 제어합니다. 하이퍼파라미터는 모델이 효과적으로 학습하고 보이지 않는 새로운 데이터로 일반화하는 능력에 큰 영향을 미칠 수 있습니다.

하이퍼파라미터 튜닝의 중요성

하이퍼파라미터를 적절히 조정하는 것은 최적의 모델 성능을 달성하는 데 매우 중요합니다. 이는 평범한 모델과 고성능 모델의 차이를 의미할 수 있습니다. 이러한 설정을 신중하게 선택하고 조정하면 모델의 정확도, 효율성 및 일반화 능력을 크게 향상시킬 수 있습니다. 예를 들어, 딥 러닝의 경우 하이퍼파라미터 튜닝은 신경망을 미세 조정하고 최상의 솔루션으로 수렴하도록 하는 데 필수적입니다.

일반적인 하이퍼파라미터

머신 러닝 모델에서는 일반적으로 몇 가지 하이퍼파라미터를 조정합니다. 가장 중요한 몇 가지 하이퍼파라미터는 다음과 같습니다:

  • 학습 속도: 학습 속도: 최적화 중에 모델이 수행하는 단계 크기를 결정합니다. 학습 속도가 너무 높으면 모델이 최적의 솔루션을 오버슈팅할 수 있고, 너무 낮으면 수렴이 느려질 수 있습니다.
  • 배치 크기: 모델 학습의 각 반복에 사용되는 학습 예제 수를 나타냅니다. 배치 크기는 학습 속도와 학습 프로세스의 안정성 모두에 영향을 줍니다.
  • 에포크 수: 에포크는 전체 학습 데이터 세트에 대한 전체 패스를 한 번 나타냅니다. 에포크 수에 따라 모델이 학습 데이터를 볼 수 있는 횟수가 결정됩니다.
  • 정규화 강도: L1 또는 L2 정규화와 같은 정규화 기법은 손실 함수에 페널티 항을 추가하여 과적합을 방지하는 데 도움이 됩니다. 정규화 강도는 이 페널티의 크기를 제어합니다.
  • 네트워크 아키텍처: 신경망의 경우 여기에는 레이어 수, 각 레이어의 뉴런 수, 사용되는 활성화 함수 유형이 포함됩니다.

하이퍼파라미터 튜닝 기법

하이퍼파라미터를 조정하는 데는 여러 가지 기술을 사용할 수 있으며, 각 기술에는 고유한 장단점이 있습니다:

  • 수동 검색: 여기에는 하이퍼파라미터 값을 수동으로 설정하고 모델의 성능을 평가하는 작업이 포함됩니다. 간단하지만 시간이 많이 소요될 수 있으며 최상의 결과를 얻지 못할 수도 있습니다.
  • 그리드 검색: 이 방법은 지정된 범위 내에서 가능한 모든 하이퍼파라미터 값의 조합을 체계적으로 테스트합니다. 철저하지만, 특히 많은 수의 하이퍼파라미터를 처리하는 경우 계산 비용이 많이 들 수 있습니다.
  • 무작위 검색: 이 접근 방식은 지정된 분포에서 하이퍼파라미터 값을 무작위로 샘플링합니다. 그리드 검색보다 효율적이며 좋은 하이퍼파라미터 조합을 더 빨리 찾을 수 있는 경우가 많습니다.
  • 베이지안 최적화: 이 기법은 확률 모델을 사용하여 다양한 하이퍼파라미터 조합의 성능을 예측하고 가장 유망한 조합을 반복적으로 선택하여 평가합니다. 무작위 검색보다 효율적이며 종종 더 나은 솔루션을 찾습니다.
  • 유전 알고리즘: 자연 선택에서 영감을 얻은 이 알고리즘은 여러 세대에 걸쳐 하이퍼파라미터 조합을 진화시켜 가장 성능이 좋은 조합을 선택하고 결합하여 새로운 후보를 만듭니다.

실제 하이퍼파라미터 튜닝

실제 애플리케이션에서 하이퍼파라미터 튜닝은 다양한 기법을 실험하고 결과를 평가하는 반복적인 과정으로 이루어지는 경우가 많습니다. 예를 들어, 물체 감지를 위해 Ultralytics YOLO 모델을 훈련할 때는 무작위 검색으로 시작하여 광범위한 하이퍼파라미터 값을 빠르게 탐색할 수 있습니다. Ultralytics 허브에서 사용자 지정 모델을 훈련하는 방법에 대해 자세히 알아볼 수 있습니다. 하이퍼파라미터 공간에서 유망한 영역을 파악한 후에는 베이지안 최적화를 사용하여 하이퍼파라미터를 더욱 미세 조정할 수 있습니다. Ultralytics 에서는 모델에 대한 하이퍼파라미터 조정에 대한 종합적인 가이드를 제공하여 프로세스를 간소화하는 실용적인 조언과 도구를 제공합니다.

실제 애플리케이션에서의 하이퍼파라미터 튜닝 예시

  1. 의료 분야의 이미지 분류: 의료 영상에서 하이퍼파라미터 튜닝은 질병 진단을 위한 정확한 모델을 개발하는 데 매우 중요한 역할을 합니다. 예를 들어, 컨볼루션 신경망(CNN) 을 훈련시켜 엑스레이 이미지를 건강 또는 질병으로 분류할 때는 학습 속도, 배치 크기, 네트워크의 레이어 수와 같은 하이퍼파라미터를 신중하게 조정해야 합니다. 이러한 하이퍼파라미터를 최적화함으로써 연구자들은 폐렴이나 암과 같은 질병을 나타내는 미묘한 패턴을 감지하는 모델의 능력을 개선하여 진단 정확도와 환자 치료 결과를 개선할 수 있습니다. 의료 분야의 AI에 대해 자세히 알아보세요.
  2. 자율주행 차량의 물체 감지: 하이퍼파라미터 튜닝은 자율 주행 차량에 사용되는 물체 감지 모델의 성능에 매우 중요합니다. 예를 들어 보행자, 차량, 교통 표지판을 감지하도록 모델을 훈련할 때는 에포크 수, 정규화 강도, 앵커 박스 크기와 같은 하이퍼파라미터를 최적화해야 합니다. 적절한 튜닝은 모델이 다양한 실제 시나리오에서 사물을 정확하고 빠르게 식별할 수 있도록 하여 자율 주행 시스템의 안전성과 신뢰성을 높이는 데 기여합니다. 자율 주행 차량의 AI에 대해 자세히 알아보세요.

하이퍼파라미터 튜닝과 기타 관련 용어 비교

하이퍼파라미터 튜닝을 다른 관련 개념과 구별하는 것이 중요합니다:

  • 모델 매개변수: 학습 중에 학습되는 모델의 내부 변수로, 신경망의 weights and biases 등이 이에 해당합니다. 반면에 하이퍼파라미터는 모델 외부에 있으며 학습이 시작되기 전에 설정됩니다.
  • 모델 선택: 여기에는 랜덤 포리스트와 서포트 벡터 머신 중에서 선택하는 것과 같이 주어진 작업에 가장 적합한 모델 유형을 선택하는 것이 포함됩니다. 반면 하이퍼파라미터 튜닝은 특정 모델의 설정을 최적화하는 데 중점을 둡니다.
  • 피처 엔지니어링: 이 프로세스에는 모델 성능을 개선하기 위해 원시 데이터에서 새로운 피처를 선택, 변환 및 생성하는 작업이 포함됩니다. 피처 엔지니어링은 최적의 하이퍼파라미터 값에 영향을 미칠 수 있지만, 일반적으로 하이퍼파라미터 튜닝에 선행하는 별도의 단계입니다.

이러한 차이점을 이해하고 효과적인 하이퍼파라미터 튜닝 전략을 활용하면 머신러닝 모델의 성능을 크게 개선하고 특정 작업에서 더 나은 결과를 얻을 수 있습니다.

모두 보기