용어집

최적화 알고리즘

신경망 훈련부터 의료 및 농업 분야의 실제 애플리케이션에 이르기까지 최적화 알고리즘이 AI 및 ML 성능을 향상시키는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

인공지능(AI)머신러닝(ML) 영역에서 최적화 알고리즘은 모델을 개선하고 성능을 향상시키는 데 사용되는 필수적인 방법입니다. 이러한 알고리즘은 모델의 예측값과 실제 목표값 간의 차이를 측정하는 사전 정의된 손실 함수를 최소화하기 위해 모델의 매개변수( weights and biases 등)를 반복적으로 조정합니다. 이 프로세스는 신경망과 같은 복잡한 모델을 훈련하는 데 기본이 되며, 이를 통해 데이터로부터 효과적으로 학습하고 이미지 인식부터 자연어 처리(NLP)에 이르는 다양한 작업에서 정확도와 신뢰도를 향상시킬 수 있습니다. 가장 선명한 소리를 내기 위해 악기를 미세 조정하는 것처럼, 최적화 알고리즘은 가장 정확한 예측을 할 수 있도록 모델을 조정합니다.

AI 및 머신 러닝의 관련성

최적화 알고리즘은 대부분의 ML 모델, 특히 딥러닝(DL)에서 학습 프로세스를 구동하는 엔진입니다. 컨볼루션 신경망(CNN)순환 신경망(RNN) 과 같은 모델은 이러한 알고리즘에 크게 의존하여 방대한 매개변수 공간을 탐색하고 좋은 성능을 내는 구성을 찾습니다. 효과적인 최적화가 이루어지지 않으면 모델이 최적의 솔루션으로 수렴하는 데 어려움을 겪게 되어 예측이 부정확해지고 학습 시간이 길어집니다. 예를 들어 Ultralytics YOLO 모델은 훈련 중에 정교한 최적화 알고리즘을 활용하여 실시간 물체 감지에서 높은 정밀도를 달성합니다. 이러한 알고리즘은 GPT-4 및 기타 대규모 언어 모델(LLM)과 같은 최첨단 모델을 훈련하는 데도 매우 중요하며, 이를 통해 놀라운 성능을 구현할 수 있습니다. 모델 훈련 팁 가이드에서 설명한 대로 최적화 도구의 선택은 훈련 속도와 최종 모델 성능에 큰 영향을 미칠 수 있습니다. 손실 환경을 효율적으로 탐색하는 것이 성공적인 모델 학습의 핵심입니다.

주요 개념 및 알고리즘

머신 러닝에는 여러 가지 최적화 알고리즘이 널리 사용되며, 각 알고리즘은 손실 환경을 탐색하고 모델 매개변수를 업데이트하기 위한 다양한 전략을 제공합니다. 몇 가지 일반적인 예는 다음과 같습니다:

  • 그라데이션 하강: 손실 함수의 기울기와 반대 방향으로 매개 변수를 반복적으로 이동시키는 기본 알고리즘입니다. 가장 낮은 지점을 찾기 위해 조심스럽게 내리막길을 걷는 것과 같습니다. 성능 향상을 위해 다양한 변형이 존재합니다.
  • 확률적 경사 하강(SGD): 한 번에 하나 또는 몇 개의 훈련 예제(미니 배치)만 사용하여 파라미터를 업데이트하는 경사 하강의 변형으로, 업데이트 속도를 높이고 로컬 최소값을 벗어날 가능성이 있습니다.
  • 아담 옵티마이저: 기울기의 첫 번째 및 두 번째 모멘트 추정치로부터 다양한 매개변수에 대한 개별 적응 학습률을 계산하는 적응 학습률 최적화 알고리즘입니다. 효율성이 뛰어난 것으로 알려져 있으며 딥 러닝에 널리 사용됩니다. 기술적 세부 사항은 Adam의 원본 논문을 참조하세요.
  • RMSprop: 가중치에 대한 학습률을 해당 가중치에 대한 최근 기울기 크기의 연속 평균으로 나누는 또 다른 적응형 학습률 방법입니다.

이러한 최적화 도구는 종종 다음과 같은 ML 프레임워크 내에서 구성 가능한 매개변수입니다. PyTorchTensorFlow과 같은 ML 프레임워크와 Ultralytics HUB와 같은 플랫폼 내에서 구성 가능한 매개변수로 제공되므로 사용자는 특정 작업과 데이터 세트에 가장 적합한 것을 선택할 수 있습니다. 효율적인 모델 학습을 위해서는 올바른 최적화 도구를 선택하는 것이 중요합니다.

실제 애플리케이션

최적화 알고리즘은 다양한 분야에서 AI/ML의 성공을 위한 기본 요소입니다:

  1. 헬스케어: 의료 이미지 분석에서 최적화 알고리즘은 종양과 같은 이상 징후를 감지하거나 조직 유형을 분류하도록 모델을 훈련시킵니다. 예를 들어, 종양 탐지에 YOLO11 사용하는 경우, 최적화 알고리즘은 주석이 달린 의료 스캔(데이터 세트)을 기반으로 모델의 매개변수를 조정하여 암 부위를 정확하게 식별함으로써 영상의학과 전문의의 진단을 돕습니다. 더 많은 의료 솔루션의 AI를 살펴보세요.
  2. 자율주행 차량: 최적화 알고리즘은 자율주행 차량의 인식 시스템을 훈련하는 데 필수적입니다. 카메라 및 LiDAR 등의 센서 데이터에서 보행자, 다른 차량, 신호등, 도로 차선을 감지하는 데 사용되는 모델을 개선합니다. Adam과 같은 알고리즘은 모델이 높은 정확도로 물체를 식별하는 방법을 빠르게 학습하도록 지원하며, 이는 복잡한 환경에서의 안전과 내비게이션에 매우 중요합니다. 자동차 솔루션의 AI에 대해 자세히 알아보세요.
  3. 금융: 사기 탐지 또는 주식 시장 예측을 위한 학습 모델은 과거 데이터를 기반으로 예측 오류를 최소화하기 위해 최적화에 크게 의존합니다.
  4. 이커머스: 추천 시스템은 최적화를 통해 사용자 선호도를 예측하고 관련 상품을 제안하는 알고리즘을 미세 조정하여 참여도와 매출을 극대화합니다.

최적화 알고리즘과 관련 개념 비교

최적화 알고리즘을 관련 ML 개념과 구별하는 것이 중요합니다:

  • 최적화 알고리즘과 하이퍼파라미터 튜닝 비교: 최적화 알고리즘(예 Adam 또는 SGD) 조정 내부 매개변수 weights and biases을 설정합니다. 동안 교육 과정을 최소화하기 위해 손실 기능. 반면 하이퍼파라미터 튜닝은 최적의 파라미터를 찾는 데 중점을 둡니다. 외부 구성 설정 (다음과 같은 하이퍼파라미터 학습 속도, 배치 크기또는 최적화 알고리즘 자체의 선택) 전에 교육이 시작됩니다. 다음과 같은 도구 Ultralytics Tuner 클래스 다음과 같은 방법을 사용하여 하이퍼파라미터 튜닝을 자동화합니다. 진화 알고리즘. 읽기 하이퍼파라미터 튜닝 가이드 에서 자세한 내용을 확인하세요.
  • 최적화 알고리즘과 손실 함수 비교: 손실 함수는 예측값과 실제값 사이의 오차를 측정하여 모델이 얼마나 잘 작동하고 있는지 정량화합니다. 최적화 알고리즘은 이 정량화된 오차를 최소화하기 위해 모델의 매개변수를 반복적으로 조정하는 데 사용되는 메커니즘입니다. 작업에 따라 다른 손실 함수를 선택할 수 있습니다(예: 분류의 경우 교차 엔트로피, 회귀의 경우 평균 제곱 오차).
  • 최적화 알고리즘과 모델 아키텍처 비교: 모델 아키텍처는 레이어의 수와 유형(예: 컨볼루션 레이어, 드롭아웃 레이어), 레이어의 연결 방식 등 신경망의 구조를 정의합니다. 최적화 알고리즘은 이 사전 정의된 아키텍처 내에서 작동하여 이러한 레이어와 관련된 학습 가능한 파라미터weights and biases를 학습합니다. 아키텍처를 설계하고 최적화 알고리즘을 선택하는 것은 효과적인 ML 모델을 구축하는 데 있어 매우 중요한 단계입니다. 신경망 아키텍처 검색(NAS) 은 아키텍처 설계를 자동화하는 관련 분야입니다.
모두 보기