용어집

선형 회귀

머신 러닝에서 선형 회귀의 힘을 알아보세요! 성공적인 예측 모델링을 위한 선형 회귀의 적용, 이점 및 주요 개념에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

선형 회귀는 머신러닝(ML)의 기본 알고리즘으로, 특히 지도 학습의 영역에 속합니다. 예측 모델링에 사용되는 통계적 방법으로, 종속 변수(예측하려는 변수)와 하나 이상의 독립 변수(예측자 또는 특징) 사이의 선형 관계를 설정하고 정량화하는 것을 목표로 합니다. 선형 회귀를 이해하는 것은 예측 분석의 첫 단계로, 보다 복잡한 인공 지능(AI) 기술의 기초를 제공하는 경우가 많습니다.

선형 회귀 이해

선형 회귀의 핵심은 데이터 포인트 집합을 통해 가장 잘 맞는 직선(또는 여러 독립 변수가 있는 경우 쌍곡선)을 찾는 것입니다. 이 선은 변수 간의 예측된 관계를 나타냅니다. '최적 적합도'는 일반적으로 실제 관측된 값과 선형 모델로 예측한 값 사이의 제곱 차이의 합을 최소화하여 결정됩니다. 이 최소화 프로세스는 경사 하강과 같은 최적화 알고리즘을 사용하여 수행되는 경우가 많습니다.

선형 회귀의 주요 장점은 해석 가능성입니다. 출력 계수는 모델의 기본 가정이 참이라고 가정할 때 각 독립 변수와 종속 변수 간의 관계의 강도와 방향(양 또는 음)을 직접적으로 나타냅니다. 이러한 투명성 덕분에 예측 자체만큼이나 예측이 이루어진 이유를 이해하는 것이 중요한 시나리오에서 유용합니다. 선형 회귀는 딥러닝 네트워크와 같은 복잡한 모델에 비해 계산적으로 효율적이며 선형 관계의 가정에 의존하지만 효과적으로 학습하는 데 필요한 데이터가 더 적습니다.

주요 개념 및 고려 사항

선형 회귀를 효과적으로 이해하고 적용하기 위해서는 몇 가지 개념이 핵심입니다:

  • 종속 변수와 독립 변수: 예측하려는 변수(종속 변수)와 예측에 사용되는 변수(독립 변수)를 명확하게 식별하는 것이 중요합니다.
  • 기능 엔지니어링: 독립 변수의 선택과 변환은 모델 성능에 큰 영향을 미칩니다. 관련성 있고 유익한 특징이 핵심입니다.
  • 모델 평가: 모델의 성능을 평가하는 것은 매우 중요합니다. 일반적인 지표로는 R-제곱(모델로 설명되는 분산 비율을 측정)과 예측 오류의 평균 크기를 나타내는 평균제곱오차(RMSE)가 있습니다. 특정 목표에 따라 다양한 회귀 지표를 사용할 수 있습니다.
  • 과적합과소적합: 모델이 학습 데이터에 너무 밀착되어(과적합) 노이즈를 포착하고 새로운 데이터에서 제대로 작동하지 않거나(과소적합) 너무 단순하여(과소적합) 기본 추세를 포착하지 못할 수 있습니다. 정규화와 같은 기술은 과적합을 완화하는 데 도움이 될 수 있습니다.

선형 회귀의 응용

선형 회귀는 예측 및 분석을 위해 다양한 영역에서 널리 사용됩니다:

  1. 경제 예측: 인플레이션율, 실업률, 정부 지출과 같은 변수를 기반으로 GDP 성장률과 같은 경제 지표를 예측합니다. 계량 경제학 모델은 선형 회귀를 기본으로 사용하는 경우가 많습니다.
  2. 비즈니스 매출 예측: 광고 지출, 과거 판매 데이터, 경쟁사 가격, 계절성 등의 요소를 기반으로 향후 제품 판매를 예측합니다. 이는 재고 관리 및 리소스 계획에 도움이 됩니다.
  3. 금융 분야의 위험 평가: 대출자의 재무 속성(소득, 부채, 신용 기록)과 채무 불이행 가능성 간의 관계를 모델링하여 신용 위험을 평가하는 것으로, 종종 더 복잡한 점수 시스템의 일부로 사용됩니다. 금융 분야에서 AI가 어떻게 활용되는지 알아보세요.
  4. 의학 연구: 복용량 수준과 환자의 혈압 감소와 같은 요인 또는 라이프스타일 요인(식단, 운동)과 건강 결과 사이의 관계를 분석하는 경우, 복잡한 생물학적 시스템에 대한 고급 모델이 필요한 경우가 많습니다.

선형 회귀와 다른 모델 비교

선형 회귀를 다른 ML 모델과 구별하는 것이 중요합니다:

  • 로지스틱 회귀: 이름은 비슷하지만 로지스틱 회귀는 선형 회귀처럼 연속적인 숫자 값을 예측하는 것이 아니라 분류 작업(예/아니오, 스팸/스팸 아님 등 불연속적인 범주 예측)에 사용됩니다.
  • 복잡한 모델(예: 신경망, 트리 기반 앙상블): 랜덤 포레스트와 같은 모델 또는 다음에서 사용되는 딥 러닝 아키텍처 Ultralytics YOLO 와 같은 모델은 컴퓨터 비전 작업(객체 감지, 이미지 분할)에 매우 복잡한 비선형 관계를 포착할 수 있습니다. 선형 회귀는 변수 간의 기본 관계가 거의 선형일 때 더 간단하고 가장 적합합니다. Ultralytics HUB와 같은 플랫폼은 이러한 보다 복잡한 모델의 훈련과 배포를 용이하게 합니다.

선형 회귀는 단순함에도 불구하고 데이터 분석 및 ML에서 여전히 가치 있고 널리 사용되는 도구로, 해석 가능한 인사이트를 제공하고 많은 예측 작업의 중요한 기준 모델 역할을 합니다. Scikit-learn과 같은 라이브러리는 실제 사용을 위한 강력한 구현을 제공합니다.

모두 보기