선형 회귀의 기초와 AI에서의 역할을 탐구하세요. Ultralytics 정밀한 객체 탐지 및 바운딩 박스 좌표 추출을 위해 회귀 분석을 활용하는 방식을 알아보세요.
선형 회귀는 기본적인 통계 방법이자 감독 학습의 기초 알고리즘으로, 종속 변수(목표)와 하나 이상의 독립 변수(특징) 간의 관계를 모델링하는 데 사용됩니다. 분류 알고리즘이 이산 범주를 예측하는 것과 달리, 선형 회귀는 연속적인 출력을 예측하므로 특정 수치 값을 예측하는 작업에 필수적입니다. 그 단순성과 해석 가능성은 오차를 최소화함으로써 모델이 데이터로부터 학습하는 핵심 메커니즘을 소개하므로 더 복잡한 기계 학습(ML) 개념을 이해하는 관문 역할을 합니다.
이 기법의 주요 목적은 데이터 패턴을 가장 잘 설명하는 "최적의 적합선"—또는 고차원에서는 초평면—을 찾는 것이다. 이를 위해 알고리즘은 입력 특징의 가중 합계에 편향 항을 더하여 계산한다. 학습 과정에서 모델은 이러한 내부 매개변수(가중치와 편향으로 알려짐)를 반복적으로 조정한다. weights and biases, 예측값과 실제 기준값 간의 차이를 줄이기 위해 반복적으로 조정합니다.
이러한 불일치는 손실 함수를 사용하여 정량화되며, 가장 흔히 선택되는 것은 평균 제곱 오차(MSE)입니다. 손실을 효과적으로 최소화하기 위해 경사 하강법과 같은 최적화 알고리즘을 활용하여 가중치를 업데이트합니다. 모델이 훈련 데이터의 잡음과 지나치게 일치할 경우 과적합의 위험이 있으며, 반대로 기본적인 추세를 포착하기에 너무 단순한 모델은 저적합 현상을 겪습니다.
데이터 분석에서 종종 단순한 예측 모델링과 연관되지만, 선형 회귀 원리는 고급 딥러닝(DL) 아키텍처에 깊이 내재되어 있다.
이 용어는 로지스틱 회귀와 구분하는 것이 중요합니다. 둘 다 선형 모델이지만 출력 방식이 크게 다릅니다. 선형 회귀는 연속적인 수치 값 (예: 자동차 가격)을 예측합니다. 반면 로지스틱 회귀는 분류 작업에 사용되며, 입력값이 특정 범주(예: 이메일이 "스팸"인지 "스팸이 아닌지")에 속할 확률을 예측합니다. 이를 위해 선형 출력을 시그모이드 함수와 같은 활성화 함수를 통과시킵니다.
컴퓨터 비전 분야에서 YOLO26과 같은 모델이 물체를 감지할 때, 바운딩 박스 좌표는 회귀 작업의 결과물입니다. 모델은 물체의 정확한 위치를 파악하기 위해 연속적인 값을 예측합니다.
from ultralytics import YOLO
# Load the YOLO26 model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image
# The model uses regression to determine the exact box placement
results = model("https://ultralytics.com/images/bus.jpg")
# Display the continuous regression outputs (x, y, width, height)
for box in results[0].boxes:
print(f"Box Regression Output (xywh): {box.xywh.numpy()}")
특정 데이터셋을 위한 이러한 회귀 기능을 활용하는 맞춤형 모델을 훈련하려는 사용자는 Ultralytics 통해 효율적인 주석 작업 및 클라우드 훈련을 수행할 수 있습니다. 이러한 기본적인 회귀 원리를 이해하는 것은 인공지능(AI) 및 컴퓨터 비전 분야의 복잡한 작업을 숙달하는 데 탄탄한 기반을 제공합니다.