주의 메커니즘이 인간의 집중력을 모방하여 AI를 어떻게 혁신하는지 살펴보세요. 쿼리, 키, 값 구성 요소가 Ultralytics 정확도를 어떻게 주도하는지 알아보세요.
주의 메커니즘은 인공지능(AI)의 핵심 기술로, 인간의 인지 능력인 특정 세부 사항에 집중하면서 관련 없는 정보를 무시하는 능력을 모방합니다. 딥 러닝(DL) 딥 러닝(DL), 이 메커니즘은 신경망(NN)이 가 입력 데이터의 서로 다른 부분에 동적으로 다른 수준의 중요도, 즉 "가중치"를 할당할 수 있게 합니다. 전체 이미지나 문장을 동일한 강조로 처리하는 대신, 모델은 가장 중요한 특징에 주의를 기울이는 법을 학습합니다—예를 들어 문맥을 이해하기 위한 문장 내 특정 단어나 복잡한 시각적 장면 속 뚜렷한 객체와 같은 것들입니다. 이 혁신은 트랜스포머 아키텍처의 핵심 동력으로, 자연어 처리(NLP)부터 자연어 처리(NLP) 부터 고급 컴퓨터 비전(CV)에 이르기까지 다양한 분야에 혁명을 일으켰습니다.
원래는 재귀 신경망(RNNs)의의 사라지는 기울기 문제를 해결합니다. 이 과정은 종종 세 가지 구성 요소인 쿼리(Queries), 키(Keys), 값(Values)을 포함한 검색 비유를 사용하여 설명됩니다.
모델은 쿼리를 다양한 키와 비교하여 어텐션 점수를 계산합니다. 이 점수는 출력을 형성하는 데 사용될 값의 양을 결정합니다. 이를 통해 모델은 장거리 의존성을 효과적으로 처리하고 효과적으로 처리할 수 있게 하여, 데이터 포인트 간 거리와 무관하게 그 관계를 이해할 수 있게 합니다.
주의 메커니즘은 현대 기술에서 가장 눈에 띄는 발전 중 일부를 가능하게 했다.
주의를 구분하는 것이 중요합니다 컨볼루션 신경망(CNN). CNN이 고정된 창(커널)을 사용하여 데이터를 국소적으로 처리해 detect 질감을 detect 반면, 어텐션은 데이터를 전역적으로 처리하여 입력의 모든 부분을 다른 모든 부분과 연관시킵니다.
최첨단 모델들인 Ultralytics 최적화되어 있지만 실시간 추론을 위해 사용하는 고급 CNN 구조에 최적화되어 있는 반면, RT-DETR (실시간 탐지 트랜스포머) 명시적으로 어텐션을 활용하여 높은 정확도를 달성합니다. 두 유형의 모델 모두 Ultralytics 를 통해 쉽게 훈련 및 배포할 수 있습니다.
다음 Python 추론을 수행하는 방법을 보여줍니다. RT-DETR모델 아키텍처
기본적으로 어텐션 메커니즘에 의존하는
물체 감지.
from ultralytics import RTDETR
# Load a pre-trained RT-DETR model which uses attention mechanisms
# This model captures global context effectively compared to pure CNNs
model = RTDETR("rtdetr-l.pt")
# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")
# Print the number of detections found via transformer attention
print(f"Detected {len(results[0].boxes)} objects using attention-based detection.")