용어집

프롬프트 튜닝

프롬프트 튜닝을 통해 대규모 언어 모델을 효율적으로 최적화하여 비용을 절감하고 리소스를 절약하며 작업별 적응성을 손쉽게 달성하세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

프롬프트 튜닝은 사전 학습된 언어 모델을 특정 작업이나 데이터 세트에 맞게 조정하는 간소화된 접근 방식입니다. 프롬프트 튜닝은 대규모 모델의 모든 파라미터를 업데이트하는 대신 모델의 가중치를 동결한 채 입력 프롬프트를 최적화하는 데 중점을 둡니다. 이 방법은 특히 효율적이고 리소스 친화적이기 때문에 대규모 계산 능력 없이도 다양한 애플리케이션에서 사용할 수 있습니다.

개념 및 관련성

프롬프트 튜닝의 핵심은 GPT-3 또는 GPT-4와 같은 대규모 언어 모델(LLM)과 같이 사전 학습된 모델에 이미 내장된 지식을 활용하는 것입니다. 입력 프롬프트를 신중하게 제작함으로써 모델이 원하는 작업을 효과적으로 수행하도록 안내할 수 있다는 것입니다. 이는 입력에 학습 가능한 매개변수, 즉 작은 '소프트 프롬프트' 또는 '접두사' 세트를 추가함으로써 달성할 수 있습니다. 그런 다음 이러한 매개변수를 최적화하여 모델의 출력을 조정함으로써 프롬프트 자체를 통해 모델의 동작을 효과적으로 '튜닝'할 수 있습니다.

몇 가지 장점으로 인해 신속한 튜닝의 중요성이 빠르게 증가하고 있습니다:

  • 파라미터 효율성: 기존의 미세 조정에 비해 훈련 가능한 파라미터의 수를 대폭 줄입니다. 이는 전체 미세 조정이 계산상 불가능한 대규모 모델로 작업할 때 특히 중요합니다.
  • 계산 비용 절감: 소수의 프롬프트 매개변수만 학습하면 GPU 메모리와 컴퓨팅 시간이 훨씬 적게 듭니다. 따라서 특정 사용 사례에 맞게 모델을 더 쉽고 빠르게 조정할 수 있습니다.
  • 치명적인 망각 방지: 원래 모델 가중치를 고정된 상태로 유지함으로써 미세 조정으로 인해 이전에 학습한 작업에서 모델의 성능이 저하되는 현상인 치명적인 망각을 방지하는 데 도움이 됩니다.
  • 작업의 다양성: 프롬프트 튜닝은 다양한 NLP 작업에 적용할 수 있으며, 컴퓨터 비전과 같은 다른 영역으로 확장할 수도 있어 최신 AI에서 다용도로 활용되는 기술입니다.

프롬프트 튜닝의 적용

프롬프트 튜닝은 다양한 애플리케이션에서 활용되고 있으며, 특히 사전 학습된 대규모 모델을 효율적으로 적용하는 것이 핵심인 경우 더욱 그렇습니다. 다음은 몇 가지 구체적인 예시입니다:

  1. 텍스트 생성 및 콘텐츠 만들기: 텍스트 생성에서 프롬프트 튜닝을 사용하여 생성된 텍스트의 스타일, 어조 또는 주제를 구체화할 수 있습니다. 예를 들어 사전 학습된 모델을 사용하여 마케팅 문구를 생성하려는 경우 광고 언어, 브랜드 보이스 또는 제품 설명에 맞게 프롬프트를 튜닝할 수 있습니다. 이를 통해 전체 모델을 재교육하지 않고도 고도로 맞춤화된 콘텐츠를 생성할 수 있습니다. LangChain과 같은 도구를 사용하면 정교한 프롬프트 체인을 생성하여 생성된 콘텐츠에 대한 제어를 더욱 강화할 수 있습니다.

  2. 감성 분석: 감성 분석과 같은 작업의 경우, 프롬프트 튜닝을 통해 특정 제품이나 브랜드에 대한 고객 리뷰 분석과 같이 범용 언어 모델을 특정 도메인에 맞게 조정할 수 있습니다. 대상 도메인과 관련된 예시로 프롬프트를 튜닝하면 모델이 특정 맥락에서 뉘앙스를 더 정확하게 이해하고 감정을 표현할 수 있습니다.

즉각적인 튜닝 대 미세 튜닝

프롬프트 튜닝과 미세 튜닝은 모두 사전 학습된 모델을 조정하는 것을 목표로 하지만 접근 방식은 크게 다릅니다. 미세 조정 에는 대상 작업과 관련된 새로운 데이터 세트를 사용하여 사전 학습된 모델의 매개변수 전부 또는 대부분을 업데이트하는 작업이 포함됩니다. 이 작업은 계산 집약적이지만 특히 대규모 작업별 데이터 세트를 사용할 수 있는 경우 높은 정확도로 이어질 수 있습니다.

반면 프롬프트 튜닝은 사전 학습된 모델의 가중치를 고정된 상태로 유지하고 작업별 소규모 프롬프트만 최적화합니다. 이 방식은 계산 부담이 적고 매개변수 효율성이 높습니다. 프롬프트 튜닝은 데이터가 제한적이거나 신속한 적응이 필요할 때 특히 유용합니다. 또한 사전 학습된 모델의 일반적인 기능은 유지하면서 특정 작업에 맞게 전문화하려는 경우에도 유용합니다.

요약하면, 프롬프트 튜닝은 특정 애플리케이션을 위해 사전 학습된 대규모 모델의 기능을 활용할 수 있는 강력하고 효율적이며 접근하기 쉬운 방법을 제공하며, 이는 AI 분야의 중요한 발전을 의미합니다.

모두 보기