용어집

제너레이티브 AI

제너레이티브 AI가 텍스트, 이미지, 오디오와 같은 독창적인 콘텐츠를 제작하여 혁신적인 애플리케이션으로 산업을 변화시키는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

생성형 인공 지능(AI)은 광범위한 인공 지능(AI) 분야에서 중요한 분야로, 특히 완전히 새로운 독창적인 콘텐츠를 생성할 수 있는 시스템을 만드는 데 중점을 둡니다. 이러한 콘텐츠는 텍스트, 이미지, 오디오, 코드, 합성 데이터 등 다양한 양식을 포괄할 수 있습니다. 입력 데이터를 기반으로 분류하거나 예측하도록 학습되는 차별적 AI 모델(예: 객체 감지를 사용하여 이미지에서 객체를 식별)과 달리, 생성 모델은 학습 데이터 세트 내의 기본 패턴, 구조 및 확률 분포를 학습합니다. 그런 다음 이 학습된 지식을 사용하여 원본 데이터의 특성을 모방한 새로운 결과물을 만들어냅니다. 특히 사전 훈련된 제너레이티브 트랜스포머(GPT)확산 모델과 같은 아키텍처가 주도하는 최근의 혁신은 놀랍도록 사실적이고 복잡한 콘텐츠를 제작할 수 있게 하여 머신 크리에이티브의 한계를 넓혀주고 있습니다.

제너레이티브 AI의 작동 방식

대부분의 생성 모델의 핵심 아이디어는 데이터 분포의 표현을 학습하는 것입니다. 이 분포가 학습되면 모델은 이를 샘플링하여 학습된 데이터와 통계적으로 유사한 새로운 데이터 포인트를 생성할 수 있습니다. 여기에는 복잡한 신경망(NN) 아키텍처와 정교한 훈련 기법이 사용됩니다. 몇 가지 대표적인 아키텍처는 다음과 같습니다:

  • 생성적 적대 신경망(GAN): 이 모델은 데이터를 생성하는 생성기와 실제 데이터와 생성된 데이터를 구별하는 판별기라는 두 가지 경쟁 신경망을 사용하여 생성된 결과물의 품질을 반복적으로 개선합니다.
  • 변형 자동 인코더(VAE): VAE는 데이터의 압축된 표현(잠재 공간)을 학습한 다음, 이 잠재 공간에서 포인트를 샘플링하고 디코딩하여 새로운 데이터를 생성할 수 있습니다.
  • 트랜스포머: 원래 자연어 처리(NLP)를 위해 개발된 트랜스포머 아키텍처, 특히 자체 주의 메커니즘은 다양한 생성 작업에 매우 효과적인 것으로 입증되어 GPT-4와 같은 대규모 언어 모델(LLM) 의 기반을 형성하고 있습니다.
  • 확산 모델: 이러한 모델은 훈련 데이터에 노이즈를 점진적으로 추가한 다음 노이즈에서 시작하여 깨끗하고 일관된 데이터 샘플을 생성하기 위해 이 과정을 역으로 학습하는 방식으로 작동합니다. 안정 확산과 같은 모델은 텍스트-이미지 생성에 사용되는 대표적인 예입니다.

제너레이티브 AI와 컴퓨터 비전

두 가지 모두 AI의 하위 분야이긴 하지만, 생성 AI와 컴퓨터 비전(CV) 은 근본적으로 다른 목표를 가지고 있습니다. CV는 기계가 세상의 시각 정보를 해석하고 이해하여 이미지 분류, 객체 감지, 인스턴스 분할과 같은 작업을 수행할 수 있도록 하는 데 중점을 둡니다. 반대로 생성형 AI는 새로운 시각적(또는 기타) 콘텐츠를 만드는 데 중점을 둡니다.

YOLO 비전 2024와 같은 토론에서 강조된 주요 차이점은 다음과 같습니다:

  1. 모델 크기: 생성 모델, 특히 LLM과 대형 이미지 모델에는 수십억 개 또는 수조 개의 파라미터가 포함되어 있는 경우가 많습니다. 다음과 같은 실시간 분석을 위해 설계된 CV 모델 Ultralytics YOLO11와 같이 실시간 분석을위해 설계된 CV모델은 일반적으로 훨씬 더 작고 효율적이며, 일부 변형은 매개 변수가 수백만 개에 불과합니다( YOLO 모델과 비교).
  2. 컴퓨팅 리소스: 대규모 생성 모델을 훈련하고 실행하려면 상당한 연산 능력이 필요하며, 종종 분산된 GPU 클러스터가 필요합니다. Ultralytics 모델을 포함한 많은 CV 모델은 효율성을 위해 최적화되어 있으며 다음과 같은 프레임워크를 사용하여 표준 하드웨어 또는 특수 에지 장치에 배포할 수 있습니다. ONNX 또는 TensorRT.
  3. 목표: CV는 기존 데이터를 분석하고, 생성형 AI는 새로운 데이터를 합성합니다.

이러한 차이에도 불구하고 각 분야는 점점 더 상호 연결되고 있습니다. 제너레이티브 AI는 고품질 합성 데이터를 생성함으로써 CV에 대한 가치를 입증하고 있습니다. 이러한 합성 데이터는 실제 데이터 세트를 보강하여 더욱 강력하고 정확한 CV 모델을 학습시킬 수 있으며, 특히 자율주행 시뮬레이션이나 희귀 질환 이미징(의료 분야의 AI)과 같이 실제 데이터가 부족하거나 확보하기 어려운 시나리오에서 더욱 유용합니다.

실제 애플리케이션

제너레이티브 AI는 수많은 산업을 혁신하고 있습니다:

  • 콘텐츠 제작: 기사, 마케팅 카피, 스크립트 생성 자동화(GPT-3), 고유한 이미지 및 아트웍 제작(Midjourney, DALL-E 3), 음악 작곡, 동영상 콘텐츠 생성(OpenAI Sora).
  • 합성 데이터 생성: 로봇 공학, 금융(금융 분야의 컴퓨터 비전 모델), 헬스케어 등의 분야에서 ML 모델 학습을 위한 사실적인 데이터 세트를 생성하여 모델 성능을 개선하고 데이터 개인정보 보호 문제를 해결합니다. 예를 들어, 실제 환자 데이터를 사용하지 않고도 진단 도구를 훈련하기 위해 합성 의료 이미지를 생성할 수 있습니다.
  • 신약 개발 및 재료 과학: 새로운 분자 구조를 설계하고 그 특성을 예측하여 Google 딥마인드와 같은 조직에서 입증한 것처럼 연구 개발을 가속화합니다.
  • 개인화: 챗봇, 가상 비서, 추천 엔진에서 동적 콘텐츠 생성을 통해 고도로 맞춤화된 사용자 경험을 제공합니다.
  • 소프트웨어 개발: 코드 스니펫 생성, 버그 수정 제안, 자연어 설명을 기반으로 한 전체 함수 생성(GitHub Copilot)을 통해 개발자를 지원합니다.

도전 과제 및 윤리적 고려 사항

생성 AI의 급속한 발전은 도전과제를 동반하기도 합니다. 특히 딥페이크, 잘못된 정보, 지적 재산권, 학습 데이터에서 학습된 내재적 편견과 관련하여 이러한 강력한 도구의 윤리적 사용을 보장하는 것이 가장 중요합니다. 이러한 문제를 해결하려면 신중한 모델 개발, 강력한 탐지 방법, AI 윤리 원칙에 명시된 명확한 가이드라인이 필요합니다. 또한, 상당한 컴퓨팅 리소스가 필요하기 때문에 환경 및 접근성 문제도 발생합니다. Ultralytics HUB와 같은 플랫폼은 워크플로우를 간소화하고 특정 AI 작업에 대한 진입 장벽을 낮추는 것을 목표로 합니다.

모두 보기