녹색 확인
링크가 클립보드에 복사됨

Hugging Face 오픈 소스 도구로 CV 프로젝트 강화하기

Hugging Face오픈소스 도구가 AI 개발을 어떻게 발전시키고 있는지 살펴보는 YOLO 비전 2024의 기조 강연을 다시 한 번 살펴보세요.

올바른 알고리즘을 선택하는 것은 영향력 있는 컴퓨터 비전 솔루션을 구축하는 데 있어 한 부분일 뿐입니다. AI 엔지니어는 종종 대규모 데이터 세트로 작업하고, 특정 작업에 맞게 모델을 미세 조정하며, 실제 성능을 위해 AI 시스템을 최적화합니다. AI 애플리케이션이 더욱 빠르게 채택됨에 따라 이러한 프로세스를 간소화하는 도구에 대한 필요성도 커지고 있습니다.

Ultralytics 주최하는 연례 하이브리드 이벤트인 YOLO 비전 2024(YV24)에서는 AI 전문가와 기술 애호가들이 모여 컴퓨터 비전의 최신 혁신에 대해 논의했습니다. 이 행사에서는 AI 애플리케이션 개발 속도를 높이는 방법 등 다양한 주제에 대한 논의가 활발하게 이루어졌습니다.

이번 행사의 주요 하이라이트는 모델 훈련, 최적화, 배포를 간소화하는 오픈소스 AI 플랫폼인 Hugging Face 대한 기조연설이었습니다. Hugging Face 머신러닝 엔지니어인 파벨 라쿠보브스키(Pavel Lakubovskii)는 이 툴이 이미지에서 물체 감지, 이미지를 여러 그룹으로 분류, 특정 예제에 대한 사전 학습 없이 예측(제로 샷 학습)과 같은 컴퓨터 비전 작업의 워크플로를 개선하는 방법을 공유했습니다.

허깅 Hugging Face 허브는 Ultralytics YOLO11 같은 다양한 AI 및 컴퓨터 비전 모델을 호스팅하고 이에 대한 액세스를 제공합니다. 이 글에서는 Pavel의 강연에서 얻은 핵심 내용을 요약하고 개발자가 Hugging Face오픈 소스 도구를 사용하여 AI 모델을 빠르게 구축하고 배포하는 방법을 살펴봅니다.

그림 1. YV24 무대에 선 파벨.

더 빠른 AI 개발을 지원하는 Hugging Face 허브

파벨은 다양한 애플리케이션을 위해 사전 학습된 모델을 제공하는 오픈소스 AI 플랫폼인 Hugging Face 소개하는 것으로 강연을 시작했습니다. 이러한 모델은 자연어 처리(NLP), 컴퓨터 비전, 멀티모달 AI 등 다양한 AI 분야를 위해 설계되어 시스템이 텍스트, 이미지, 오디오 등 다양한 유형의 데이터를 처리할 수 있도록 지원합니다.

Pavel은 Hugging Face Hub에 현재 100만 개 이상의 모델이 호스팅되어 있으며, 개발자는 특정 프로젝트에 적합한 모델을 쉽게 찾을 수 있다고 언급했습니다. Hugging Face 모델 훈련, 미세 조정 및 배포를 위한 도구를 제공하여 AI 개발을 간소화하는 것을 목표로 합니다. 개발자가 다양한 모델을 실험해 볼 수 있으므로 AI를 실제 애플리케이션에 통합하는 과정이 간소화됩니다.

처음에는 NLP로 유명했지만, 이후 컴퓨터 비전과 멀티모달 AI로 확장하여 개발자가 더 광범위한 AI 작업을 처리할 수 있도록 지원하고 있습니다. 또한 개발자들이 포럼, Discord, GitHub를 통해 협업하고 인사이트를 공유하며 지원을 받을 수 있는 강력한 커뮤니티를 보유하고 있습니다.

컴퓨터 비전 애플리케이션을 위한 Hugging Face 모델 살펴보기

파벨은 Hugging Face도구로 컴퓨터 비전 애플리케이션을 더 쉽게 구축할 수 있는 방법에 대해 자세히 설명했습니다. 개발자는 이미지 분류, 물체 감지, 비전 언어 애플리케이션과 같은 작업에 이 도구를 사용할 수 있습니다.

그는 또한 이러한 컴퓨터 비전 작업 중 상당수는 Hugging Face 허브에서 제공되는 사전 훈련된 모델을 사용하여 처리할 수 있으므로 처음부터 훈련할 필요가 없어 시간을 절약할 수 있다고 지적했습니다. 실제로 Hugging Face 음식 분류, 애완동물 분류, 감정 감지 등 이미지 분류 작업을 위해 13,000개 이상의 사전 학습된 모델을 제공합니다.

그는 이러한 모델의 접근성을 강조하면서 "프로젝트를 위해 모델을 교육할 필요도 없이 커뮤니티의 누군가가 이미 교육한 모델을 허브에서 찾을 수 있을 것"이라고 말했습니다. 

물체 감지를 위한 Hugging Face 모델 

파벨은 또 다른 예를 들어 Hugging Face 이미지 내에서 물체를 식별하고 위치를 파악하는 데 사용되는 컴퓨터 비전의 핵심 기능인 물체 감지에 어떻게 도움이 되는지 자세히 설명했습니다. 레이블이 지정된 데이터가 제한되어 있더라도 허깅 Hugging Face 허브에서 제공되는 사전 학습된 모델을 사용하면 물체 감지를 보다 효율적으로 수행할 수 있습니다. 

또한 이 작업을 위해 구축된 몇 가지 모델에 대한 간략한 개요를 Hugging Face 확인할 수 있습니다:

  • 실시간 객체 감지 모델: 속도가 중요한 동적 환경의 경우 감지 트랜스포머(DETR)와 같은 모델이 실시간 객체 감지 기능을 제공합니다. DETR은 COCO 데이터 세트에 대해 학습되며 멀티스케일 기능을 효율적으로 처리하도록 설계되어 시간에 민감한 애플리케이션에 적합합니다.
  • 비전 언어 모델: 이러한 모델은 이미지와 텍스트 처리를 결합하여 AI 시스템이 이미지와 설명을 일치시키거나 학습 데이터 이상의 사물을 인식할 수 있게 해줍니다. 예를 들어 CLIP과 SigLIP은 텍스트를 시각적 이미지에 연결하여 이미지 검색을 개선하고 AI 솔루션이 문맥을 이해하여 새로운 물체를 식별할 수 있게 해줍니다.
  • 제로샷 물체 감지 모델: 이미지와 텍스트 사이의 관계를 이해하여 이전에 보지 못한 물체를 식별할 수 있습니다. 예를 들어, 제로 샷 학습을 사용하여 레이블이 지정된 학습 데이터 없이도 새로운 물체를 감지하는 OwlVit, GroundingDINO 및 OmDet이 있습니다.

Hugging Face 모델 사용 방법

그런 다음 Pavel은 Hugging Face 모델을 직접 사용해 보는 데 초점을 맞추면서 개발자가 모델을 활용할 수 있는 세 가지 방법, 즉 모델 탐색, 신속한 테스트, 추가 사용자 지정에 대해 설명했습니다.

그는 개발자가 코드를 작성하지 않고도 Hugging Face 허브에서 직접 모델을 탐색하여 대화형 인터페이스를 통해 모델을 즉시 쉽게 테스트할 수 있는 방법을 시연했습니다. "코드를 한 줄도 작성하거나 컴퓨터에 모델을 다운로드하지 않고도 시도해 볼 수 있습니다."라고 Pavel은 덧붙였습니다. 일부 모델은 크기가 크기 때문에 허브에서 실행하면 스토리지 및 처리 제한을 피할 수 있습니다.

그림 2. Hugging Face 모델 사용 방법.

또한, Hugging Face Inference API를 사용하면 개발자는 간단한 API 호출로 AI 모델을 실행할 수 있습니다. 복잡한 설정 없이도 빠른 테스트, 개념 증명 프로젝트, 신속한 프로토타입 제작에 유용합니다.

고급 사용 사례를 위해 개발자는 텍스트, 시각 및 오디오 작업을 위해 사전 학습된 모델을 제공하는 동시에 PyTorch TensorFlow 모두 지원하는 오픈 소스 도구인 Hugging Face Transformers 프레임워크를 사용할 수 있습니다. 파벨은 개발자가 단 두 줄의 코드만으로 Hugging Face 허브에서 모델을 검색하고 이미지 프로세서와 같은 전처리 도구에 연결하여 비전 AI 애플리케이션을 위한 이미지 데이터를 분석할 수 있다고 설명합니다.

Hugging Face AI 워크플로 최적화하기

다음으로 파벨은 Hugging Face 통해 AI 워크플로를 간소화하는 방법을 설명했습니다. 그가 다룬 주요 주제 중 하나는 입력 데이터에서 가장 관련성이 높은 부분에 집중하도록 돕는 딥러닝 모델의 핵심 기능인 Transformers의 주의 메커니즘을 최적화하는 것이었습니다. 이는 언어 처리 및 컴퓨터 비전과 관련된 작업의 정확성을 향상시킵니다. 하지만 리소스 집약적일 수 있습니다.

주의 메커니즘을 최적화하면 메모리 사용량을 크게 줄이면서 속도를 향상시킬 수 있습니다. "예를 들어, 보다 효율적인 주의 집중 구현으로 전환하면 최대 1.8배 빠른 성능을 볼 수 있습니다."라고 Pavel은 지적합니다.

Hugging Face 트랜스포머 프레임워크 내에서 보다 효율적인 주의 구현을 위한 기본 지원을 제공합니다. 개발자는 모델을 로드할 때 대체 주의 구현을 지정하기만 하면 이러한 최적화를 활성화할 수 있습니다.

최적 및 Torch 컴파일

그는 또한 성능에 큰 영향을 주지 않으면서 사용하는 숫자의 정밀도를 낮춰 AI 모델을 더 작게 만드는 기술인 양자화에 대해서도 이야기했습니다. 이를 통해 모델은 더 적은 메모리를 사용하고 더 빠르게 실행되므로 스마트폰이나 임베디드 시스템과 같이 처리 능력이 제한된 장치에 더 적합합니다.

효율성을 더욱 향상시키기 위해 파벨은 모델 최적화 및 배포를 위해 설계된 도구 세트인 Hugging Face Optimum 라이브러리를 도입했습니다. 개발자는 단 몇 줄의 코드만으로 양자화 기법을 적용하고 모델을 ONNX (Open Neural Network Exchange)와 같은 효율적인 형식으로 변환하여 클라우드 서버와 엣지 디바이스를 비롯한 다양한 유형의 하드웨어에서 원활하게 실행할 수 있습니다.

그림 3. Pavel이 Optimum 라이브러리와 그 기능에 대해 설명했습니다.

마지막으로 Pavel은 AI 모델이 데이터를 처리하는 방식을 최적화하여 더 빠르고 효율적으로 실행할 수 있도록 하는 PyTorch 기능인 Torch Compile의 이점에 대해 언급했습니다. Hugging Face 트랜스포머와 옵티멈 라이브러리 내에 Torch 컴파일을 통합하여 개발자가 최소한의 코드 변경으로 이러한 성능 개선의 이점을 활용할 수 있도록 지원합니다. 

Torch 컴파일은 모델의 계산 구조를 최적화함으로써 정확도나 품질 저하 없이 추론 시간을 단축하고 프레임 속도를 초당 29프레임에서 150프레임으로 높일 수 있습니다.

Hugging Face 도구로 모델 배포하기

이어서 Pavel은 개발자가 올바른 모델을 선택하고 개발에 가장 적합한 접근 방식을 선택한 후 Hugging Face 도구를 사용하여 비전 AI 모델을 확장하고 배포하는 방법에 대해 간략하게 설명했습니다.

예를 들어, 개발자는 Gradio와 Streamlit을 사용해 대화형 AI 애플리케이션을 배포할 수 있습니다. Gradio를 사용하면 개발자는 머신 러닝 모델을 위한 웹 기반 인터페이스를 만들 수 있으며, Streamlit을 사용하면 간단한 Python 스크립트로 대화형 데이터 애플리케이션을 구축할 수 있습니다. 

또한 파벨은 Hugging Face 제공하는 가이드, 교육 노트, 예제 스크립트를 언급하며 "모든 것을 처음부터 작성할 필요는 없다"고 강조했습니다. 이러한 리소스는 개발자가 모든 것을 처음부터 구축할 필요 없이 빠르게 시작할 수 있도록 도와줍니다.

그림 4. YV24에서 Hugging Face 기능에 대해 논의하는 파벨.

Hugging Face 허브의 이점 

파벨은 기조연설을 마무리하며 Hugging Face 허브 사용의 장점을 요약했습니다. 그는 모델 관리와 협업을 간소화하는 방법을 강조했습니다. 또한 초보자와 전문가 모두 AI 모델을 이해하고 구현하는 데 도움이 되는 가이드, 노트북, 튜토리얼이 제공된다는 점에 주목했습니다.

"허브에는 이미 멋진 공간이 많이 있습니다. 비슷한 것을 찾아 공유 코드를 복제하고, 몇 줄을 수정하고, 모델을 자신만의 것으로 바꾸고, 다시 밀어 넣을 수 있습니다."라고 설명하며 개발자들이 플랫폼의 유연성을 활용하도록 독려했습니다.

주요 요점 

파벨은 YV24 강연에서 Hugging Face AI 모델 훈련, 최적화 및 배포를 지원하는 도구를 제공하는 방법을 공유했습니다. 예를 들어 트랜스포머, 옵티멈, Torch 컴파일과 같은 혁신 기술을 통해 개발자는 모델 성능을 향상시킬 수 있습니다.

AI 모델의 효율성이 높아짐에 따라 정량화 및 엣지 배포의 발전으로 리소스가 제한된 디바이스에서 더 쉽게 실행할 수 있게 되었습니다. 이러한 개선 사항은 Hugging Face 같은 도구 및 Ultralytics YOLO11 같은 고급 컴퓨터 비전 모델과 결합되어 확장 가능한 고성능 비전 AI 애플리케이션을 구축하는 데 핵심적인 역할을 합니다.

성장하는 커뮤니티에 참여하세요! GitHub 리포지토리를 살펴보고 AI에 대해 알아보고, yolo 라이선스를 확인하여 Vision AI 프로젝트를 시작하세요. 의료 분야의 컴퓨터 비전 이나 농업 분야의 컴퓨터 비전과 같은 혁신에 관심이 있으신가요? 솔루션 페이지를 방문하여 자세히 알아보세요!

Facebook 로고트위터 로고LinkedIn 로고복사 링크 기호

이 카테고리에서 자세히 보기

인공지능의 미래
를 함께 만들어 갑시다!

머신 러닝의 미래와 함께하는 여정 시작하기