YOLO 모델을 Intel OpenVino 으로 최적화하고 Intel 의 AI PC에서 실시간 추론을 실행하는 방법에 대한 Dmitriy Pastushenkov와 Adrian Boguszewski의 YOLO 비전 2024 강연을 다시 한 번 살펴보세요.
YOLO 비전 2024( Ultralytics)는 전 세계의 AI 애호가, 개발자, 전문가들이 모여 컴퓨터 비전의 최신 혁신을 탐구하는 연례 하이브리드 행사입니다. YV24는 새로운 혁신에 대해 논의할 수 있는 좋은 기회이자 플랫폼이었습니다. 이 행사에서는 AI 업계의 주요 업체들이 최신 혁신 기술을 소개했습니다. 그중에는 Intel 이 참여하여 새로운 획기적인 AI PC와 Intel OpenVino 의 Ultralytics YOLO 모델과의 통합에 대한 기조연설을 발표했습니다. Ultralytics YOLO11.
이 강연은 LandCover.ai 데이터세트를 공동 집필하고 개발자들에게 Intel의 OpenVINO 툴킷에 대해 교육하는 소프트웨어 에반젤리스트인 Adrian Boguszewski와 산업 자동화 및 AI 분야에서 20년 이상의 경력을 쌓은 AI PC 에반젤리스트인 Dmitriy Pastushenkov가 진행했습니다. 행사에서 Adrian은 "오늘은 Ultralytics 에서 새로운 YOLO 버전을 출시했을 뿐만 아니라 새로운 하드웨어에서 실행되는 이 새로운 모델과 OpenVINO 의 새로운 버전을 소개할 수 있어서 매우 뜻깊은 행사입니다."라고 흥분을 감추지 못했습니다.
이 글에서는 YV24에서 진행된Intel의 강연의 주요 내용을 살펴보고, AI PC인 Intel Core Ultra 200V 시리즈에 대해 자세히 알아보고, OpenVINO 툴킷을 사용하여 Ultralytics YOLO 모델과 통합하는 방법을 소개합니다. 시작해 보겠습니다!
드미트리는 기조연설을 시작하며 기존 AI와 제너레이티브 AI의 주요 차이점에 대해 설명했습니다. 2024년에 이러한 기술과 그 활용 사례가 어떻게 진화할 것인지에 초점을 맞추었습니다. 컴퓨터 비전과 자연어 처리와 같은 전통적인 AI 기술은 포즈 추정, 물체 감지, 음성 인식과 같은 작업에 필수적이었습니다. 그러나 제너레이티브 AI는 챗봇, 텍스트-이미지 생성, 코드 작성, 심지어 텍스트-비디오와 같은 애플리케이션을 포함하는 새로운 AI 기술의 물결을 나타냅니다.
드미트리는 이 둘의 규모 차이를 지적했습니다. 그는 기존 AI 모델은 수백만 개의 파라미터로 구성되지만, 생성형 AI 모델은 훨씬 더 큰 규모로 작동한다고 설명했습니다. 생성형 AI 모델에는 수십억 또는 수조 개의 매개변수가 포함되는 경우가 많기 때문에 훨씬 더 많은 계산 능력이 요구됩니다.
드미트리는 기존 AI 모델과 생성 AI 모델을 효율적으로 실행하는 데 있어 점점 더 커지는 문제를 해결하기 위해 설계된 새로운 하드웨어 솔루션으로 Intel AI PC를 소개했습니다. Intel AI PC는 강력하고 에너지 효율적인 머신입니다. 클라우드 기반 처리 없이도 다양한 AI 모델을 로컬에서 실행할 수 있습니다.
로컬 처리는 민감한 데이터를 비공개로 유지하는 데 도움이 됩니다. AI 모델이 인터넷 연결과 독립적으로 작동할 수 있게 되면 개인정보 보호 및 보안에 대한 업계의 윤리적 우려에 대한 해답을 얻을 수 있습니다.
Intel AI PC의 원동력은 Intel 코어 울트라 200V 시리즈 프로세서입니다. 이 프로세서는 중앙 처리 장치(CPU), 그래픽 처리 장치(GPU), 신경 처리 장치(NPU)의 세 가지 주요 구성 요소를 통합합니다. 각 구성 요소는 다양한 유형의 AI 워크로드를 처리하는 데 특정한 역할을 합니다. CPU 은 빠른 응답이 필요한 소규모의 저지연 작업에 적합하며, GPU 은 AI 모델 실행과 같은 고처리량 작업에 최적화되어 있습니다. 전력 효율을 위해 설계된 NPU는 다음과 같은 모델을 사용한 실시간 물체 감지와 같이 장시간 실행되는 작업에 적합합니다. YOLO11.
CPU 는 최대 5 TOPS(초당 수조 연산), GPU 는 최대 67 TOPS를 제공할 수 있으며, NPU는 시스템 리소스를 소모하지 않고 에너지 효율적으로 AI 작업을 지속적으로 실행할 수 있는 방법을 제공한다고 강조했습니다.
Intel 코어 울트라 200V 시리즈 프로세서는 NPU, CPU, GPU 의 세 가지 AI 엔진을 모두 하나의 작은 칩에 통합했습니다. 성능 저하 없이 노트북과 같은 소형 디바이스에 완벽하게 적합한 디자인입니다.
프로세서에는 내장 RAM도 포함되어 있어 별도의 그래픽 카드가 필요하지 않습니다. 따라서 전력 사용량을 줄이고 디바이스를 컴팩트하게 유지할 수 있습니다. 드미트리는 프로세서의 유연성도 강조했습니다. 사용자는 작업에 따라 CPU, GPU, 또는 NPU에서 AI 모델을 실행할지 여부를 결정할 수 있습니다. 예를 들어, YOLO11 모델을 사용한 물체 감지는 이러한 엔진 중 하나에서 실행할 수 있지만, 텍스트-이미지 생성처럼 더 복잡한 작업은 GPU 과 NPU를 동시에 사용하여 성능을 향상시킬 수 있습니다.
프레젠테이션 도중 드미트리는 주머니에서 칩을 꺼내어 이 칩이 고급 AI 작업을 처리할 수 있음에도 불구하고 실제로는 얼마나 작은지 모두에게 보여줬습니다. Intel 이 어떻게 휴대가 간편하고 실용적인 기기에 강력한 AI 기능을 구현하는지 보여줄 수 있는 재미있고 기억에 남는 시간이었습니다.
Intel 의 최신 하드웨어 발전을 소개한 후, Dmitriy는 AI를 지원하는 Intel 의 소프트웨어 스택으로 자리를 옮겼습니다. OpenVINO , Intel의 오픈 소스 프레임워크를 소개하며 다양한 기기에서 AI 모델을 효율적으로 최적화하고 배포할 수 있도록 설계되었습니다. OpenVINO 는 시각적 작업을 넘어 자연어 처리, 오디오 처리, 트랜스포머 등에 사용되는 AI 모델까지 지원을 확장합니다.
OpenVINO 와 같은 인기 플랫폼과 호환됩니다. PyTorch, TensorFlow, 및 ONNX와 같은 인기 플랫폼과 호환되며 개발자는 워크플로에 쉽게 통합할 수 있습니다. 그가 주목한 핵심 기능 중 하나는 바로 정량화입니다. 정량화는 모델 가중치를 압축하여 크기를 줄여 클라우드 없이도 로컬 디바이스에서 대형 모델을 원활하게 실행할 수 있도록 합니다. OpenVINO 는 여러 프레임워크에서 작동하며 CPU, GPU, NPU, FPGA, 심지어 ARM 디바이스에서 실행되고 Windows, Linux, macOS를 지원합니다. Dmitriy는 또한 OpenVINO 을 시작하는 것이 얼마나 쉬운지 청중에게 안내했습니다.
강연의 두 번째 파트에서는 Ultralytics YOLO 모델과 Intel의 OpenVINO 툴킷을 원활하게 통합하여 YOLO 모델 배포 프로세스를 간소화하는 방법을 설명하는 Adrian에게 마이크가 넘어갔습니다. 그는 Ultralytics Python 패키지를 사용하여 YOLO 모델을 OpenVINO 형식으로 내보내는 것이 얼마나 빠르고 간단한지 단계별로 설명했습니다. 이러한 통합을 통해 개발자는 Intel 하드웨어에 맞게 모델을 훨씬 쉽게 최적화하고 두 플랫폼을 최대한 활용할 수 있습니다.
Adrian은 Ultralytics YOLO 모델이 학습되면 사용자가 몇 가지 간단한 명령줄 플래그를 사용하여 모델을 내보낼 수 있음을 보여주었습니다. 예를 들어, 사용자는 모델을 부동소수점 버전으로 내보내 정밀도를 극대화할지 아니면 양자화 버전으로 내보내 속도와 효율성을 높일지 지정할 수 있습니다. 또한 개발자가 INT8 정량화와 같은 옵션을 사용하여 정확도를 크게 떨어뜨리지 않으면서도 성능을 향상시킬 수 있도록 코드를 통해 이 프로세스를 직접 관리할 수 있는 방법도 강조했습니다.
Intel 팀은 이 모든 이론을 실제로 적용하여, 물체를 감지하는 실시간 데모를 YOLO11Intel 를 실행하여 실시간 물체 감지 데모를 선보였습니다. Adrian은 부동 소수점 모델을 사용하는 CPU 에서 초당 36프레임(FPS), 통합된 GPU 에서 100 FPS 이상, INT8 양자화 버전에서는 70 FPS를 달성하여 시스템이 다양한 프로세서에서 모델을 처리하는 방법을 보여주었습니다. 이를 통해 Intel AI PC가 복잡한 AI 작업을 얼마나 효율적으로 관리할 수 있는지 보여줄 수 있었습니다.
그는 또한 시스템이 모든 데이터 또는 비디오 프레임을 미리 사용할 수 있는 작업의 경우 CPU, GPU, NPU를 함께 사용하여 모델을 병렬로 실행할 수 있다고 지적했습니다. 이는 비디오와 같이 부하가 많은 작업을 처리할 때 유용합니다. 이 시스템은 워크로드를 여러 프로세서로 분할하여 더 빠르고 효율적으로 처리할 수 있습니다.
끝으로 Adrian은 사용자들이 집에서 인원 계산 및 지능형 대기열 관리와 같은 솔루션을 포함한 데모를 사용해 볼 수 있다고 언급했습니다. 그런 다음 그는 사용자가 GPU 에서 실시간으로 꿈과 같은 이미지를 생성하는 프롬프트를 입력하는 보너스 데모를 보여주었습니다. 이 데모는 전통적인 AI 작업과 창의적이고 생성적인 AI 프로젝트 모두에 대한 Intel AI PC의 다용도성을 보여주었습니다.
이번 행사에서 Intel 는 부스를 마련하여 Intel AI PC에서 실행되는 YOLO11 을 사용한 실시간 물체 감지 데모를 선보였습니다. 참석자들은 OpenVINO 로 최적화되고 Intel 코어 울트라 200V 프로세서에 배포된 이 모델이 실제로 작동하는 모습을 직접 볼 수 있었습니다.
Intel 부스에서 Dmitry는 " YOLO Vision에 처음 참석했는데 마드리드에 오게 되어 기쁩니다. 저희는 Ultralytics 의 YOLO11 모델을 선보이고 있으며, Intel 코어 울트라 200V 프로세서에서 실행됩니다. 이 모델은 뛰어난 성능을 보여주며, 저희는 OpenVINO 을 사용하여 모델을 최적화하고 배포합니다. Ultralytics 와 협력하여 최신 Intel 하드웨어에서 CPU, GPU, NPU를 활용하여 모델을 실행하는 것은 매우 쉬웠습니다." 부스에서는 참석자들이 가져갈 수 있는 티셔츠와 노트북 등 재미있는 경품도 제공했습니다.
Intel의 기술 강연에서는 Intel 코어 울트라 200V 시리즈 프로세서가 포함된 YV24에서 OpenVINO 툴킷이 Ultralytics YOLO11 과 같은 AI 모델을 최적화하는 방법을 선보였습니다. 이 통합을 통해 사용자는 자신의 장치에서 직접 YOLO 모델을 실행하여 물체 감지와 같은 컴퓨터 비전 작업에 뛰어난 성능을 제공할 수 있습니다. 가장 큰 장점은 사용자가 클라우드 서비스에 의존할 필요가 없다는 것입니다.
개발자와 AI 애호가는 YOLO 모델을 손쉽게 실행하고 미세 조정하여 실시간 애플리케이션에 CPU, GPU, NPU와 같은 하드웨어를 완벽하게 활용할 수 있습니다. Intel OpenVINO 툴킷은 Ultralytics YOLO 모델과 결합하여 개인 디바이스에 고급 AI 기능을 바로 적용할 수 있는 새로운 가능성을 열어 다양한 산업에서 AI 혁신을 주도하고자 하는 개발자에게 이상적인 옵션이 될 수 있습니다.
협업하고 혁신합시다! GitHub 리포지토리를 방문하여 저희의 기여를 살펴보고 커뮤니티에 참여하세요. 제조 및 의료와 같은 산업에서 AI를 사용하여 어떻게 영향력을 발휘하고 있는지 알아보세요.