Tìm hiểu cách sử dụng Ultralytics YOLO11 mô hình để ước tính tư thế chính xác. Chúng tôi sẽ đề cập đến suy luận thời gian thực và đào tạo mô hình tùy chỉnh cho nhiều ứng dụng khác nhau.
Nghiên cứu liên quan đến thị giác máy tính , một nhánh của trí tuệ nhân tạo (AI), có thể bắt nguồn từ những năm 1960. Tuy nhiên, mãi đến những năm 2010, với sự phát triển của học sâu , chúng ta mới thấy những đột phá lớn trong cách máy móc hiểu hình ảnh . Một trong những tiến bộ mới nhất trong thị giác máy tính là các mô hình YOLO11 tiên tiến Ultralytics . Các mô hình YOLO11 , lần đầu tiên được giới thiệu tại Ultralytics ' sự kiện kết hợp thường niên , YOLO Vision 2024 (YV24) , hỗ trợ một loạt các tác vụ thị giác máy tính , bao gồm ước tính tư thế .
Ước tính tư thế có thể được sử dụng để phát hiện các điểm chính trên một người hoặc vật thể trong hình ảnh hoặc video để hiểu vị trí, tư thế hoặc chuyển động của họ. Nó được sử dụng rộng rãi trong các ứng dụng như phân tích thể thao , theo dõi hành vi động vật và robot để giúp máy móc diễn giải các hành động vật lý theo thời gian thực. Nhờ độ chính xác, hiệu quả và tốc độ được cải thiện so với các mô hình trước đó trong sê-ri YOLO (Bạn chỉ nhìn một lần) , YOLO11 rất phù hợp cho các tác vụ ước tính tư thế theo thời gian thực .
Trong bài viết này, chúng ta sẽ khám phá pose estimate là gì, thảo luận về một số ứng dụng của nó và hướng dẫn cách bạn có thể sử dụng YOLO11 với gói Ultralytics Python để ước tính pose estimate. Chúng ta cũng sẽ xem xét cách bạn có thể sử dụng Ultralytics HUB để thử nghiệm YOLO11 và ước tính tư thế chỉ bằng vài cú nhấp chuột đơn giản. Hãy bắt đầu nào!
Trước khi tìm hiểu cách sử dụng mô hình Ultralytics YOLO11 mới để ước tính tư thế, chúng ta hãy hiểu rõ hơn về ước tính tư thế.
Ước tính tư thế là một kỹ thuật thị giác máy tính được sử dụng để phân tích tư thế của một người hoặc vật thể trong hình ảnh hoặc video. Các mô hình học sâu như YOLO11 có thể xác định, định vị và theo dõi các điểm chính trên một vật thể hoặc người nhất định. Đối với các vật thể, các điểm chính này có thể bao gồm các góc, cạnh hoặc các dấu hiệu bề mặt riêng biệt, trong khi đối với con người, các điểm chính này đại diện cho các khớp chính như khuỷu tay, đầu gối hoặc vai.
Ước tính tư thế là duy nhất và phức tạp hơn khi so sánh với các tác vụ thị giác máy tính khác như phát hiện đối tượng . Trong khi phát hiện đối tượng định vị các đối tượng trong hình ảnh bằng cách vẽ một hộp xung quanh chúng, ước tính tư thế tiến xa hơn bằng cách dự đoán vị trí chính xác của các điểm chính trên đối tượng.
Khi nói đến ước tính tư thế, có hai cách chính hoạt động: từ dưới lên và từ trên xuống. Cách tiếp cận từ dưới lên phát hiện các điểm chính riêng lẻ và nhóm chúng thành bộ xương, trong khi cách tiếp cận từ trên xuống tập trung vào việc phát hiện các đối tượng trước rồi ước tính các điểm chính trong đó.
YOLO11 kết hợp điểm mạnh của cả phương pháp từ trên xuống và từ dưới lên. Giống như phương pháp từ dưới lên, nó giúp mọi thứ đơn giản và nhanh chóng mà không cần phải nhóm các điểm chính theo cách thủ công. Đồng thời, nó sử dụng độ chính xác của phương pháp từ trên xuống bằng cách phát hiện mọi người và ước tính tư thế của họ trong một bước duy nhất.
Khả năng đa dạng của YOLO11 để ước tính tư thế mở ra một loạt các ứng dụng khả thi trong nhiều ngành công nghiệp. Chúng ta hãy xem xét kỹ hơn một số trường hợp sử dụng ước tính tư thế của YOLO11 .
An toàn là một khía cạnh quan trọng của bất kỳ dự án xây dựng nào . Điều này đặc biệt đúng, vì theo thống kê, các công trường xây dựng chứng kiến số lượng thương tích liên quan đến công việc cao hơn. Vào năm 2021, khoảng 20% trong số tất cả các trường hợp tử vong liên quan đến công việc xảy ra tại hoặc gần các công trường xây dựng. Với những rủi ro hàng ngày như thiết bị nặng và hệ thống điện, các biện pháp an toàn mạnh mẽ là điều cần thiết để đảm bảo an toàn cho người lao động. Các phương pháp truyền thống như sử dụng biển báo, rào chắn và giám sát thủ công của giám sát viên không phải lúc nào cũng hiệu quả và thường khiến giám sát viên không thể thực hiện các nhiệm vụ quan trọng hơn.
AI có thể can thiệp để cải thiện an toàn và rủi ro tai nạn có thể được giảm thiểu bằng cách sử dụng hệ thống giám sát công nhân dựa trên ước tính tư thế. Các mô hình Ultralytics YOLO11 có thể được sử dụng để theo dõi chuyển động và tư thế của công nhân. Bất kỳ mối nguy hiểm tiềm ẩn nào như công nhân đứng quá gần thiết bị nguy hiểm hoặc thực hiện nhiệm vụ không đúng cách đều có thể được phát hiện nhanh chóng. Nếu phát hiện ra rủi ro, có thể thông báo cho người giám sát hoặc báo động có thể cảnh báo công nhân. Hệ thống giám sát liên tục có thể giúp các công trường xây dựng an toàn hơn bằng cách luôn để mắt đến các mối nguy hiểm và bảo vệ công nhân .
Nông dân và các nhà nghiên cứu có thể sử dụng YOLO11 để nghiên cứu chuyển động và hành vi của động vật trang trại , như gia súc, để phát hiện các dấu hiệu sớm của bệnh tật như bệnh què. Bệnh què là tình trạng mà động vật gặp khó khăn khi di chuyển bình thường do đau ở chân hoặc bàn chân. Ở gia súc, các bệnh như bệnh què không chỉ ảnh hưởng đến sức khỏe và phúc lợi của chúng mà còn dẫn đến các vấn đề về sản xuất tại các trang trại bò sữa. Các nghiên cứu cho thấy bệnh què ảnh hưởng đến 8% gia súc trong các hệ thống chăn thả và 15% đến 30% trong các hệ thống hạn chế trên toàn ngành công nghiệp sữa toàn cầu. Phát hiện và giải quyết bệnh què sớm có thể giúp cải thiện phúc lợi động vật và giảm tổn thất sản xuất liên quan đến tình trạng này.
YOLO11 Các tính năng ước tính tư thế có thể giúp nông dân theo dõi các kiểu dáng đi của động vật và nhanh chóng xác định bất kỳ bất thường nào có thể báo hiệu các vấn đề sức khỏe, chẳng hạn như các vấn đề về khớp hoặc nhiễm trùng. Phát hiện sớm các vấn đề này cho phép điều trị nhanh hơn , giảm sự khó chịu của động vật và giúp nông dân tránh được tổn thất kinh tế.
Hệ thống giám sát hỗ trợ Vision AI cũng có thể giúp phân tích hành vi nghỉ ngơi, tương tác xã hội và kiểu ăn uống. Người nông dân cũng có thể sử dụng ước tính tư thế để quan sát các dấu hiệu căng thẳng hoặc hung dữ. Những hiểu biết này có thể được sử dụng để tạo ra điều kiện sống tốt hơn cho động vật và tăng cường sức khỏe của chúng.
Ước tính tư thế cũng có thể giúp mọi người cải thiện tư thế của mình theo thời gian thực trong khi tập luyện. Với YOLO11 , các huấn luyện viên thể dục và yoga có thể theo dõi và giám sát các chuyển động cơ thể của những người đang tập luyện, tập trung vào các điểm chính như khớp và chân tay để đánh giá tư thế của họ. Dữ liệu thu thập được có thể được so sánh với các tư thế và kỹ thuật tập luyện lý tưởng, và các huấn luyện viên có thể nhận được cảnh báo nếu ai đó thực hiện động tác không đúng cách, giúp ngăn ngừa chấn thương.
Ví dụ, trong lớp yoga, ước tính tư thế có thể giúp theo dõi xem tất cả học viên có duy trì được sự cân bằng và căn chỉnh phù hợp hay không. Các ứng dụng di động tích hợp với tầm nhìn máy tính và ước tính tư thế có thể giúp những người tập luyện tại nhà hoặc những người không có huấn luyện viên cá nhân dễ tiếp cận thể dục hơn . Phản hồi liên tục theo thời gian thực này giúp người dùng cải thiện kỹ thuật và đạt được mục tiêu thể dục của mình đồng thời giảm nguy cơ chấn thương.
Bây giờ chúng ta đã khám phá ước tính tư thế là gì và thảo luận về một số ứng dụng của nó. Hãy cùng xem cách bạn có thể thử ước tính tư thế với YOLO11 mô hình. Để bắt đầu, có hai cách thuận tiện để thực hiện việc này: sử dụng Ultralytics Python gói hoặc thông qua Ultralytics HUB . Chúng ta hãy xem xét cả hai tùy chọn.
Chạy một suy luận liên quan đến YOLO11 mô hình xử lý dữ liệu mới bên ngoài các tập huấn luyện của nó và sử dụng các mẫu mà nó học được để đưa ra dự đoán dựa trên dữ liệu đó. Bạn có thể chạy suy luận thông qua mã với Ultralytics Python gói. Tất cả những gì bạn cần làm để bắt đầu là cài đặt Ultralytics gói sử dụng pip, conda hoặc Docker. Nếu bạn gặp bất kỳ thách thức nào trong quá trình cài đặt, Hướng dẫn về các sự cố thường gặp của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích.
Sau khi cài đặt gói thành công, đoạn mã sau sẽ phác thảo cách tải mô hình và sử dụng mô hình đó để dự đoán tư thế của các đối tượng trong hình ảnh.
Giả sử bạn đang làm việc trên một dự án thị giác máy tính và bạn có một tập dữ liệu cụ thể cho một ứng dụng cụ thể liên quan đến ước tính tư thế. Sau đó, bạn có thể tinh chỉnh và đào tạo một mô hình YOLO11 tùy chỉnh để phù hợp với ứng dụng của mình. Ví dụ, bạn có thể sử dụng một tập dữ liệu các điểm chính để phân tích và hiểu tư thế của một con hổ trong hình ảnh bằng cách xác định các đặc điểm chính như vị trí của các chi, đầu và đuôi của nó.
Bạn có thể sử dụng đoạn mã sau để tải và đào tạo YOLO11 mô hình ước tính tư thế. Mô hình có thể được xây dựng từ cấu hình YAML hoặc bạn có thể tải mô hình được đào tạo trước để đào tạo. Tập lệnh này cũng cho phép bạn chuyển trọng số và bắt đầu đào tạo mô hình bằng cách sử dụng một tập dữ liệu được chỉ định, chẳng hạn như tập dữ liệu COCO để ước tính tư thế.
Sử dụng mô hình tùy chỉnh mới được đào tạo, bạn có thể chạy suy luận trên các hình ảnh chưa thấy liên quan đến giải pháp thị giác máy tính của bạn. Mô hình đã đào tạo cũng có thể được chuyển đổi sang các định dạng khác bằng chế độ xuất .
Cho đến nay, chúng ta đã xem xét các phương pháp để sử dụng YOLO11 yêu cầu một số kiến thức cơ bản về mã hóa. Nếu đó không phải là những gì bạn đang tìm kiếm hoặc bạn không quen với mã hóa, thì có một lựa chọn khác: Ultralytics HUB . Ultralytics HUB là một nền tảng thân thiện với người dùng được thiết kế để đơn giản hóa quá trình đào tạo và triển khai YOLO mô hình. HUB cho phép bạn dễ dàng quản lý tập dữ liệu, đào tạo mô hình và triển khai chúng mà không cần chuyên môn kỹ thuật.
Để chạy suy luận trên hình ảnh, bạn có thể tạo một tài khoản , điều hướng đến phần 'Mô hình' và chọn YOLO11 mô hình ước tính tư thế mà bạn quan tâm. Trong phần xem trước, bạn có thể tải lên hình ảnh và xem kết quả dự đoán như hiển thị bên dưới.
Ultralytics YOLO11 cung cấp các giải pháp chính xác và linh hoạt cho các nhiệm vụ như ước tính tư thế trên nhiều ứng dụng. Từ việc cải thiện sự an toàn của công nhân tại các công trường xây dựng đến theo dõi sức khỏe vật nuôi và hỗ trợ điều chỉnh tư thế trong các thói quen tập thể dục, YOLO11 mang lại độ chính xác và phản hồi thời gian thực thông qua công nghệ thị giác máy tính tiên tiến.
Tính linh hoạt của nó, với nhiều biến thể mô hình và khả năng tùy chỉnh đào tạo cho các trường hợp sử dụng cụ thể, làm cho nó trở thành một công cụ rất có giá trị cho cả nhà phát triển và doanh nghiệp. Cho dù thông qua mã hóa với Ultralytics Python gói hoặc sử dụng Ultralytics HUB để thực hiện dễ dàng hơn, YOLO11 giúp việc ước tính tư thế trở nên dễ dàng và có tác động.
Để khám phá thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong sản xuất và nông nghiệp trên các trang giải pháp của chúng tôi. 🚀
Bắt đầu hành trình của bạn với tương lai của machine learning