Hiểu cách Ultralytics YOLO11 có thể tăng cường khả năng phát hiện đối tượng bằng cách sử dụng hộp giới hạn định hướng (OBB) và ứng dụng nào là lý tưởng cho tác vụ thị giác máy tính này.
Ultralytics ' sự kiện kết hợp thường niên , YOLO Vision 2024 (YV24) , tập trung vào việc thảo luận về những đột phá mới nhất trong AI và thị giác máy tính . Đây là dịp hoàn hảo để giới thiệu mô hình mới nhất của chúng tôi, Ultralytics YOLO11 . Mô hình này hỗ trợ các tác vụ thị giác máy tính giống như Ultralytics YOLOv8 , giúp người dùng dễ dàng chuyển sang mô hình mới.
Giả sử bạn đang sử dụng YOLOv8 để phát hiện đối tượng hộp giới hạn định hướng (OBB) để phát hiện đối tượng từ nhiều góc độ khác nhau. Bây giờ bạn có thể chuyển sang YOLO11 với một vài thay đổi nhỏ đối với mã của bạn và hưởng lợi từ những cải tiến của YOLO11 , từ độ chính xác và hiệu quả tăng lên đến tốc độ xử lý. Trong trường hợp bạn chưa sử dụng các mô hình như YOLO11 , phát hiện OBB là một ví dụ tuyệt vời về cách YOLO11 có thể được áp dụng trong nhiều ngành công nghiệp, cung cấp các giải pháp thực tế tạo ra tác động thực sự.
Trong bài viết này, chúng ta sẽ xem xét phát hiện đối tượng OBB là gì , nơi nó có thể được áp dụng và cách sử dụng YOLO11 để phát hiện OBB. Chúng tôi cũng sẽ hướng dẫn cách YOLO11 Các tính năng mới của có thể cải thiện các quy trình này cũng như cách chạy suy luận và đào tạo các mô hình tùy chỉnh để tận dụng tối đa khả năng phát hiện OBB của nó.
Phát hiện đối tượng OBB đưa phát hiện đối tượng truyền thống tiến thêm một bước nữa bằng cách phát hiện đối tượng ở các góc khác nhau. Không giống như các hộp giới hạn thông thường luôn thẳng hàng với trục của hình ảnh, OBB xoay để phù hợp với hướng của đối tượng. Phát hiện đối tượng OBB có thể được sử dụng để phân tích hình ảnh trên không hoặc vệ tinh khi đối tượng không phải lúc nào cũng thẳng. Trong các ngành như quy hoạch đô thị, năng lượng và giao thông , khả năng phát hiện chính xác các đối tượng có góc như tòa nhà, phương tiện hoặc cơ sở hạ tầng có thể hình thành nền tảng cho các ứng dụng thị giác máy tính với những lợi ích hữu hình.
YOLO11 hỗ trợ phát hiện OBB và được đào tạo trên tập dữ liệu DOTA v1.0 để phát hiện các vật thể như máy bay , tàu và bồn chứa từ các góc nhìn khác nhau. YOLO11 có một số biến thể mô hình để phù hợp với các nhu cầu khác nhau, bao gồm YOLO11n-obb (Nano), YOLO11s-obb (Nhỏ), YOLO11m-obb (Trung bình), YOLO11l-obb (Lớn) và YOLO11x-obb (Cực lớn). Mỗi mô hình cung cấp một kích thước khác nhau, với các mức tốc độ, độ chính xác và sức mạnh tính toán khác nhau. Người dùng có thể chọn mô hình cung cấp sự cân bằng phù hợp giữa tốc độ và độ chính xác cho ứng dụng của họ.
YOLO11 Khả năng phát hiện đối tượng của ', đặc biệt là hỗ trợ của nó cho các hộp giới hạn định hướng, mang lại độ chính xác cao hơn cho nhiều ngành công nghiệp khác nhau. Tiếp theo, chúng ta sẽ xem xét một vài ví dụ về cách YOLO11 và phát hiện OBB có thể được sử dụng trong các tình huống thực tế để làm cho các quy trình hiệu quả hơn, chính xác hơn và dễ quản lý hơn trong các lĩnh vực khác nhau.
Nếu bạn từng ngưỡng mộ thiết kế và bố cục của một thành phố , thì đó là nhờ vào công tác quy hoạch đô thị và giám sát cơ sở hạ tầng chi tiết. Một trong nhiều khía cạnh của giám sát cơ sở hạ tầng là xác định và quản lý các công trình quan trọng như bể chứa, đường ống và khu công nghiệp . YOLO11 có thể giúp các nhà quy hoạch thành phố phân tích hình ảnh trên không để phát hiện các thành phần quan trọng này một cách nhanh chóng và chính xác.
Phát hiện đối tượng hộp giới hạn định hướng đặc biệt hữu ích ở đây vì nó cho phép phát hiện các đối tượng được nhìn từ nhiều góc độ khác nhau (thường là trường hợp với hình ảnh trên không). Độ chính xác rất quan trọng ở đây để theo dõi các khu công nghiệp, quản lý tác động môi trường và đảm bảo cơ sở hạ tầng được bảo trì đúng cách. OBB làm cho quá trình phát hiện đáng tin cậy hơn, giúp các nhà quy hoạch đưa ra quyết định sáng suốt về sự phát triển, an toàn và tính bền vững của thành phố. Sử dụng YOLO11 , có thể giúp các nhà quy hoạch theo dõi và quản lý cơ sở hạ tầng giúp thành phố vận hành trơn tru.
Khi năng lượng tái tạo và các sáng kiến như trang trại năng lượng mặt trời trở nên phổ biến hơn, việc kiểm tra thường xuyên trở nên quan trọng hơn. Các tấm pin mặt trời cần được kiểm tra để đảm bảo chúng hoạt động hiệu quả. Theo thời gian, những thứ như vết nứt , bụi bẩn tích tụ hoặc sai lệch có thể làm giảm hiệu suất của chúng. Các cuộc kiểm tra thường xuyên giúp phát hiện sớm các vấn đề này, do đó có thể bảo trì để chúng hoạt động trơn tru.
Ví dụ, các tấm pin mặt trời có thể được kiểm tra hư hỏng bằng máy bay không người lái được tích hợp với AI biên và YOLO11 . Phân tích hình ảnh ở rìa mang lại độ chính xác và hiệu quả hơn cho quá trình kiểm tra. Do chuyển động và góc nhìn của máy bay không người lái, cảnh quay giám sát thường có thể chụp các tấm pin mặt trời từ nhiều góc độ khác nhau. Trong những trường hợp này, YOLO11 Tính năng phát hiện OBB có thể giúp máy bay không người lái xác định chính xác các tấm pin mặt trời.
Các cảng và bến cảng xử lý hàng trăm tàu mỗi tuần và việc quản lý một đội tàu lớn như vậy có thể là một thách thức. Một yếu tố khó khăn nữa là khi phân tích tàu trong hình ảnh trên không ; các tàu thường xuất hiện ở các góc độ khác nhau. Đây chính là lúc hỗ trợ phát hiện OBB của YOLO11 trở nên hữu ích.
Phát hiện OBB giúp mô hình có thể phát hiện tàu ở nhiều góc độ chính xác hơn so với các hộp chữ nhật tiêu chuẩn. Bằng cách sử dụng YOLO11 Với OBB, các công ty vận chuyển có thể dễ dàng xác định vị trí và tình trạng của đội tàu, theo dõi các chi tiết quan trọng như chuyển động của đội tàu và hậu cần chuỗi cung ứng . Các giải pháp hỗ trợ tầm nhìn như vậy giúp tối ưu hóa các tuyến đường, giảm sự chậm trễ và cải thiện quản lý đội tàu nói chung trên các tuyến vận chuyển.
Nếu bạn là một nhà phát triển AI đang muốn sử dụng YOLO11 để phát hiện OBB, có hai tùy chọn dễ dàng để bắt đầu. Nếu bạn thoải mái làm việc với mã, gói Python Ultralytics là một lựa chọn tuyệt vời. Nếu bạn thích giải pháp thân thiện với người dùng, không cần mã với khả năng đào tạo đám mây, Ultralytics HUB là nền tảng nội bộ được thiết kế dành riêng cho mục đích đó. Để biết thêm chi tiết, bạn có thể xem hướng dẫn của chúng tôi về đào tạo và triển khai Ultralytics YOLO11 bằng Ultralytics TRUNG TÂM.
Bây giờ chúng ta đã thấy những ví dụ về nơi YOLO11 Hỗ trợ OBB có thể được áp dụng, chúng ta hãy cùng khám phá Ultralytics Python gói và xem cách bạn có thể chạy suy luận và đào tạo các mô hình tùy chỉnh bằng cách sử dụng nó.
Đầu tiên, sử dụng YOLO11 với Python , bạn sẽ cần phải cài đặt Ultralytics package. Tùy thuộc vào sở thích của bạn, bạn có thể chọn cài đặt bằng pip, conda hoặc Docker. Để biết hướng dẫn từng bước, bạn có thể tham khảo Hướng dẫn cài đặt Ultralytics của chúng tôi. Nếu bạn gặp bất kỳ khó khăn nào trong quá trình cài đặt, Hướng dẫn sự cố thường gặp của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích.
Sau khi bạn đã cài đặt Ultralytics gói, làm việc với YOLO11 cực kỳ đơn giản. Chạy suy luận đề cập đến quá trình sử dụng mô hình đã được đào tạo để đưa ra dự đoán về hình ảnh mới - như phát hiện vật thể bằng OBB theo thời gian thực. Nó khác với đào tạo mô hình , tức là khi bạn dạy mô hình nhận dạng vật thể mới hoặc cải thiện hiệu suất của mô hình trên các tác vụ cụ thể. Suy luận được sử dụng khi bạn muốn áp dụng mô hình vào dữ liệu chưa biết.
Ví dụ bên dưới hướng dẫn bạn cách tải mô hình và sử dụng mô hình đó để dự đoán các hộp giới hạn định hướng trên hình ảnh. Để biết các ví dụ chi tiết hơn và mẹo sử dụng nâng cao, hãy đảm bảo xem tài liệu chính thức Ultralytics để biết các phương pháp hay nhất và hướng dẫn thêm.
Đào tạo một YOLO11 mô hình có nghĩa là bạn có thể tinh chỉnh hiệu suất của nó trên các tập dữ liệu và tác vụ cụ thể, chẳng hạn như phát hiện đối tượng hộp giới hạn định hướng. Trong khi các mô hình được đào tạo trước như YOLO11 có thể được sử dụng để phát hiện đối tượng chung, việc đào tạo một mô hình tùy chỉnh là cần thiết khi bạn cần mô hình phát hiện các đối tượng duy nhất hoặc tối ưu hóa hiệu suất trên một tập dữ liệu cụ thể.
Trong đoạn mã dưới đây, chúng tôi trình bày các bước để đào tạo một YOLO11 mô hình phát hiện OBB.
Đầu tiên, mô hình được khởi tạo bằng cách sử dụng được đào tạo trước YOLO11 Trọng số cụ thể của OBB (yolo11n-obb.pt). Sau đó, một hàm đào tạo được sử dụng để đào tạo mô hình trên một tập dữ liệu tùy chỉnh, với các tham số như tệp cấu hình tập dữ liệu, số chu kỳ đào tạo, kích thước hình ảnh đào tạo và phần cứng để chạy đào tạo (ví dụ: CPU hoặc GPU ). Sau khi đào tạo, hiệu suất của mô hình được xác thực để kiểm tra các số liệu như độ chính xác và độ mất mát.
Sử dụng mô hình đã được đào tạo, bạn có thể chạy suy luận trên hình ảnh mới để phát hiện các đối tượng bằng OBB và trực quan hóa chúng . Ngoài ra, mô hình đã được đào tạo có thể được chuyển đổi sang các định dạng như ONNX để triển khai bằng tính năng xuất .
Ultralytics YOLO11 đưa việc phát hiện đối tượng lên một tầm cao mới với sự hỗ trợ của hộp giới hạn định hướng. Bằng cách có thể phát hiện đối tượng ở các góc độ khác nhau, YOLO11 có thể được sử dụng cho nhiều ứng dụng khác nhau trong nhiều ngành công nghiệp khác nhau. Ví dụ, nó hoàn toàn phù hợp với các ngành công nghiệp như quy hoạch đô thị, năng lượng và vận chuyển, nơi độ chính xác là rất quan trọng đối với các nhiệm vụ như kiểm tra tấm pin mặt trời hoặc giám sát đội tàu. Với hiệu suất nhanh hơn và độ chính xác được cải thiện, YOLO11 có thể giúp các nhà phát triển AI giải quyết những thách thức trong thế giới thực.
Khi AI ngày càng được áp dụng rộng rãi và tích hợp vào cuộc sống hàng ngày của chúng ta, các mô hình như YOLO11 sẽ định hình tương lai của các giải pháp AI.
Để tìm hiểu về tiềm năng của Vision AI, hãy tham gia cộng đồng đang phát triển của chúng tôi và khám phá kho lưu trữ GitHub của chúng tôi. Chúng tôi đang thúc đẩy sự đổi mới bằng cách tái tạo các lĩnh vực như chăm sóc sức khỏe cho đến xe tự lái .
Bắt đầu hành trình của bạn với tương lai của machine learning