Kiểm tra màu xanh lá cây
Liên kết được sao chép vào khay nhớ tạm

Đào tạo tùy chỉnh Ultralytics YOLO11 với bộ dữ liệu thị giác máy tính

Khám phá cách thức Roboflow tích hợp có thể đơn giản hóa đào tạo tùy chỉnh Ultralytics YOLO11 bằng cách tạo ra các tập dữ liệu thị giác máy tính nguồn mở dễ truy cập.

Đào tạo mô hình thị giác máy tính như Ultralytics YOLO11 thường bao gồm thu thập hình ảnh cho tập dữ liệu của bạn, chú thích chúng, chuẩn bị dữ liệu và tinh chỉnh mô hình để đáp ứng các yêu cầu cụ thể của bạn. Mặc dù gói Ultralytics Python giúp các bước này trở nên đơn giản và thân thiện với người dùng, nhưng việc phát triển Vision AI vẫn có thể tốn thời gian.

Điều này đặc biệt đúng khi bạn đang làm việc với thời hạn gấp hoặc đang phát triển một nguyên mẫu. Trong những tình huống này, việc có các công cụ hoặc tích hợp giúp đơn giản hóa một số phần của quy trình - chẳng hạn như hợp lý hóa việc chuẩn bị tập dữ liệu hoặc tự động hóa các tác vụ lặp đi lặp lại - có thể tạo ra sự khác biệt lớn. Bằng cách giảm thời gian và công sức cần thiết, các giải pháp này giúp bạn tập trung vào việc xây dựng và tinh chỉnh mô hình của mình. Đó chính xác là những gì Roboflow cung cấp tích hợp.

Các Roboflow tích hợp cho phép bạn dễ dàng truy cập các tập dữ liệu từ Roboflow Universe, một thư viện lớn các tập dữ liệu thị giác máy tính nguồn mở. Thay vì dành hàng giờ để thu thập và sắp xếp dữ liệu, bạn có thể nhanh chóng tìm và sử dụng các tập dữ liệu hiện có để khởi động YOLO11 quá trình đào tạo. Sự tích hợp này giúp việc thử nghiệm và lặp lại quá trình phát triển mô hình thị giác máy tính của bạn nhanh hơn và đơn giản hơn nhiều.

Trong bài viết này, chúng ta sẽ đi sâu vào cách bạn có thể tận dụng Roboflow tích hợp để phát triển mô hình nhanh hơn. Hãy bắt đầu nào!

Là gì Roboflow Vũ trụ?

Roboflow Vũ trụ là một nền tảng được duy trì bởi Roboflow , một công ty tập trung vào việc đơn giản hóa quá trình phát triển thị giác máy tính. Nó bao gồm hơn 350 triệu hình ảnh, 500.000 tập dữ liệu và 100.000 mô hình được tinh chỉnh cho các tác vụ như phát hiện đối tượng , phân loại hình ảnh và phân đoạn. Với sự đóng góp của các nhà phát triển và nhà nghiên cứu trên toàn thế giới, Roboflow Universe là trung tâm cộng tác dành cho bất kỳ ai muốn khởi động hoặc nâng cao các dự án về thị giác máy tính của mình.

Hình 1. Ví dụ về tập dữ liệu phát hiện đối tượng trên Roboflow Vũ trụ.

Roboflow Universe bao gồm các tính năng chính sau:

  • Công cụ khám phá tập dữ liệu : Khám phá, lọc và trực quan hóa các tập dữ liệu để nhanh chóng tìm ra các tài nguyên phù hợp với yêu cầu dự án của bạn.
  • Tùy chọn xuất : Xuất dữ liệu theo các định dạng như COCO, YOLO , TFRecord, CSV và nhiều định dạng khác phù hợp với quy trình làm việc của bạn.
  • Phân tích tập dữ liệu : Tìm hiểu sâu hơn về nhiều tập dữ liệu khác nhau bằng các công cụ phân tích cung cấp hình ảnh trực quan về phân phối nhãn, mất cân bằng lớp và chất lượng tập dữ liệu. 
  • Theo dõi phiên bản : Xem và truy cập các phiên bản khác nhau của bộ dữ liệu do người đóng góp tải lên, cho phép bạn theo dõi các bản cập nhật, so sánh các thay đổi và chọn phiên bản phù hợp nhất với nhu cầu dự án của bạn. 

Các Roboflow tích hợp giúp bạn tìm đúng dữ liệu

Việc tìm đúng tập dữ liệu thường là một trong những phần khó khăn nhất khi xây dựng mô hình thị giác máy tính . Việc tạo tập dữ liệu thường liên quan đến việc thu thập một lượng lớn hình ảnh, đảm bảo chúng có liên quan đến nhiệm vụ của bạn và sau đó dán nhãn chính xác cho chúng. 

Quá trình này có thể tốn nhiều thời gian và tài nguyên, đặc biệt là nếu bạn đang thử nghiệm nhiều cách tiếp cận khác nhau trong thời gian ngắn. Ngay cả việc tìm kiếm các tập dữ liệu có sẵn cũng có thể khó khăn, vì chúng thường nằm rải rác trên nhiều nền tảng, không được ghi chép đúng cách hoặc thiếu các chú thích cụ thể mà bạn cần.

Ví dụ, nếu bạn đang xây dựng một ứng dụng thị giác máy tính để phát hiện cỏ dại trên các cánh đồng nông nghiệp, bạn có thể muốn thử nghiệm các phương pháp tiếp cận Vision AI khác nhau, như phát hiện đối tượng so với phân đoạn thể hiện. Điều này cho phép bạn thử nghiệm và tìm ra phương pháp nào hiệu quả nhất trước khi dành thời gian và công sức để thu thập và dán nhãn tập dữ liệu của riêng bạn.

Hình 2. Phát hiện các bộ phận xe hơi bằng cách sử dụng YOLO11 .

Sử dụng Roboflow tích hợp, bạn có thể duyệt qua nhiều tập dữ liệu liên quan đến nông nghiệp, bao gồm các tập dữ liệu tập trung vào phát hiện cỏ dại, sức khỏe cây trồng hoặc theo dõi đồng ruộng. Các tập dữ liệu sẵn sàng sử dụng này cho phép bạn thử nghiệm các kỹ thuật khác nhau và tinh chỉnh mô hình của mình mà không cần nỗ lực tạo dữ liệu riêng ngay từ đầu. 

Làm thế nào Roboflow công trình tích hợp

Bây giờ chúng ta đã thảo luận về cách bạn có thể sử dụng Roboflow tích hợp để tìm đúng tập dữ liệu, hãy xem nó phù hợp với quy trình làm việc của bạn như thế nào. Sau khi bạn đã chọn một tập dữ liệu từ Roboflow Vũ trụ, bạn có thể xuất hoặc tải xuống trong YOLO11 định dạng. Sau khi tập dữ liệu của bạn được xuất, bạn có thể sử dụng nó để đào tạo tùy chỉnh YOLO11 sử dụng Ultralytics Python bưu kiện. 

Trong khi tải xuống tập dữ liệu của bạn, bạn có thể nhận thấy rằng Roboflow Universe cũng hỗ trợ các định dạng khác để đào tạo các mô hình khác nhau. Vậy, tại sao bạn nên chọn đào tạo tùy chỉnh Ultralytics YOLO11 ? 

YOLO11 là phiên bản mới nhất của Ultralytics YOLO mô hình và được xây dựng để cung cấp khả năng phát hiện đối tượng nhanh hơn và chính xác hơn. Nó sử dụng ít hơn 22% tham số (các giá trị nội bộ mà mô hình điều chỉnh trong quá trình đào tạo để đưa ra dự đoán) so với YOLOv8m , nhưng vẫn đạt được độ chính xác trung bình cao hơn (mAP) trên tập dữ liệu COCO. Sự cân bằng giữa tốc độ và độ chính xác này làm cho YOLO11 một lựa chọn linh hoạt cho nhiều ứng dụng thị giác máy tính, đặc biệt là khi tùy chỉnh các mô hình đào tạo phù hợp với các nhiệm vụ cụ thể.

Sau đây là cái nhìn sâu hơn về cách thức hoạt động của chương trình đào tạo tùy chỉnh YOLO11 :

  • Cung cấp dữ liệu : YOLO11 mô hình xử lý tập dữ liệu của bạn, học cách phát hiện và phân loại các đối tượng từ hình ảnh và chú thích của chúng.
  • Dự đoán và phản hồi : Mô hình đưa ra dự đoán về các đối tượng trong hình ảnh và so sánh chúng với câu trả lời đúng có trong tập dữ liệu.
  • Theo dõi hiệu suất : Các số liệu như độ chính xác (phát hiện đúng), khả năng thu hồi (phát hiện bỏ sót) và mất mát (lỗi dự đoán) được theo dõi để đánh giá tiến độ.
  • Học lặp đi lặp lại : Mô hình điều chỉnh các tham số của nó qua nhiều vòng (thời đại) để cải thiện độ chính xác phát hiện và giảm thiểu lỗi.
  • Đầu ra mô hình cuối cùng : Sau khi đào tạo, mô hình được tối ưu hóa sẽ được lưu và sẵn sàng để triển khai.

Các tích hợp khác tập trung vào phát triển thị giác máy tính

Khi bạn khám phá Roboflow tích hợp, bạn sẽ thấy các tích hợp khác được đề cập trong tài liệu Ultralytics . Chúng tôi hỗ trợ nhiều tích hợp liên quan đến nhiều giai đoạn phát triển thị giác máy tính. 

Điều này nhằm cung cấp cho cộng đồng của chúng tôi nhiều lựa chọn để bạn có thể chọn phương án phù hợp nhất với quy trình làm việc cụ thể của mình.

Hình 3. Tổng quan về các tích hợp được hỗ trợ bởi Ultralytics .

Ngoài các tập dữ liệu, các tích hợp khác được Ultralytics hỗ trợ tập trung vào nhiều phần khác nhau của quy trình thị giác máy tính, chẳng hạn như đào tạo, triển khai và tối ưu hóa. Sau đây là một số ví dụ về các tích hợp khác mà chúng tôi hỗ trợ:

  • Tích hợp đào tạo: Tích hợp như Amazon SageMaker và Paperspace Hợp lý hóa quy trình đào tạo bằng cách cung cấp nền tảng đám mây để phát triển và thử nghiệm mô hình hiệu quả.
  • Tích hợp theo dõi quy trình làm việc và thử nghiệm: ClearML , MLFlow và Weights & Biases (W&B) giúp tự động hóa quy trình làm việc, theo dõi các thử nghiệm và cải thiện sự cộng tác, giúp quản lý các dự án học máy dễ dàng hơn.
  • Tích hợp tối ưu hóa và triển khai: CoreML , ONNX , Và OpenVINO cho phép triển khai được tối ưu hóa trên nhiều thiết bị và khuôn khổ khác nhau, đảm bảo hiệu suất hiệu quả trên các nền tảng như phần cứng Apple và Intel CPU.
  • Tích hợp giám sát và trực quan hóa: TensorBoard và Weights & Biases cung cấp các công cụ để trực quan hóa tiến trình đào tạo và theo dõi hiệu suất, đưa ra thông tin chi tiết để tinh chỉnh mô hình.

YOLO11 ứng dụng và vai trò của tích hợp

Tích hợp hỗ trợ phát triển thị giác máy tính, kết hợp với khả năng đáng tin cậy của YOLO11 , giúp giải quyết các thách thức trong thế giới thực dễ dàng hơn. Hãy xem xét các sáng kiến như thị giác máy tính trong sản xuất , trong đó AI thị giác được sử dụng để phát hiện các khiếm khuyết trên dây chuyền sản xuất - như vết xước trên các bộ phận kim loại hoặc các thành phần bị thiếu. Việc thu thập dữ liệu phù hợp cho các nhiệm vụ như vậy thường có thể chậm và đầy thách thức, đòi hỏi phải tiếp cận các môi trường chuyên biệt. 

Thông thường, nó bao gồm việc thiết lập máy ảnh hoặc cảm biến dọc theo dây chuyền sản xuất để chụp ảnh sản phẩm. Những hình ảnh này cần được chụp với khối lượng lớn, thường dưới ánh sáng và góc độ nhất quán, để đảm bảo độ rõ nét và đồng nhất. 

Sau khi chụp, hình ảnh phải được chú thích tỉ mỉ bằng nhãn chính xác cho mọi loại khuyết tật, chẳng hạn như vết xước, vết lõm hoặc thiếu thành phần. Quá trình này đòi hỏi nhiều thời gian và nguồn lực, cũng như chuyên môn, để đảm bảo tập dữ liệu phản ánh chính xác sự thay đổi trong thế giới thực. Các yếu tố như kích thước, hình dạng và vật liệu khuyết tật khác nhau phải được tính đến để tạo ra một tập dữ liệu mạnh mẽ và đáng tin cậy.

Các tích hợp cung cấp các tập dữ liệu có sẵn tạo điều kiện thuận lợi cho các nhiệm vụ như kiểm soát chất lượng công nghiệp và với YOLO11 Với khả năng phát hiện thời gian thực, các nhà sản xuất có thể theo dõi dây chuyền sản xuất, phát hiện lỗi ngay lập tức và cải thiện hiệu quả.

Hình 4. Một ví dụ về việc sử dụng Ultraytics YOLO11 để phát hiện và đếm số lượng lon đang được sản xuất.

Ngoài sản xuất, tích hợp liên quan đến tập dữ liệu có thể được sử dụng trong nhiều ngành công nghiệp khác. Bằng cách kết hợp YOLO11 Tốc độ và độ chính xác của với các tập dữ liệu dễ truy cập, các doanh nghiệp có thể nhanh chóng phát triển và triển khai các giải pháp phù hợp với nhu cầu cụ thể của họ. Ví dụ, chăm sóc sức khỏe - tích hợp tập dữ liệu có thể giúp phát triển các giải pháp phân tích hình ảnh y tế để phát hiện các bất thường như khối u. Tương tự như vậy, trong lái xe tự động, các tích hợp như vậy có thể giúp xác định phương tiện, người đi bộ và biển báo giao thông để tăng cường an toàn.

Những điểm chính

Việc tìm đúng tập dữ liệu thường là một trong những phần tốn thời gian nhất khi xây dựng mô hình thị giác máy tính. Tuy nhiên, Roboflow tích hợp giúp bạn dễ dàng tìm thấy tập dữ liệu tốt nhất để đào tạo tùy chỉnh Ultralytics YOLO mô hình, ngay cả khi bạn mới làm quen với thị giác máy tính. 

Với quyền truy cập vào bộ sưu tập dữ liệu khổng lồ cho các tác vụ thị giác máy tính như phát hiện đối tượng, phân loại hình ảnh hoặc phân đoạn trường hợp, Roboflow Universe giúp bạn giải quyết rắc rối trong quá trình khám phá dữ liệu. Nó giúp bạn bắt đầu nhanh chóng và tập trung vào việc xây dựng mô hình của mình thay vì dành thời gian thu thập và sắp xếp dữ liệu. Phương pháp hợp lý này giúp các nhà phát triển tạo nguyên mẫu, lặp lại và phát triển các giải pháp thị giác máy tính hiệu quả hơn.

Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi. Khám phá những đổi mới trong các lĩnh vực như AI trong xe tự láithị giác máy tính trong nông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Logo FacebookBiểu trưng TwitterBiểu tượng LinkedInBiểu tượng sao chép liên kết

Đọc thêm trong danh mục này

Hãy xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của machine learning