Tìm hiểu cách thức mới Ultralytics YOLO11 mô hình cải thiện khả năng phân loại hình ảnh, mang lại độ chính xác cao hơn cho các nhiệm vụ trong nông nghiệp, bán lẻ và giám sát động vật hoang dã.
Giả sử một con robot đang nhìn vào hai con mèo, một con đen và một con trắng, và nó cần phải tìm ra con nào là con nào. Để làm như vậy, nó có thể sử dụng phân loại hình ảnh , một tác vụ thị giác máy tính giúp xác định và phân loại các đối tượng hoặc cảnh trong một hình ảnh. Trên thực tế, nhờ những tiến bộ gần đây trong trí tuệ nhân tạo (AI) , phân loại hình ảnh có thể được sử dụng trong nhiều ứng dụng khác nhau, từ giám sát động vật đến sản xuất và nông nghiệp với phát hiện bệnh cây trồng .
Một trong những tiến bộ mới nhất trong phân loại hình ảnh là mô hình YOLO11 Ultralytics . Ra mắt tại sự kiện kết hợp thường niên của Ultralytics , YOLO Vision 2024 (YV24) , YOLO11 được thiết kế để giải quyết nhiều tác vụ Vision AI khác nhau, bao gồm phân loại hình ảnh , một cách dễ dàng và chính xác.
Trong bài viết này, chúng ta sẽ khám phá những điều cơ bản của phân loại hình ảnh , thảo luận về các ứng dụng trong thế giới thực và chỉ cho bạn cách sử dụng YOLO11 để phân loại hình ảnh thông qua gói Ultralytics Python . Chúng ta cũng sẽ xem xét cách bạn có thể dùng thử các khả năng của YOLO11 trên Ultralytics HUB trong một vài bước đơn giản. Hãy bắt đầu nào!
Phân loại hình ảnh hoạt động bằng cách gán nhãn hoặc thẻ cho hình ảnh dựa trên các mẫu học được từ hình ảnh được gắn nhãn trước đó. Bằng cách phân tích cẩn thận các pixel của hình ảnh, mô hình thị giác máy tính có thể tìm ra sự phù hợp nhất cho hình ảnh. Các mô hình đáng tin cậy như YOLO11 có thể xử lý quá trình này một cách liền mạch. YOLO11 Kiến trúc mô hình của 'cho phép xử lý hình ảnh hoặc khung hình video gần như ngay lập tức, rất lý tưởng cho các ứng dụng cần phân loại hình ảnh nhanh và chính xác.
Để thực sự hiểu phạm vi phân loại hình ảnh, cần phân biệt nó với các nhiệm vụ khác như phát hiện đối tượng . Trong khi phân loại hình ảnh gắn nhãn toàn bộ hình ảnh, phát hiện đối tượng xác định và định vị từng đối tượng trong hình ảnh.
Hãy xem xét hình ảnh một con hươu cao cổ. Trong phân loại hình ảnh , mô hình có thể dán nhãn toàn bộ hình ảnh chỉ là một con hươu cao cổ dựa trên nội dung tổng thể của nó. Tuy nhiên, với phát hiện đối tượng , mô hình không dừng lại ở việc xác định con hươu cao cổ; nó cũng đặt một hộp giới hạn xung quanh con hươu cao cổ, xác định vị trí chính xác của nó trong hình ảnh.
Bây giờ, hãy tưởng tượng con hươu cao cổ đứng gần một cái cây trong thảo nguyên với các loài động vật khác. Một mô hình phân loại hình ảnh có thể dán nhãn toàn bộ cảnh là thảo nguyên hoặc chỉ là động vật hoang dã. Tuy nhiên, với phát hiện đối tượng, mô hình sẽ xác định từng yếu tố riêng lẻ, nhận dạng con hươu cao cổ, cây và các loài động vật khác, mỗi loài có hộp giới hạn riêng.
Độ chính xác và hiệu suất của Ultralytics YOLO11 mô hình phân loại hình ảnh làm cho nó hữu ích trong nhiều ngành công nghiệp. Hãy cùng khám phá một số ứng dụng chính của YOLO11 trong phân loại hình ảnh.
Phân loại hình ảnh có thể giúp hợp lý hóa nhiều chức năng trong ngành nông nghiệp và chăn nuôi. Cụ thể, sử dụng các mô hình phân loại hình ảnh như YOLO11 , nông dân có thể liên tục theo dõi sức khỏe cây trồng , phát hiện các bệnh nghiêm trọng và xác định bất kỳ đợt xâm nhập của sâu bệnh nào với độ chính xác cao.
Sau đây là cách thức hoạt động của nó:
Phân loại hình ảnh có thể cải thiện đáng kể trải nghiệm mua sắm bán lẻ , giúp trải nghiệm này trở nên cá nhân hóa và thân thiện hơn với người dùng. Các nhà bán lẻ có thể sử dụng các mô hình thị giác máy tính được đào tạo tùy chỉnh để nhận dạng sản phẩm trong kho của họ và tích hợp khả năng này vào ứng dụng di động hoặc trang web của họ. Sau đó, khách hàng có thể tìm kiếm sản phẩm chỉ bằng cách tải ảnh lên, giúp việc mua sắm nhanh hơn và thuận tiện hơn.
Khi khách hàng tải hình ảnh lên hệ thống tìm kiếm trực quan, có một số bước diễn ra ở hậu trường trước khi kết quả tìm kiếm hiển thị.
Đầu tiên, phát hiện đối tượng có thể được sử dụng để chọn ra các mục chính trong hình ảnh, như xác định một mảnh quần áo hoặc một món đồ nội thất và tách nó ra khỏi nền. Tiếp theo, phân loại hình ảnh có thể được sử dụng để phân loại thêm từng mục, nhận dạng xem đó là áo khoác, áo sơ mi, ghế sofa hay bàn.
Với thông tin này, hệ thống có thể đưa ra các sản phẩm tương tự có sẵn để mua, đặc biệt hữu ích khi tìm các mặt hàng độc đáo hoặc hợp thời trang khó có thể mô tả bằng lời. Công nghệ tương tự cũng có thể giúp hợp lý hóa các tác vụ bán lẻ khác, như quản lý hàng tồn kho , bằng cách tự động nhận dạng và phân loại các mặt hàng.
Theo truyền thống, việc theo dõi động vật trong tự nhiên là một nhiệm vụ tẻ nhạt liên quan đến nhiều người phân loại và phân tích thủ công hàng nghìn bức ảnh. Với các chế độ thị giác máy tính như YOLO11 , các nhà nghiên cứu có thể tự động theo dõi động vật với tốc độ nhanh hơn. Có thể đặt máy ảnh trong môi trường sống tự nhiên để chụp ảnh. Sau đó, mô hình AI thị giác có thể được sử dụng để phân tích những bức ảnh này và phân loại các loài động vật trong đó (nếu có). Một hệ thống như vậy có thể giúp các nhà nghiên cứu nghiên cứu và theo dõi quần thể động vật, mô hình di cư của chúng, v.v.
Một cách khác AI và các mô hình thị giác máy tính như YOLO11 có thể giúp ích trong lĩnh vực này là bằng cách hợp lý hóa quy trình phân loại các loài có nguy cơ tuyệt chủng. Bằng cách xác định các loài tiềm năng hoặc các loại giống mà một loài động vật có thể thuộc về, các mô hình này có thể cung cấp dữ liệu cần thiết cho các nhà nghiên cứu. Ví dụ, Đại học Tasmania (UTAS) đã phát triển một hệ thống phân loại hình ảnh để theo dõi các loài động vật hoang dã khác nhau của Tasmania . Các dự đoán từ các mô hình sau đó có thể giúp các nhà khoa học và nhà nghiên cứu theo dõi hoạt động và hành vi của động vật, có thể báo hiệu các mối đe dọa như săn trộm hoặc mất môi trường sống .
Bây giờ chúng ta đã thảo luận về phân loại hình ảnh là gì và khám phá một số ứng dụng của nó. Hãy cùng xem cách bạn có thể thử phân loại hình ảnh với YOLO11 mô hình. Có hai cách dễ dàng để bắt đầu: sử dụng gói Ultralytics Python hoặc thông qua Ultralytics HUB . Chúng tôi sẽ hướng dẫn cả hai tùy chọn.
Để bắt đầu với Ultralytics Python gói, chỉ cần cài đặt nó bằng pip, conda hoặc Docker. Nếu bạn gặp bất kỳ sự cố nào, hãy xem Hướng dẫn sự cố phổ biến của chúng tôi để biết các mẹo khắc phục sự cố hữu ích.
Sau khi gói được cài đặt, bạn có thể sử dụng mã sau để tải một biến thể của YOLO11 mô hình phân loại hình ảnh và chạy suy luận trên hình ảnh. Chạy suy luận có nghĩa là sử dụng mô hình đã được đào tạo để đưa ra dự đoán về dữ liệu mới, chưa từng thấy. Bạn có thể thử với hình ảnh bạn chọn!
Bạn cũng có thể sử dụng tương tự Python gói để đào tạo một tùy chỉnh YOLO11 mô hình phân loại. Đào tạo tùy chỉnh giúp bạn có thể tinh chỉnh một YOLO11 mô hình cho nhu cầu cụ thể của bạn. Ví dụ, nếu bạn đang phát triển một ứng dụng để phân loại các giống mèo khác nhau, bạn có thể huấn luyện tùy chỉnh một YOLO11 mô hình chỉ dành cho mục đích đó.
Mã dưới đây cho thấy cách tải và đào tạo một YOLO11 mô hình phân loại hình ảnh. Nó cho phép bạn chuyển các trọng số được đào tạo trước , sử dụng kiến thức từ một mô hình hiện có để tăng hiệu suất của mô hình của riêng bạn. Bạn có thể chỉ định một tập dữ liệu , như tập dữ liệu "fashion-mnist", là một tập hợp các hình ảnh thang độ xám nổi tiếng của các mặt hàng quần áo (áo sơ mi, quần, giày dép, v.v.). Đào tạo mô hình trên tập dữ liệu này sẽ dạy cho nó cách nhận dạng các loại quần áo khác nhau. Bạn có thể hoán đổi "fashion-mnist" cho bất kỳ tập dữ liệu nào phù hợp với dự án của mình, chẳng hạn như giống mèo hoặc loại cây.
Mặc dù sử dụng Ultralytics gói này rất đơn giản, nó đòi hỏi một số kiến thức về Python . Nếu bạn đang tìm kiếm một lựa chọn thân thiện hơn với người mới bắt đầu, bạn có thể sử dụng Ultralytics HUB, một nền tảng được thiết kế để thực hiện đào tạo và triển khai khác nhau YOLO mô hình đơn giản và dễ tiếp cận. Để bắt đầu, bạn cần tạo một tài khoản .
Sau khi bạn đã đăng nhập, hãy điều hướng đến phần 'Mô hình' và chọn YOLO11 mô hình để phân loại hình ảnh. Bạn sẽ thấy một loạt các kích thước mô hình có sẵn: nano, nhỏ, trung bình, lớn và cực lớn. Sau khi chọn một mô hình, bạn có thể tải lên một hình ảnh trong phần 'Xem trước', nơi các dự đoán sẽ xuất hiện ở phía bên trái của trang sau khi hình ảnh được xử lý.
YOLO11 cung cấp khả năng phân loại hình ảnh mạnh mẽ mở ra những khả năng mới trong nhiều ngành công nghiệp khác nhau. Từ việc cải thiện việc giám sát cây trồng trong nông nghiệp và tăng cường tìm kiếm sản phẩm trong bán lẻ đến hỗ trợ bảo tồn động vật hoang dã, YOLO11 Tốc độ và độ chính xác của nó làm cho nó lý tưởng cho các ứng dụng đa dạng. Với các tùy chọn đào tạo tùy chỉnh thông qua Ultralytics Python gói hoặc thiết lập thân thiện với người dùng, không cần mã trên Ultralytics HUB, người dùng có thể dễ dàng kết hợp YOLO11 vào quy trình làm việc của họ. Khi ngày càng nhiều ngành công nghiệp áp dụng các giải pháp AI, YOLO11 cung cấp một công cụ linh hoạt, hiệu suất cao hỗ trợ sự đổi mới và tiến bộ thực tế.
Để khám phá thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong xe tự lái và chăm sóc sức khỏe trên các trang giải pháp của chúng tôi. 🚀
Bắt đầu hành trình của bạn với tương lai của machine learning