Thuật ngữ

Giao điểm qua Union (IoU)

Tìm hiểu Giao điểm trên hợp (IoU) là gì, cách tính toán và vai trò quan trọng của nó trong phát hiện đối tượng và đánh giá mô hình AI.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Giao điểm trên hợp (IoU) là một số liệu cơ bản được sử dụng rộng rãi trong thị giác máy tính (CV) , đặc biệt là đối với các tác vụ như phát hiện đối tượngphân đoạn hình ảnh . Nó định lượng mức độ chính xác của ranh giới dự đoán (như hộp giới hạn trong phát hiện đối tượng) khớp với ranh giới thực tế, ranh giới thực tế của một đối tượng. Về cơ bản, IoU đo mức độ chồng lấn giữa khu vực dự đoán và khu vực thực, cung cấp điểm số đơn giản nhưng hiệu quả cho hiệu suất định vị. Hiểu IoU là điều cần thiết để đánh giá và so sánh hiệu quả của các mô hình thị giác máy tính, đặc biệt là đối với người dùng quen thuộc với các khái niệm học máy (ML) cơ bản.

Tầm quan trọng của IoU trong đánh giá mô hình

IoU đóng vai trò là chỉ báo hiệu suất quan trọng khi đánh giá mức độ các mô hình, chẳng hạn như Ultralytics YOLO , định vị các đối tượng trong một hình ảnh. Trong khi phân loại cho chúng ta biết đối tượng nào hiện diện (xem Phân loại hình ảnh ), IoU cho chúng ta biết mô hình xác định vị trí của nó tốt như thế nào . Độ chính xác về mặt không gian này rất quan trọng trong nhiều tình huống thực tế, trong đó định vị chính xác cũng quan trọng như phân loại chính xác. Điểm IoU cao cho thấy các dự đoán của mô hình phù hợp chặt chẽ với ranh giới đối tượng thực tế. Nhiều chuẩn phát hiện đối tượng, như đánh giá tập dữ liệu COCO phổ biến và thử thách PASCAL VOC cũ hơn, dựa rất nhiều vào ngưỡng IoU để xác định xem phát hiện có được coi là chính xác hay không. Bạn có thể khám phá nhiều tập dữ liệu chuẩn khác nhau như COCOPASCAL VOC trong tài liệu của chúng tôi.

Tính toán IoU

Phép tính bao gồm việc chia diện tích mà hộp giới hạn dự đoán và hộp giới hạn thực tế chồng lên nhau (giao điểm) cho tổng diện tích được bao phủ bởi cả hai hộp kết hợp (hợp). Tỷ lệ này cho kết quả điểm từ 0 đến 1. Điểm 1 biểu thị sự khớp hoàn hảo, nghĩa là hộp dự đoán chồng lên chính xác hộp giới hạn thực tế. Điểm 0 biểu thị không có sự chồng chéo nào cả. Một thông lệ phổ biến trong nhiều giao thức đánh giá phát hiện đối tượng là coi một dự đoán là đúng nếu điểm IoU đạt hoặc vượt quá một ngưỡng nhất định, thường là 0,5. Tuy nhiên, các ngưỡng nghiêm ngặt hơn (ví dụ: 0,75 hoặc thậm chí 0,9) có thể được sử dụng tùy thuộc vào nhu cầu về độ chính xác của ứng dụng, như được thấy trong các số liệu như mAP@.5:.95 được sử dụng trong các đánh giá COCO. Ngưỡng này tác động trực tiếp đến các số liệu như độ chính xác và khả năng thu hồi .

Ứng dụng thực tế của IoU

Khả năng đo độ chính xác định vị của IoU khiến nó trở nên không thể thiếu trong nhiều lĩnh vực khác nhau:

  • Xe tự hành: Trong AI dành cho xe tự lái , việc phát hiện chính xác người đi bộ, người đi xe đạp và các phương tiện khác là tối quan trọng đối với sự an toàn. Một mô hình phát hiện vật thể như YOLO11 dự đoán các hộp giới hạn xung quanh các vật thể này. IoU cao giữa hộp dự đoán và vị trí vật thể thực tế đảm bảo hệ thống của xe hiểu chính xác môi trường xung quanh, rất quan trọng đối với việc điều hướng và tránh va chạm. Các tiêu chuẩn an toàn của xe tự hành thường ngầm dựa vào độ chính xác định vị cao.
  • Phân tích hình ảnh y tế: Khi sử dụng AI trong chăm sóc sức khỏe , đặc biệt là để phân tích hình ảnh y tế , IoU giúp đánh giá các mô hình được thiết kế để phát hiện khối u hoặc bất thường trong các lần quét (như CT hoặc MRI). Ví dụ, một mô hình phân đoạn khối u ( Phân đoạn hình ảnh ) cần phác thảo khối u một cách chính xác. IoU đo lường sự chồng chéo giữa vùng khối u dự đoán của mô hình và vùng được bác sĩ X quang đánh dấu (sự thật cơ bản), đảm bảo các phát hiện của mô hình có liên quan về mặt lâm sàng. IoU cao rất quan trọng để chẩn đoán chính xác và lập kế hoạch điều trị, như đã nêu bật trong nhiều nghiên cứu AI về hình ảnh y tế . Bạn có thể tìm thấy các tập dữ liệu có liên quan như Bộ dữ liệu phát hiện khối u não trong các nguồn dữ liệu của chúng tôi.

IoU so với các số liệu đánh giá khác

Trong khi IoU đo lường cụ thể chất lượng bản địa hóa cho một dự đoán duy nhất so với thực tế, thì nó thường được sử dụng cùng với các số liệu khác để có được bức tranh hiệu suất hoàn chỉnh.

  • Độ chính xác trung bình trung bình (mAP) : Đây là một số liệu tổng hợp được sử dụng rộng rãi trong phát hiện đối tượng. Nó tính toán độ chính xác trung bình trên nhiều ngưỡng IoU khác nhau (ví dụ: từ 0,5 đến 0,95) và thường trên nhiều lớp đối tượng. Không giống như IoU, đánh giá các dự đoán riêng lẻ, mAP cung cấp một con số duy nhất tóm tắt hiệu suất tổng thể của mô hình về cả độ chính xác phân loại và định vị trên các điểm vận hành khác nhau. Bạn có thể tìm hiểu thêm về các số liệu này trong hướng dẫn Số liệu hiệu suất YOLO của chúng tôi.
  • Độ chính xác và thu hồi: Bản thân IoU không trực tiếp đo độ chính xác của phân loại, chỉ có chồng chéo vị trí. Độ chính xác đo độ chính xác của các dự đoán tích cực (có bao nhiêu hộp được phát hiện thực sự chứa một đối tượng), trong khi Độ thu hồi đo khả năng của mô hình trong việc tìm thấy tất cả các trường hợp có liên quan (có bao nhiêu đối tượng thực tế được phát hiện). Ngưỡng IoU được sử dụng trong phép tính độ chính xác và thu hồi để xác định xem phát hiện có phải là kết quả dương tính thực sự hay không. Hiểu được mối quan hệ giữa độ chính xác và thu hồi là chìa khóa để diễn giải các số liệu như mAP và điểm F1 .

Nâng cao hiệu suất mô hình với IoU

IoU không chỉ là một số liệu đánh giá; nó còn là một phần không thể thiếu của quá trình đào tạo. Nhiều kiến trúc phát hiện đối tượng hiện đại, bao gồm các biến thể của Ultralytics YOLOv8YOLOv10 , sử dụng IoU hoặc các biến thể của nó (như IoU tổng quát (GIoU), IoU khoảng cách (DIoU) hoặc IoU hoàn chỉnh (CIoU)) trực tiếp trong các hàm mất mát của chúng. Các mất mát dựa trên IoU nâng cao này giúp mô hình học cách dự đoán các hộp giới hạn không chỉ chồng chéo tốt mà còn xem xét các yếu tố như khoảng cách giữa các tâm và tính nhất quán của tỷ lệ khung hình, dẫn đến sự hội tụ nhanh hơn và hiệu suất định vị tốt hơn so với các mất mát hồi quy truyền thống. Bạn có thể tìm thấy các so sánh chi tiết giữa các mô hình YOLO khác nhau trong tài liệu của chúng tôi.

Việc theo dõi IoU trong quá trình đào tạo mô hìnhđiều chỉnh siêu tham số giúp các nhà phát triển tinh chỉnh các mô hình để bản địa hóa tốt hơn. Các công cụ như Ultralytics HUB cho phép theo dõi IoU và các số liệu khác, hợp lý hóa chu kỳ cải tiến mô hình. Mặc dù có tiện ích rộng rãi, IoU tiêu chuẩn đôi khi có thể không nhạy, đặc biệt là đối với các hộp không chồng lấn hoặc các hộp có tỷ lệ rất khác nhau. Điều này đã thúc đẩy sự phát triển của các biến thể IoU đã đề cập ở trên. Tuy nhiên, IoU vẫn là nền tảng của đánh giá thị giác máy tính và là một khái niệm chính trong học sâu (DL) .

Đọc tất cả