Thuật ngữ

Bản đồ đặc điểm

Khám phá cách bản đồ tính năng có sức mạnh Ultralytics YOLO mô hình, cho phép phát hiện đối tượng chính xác và các ứng dụng AI tiên tiến như lái xe tự động.

Bản đồ đặc điểm là các đầu ra cơ bản được tạo ra bởi các lớp trong Mạng nơ-ron tích chập (CNN) , đặc biệt là các lớp tích chập. Chúng biểu diễn các đặc điểm hoặc mẫu đã học được phát hiện trong dữ liệu đầu vào, chẳng hạn như hình ảnh. Hãy coi chúng như các phiên bản đã lọc của đầu vào, trong đó mỗi bản đồ làm nổi bật sự hiện diện và vị trí không gian của một đặc điểm cụ thể—như các cạnh, góc, kết cấu hoặc các hình dạng phức tạp hơn—mà mạng cho là quan trọng đối với nhiệm vụ đang thực hiện, chẳng hạn như phát hiện đối tượng , phân đoạn hình ảnh hoặc phân loại hình ảnh . Các bản đồ này là các thành phần quan trọng trong cách các mô hình học sâu (DL) diễn giải thông tin trực quan.

Bản đồ tính năng được tạo ra như thế nào

Bản đồ tính năng được tạo thông qua phép toán gọi là tích chập . Trong quá trình này, một ma trận nhỏ được gọi là bộ lọc (hoặc hạt nhân ) trượt qua dữ liệu đầu vào (hoặc bản đồ tính năng từ lớp trước đó). Tại mỗi vị trí, bộ lọc thực hiện phép nhân từng phần tử với bản vá chồng lấn của đầu vào và tính tổng các kết quả để tạo ra một giá trị duy nhất trong bản đồ tính năng đầu ra. Mỗi bộ lọc được thiết kế hoặc học trong quá trình đào tạo để phát hiện một mẫu cụ thể. Một lớp tích chập thường sử dụng nhiều bộ lọc, mỗi bộ lọc tạo ra bản đồ tính năng riêng của nó, do đó nắm bắt một tập hợp các tính năng đa dạng từ đầu vào. Xương sống của mạng, thường được xây dựng bằng các khung như PyTorch hoặc TensorFlow , chủ yếu chịu trách nhiệm tạo các bản đồ tính năng phong phú này từ dữ liệu đầu vào, thường được trực quan hóa bằng các công cụ như OpenCV .

Biểu diễn tính năng phân cấp

Trong kiến trúc CNN thông thường, hình ảnh đầu vào đi qua một loạt các lớp. Các lớp đầu, gần với đầu vào hơn, có xu hướng tạo ra các bản đồ đặc điểm nắm bắt các đặc điểm đơn giản, cấp thấp (ví dụ: đường ngang, độ tương phản màu đơn giản, kết cấu cơ bản). Khi dữ liệu chảy sâu hơn vào mạng nơ-ron (NN) , các lớp tiếp theo sẽ kết hợp các đặc điểm đơn giản này để xây dựng các biểu diễn phức tạp và trừu tượng hơn. Bản đồ đặc điểm trong các lớp sâu hơn có thể làm nổi bật các bộ phận của đối tượng (như bánh xe trên ô tô hoặc mắt trên khuôn mặt) hoặc thậm chí là toàn bộ đối tượng. Việc học đặc điểm theo thứ bậc này cho phép mạng học các mẫu phức tạp theo từng bước, chuyển từ các mẫu chung sang các chi tiết cụ thể có liên quan đến nhiệm vụ. Bạn có thể khám phá các khái niệm cơ bản trong các tài nguyên như ghi chú khóa học CS231n của Stanford về CNN .

Tầm quan trọng và vai trò trong phát hiện đối tượng

Bản đồ đặc điểm là nền tảng cho cách CNN thực hiện trích xuất đặc điểm tự động, loại bỏ nhu cầu thiết kế đặc điểm thủ công vốn phổ biến trong thị giác máy tính (CV) truyền thống. Chất lượng và mức độ liên quan của các đặc điểm được ghi lại trong các bản đồ này ảnh hưởng trực tiếp đến hiệu suất của mô hình, được đo bằng các số liệu như độ chính xác và Độ chính xác trung bình trung bình (mAP) . Trong các mô hình phát hiện đối tượng như Ultralytics YOLO , cụ thể là các phiên bản như YOLOv8 và YOLO11 , các bản đồ đặc điểm do xương sống tạo ra thường được xử lý thêm bằng cấu trúc 'cổ' (như FPN hoặc PAN) trước khi được chuyển đến đầu phát hiện . Sau đó, đầu phát hiện sử dụng các bản đồ đặc điểm đã tinh chỉnh này để dự đoán đầu ra cuối cùng: các hộp giới hạn chỉ ra vị trí đối tượng và xác suất lớp xác định các đối tượng được tìm thấy trong các tập dữ liệu như COCO hoặc ImageNet .

Bản đồ tính năng so với các khái niệm liên quan

Trích xuất tính năng: Bản đồ tính năng là đầu ra của quá trình trích xuất tính năng được thực hiện bởi các lớp tích chập trong CNN. Trích xuất tính năng là quá trình tổng thể chuyển đổi dữ liệu thô thành các tính năng số và bản đồ tính năng là một loại biểu diễn cụ thể được tạo ra trong quá trình này trong các mô hình thị giác.
Bản đồ kích hoạt: Các thuật ngữ "bản đồ tính năng" và "bản đồ kích hoạt" thường được sử dụng thay thế cho nhau. Bản đồ kích hoạt đề cập đến đầu ra của việc áp dụng hàm kích hoạt (như ReLU hoặc SiLU ) vào đầu ra của lớp tích chập. Vì bản đồ tính năng biểu diễn sự hiện diện được kích hoạt của các tính năng, về cơ bản chúng là bản đồ kích hoạt.

Ứng dụng trong thế giới thực

Bản đồ đặc điểm là một phần không thể thiếu của vô số ứng dụng Trí tuệ nhân tạo (AI) và Học máy (ML) :

Lái xe tự động: Trong xe tự hành , CNN xử lý dữ liệu camera và cảm biến. Bản đồ đặc điểm được tạo ở các lớp khác nhau giúp xác định người đi bộ, các phương tiện khác, vạch kẻ đường và biển báo giao thông. Các lớp đầu tiên phát hiện các cạnh và kết cấu, trong khi các lớp sâu hơn kết hợp những thứ này để nhận dạng các vật thể phức tạp như ô tô hoặc đèn giao thông, rất quan trọng để điều hướng an toàn. Các công ty như Waymo rất tin tưởng vào các công nghệ như vậy cho AI của họ trong xe tự lái .
Phân tích hình ảnh y tế: CNN phân tích các hình ảnh quét y tế (X-quang, CT, MRI) để chẩn đoán. Bản đồ đặc điểm làm nổi bật các bất thường tiềm ẩn. Ví dụ, khi phát hiện khối u, bản đồ đặc điểm ban đầu có thể xác định các kết cấu hoặc cạnh bất thường, trong khi bản đồ sâu hơn học cách nhận dạng các hình dạng và cấu trúc cụ thể đặc trưng của khối u, hỗ trợ các bác sĩ X quang trong chẩn đoán. Đây là một phần quan trọng của phân tích hình ảnh y tế , với các nghiên cứu đang diễn ra được nêu bật trong các tạp chí như Radiology: Artificial Intelligence .

Hình dung và Diễn giải

Việc trực quan hóa bản đồ đặc điểm có thể cung cấp thông tin chi tiết về những gì CNN đã học được và cách nó đưa ra quyết định. Bằng cách kiểm tra những phần nào của hình ảnh kích hoạt bản đồ đặc điểm cụ thể, các nhà phát triển có thể hiểu được liệu mô hình có tập trung vào các đặc điểm có liên quan hay không. Đây là một thành phần của Explainable AI (XAI) và có thể được thực hiện bằng các công cụ như TensorBoard hoặc các kỹ thuật trực quan hóa khác. Việc hiểu bản đồ đặc điểm giúp gỡ lỗi các mô hình và cải thiện độ mạnh mẽ và độ tin cậy của chúng, có thể được quản lý và theo dõi bằng các nền tảng như Ultralytics HUB .

Bản đồ đặc điểm

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Xe lửa YOLO mô hình đơn giản với Ultralytics TRUNG TÂM