Thuật ngữ

Trích xuất tính năng

Khám phá sức mạnh của việc trích xuất tính năng trong máy học với Ultralytics YOLO11 . Tìm hiểu các kỹ thuật phát hiện và phân tích hiệu quả.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trích xuất tính năng là một quá trình quan trọng trong học máy (ML)thị giác máy tính (CV) , đóng vai trò là bước quan trọng để chuyển đổi dữ liệu thô, thường phức tạp thành định dạng mà thuật toán có thể xử lý hiệu quả. Quá trình này bao gồm việc chuyển đổi dữ liệu không có cấu trúc hoặc có nhiều chiều, chẳng hạn như hình ảnh, âm thanh hoặc văn bản, thành một tập hợp có cấu trúc các tính năng số, thường được biểu diễn dưới dạng vectơ tính năng. Các tính năng này nhằm mục đích nắm bắt các đặc điểm thiết yếu của dữ liệu gốc trong khi loại bỏ nhiễu và sự dư thừa. Các mục tiêu chính bao gồm giảm độ phức tạp của dữ liệu thông qua việc giảm chiều , làm nổi bật các mẫu có liên quan và làm cho dữ liệu phù hợp hơn với các mô hình ML. Điều này thường dẫn đến độ chính xác của mô hình được cải thiện, đào tạo mô hình nhanh hơn và khái quát hóa tốt hơn đối với dữ liệu chưa biết.

Trích xuất tính năng hoạt động như thế nào

Các kỹ thuật cụ thể để trích xuất tính năng phụ thuộc rất nhiều vào loại dữ liệu đang được xử lý.

  • Dữ liệu hình ảnh: Trong thị giác máy tính truyền thống, các phương pháp liên quan đến việc thiết kế thủ công các thuật toán để phát hiện các đặc điểm cụ thể như cạnh, góc, kết cấu (sử dụng các kỹ thuật như bộ lọc Gabor ) hoặc biểu đồ màu. Các thư viện như OpenCV cung cấp các công cụ để triển khai nhiều kỹ thuật cổ điển này ( trang web chính thức của OpenCV ). Tuy nhiên, trong học sâu (DL) hiện đại, đặc biệt là với Mạng nơ-ron tích chập (CNN) được sử dụng trong các mô hình như Ultralytics YOLO , việc trích xuất đặc điểm thường được học tự động. Các lớp tích chập của mạng áp dụng các bộ lọc cho hình ảnh đầu vào, tạo ra các bản đồ đặc điểm nắm bắt các mẫu ngày càng phức tạp theo thứ bậc - từ các đường và kết cấu đơn giản ở các lớp đầu đến các bộ phận đối tượng và toàn bộ đối tượng ở các lớp sâu hơn. Bạn có thể khám phá nhiều tác vụ thị giác máy tính khác nhau trong đó điều này được áp dụng.

  • Dữ liệu văn bản: Đối với các tác vụ Xử lý ngôn ngữ tự nhiên (NLP) , việc trích xuất tính năng có thể liên quan đến các phương pháp như tính toán Tần suất thuật ngữ-Tần suất tài liệu nghịch đảo ( TF -IDF) để biểu diễn tầm quan trọng của từ hoặc tạo nhúng từ bằng các mô hình như Word2Vec hoặc GloVe. Các nhúng này là các vectơ dày đặc nắm bắt mối quan hệ ngữ nghĩa giữa các từ. Các mô hình tiên tiến hơn như BERTTransformers học các biểu diễn theo ngữ cảnh trực tiếp từ văn bản.

  • Kỹ thuật chung: Các phương pháp như Phân tích thành phần chính (PCA)Nhúng hàng xóm ngẫu nhiên phân phối t (t-SNE) là các kỹ thuật giảm chiều mục đích chung có thể áp dụng trên nhiều loại dữ liệu khác nhau. Chúng chuyển đổi dữ liệu chiều cao thành không gian chiều thấp hơn trong khi vẫn hướng đến mục tiêu bảo toàn các cấu trúc phương sai hoặc lân cận quan trọng, có thể được coi là một dạng trích xuất tính năng. Scikit-learn cung cấp các triển khai cho các kỹ thuật này.

Trích xuất tính năng so với Kỹ thuật tính năng

Trích xuất tính năng thường bị nhầm lẫn với kỹ thuật tính năng , nhưng chúng là những khái niệm riêng biệt.

  • Trích xuất tính năng: Tập trung cụ thể vào việc chuyển đổi dữ liệu thô thành một tập hợp các tính năng được suy ra, thường sử dụng các thuật toán tự động (như các lớp CNN) hoặc các kỹ thuật toán học đã được thiết lập (như biến đổi PCA hoặc Fourier). Mục tiêu thường là giảm chiều và tạo ra một biểu diễn dễ quản lý hơn.
  • Kỹ thuật tính năng: Là một hoạt động rộng hơn bao gồm trích xuất tính năng nhưng cũng liên quan đến việc tạo các tính năng mới từ các tính năng hiện có (ví dụ: tính toán tỷ lệ của hai phép đo), chọn các tính năng có liên quan nhất cho một mô hình, xử lý các giá trị bị thiếu và chuyển đổi các tính năng dựa trên kiến thức chuyên môn và yêu cầu cụ thể của mô hình ( như xử lý trước dữ liệu ). Thông thường, hoạt động này đòi hỏi nhiều nỗ lực thủ công và chuyên môn hơn.

Trong khi các mô hình học sâu tự động hóa phần lớn quá trình trích xuất tính năng cho các tác vụ như nhận dạng hình ảnhphát hiện đối tượng , các nguyên tắc kỹ thuật tính năng, chẳng hạn như tăng cường dữ liệu thích hợp hoặc chuẩn hóa đầu vào, vẫn đóng vai trò quan trọng để đạt được hiệu suất tối ưu.

Ứng dụng trong thế giới thực

Trích xuất tính năng là nền tảng cho vô số ứng dụng AI và ML:

  1. Phân tích hình ảnh y tế: Trong quá trình phân tích các hình ảnh quét y tế như X-quang, CT hoặc MRI để phát hiện các bệnh như ung thư, các đặc điểm cụ thể được trích xuất từ hình ảnh. Chúng có thể bao gồm các mẫu kết cấu bên trong mô, hình dạng và kích thước của các bất thường tiềm ẩn (như khối u được tìm thấy trong tập dữ liệu U não ) hoặc các biến thể cường độ. Các đặc điểm được trích xuất này sau đó được đưa vào bộ phân loại (như SVM hoặc mạng nơ-ron) để dự đoán sự hiện diện hoặc giai đoạn của bệnh. Điều này hỗ trợ các bác sĩ X quang trong chẩn đoán, như đã thảo luận trong các ấn phẩm như Radiology: Artificial Intelligence . Các hệ thống hiện đại có thể sử dụng Ultralytics YOLO11 để trích xuất ngầm các đặc điểm cho các tác vụ như phân tích hình ảnh y tế .

  2. Phân tích tình cảm: Để xác định tình cảm (tích cực, tiêu cực, trung lập) được thể hiện trong dữ liệu văn bản như đánh giá của khách hàng hoặc bài đăng trên mạng xã hội, các tính năng phải được trích xuất từ văn bản thô. Điều này có thể bao gồm việc đếm tần suất của các từ tích cực so với tiêu cực ( Túi từ ), sử dụng TF -Điểm IDF hoặc tạo ra các nhúng câu phức tạp bằng các mô hình ngôn ngữ được đào tạo trước như các mô hình có sẵn qua Hugging Face . Các tính năng này định lượng tông điệu cảm xúc của văn bản, cho phép mô hình ML phân loại cảm xúc chung, điều này rất quan trọng để hiểu phản hồi của khách hàng .

Trích xuất tính năng trong Ultralytics YOLO Mô hình

Các mô hình phát hiện đối tượng tiên tiến như Ultralytics YOLOv8 và YOLO11 thực hiện trích xuất tính năng ngầm định trong kiến trúc mạng nơ-ron (NN) của chúng. Các lớp ban đầu (thường là một phần của xương sống ) hoạt động như các trình trích xuất tính năng mạnh mẽ, đã học được. Khi dữ liệu đầu vào đi qua các lớp này, các tính năng phân cấp được tự động xác định và biểu diễn trong các bản đồ tính năng . Mặc dù quy trình này phần lớn được tự động hóa, nhưng việc hiểu được cách trích xuất tính năng giúp thiết kế các bước xử lý dữ liệu hiệu quả, thực hiện điều chỉnh siêu tham số và diễn giải hành vi của mô hình, có khả năng sử dụng các công cụ có sẵn trong tài liệu Ultralytics hoặc các nền tảng như Ultralytics HUB để quản lý các tập dữ liệu và thử nghiệm. Các kỹ thuật cũng được sử dụng trong các tác vụ hạ nguồn như theo dõi đối tượng , trong đó các tính năng xuất hiện có thể được trích xuất để duy trì danh tính đối tượng trên các khung. Các khuôn khổ như PyTorchTensorFlow cung cấp cơ sở hạ tầng cơ bản để xây dựng và đào tạo các mô hình này.

Đọc tất cả