Thuật ngữ

Kỹ thuật tính năng

Nắm vững kỹ thuật tính năng để tăng hiệu suất mô hình học máy. Tìm hiểu các kỹ thuật, ứng dụng thực tế và mẹo để có độ chính xác cao hơn.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Kỹ thuật tính năng là một quy trình quan trọng trong học máy (ML) liên quan đến việc chuyển đổi dữ liệu thô thành định dạng giúp cải thiện hiệu suất của các mô hình ML. Đây là nghệ thuật và khoa học trong việc lựa chọn, tạo và chuyển đổi các biến, được gọi là tính năng, được sử dụng làm đầu vào cho các mô hình này. Mục tiêu là tạo ra các tính năng nắm bắt thông tin cần thiết trong dữ liệu, giúp mô hình dễ dàng học các mẫu và đưa ra dự đoán chính xác hơn. Kỹ thuật tính năng hiệu quả có thể cải thiện đáng kể khả năng khái quát hóa của mô hình từ dữ liệu đào tạo sang dữ liệu chưa biết, cuối cùng là cải thiện độ chính xác và hiệu quả của mô hình.

Tầm quan trọng của Kỹ thuật tính năng

Kỹ thuật tính năng rất quan trọng vì chất lượng và mức độ liên quan của các tính năng tác động trực tiếp đến hiệu suất của mô hình học máy. Các tính năng được thiết kế tốt có thể đơn giản hóa cấu trúc cơ bản của dữ liệu, giúp các mô hình dễ dàng phân biệt các mẫu và mối quan hệ hơn. Điều này có thể dẫn đến các dự đoán chính xác hơn, thời gian đào tạo nhanh hơn và giảm độ phức tạp của các mô hình. Trong nhiều trường hợp, các tính năng phù hợp có thể tạo nên sự khác biệt giữa một mô hình hoạt động kém và một mô hình đạt được kết quả tiên tiến. Điều này đặc biệt quan trọng trong các tác vụ phức tạp như phát hiện đối tượng , trong đó dữ liệu pixel thô có thể không cung cấp thông tin trực tiếp.

Kỹ thuật thiết kế tính năng

Một số kỹ thuật thường được sử dụng trong thiết kế tính năng:

  • Tạo Tính năng Tương tác : Điều này liên quan đến việc kết hợp hai hoặc nhiều tính năng để tạo ra một tính năng mới nắm bắt các tương tác giữa các biến. Ví dụ, trong mô hình dự đoán giá bất động sản, việc nhân số phòng với kích thước ngôi nhà có thể tạo ra một tính năng cung cấp nhiều thông tin hơn so với từng biến riêng lẻ.
  • Xử lý giá trị bị thiếu : Dữ liệu bị thiếu có thể được quy ước bằng nhiều phương pháp khác nhau, chẳng hạn như điền giá trị trung bình, trung vị hoặc mốt của các giá trị quan sát được hoặc sử dụng các kỹ thuật phức tạp hơn như quy ước dự đoán.
  • Feature Scaling : Điều này liên quan đến việc chia tỷ lệ các tính năng thành một phạm vi tương tự, điều này có thể rất quan trọng đối với các thuật toán nhạy cảm với tỷ lệ các tính năng đầu vào, chẳng hạn như các thuật toán sử dụng tính toán khoảng cách. Các phương pháp phổ biến bao gồm chuẩn hóa và chuẩn hóa. Tìm hiểu thêm về các kỹ thuật này trong quá trình xử lý trước dữ liệu có chú thích .
  • Mã hóa các biến phân loại : Các đặc điểm phân loại, chẳng hạn như màu sắc hoặc danh mục, cần được chuyển đổi thành định dạng số mà các mô hình ML có thể xử lý. Các kỹ thuật bao gồm mã hóa one-hot, mã hóa nhãn và mã hóa mục tiêu.
  • Phân nhóm hoặc Phân biệt : Các tính năng liên tục có thể được chuyển đổi thành các tính năng phân loại bằng cách chia phạm vi giá trị thành các nhóm. Điều này có thể hữu ích để nắm bắt các mối quan hệ phi tuyến tính trong dữ liệu.
  • Lựa chọn tính năng : Không phải tất cả các tính năng đều cung cấp thông tin như nhau. Các phương pháp lựa chọn tính năng, chẳng hạn như phương pháp lọc, phương pháp bao bọc và phương pháp nhúng, giúp xác định các tính năng có liên quan nhất, giảm chiều và cải thiện hiệu suất mô hình. Tìm hiểu thêm về việc giảm chiều trên Ultralytics trang web.

Kỹ thuật tính năng so với Trích xuất tính năng

Mặc dù cả kỹ thuật tính năng và trích xuất tính năng đều hướng đến mục tiêu cải thiện hiệu suất mô hình bằng cách làm việc với các tính năng, nhưng chúng có cách tiếp cận khác nhau. Trích xuất tính năng liên quan đến việc tự động tạo các tính năng mới từ dữ liệu thô, thường sử dụng thuật toán. Ví dụ, trong xử lý hình ảnh, Mạng nơ-ron tích chập (CNN) có thể học cách trích xuất các cạnh hoặc kết cấu từ hình ảnh. Mặt khác, kỹ thuật tính năng thường liên quan đến việc tạo hoặc chuyển đổi thủ công các tính năng dựa trên kiến thức về miền và sự hiểu biết về dữ liệu.

Ứng dụng trong thế giới thực

Sau đây là hai ví dụ về kỹ thuật thiết kế tính năng trong các ứng dụng AI/ML thực tế:

  1. Phát hiện gian lận : Trong phát hiện gian lận thẻ tín dụng, dữ liệu giao dịch thô có thể bao gồm số tiền giao dịch, thời gian, địa điểm và nhà cung cấp. Kỹ thuật tính năng có thể liên quan đến việc tạo ra các tính năng mới như chênh lệch thời gian giữa các giao dịch liên tiếp, số tiền giao dịch trung bình trong một khoảng thời gian hoặc tính năng nhị phân cho biết liệu giao dịch có xảy ra ở một địa điểm bất thường hay không. Các tính năng được thiết kế này có thể cải thiện đáng kể khả năng phát hiện giao dịch gian lận của mô hình.
  2. Bảo trì dự đoán : Trong sản xuất, việc dự đoán lỗi thiết bị có thể tiết kiệm đáng kể chi phí. Dữ liệu thô từ cảm biến có thể bao gồm nhiệt độ, áp suất và độ rung. Kỹ thuật tính năng có thể liên quan đến việc tạo các tính năng như tốc độ thay đổi nhiệt độ, mức trung bình động của các mức độ rung hoặc thời gian kể từ lần bảo trì cuối cùng. Các tính năng này có thể giúp mô hình dự đoán thời điểm máy có khả năng hỏng, cho phép bảo trì kịp thời. Tìm hiểu thêm về AI trong sản xuất trên Ultralytics trang web.

Kỹ thuật tính năng và Ultralytics

Ultralytics cung cấp các công cụ và tài nguyên mạnh mẽ cho các tác vụ thị giác máy tính , bao gồm cả những tác vụ được hưởng lợi từ kỹ thuật tính năng. Ví dụ, Ultralytics YOLO mô hình phát hiện đối tượng có thể được cải thiện bằng cách thiết kế cẩn thận các tính năng từ dữ liệu hình ảnh. Bằng cách sử dụng các kỹ thuật như tạo các tính năng tương tác hoặc xử lý các giá trị bị thiếu, người dùng có thể cải thiện độ chính xác và hiệu quả của mô hình của họ. Ngoài ra, Ultralytics cung cấp một nền tảng thân thiện với người dùng, Ultralytics HUB , giúp đơn giản hóa quá trình đào tạo và triển khai các mô hình, giúp dễ dàng thử nghiệm các phương pháp kỹ thuật tính năng khác nhau. Khám phá những tiến bộ mới nhất trong các mô hình Ultralytics YOLO để xem cách kỹ thuật tính năng có thể được áp dụng trong các dự án thị giác máy tính tiên tiến.

Để tìm hiểu thêm về kỹ thuật tính năng và các khái niệm liên quan, bạn có thể khám phá các tài nguyên như trang Wikipedia về kỹ thuật tính năngtài liệu scikit-learn về xử lý trước dữ liệu .

Đọc tất cả