Thuật ngữ

Máy vectơ hỗ trợ (SVM)

Khám phá cách Máy hỗ trợ vectơ (SVM) hoạt động hiệu quả trong phân loại, hồi quy và phát hiện giá trị ngoại lai với dữ liệu có chiều cao.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Support Vector Machine (SVM) là một thuật toán học máy có giám sát mạnh mẽ và linh hoạt được sử dụng để phân loại, hồi quy và phát hiện ngoại lệ. SVM đặc biệt hiệu quả trong không gian nhiều chiều và được sử dụng rộng rãi khi có ranh giới phân tách rõ ràng giữa các lớp. Chúng hoạt động bằng cách tìm siêu phẳng tốt nhất phân loại rõ ràng các điểm dữ liệu thành các danh mục khác nhau.

Các khái niệm chính của máy vectơ hỗ trợ

Về bản chất, SVM hướng đến mục tiêu tìm một siêu phẳng phân tách tốt nhất các điểm dữ liệu của các lớp khác nhau trong không gian đặc điểm. Siêu phẳng được chọn để tối đa hóa biên, tức là khoảng cách giữa siêu phẳng và điểm dữ liệu gần nhất từ mỗi lớp. Các điểm dữ liệu gần nhất này được gọi là vectơ hỗ trợ và chúng đóng vai trò quan trọng trong việc xác định siêu phẳng tối ưu.

Trong trường hợp dữ liệu không thể tách biệt tuyến tính, SVM sử dụng một kỹ thuật gọi là thủ thuật kernel. Thủ thuật kernel liên quan đến việc ánh xạ dữ liệu gốc vào không gian có chiều cao hơn, nơi có thể tách biệt tuyến tính. Các hàm kernel phổ biến bao gồm hàm cơ sở tuyến tính, đa thức và bán kính (RBF).

Ưu điểm của máy vector hỗ trợ

SVM có một số ưu điểm khiến chúng trở thành lựa chọn phổ biến trong học máy:

  • Hiệu quả trong không gian có nhiều chiều: SVM hoạt động tốt ngay cả khi số chiều lớn hơn số mẫu.
  • Hiệu quả bộ nhớ: Vì chỉ có các vectơ hỗ trợ được sử dụng trong hàm quyết định nên SVM có hiệu quả về bộ nhớ.
  • Tính linh hoạt: Có thể chỉ định nhiều hàm hạt nhân khác nhau, cho phép SVM thích ứng với nhiều loại dữ liệu và vấn đề khác nhau.
  • Tính mạnh mẽ: Bằng cách tối đa hóa biên độ, SVM ít có khả năng bị quá khớp so với các thuật toán phân loại khác.

Ứng dụng thực tế của máy vectơ hỗ trợ

SVM có nhiều ứng dụng trong nhiều lĩnh vực khác nhau:

  • Phân loại hình ảnh: SVM có thể được sử dụng cho các tác vụ phân loại hình ảnh , chẳng hạn như xác định đối tượng hoặc mẫu trong hình ảnh. Ví dụ, chúng được sử dụng trong các ứng dụng nhận dạng khuôn mặt để phân biệt giữa các cá nhân khác nhau dựa trên các đặc điểm khuôn mặt của họ.
  • Phân loại văn bản và siêu văn bản: SVM có hiệu quả trong các tác vụ phân loại văn bản, bao gồm phân tích tình cảm, phát hiện thư rác và phân loại chủ đề. Chúng có thể phân loại tài liệu dựa trên sự hiện diện và tần suất của các từ hoặc cụm từ cụ thể.
  • Tin sinh học: Trong tin sinh học, SVM được sử dụng để phân loại protein, phân tích biểu hiện gen và phân loại ung thư dựa trên hồ sơ biểu hiện gen.
  • Nhận dạng chữ viết tay: SVM có thể nhận dạng các ký tự viết tay, giúp ích trong các ứng dụng như số hóa tài liệu viết tay.

Máy vectơ hỗ trợ so với các thuật toán khác

Mặc dù SVM rất mạnh nhưng điều quan trọng là phải hiểu cách chúng so sánh với các thuật toán học máy (ML) khác:

  • SVM so với hồi quy logistic: Cả SVM và hồi quy logistic đều được sử dụng để phân loại. Tuy nhiên, hồi quy logistic mô hình hóa xác suất của một kết quả, trong khi SVM tìm siêu phẳng tốt nhất để tách các lớp. SVM thường được ưa chuộng khi có biên độ tách biệt rõ ràng hoặc khi xử lý dữ liệu có nhiều chiều.
  • SVM so với Mạng nơ-ron : Mạng nơ-ron , đặc biệt là mạng nơ-ron sâu, có thể mô hình hóa các mối quan hệ phi tuyến tính phức tạp nhưng đòi hỏi lượng lớn dữ liệu và tài nguyên tính toán. SVM hiệu quả hơn đối với các tập dữ liệu nhỏ hơn và cung cấp khả năng khái quát hóa tốt hơn với ít rủi ro quá mức khi được điều chỉnh đúng cách.
  • SVM so với Random Forest : Random forest là phương pháp tập hợp xây dựng nhiều cây quyết định và hợp nhất đầu ra của chúng. Trong khi random forest có thể xử lý dữ liệu phi tuyến tính tốt, SVM với kernel phù hợp có thể hoạt động tốt hơn trong trường hợp có ranh giới lớp riêng biệt.

Kết thúc

Support Vector Machines là một công cụ mạnh mẽ và linh hoạt trong bộ công cụ học máy, đặc biệt hiệu quả đối với các tác vụ phân loại. Khả năng xử lý dữ liệu đa chiều của chúng, kết hợp với tính linh hoạt do nhiều hàm hạt nhân khác nhau cung cấp, khiến chúng phù hợp với nhiều ứng dụng khác nhau. Hiểu được điểm mạnh và hạn chế của SVM có thể giúp các học viên lựa chọn đúng thuật toán cho nhu cầu cụ thể của mình, đảm bảo hiệu suất và kết quả tối ưu. Khám phá thêm về các thuật toán học máy và ứng dụng của chúng trên trang thuật ngữ Ultralytics . Để tìm hiểu về sự phát triển của phát hiện đối tượng và Ultralytics YOLO mô hình, hãy truy cập Sự phát triển của các mô hình YOLO của Ultralytics và Phát hiện đối tượng .

Đọc tất cả