Thuật ngữ

Dữ liệu thử nghiệm

Khám phá tầm quan trọng của dữ liệu thử nghiệm trong học máy. Tìm hiểu cách đảm bảo đánh giá mô hình khách quan để đưa ra dự đoán chính xác, thực tế.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trong lĩnh vực học máy, dữ liệu thử nghiệm đóng vai trò quan trọng trong việc đánh giá hiệu suất và khả năng khái quát hóa của một mô hình đã được đào tạo. Đây là một tập dữ liệu độc lập với dữ liệu đào tạodữ liệu xác thực , được sử dụng cụ thể để đánh giá mức độ tốt của một mô hình có thể đưa ra dự đoán về dữ liệu chưa biết. Điều này giúp đảm bảo rằng mô hình không chỉ ghi nhớ dữ liệu đào tạo mà còn học các mẫu có thể áp dụng cho các tình huống mới trong thế giới thực.

Tầm quan trọng của dữ liệu thử nghiệm

Dữ liệu thử nghiệm đóng vai trò là điểm kiểm tra cuối cùng để đánh giá hiệu quả của mô hình trước khi triển khai. Không giống như dữ liệu xác thực, được sử dụng trong quá trình đào tạo để tinh chỉnh siêu tham số và ngăn ngừa quá khớp, dữ liệu thử nghiệm được dành riêng cho đánh giá cuối cùng. Sự tách biệt này rất quan trọng để tránh bất kỳ sự thiên vị nào trong việc đánh giá hiệu suất của mô hình. Bằng cách đánh giá mô hình trên dữ liệu mà nó chưa từng gặp trước đây, các nhà phát triển có thể có được ước tính thực tế hơn về cách mô hình sẽ hoạt động trong các ứng dụng thực tế. Để biết thêm về tầm quan trọng của dữ liệu trong AI, hãy truy cập Blog Ultralytics .

Sự khác biệt chính giữa dữ liệu đào tạo và dữ liệu xác thực

Mặc dù cả ba loại dữ liệu—đào tạo, xác thực và thử nghiệm—đều cần thiết trong học máy, nhưng chúng phục vụ các mục đích riêng biệt:

  • Dữ liệu đào tạo : Đây là dữ liệu được sử dụng để đào tạo mô hình. Mô hình học từ dữ liệu này bằng cách điều chỉnh các tham số nội bộ của nó để giảm thiểu lỗi trong dự đoán của nó. Tìm hiểu thêm về dữ liệu đào tạo .
  • Dữ liệu xác thực : Dữ liệu này được sử dụng trong quá trình đào tạo để tinh chỉnh các siêu tham số của mô hình và theo dõi hiệu suất của nó. Nó giúp đưa ra quyết định về thời điểm dừng đào tạo để ngăn ngừa quá khớp . Tìm hiểu thêm về dữ liệu xác thực .
  • Dữ liệu thử nghiệm : Dữ liệu này chỉ được sử dụng sau khi mô hình đã được đào tạo đầy đủ và các siêu tham số của nó đã được hoàn thiện. Nó cung cấp đánh giá khách quan về khả năng khái quát hóa của mô hình đối với dữ liệu mới, chưa từng thấy.

Ứng dụng trong AI và Học máy

Dữ liệu thử nghiệm được sử dụng trên nhiều miền khác nhau để đánh giá các mô hình trong các ứng dụng khác nhau:

  • Phân loại hình ảnh : Trong các tác vụ phân loại hình ảnh, dữ liệu thử nghiệm có thể bao gồm một tập hợp các hình ảnh mà mô hình chưa từng thấy trước đây. Hiệu suất của mô hình được đánh giá dựa trên mức độ chính xác mà nó có thể phân loại các hình ảnh này thành các danh mục được xác định trước. Tìm hiểu thêm về phân loại hình ảnh .
  • Phát hiện đối tượng : Trong phát hiện đối tượng, dữ liệu thử nghiệm bao gồm hình ảnh có đối tượng mà mô hình cần xác định và định vị. Hiệu suất của mô hình được đo bằng khả năng xác định chính xác đối tượng và vẽ các hộp giới hạn chính xác xung quanh chúng. Khám phá thêm về phát hiện đối tượng .
  • Xử lý ngôn ngữ tự nhiên (NLP) : Đối với các tác vụ NLP, dữ liệu thử nghiệm có thể bao gồm các tài liệu văn bản hoặc câu mà mô hình phải phân tích. Ví dụ, trong phân tích tình cảm, hiệu suất của mô hình được đánh giá dựa trên mức độ xác định tình cảm (tích cực, tiêu cực hoặc trung tính) của văn bản chưa xem. Đi sâu vào Xử lý ngôn ngữ tự nhiên (NLP) .

Ví dụ thực tế

Xe tự hành

Trong quá trình phát triển xe tự lái , dữ liệu thử nghiệm rất quan trọng để đánh giá hiệu suất của các mô hình thị giác máy tính. Ví dụ, một mô hình được đào tạo để phát hiện người đi bộ phải được thử nghiệm trên một tập hợp hình ảnh và video đa dạng mà nó chưa từng gặp trong quá trình đào tạo. Điều này đảm bảo rằng mô hình có thể phát hiện người đi bộ một cách đáng tin cậy trong nhiều điều kiện thực tế khác nhau, chẳng hạn như ánh sáng, thời tiết và góc độ khác nhau.

Chẩn đoán y khoa

Trong chăm sóc sức khỏe, dữ liệu thử nghiệm được sử dụng để đánh giá các mô hình được thiết kế để hỗ trợ chẩn đoán y khoa. Ví dụ, một mô hình được đào tạo để phát hiện khối u trong hình ảnh y khoa, như những mô hình được sử dụng để phát hiện khối u não , phải được thử nghiệm trên một tập hợp hình ảnh riêng biệt không được sử dụng trong quá trình đào tạo. Điều này giúp đảm bảo rằng mô hình có thể phát hiện chính xác khối u ở bệnh nhân mới, cung cấp một công cụ đáng tin cậy cho bác sĩ.

Kết thúc

Dữ liệu thử nghiệm là một thành phần không thể thiếu trong quy trình học máy, cung cấp đánh giá cuối cùng, khách quan về hiệu suất của mô hình. Bằng cách sử dụng dữ liệu thử nghiệm, các nhà phát triển có thể đảm bảo rằng mô hình của họ mạnh mẽ, đáng tin cậy và sẵn sàng triển khai trong các ứng dụng thực tế. Việc sử dụng dữ liệu thử nghiệm độc lập giúp xây dựng sự tự tin vào khả năng khái quát hóa và hoạt động tốt của mô hình trên dữ liệu mới, chưa từng thấy, biến nó thành nền tảng của các hoạt động học máy hiệu quả. Khám phá thêm về Ultralytics YOLO và các ứng dụng của nó trên trang Ultralytics YOLO . Để biết thêm thông tin chi tiết về thị giác máy tính, hãy truy cập trang thuật ngữ thị giác máy tính . Bạn cũng có thể tìm hiểu thêm về máy học trên Wikipedia .

Đọc tất cả