Tăng cường dữ liệu là một kỹ thuật được sử dụng trong học máy (ML) để tăng kích thước và tính đa dạng của một tập dữ liệu đào tạo một cách nhân tạo bằng cách tạo các bản sao đã sửa đổi của các điểm dữ liệu hiện có hoặc tạo dữ liệu tổng hợp mới từ chúng. Quá trình này giúp cải thiện hiệu suất, khả năng khái quát hóa và độ mạnh mẽ của các mô hình ML, đặc biệt là trong các lĩnh vực như thị giác máy tính , nơi việc thu thập lượng lớn dữ liệu đa dạng có thể là thách thức và tốn kém. Bằng cách phơi bày các mô hình như Ultralytics YOLO với nhiều biến thể hơn trong quá trình đào tạo, tăng cường dữ liệu giúp chúng hoạt động tốt hơn trên dữ liệu thực tế chưa được biết đến.
Tăng cường dữ liệu hoạt động như thế nào
Tăng cường dữ liệu áp dụng nhiều phép biến đổi khác nhau vào các điểm dữ liệu gốc để tạo ra các ví dụ mới, hợp lý. Đối với dữ liệu hình ảnh, các kỹ thuật phổ biến bao gồm:
- Biến đổi hình học: Xoay, thay đổi tỷ lệ, tịnh tiến (dịch chuyển), lật (theo chiều ngang hoặc chiều dọc) và cắt hình ảnh.
- Chuyển đổi không gian màu: Điều chỉnh độ sáng, độ tương phản, độ bão hòa, sắc thái hoặc áp dụng hiệu ứng rung màu.
- Tiêm nhiễu: Thêm nhiễu ngẫu nhiên (ví dụ: nhiễu Gauss) để mô phỏng các khuyết điểm của cảm biến hoặc điều kiện ánh sáng yếu.
- Xóa/Cắt ngẫu nhiên: Xóa các mảng ngẫu nhiên khỏi hình ảnh để khuyến khích người mẫu tập trung vào các phần khác nhau của vật thể.
- Trộn hình ảnh: Kết hợp nhiều hình ảnh, chẳng hạn như trong tăng cường Mosaic (được sử dụng trong các mô hình như YOLOv4 ) hoặc MixUp, để tạo các mẫu đào tạo tổng hợp.
Mặc dù nổi bật nhất trong lĩnh vực thị giác máy tính, các kỹ thuật tăng cường cũng tồn tại đối với các loại dữ liệu khác, chẳng hạn như thay thế từ đồng nghĩa hoặc dịch ngược cho dữ liệu văn bản trong Xử lý ngôn ngữ tự nhiên (NLP) .
Tầm quan trọng và lợi ích
Việc tăng cường dữ liệu mang lại một số lợi thế quan trọng trong phát triển mô hình ML:
- Giảm thiểu vấn đề thiếu hụt dữ liệu: Mở rộng các tập dữ liệu hạn chế, giúp việc đào tạo các mô hình phức tạp như mạng nơ-ron sâu trở nên khả thi ngay cả khi không có sẵn lượng lớn dữ liệu gốc.
- Ngăn chặn tình trạng quá khớp: Bằng cách đưa ra các biến thể, việc tăng cường giúp ngăn chặn các mô hình chỉ ghi nhớ dữ liệu đào tạo ( quá khớp ) và khuyến khích chúng học các tính năng tổng quát hơn. Đọc các mẹo đào tạo mô hình của chúng tôi để biết thêm các chiến lược.
- Cải thiện độ tin cậy của mô hình: Việc đào tạo trên dữ liệu tăng cường giúp mô hình ít nhạy cảm hơn với các biến thể đầu vào, chẳng hạn như thay đổi về ánh sáng, hướng hoặc tỷ lệ, dẫn đến hiệu suất tốt hơn trong nhiều điều kiện thực tế khác nhau.
- Hiệu quả về chi phí và thời gian: Việc bổ sung dữ liệu hiện có thường rẻ hơn và nhanh hơn so với việc thu thập và dán nhãn dữ liệu mới.
Kỹ thuật và Công cụ
Nhiều thư viện đơn giản hóa việc triển khai các kỹ thuật tăng cường dữ liệu. Đối với các tác vụ thị giác máy tính, các công cụ phổ biến bao gồm:
Ultralytics các mô hình kết hợp một số kỹ thuật tăng cường tích hợp sẵn và người dùng có thể quản lý các tập dữ liệu và mô hình bằng các nền tảng như Ultralytics HUB .
Ứng dụng trong thế giới thực
Việc tăng cường dữ liệu được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau:
- Chụp ảnh y khoa: Trong chăm sóc sức khỏe, việc thu thập các tập dữ liệu lớn, đa dạng về hình ảnh y khoa (như chụp X-quang hoặc chụp CT) có thể khó khăn do các quy định về quyền riêng tư và sự hiếm gặp của một số tình trạng nhất định. Việc tăng cường dữ liệu (ví dụ: xoay, thu phóng, điều chỉnh độ tương phản) giúp đào tạo các mô hình mạnh mẽ cho các nhiệm vụ như phát hiện khối u hoặc phân loại bệnh, cải thiện độ chính xác của chẩn đoán. Đây là một phần quan trọng trong việc thúc đẩy AI trong chăm sóc sức khỏe .
- Xe tự hành: Xe tự lái phụ thuộc rất nhiều vào khả năng phát hiện vật thể để nhận biết môi trường xung quanh. Việc tăng cường hình ảnh đào tạo bằng cách mô phỏng các điều kiện thời tiết khác nhau (mưa, sương mù), ánh sáng (ngày, đêm), thêm các vật cản hoặc thay đổi góc nhìn vật thể giúp đảm bảo hệ thống nhận biết của xe hoạt động đáng tin cậy trong các tình huống lái xe khác nhau. Điều này giúp tăng cường tính an toàn trong AI cho các ứng dụng ô tô .
Tăng cường dữ liệu so với dữ liệu tổng hợp
Mặc dù có liên quan, nhưng tăng cường dữ liệu khác với tạo dữ liệu tổng hợp . Tăng cường dữ liệu thường liên quan đến việc áp dụng các phép biến đổi vào các điểm dữ liệu thực hiện có để tạo ra các phiên bản được sửa đổi đôi chút. Ngược lại, dữ liệu tổng hợp đề cập đến dữ liệu hoàn toàn mới được tạo ra một cách nhân tạo, thường sử dụng mô phỏng, thuật toán hoặc mô hình tạo như GAN , mà không nhất thiết phải bắt đầu từ một điểm dữ liệu thực. Cả hai kỹ thuật đều nhằm mục đích nâng cao các tập dữ liệu, nhưng dữ liệu tổng hợp có khả năng tạo ra các kịch bản không có trong dữ liệu gốc, trong khi tăng cường chủ yếu làm tăng phương sai xung quanh dữ liệu hiện có.