Thuật ngữ

Kỷ nguyên

Tìm hiểu về các kỷ nguyên trong học máy—cách chúng tác động đến việc đào tạo mô hình, ngăn ngừa tình trạng quá khớp và tối ưu hóa hiệu suất với Ultralytics YOLO .

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trong lĩnh vực học máy, đặc biệt là trong đào tạo mạng nơ-ron, một kỷ nguyên là một khái niệm cơ bản đánh dấu một lần hoàn thành toàn bộ tập dữ liệu đào tạo. Hiểu được các kỷ nguyên là rất quan trọng để nắm bắt cách các mô hình học và cải thiện theo thời gian. Đây là một siêu tham số chính quyết định thời lượng của quá trình đào tạo và tác động đáng kể đến hiệu suất của mô hình.

Hiểu về các kỷ nguyên trong học máy

Một kỷ nguyên biểu thị một chu kỳ đào tạo mạng nơ-ron đầy đủ trên toàn bộ tập dữ liệu đào tạo. Trong một kỷ nguyên, mô hình sẽ thấy từng điểm dữ liệu trong tập dữ liệu đào tạo một lần. Ví dụ, nếu tập dữ liệu đào tạo của bạn chứa 1.000 hình ảnh, một kỷ nguyên có nghĩa là mô hình sẽ xử lý tất cả 1.000 hình ảnh một lần trong quá trình đào tạo.

Các kỷ nguyên là cần thiết vì chúng cho phép mô hình học lặp lại từ dữ liệu. Trong mỗi kỷ nguyên, mô hình điều chỉnh các tham số nội bộ của nó ( weights and biases ) dựa trên các lỗi mà nó mắc phải trong lần chạy trước. Quá trình điều chỉnh này, thường được điều khiển bởi các thuật toán tối ưu hóa như Adam optimizer hoặc Stochastic Gradient Descent (SGD) , giúp mô hình giảm thiểu hàm mất mát và dần cải thiện độ chính xác của nó.

Tầm quan trọng của Epochs trong đào tạo mô hình

Số lượng kỷ nguyên được sử dụng để đào tạo một mô hình là một siêu tham số quan trọng ảnh hưởng trực tiếp đến đường cong học tập và hiệu suất cuối cùng của mô hình. Đào tạo quá ít kỷ nguyên có thể dẫn đến underfitting , khi mô hình không học được các mẫu cơ bản trong dữ liệu, dẫn đến hiệu suất kém trên cả dữ liệu đào tạo và dữ liệu xác thực . Ngược lại, đào tạo quá nhiều kỷ nguyên có thể gây ra overfitting , khi mô hình trở nên quá chuyên biệt đối với dữ liệu đào tạo và hoạt động kém trên dữ liệu chưa biết, do đó không thể khái quát hóa hiệu quả.

Việc tìm đúng số kỷ nguyên thường liên quan đến việc theo dõi hiệu suất của mô hình trên một tập hợp xác thực trong quá trình đào tạo. Các kỹ thuật như xác thực chéo K-Fold cũng có thể giúp đánh giá số kỷ nguyên tối ưu bằng cách cung cấp ước tính mạnh mẽ hơn về hiệu suất của mô hình trên các tập dữ liệu khác nhau. Các công cụ như TensorBoard hoặc Weights & Biases có thể vô cùng hữu ích để trực quan hóa tiến trình đào tạo và xác định thời điểm dừng đào tạo để tránh tình trạng quá khớp hoặc thiếu khớp.

Kỷ nguyên, Lặp lại và Kích thước lô

Điều quan trọng là phải phân biệt epoch với các thuật ngữ liên quan như số lần lặp và kích thước lô. Trong khi epoch là một lần hoàn thành toàn bộ tập dữ liệu đào tạo, thì một lần lặp là một lần qua một các ví dụ đào tạo. Kích thước lô xác định số lượng ví dụ đào tạo được xử lý trong mỗi lần lặp.

Ví dụ, nếu bạn có một tập dữ liệu gồm 1.000 hình ảnh và bạn đặt kích thước lô là 10, mỗi kỷ nguyên sẽ bao gồm 100 lần lặp (1.000 hình ảnh / 10 hình ảnh mỗi lô = 100 lần lặp). Trong mỗi lần lặp, mô hình xử lý 10 hình ảnh, tính toán lỗi và cập nhật các tham số mô hình. Sau 100 lần lặp, mô hình đã hoàn thành một kỷ nguyên, đã xem tất cả 1.000 hình ảnh một lần.

Hiểu được mối quan hệ này là rất quan trọng để đào tạo hiệu quả, đặc biệt là khi xử lý các tập dữ liệu lớn không thể vừa với bộ nhớ cùng một lúc. Kích thước lô và số lần lặp lại trên mỗi kỷ nguyên là các tham số có thể định cấu hình trong các khuôn khổ đào tạo như PyTorch , Ultralytics YOLO được xây dựng dựa trên.

Ứng dụng thực tế của Epochs

Epoch là nền tảng cơ bản để đào tạo bất kỳ mô hình học sâu nào và ứng dụng của chúng trải dài trên nhiều lĩnh vực khác nhau. Sau đây là một vài ví dụ:

  1. Phát hiện đối tượng YOLO Ultralytics : Khi đào tạo mô hình YOLOv8 Ultralytics để phát hiện đối tượng , bạn xác định số kỷ nguyên để đào tạo mô hình trên tập dữ liệu của mình. Ví dụ, trong các tình huống như thị giác máy tính trong nông nghiệp để phát hiện trái cây, bạn có thể đào tạo YOLO mô hình cho 100 kỷ nguyên. Điều này có nghĩa là mô hình sẽ duyệt qua toàn bộ tập dữ liệu hình ảnh trái cây của bạn 100 lần, học cách xác định và định vị chính xác trái cây trong hình ảnh. Nền tảng Ultralytics HUB đơn giản hóa quy trình này, cho phép người dùng dễ dàng thiết lập và quản lý kỷ nguyên trong quá trình đào tạo.

  2. Phân tích hình ảnh y tế: Trong phân tích hình ảnh y tế , các kỷ nguyên là cần thiết để đào tạo các mô hình phát hiện bệnh hoặc bất thường từ các lần quét y tế. Ví dụ, đào tạo một mô hình để phát hiện khối u trong hình ảnh MRI khối u não sẽ liên quan đến việc thiết lập một số kỷ nguyên. Mỗi kỷ nguyên đảm bảo mô hình tinh chỉnh khả năng nhận dạng các mẫu tinh tế chỉ ra khối u trên toàn bộ tập dữ liệu quét MRI, cải thiện độ chính xác của chẩn đoán qua các kỷ nguyên liên tiếp.

Tóm lại, các kỷ nguyên là nền tảng của quá trình đào tạo học sâu. Chúng đại diện cho các chu kỳ học tập hoàn chỉnh trên dữ liệu đào tạo và việc quản lý cẩn thận số lượng của chúng là rất quan trọng để đạt được hiệu suất mô hình tối ưu và tránh các cạm bẫy phổ biến như quá khớp và thiếu khớp. Bằng cách hiểu các kỷ nguyên, các học viên có thể kiểm soát và tối ưu hóa tốt hơn quá trình đào tạo các mô hình AI của họ cho các ứng dụng thực tế đa dạng.

Đọc tất cả