Khám phá sức mạnh của học sâu: tìm hiểu mạng lưới nơ-ron, kỹ thuật đào tạo và các ứng dụng thực tế trong AI, chăm sóc sức khỏe, v.v.
Học sâu (DL) là một nhánh chuyên biệt của Học máy (ML) , sử dụng mạng nơ-ron đa lớp để học từ lượng dữ liệu khổng lồ. Lấy cảm hứng từ cấu trúc não người, các mô hình DL, thường được gọi là mạng nơ-ron sâu, được thiết kế để tự động học các biểu diễn dữ liệu phân cấp. Điều này có nghĩa là các lớp ban đầu học các đặc điểm đơn giản, và các lớp tiếp theo kết hợp chúng để học các mẫu ngày càng phức tạp. Khả năng này đã biến DL trở thành động lực thúc đẩy những tiến bộ vượt bậc trong Trí tuệ nhân tạo (AI) , đặc biệt là trong các lĩnh vực phức tạp như Thị giác máy tính (CV) và Xử lý ngôn ngữ tự nhiên (NLP) .
Cốt lõi của Học sâu là các mạng nơ-ron sâu, là các mạng nơ-ron có nhiều lớp ẩn giữa các lớp đầu vào và đầu ra. "Sâu" trong Học sâu ám chỉ độ sâu này. Mỗi lớp chứa các đơn vị xử lý (nơ-ron) áp dụng một phép toán, được điều khiển bởi một hàm kích hoạt , cho đầu vào của chúng. Trong quá trình huấn luyện, mạng được cung cấp các tập dữ liệu lớn, và một thuật toán gọi là lan truyền ngược được sử dụng để điều chỉnh các tham số bên trong của mạng, hay trọng số . Quá trình điều chỉnh này, thường được hướng dẫn bởi một thuật toán tối ưu hóa như giảm dần độ dốc , giảm thiểu sự khác biệt giữa các dự đoán của mô hình và giá trị thực tế, được xác định bởi một hàm mất mát . Điều này cho phép mạng tự động khám phá các mẫu phức tạp mà không cần được lập trình rõ ràng để làm như vậy. Một bài báo lịch sử quan trọng đã giúp phổ biến DL hiện đại là bài báo AlexNet từ năm 2012 , đã đạt được kết quả tiên tiến trên tập dữ liệu ImageNet .
Mặc dù Học sâu là một tập hợp con của Học máy, nhưng sự khác biệt chính nằm ở cách tiếp cận của chúng đối với biểu diễn dữ liệu. Các phương pháp ML truyền thống thường phụ thuộc rất nhiều vào kỹ thuật tính năng thủ công, trong đó các chuyên gia trong lĩnh vực tỉ mỉ chế tạo các tính năng từ dữ liệu thô để giúp mô hình đưa ra dự đoán chính xác. Ngược lại, các mô hình DL thực hiện trích xuất tính năng tự động. Cấu trúc phân cấp của các mạng sâu cho phép chúng học các tính năng có liên quan trực tiếp từ dữ liệu. Điều này làm cho DL đặc biệt mạnh mẽ để xử lý dữ liệu phi cấu trúc như hình ảnh, văn bản và âm thanh, trong đó kỹ thuật tính năng thủ công thường không thực tế. Ví dụ, trong nhận dạng hình ảnh , một mô hình DL có thể học cách xác định các cạnh và kết cấu trong các lớp đầu tiên của nó, sau đó là các bộ phận của vật thể như mắt và mũi ở các lớp giữa và cuối cùng là toàn bộ vật thể như khuôn mặt ở các lớp sâu hơn.
Khả năng xử lý dữ liệu phức tạp của Học sâu đã dẫn đến việc nó được ứng dụng trong nhiều ngành công nghiệp và ứng dụng. Hai ví dụ nổi bật bao gồm:
Việc phát triển các mô hình DL được hỗ trợ bởi nhiều thư viện phần mềm và nền tảng khác nhau. Các khuôn khổ mã nguồn mở phổ biến bao gồm:
Các nền tảng như Ultralytics HUB cung cấp môi trường tích hợp để đào tạo các mô hình tùy chỉnh , triển khai và quản lý các mô hình DL, đặc biệt là cho các tác vụ thị giác máy tính sử dụng các mô hình như YOLO11 . Phát triển hiệu quả thường bao gồm các thực hành như tinh chỉnh siêu tham số nghiêm ngặt, hiểu rõ các chỉ số hiệu suất và sử dụng khả năng tăng tốc GPU để đào tạo mô hình hiệu quả. Việc phát triển và triển khai các hệ thống phức tạp này thường được quản lý thông qua các thực hành MLOps .