Khám phá sức mạnh của học sâu: tìm hiểu mạng lưới nơ-ron, kỹ thuật đào tạo và các ứng dụng thực tế trong AI, chăm sóc sức khỏe, v.v.
Học sâu (DL) là một lĩnh vực chuyên biệt của Học máy (ML) , bản thân nó nằm trong phạm vi rộng hơn của Trí tuệ nhân tạo (AI) . Các thuật toán DL lấy cảm hứng từ cấu trúc và chức năng của não người, đặc biệt là sử dụng mạng nơ-ron nhân tạo (NN) với nhiều lớp (do đó là "sâu"). Các kiến trúc sâu này cho phép các mô hình học các mẫu phức tạp và biểu diễn phân cấp trực tiếp từ dữ liệu thô như hình ảnh, văn bản hoặc âm thanh, thường vượt trội hơn các kỹ thuật ML truyền thống, đặc biệt là trên các tập dữ liệu lớn và phức tạp.
Các thành phần cốt lõi của Học sâu là mạng nơ-ron sâu, bao gồm một lớp đầu vào, nhiều lớp ẩn và một lớp đầu ra. Mỗi lớp chứa các nút hoặc 'nơ-ron' được kết nối với nhau để xử lý thông tin. Không giống như các mạng nông hơn, độ sâu của các mô hình này cho phép chúng học các tính năng theo thứ bậc. Ví dụ, trong nhận dạng hình ảnh , các lớp ban đầu có thể phát hiện các cạnh đơn giản, các lớp tiếp theo kết hợp chúng thành các hình dạng và các lớp sâu hơn nhận dạng các đối tượng phức tạp. Quá trình trích xuất tính năng tự động này loại bỏ nhu cầu thiết kế tính năng thủ công, một lợi thế đáng kể so với nhiều phương pháp ML truyền thống. Việc đào tạo các mạng này thường bao gồm việc cung cấp cho chúng một lượng lớn dữ liệu được gắn nhãn ( Học có giám sát ) và sử dụng các thuật toán như truyền ngược và giảm dần độ dốc để điều chỉnh trọng số mô hình và giảm thiểu lỗi ( hàm mất mát ). Quá trình tính toán chuyên sâu này phụ thuộc rất nhiều vào phần cứng mạnh mẽ, đặc biệt là GPU , để đào tạo mô hình hiệu quả.
Học sâu là động lực chính thúc đẩy sự tiến bộ trong AI, đặc biệt là trong Thị giác máy tính (CV) . Khả năng học các biểu diễn có ý nghĩa từ các tập dữ liệu lớn, chẳng hạn như tập dữ liệu COCO hoặc ImageNet , đã dẫn đến những đột phá trong các lĩnh vực trước đây được coi là thách thức đối với máy móc. Các mô hình như Ultralytics YOLO tận dụng DL để phát hiện đối tượng , phân đoạn hình ảnh và phân loại hình ảnh hiệu suất cao. Các kỹ thuật như học chuyển giao cho phép tận dụng các mô hình được đào tạo trước (các mô hình đã được đào tạo trên các tập dữ liệu lớn) để đẩy nhanh quá trình phát triển các tác vụ mới có liên quan, ngay cả khi có ít dữ liệu hơn. Lĩnh vực này nợ rất nhiều cho những người tiên phong như Geoffrey Hinton , Yann LeCun và Yoshua Bengio , thường được gọi là "cha đẻ của AI". Các tổ chức như DeepLearning.AI và Hiệp hội vì sự tiến bộ của trí tuệ nhân tạo (AAAI) tiếp tục thúc đẩy nghiên cứu và giáo dục trong lĩnh vực đang phát triển nhanh chóng này.
Học sâu hỗ trợ nhiều ứng dụng AI hiện đại:
Việc phát triển các mô hình DL được hỗ trợ bởi nhiều thư viện phần mềm và nền tảng khác nhau. Các khuôn khổ mã nguồn mở phổ biến bao gồm:
Các nền tảng như Ultralytics HUB cung cấp môi trường tích hợp để đào tạo các mô hình tùy chỉnh , triển khai và quản lý các mô hình DL, đặc biệt là đối với các tác vụ thị giác máy tính sử dụng các mô hình như YOLO11 . Phát triển hiệu quả thường liên quan đến các hoạt động như điều chỉnh siêu tham số nghiêm ngặt, hiểu các số liệu hiệu suất và sử dụng khả năng tăng tốc GPU để đào tạo mô hình hiệu quả.