Thuật ngữ

Học sâu (DL)

Khám phá sức mạnh của học sâu: tìm hiểu mạng lưới nơ-ron, kỹ thuật đào tạo và các ứng dụng thực tế trong AI, chăm sóc sức khỏe, v.v.

Học sâu (DL) là một nhánh chuyên biệt của Học máy (ML) , sử dụng mạng nơ-ron đa lớp để học từ lượng dữ liệu khổng lồ. Lấy cảm hứng từ cấu trúc não người, các mô hình DL, thường được gọi là mạng nơ-ron sâu, được thiết kế để tự động học các biểu diễn dữ liệu phân cấp. Điều này có nghĩa là các lớp ban đầu học các đặc điểm đơn giản, và các lớp tiếp theo kết hợp chúng để học các mẫu ngày càng phức tạp. Khả năng này đã biến DL trở thành động lực thúc đẩy những tiến bộ vượt bậc trong Trí tuệ nhân tạo (AI) , đặc biệt là trong các lĩnh vực phức tạp như Thị giác máy tính (CV)Xử lý ngôn ngữ tự nhiên (NLP) .

Học sâu hoạt động như thế nào

Cốt lõi của Học sâu là các mạng nơ-ron sâu, là các mạng nơ-ron có nhiều lớp ẩn giữa các lớp đầu vào và đầu ra. "Sâu" trong Học sâu ám chỉ độ sâu này. Mỗi lớp chứa các đơn vị xử lý (nơ-ron) áp dụng một phép toán, được điều khiển bởi một hàm kích hoạt , cho đầu vào của chúng. Trong quá trình huấn luyện, mạng được cung cấp các tập dữ liệu lớn, và một thuật toán gọi là lan truyền ngược được sử dụng để điều chỉnh các tham số bên trong của mạng, hay trọng số . Quá trình điều chỉnh này, thường được hướng dẫn bởi một thuật toán tối ưu hóa như giảm dần độ dốc , giảm thiểu sự khác biệt giữa các dự đoán của mô hình và giá trị thực tế, được xác định bởi một hàm mất mát . Điều này cho phép mạng tự động khám phá các mẫu phức tạp mà không cần được lập trình rõ ràng để làm như vậy. Một bài báo lịch sử quan trọng đã giúp phổ biến DL hiện đại là bài báo AlexNet từ năm 2012 , đã đạt được kết quả tiên tiến trên tập dữ liệu ImageNet .

Học sâu so với học máy

Mặc dù Học sâu là một tập hợp con của Học máy, nhưng sự khác biệt chính nằm ở cách tiếp cận của chúng đối với biểu diễn dữ liệu. Các phương pháp ML truyền thống thường phụ thuộc rất nhiều vào kỹ thuật tính năng thủ công, trong đó các chuyên gia trong lĩnh vực tỉ mỉ chế tạo các tính năng từ dữ liệu thô để giúp mô hình đưa ra dự đoán chính xác. Ngược lại, các mô hình DL thực hiện trích xuất tính năng tự động. Cấu trúc phân cấp của các mạng sâu cho phép chúng học các tính năng có liên quan trực tiếp từ dữ liệu. Điều này làm cho DL đặc biệt mạnh mẽ để xử lý dữ liệu phi cấu trúc như hình ảnh, văn bản và âm thanh, trong đó kỹ thuật tính năng thủ công thường không thực tế. Ví dụ, trong nhận dạng hình ảnh , một mô hình DL có thể học cách xác định các cạnh và kết cấu trong các lớp đầu tiên của nó, sau đó là các bộ phận của vật thể như mắt và mũi ở các lớp giữa và cuối cùng là toàn bộ vật thể như khuôn mặt ở các lớp sâu hơn.

Ứng dụng và Ví dụ

Khả năng xử lý dữ liệu phức tạp của Học sâu đã dẫn đến việc nó được ứng dụng trong nhiều ngành công nghiệp và ứng dụng. Hai ví dụ nổi bật bao gồm:

  1. Xe tự hành: Xe tự hành phụ thuộc rất nhiều vào DL để nhận thức thời gian thực. Các mô hình YOLO của Ultralytics , một dòng mô hình DL tiên tiến, được sử dụng để phát hiện vật thể , xác định người đi bộ, các phương tiện khác và biển báo giao thông. Tương tự, DL được sử dụng để phân đoạn hình ảnh , phân biệt mặt đường có thể lái được với môi trường xung quanh, điều này rất quan trọng cho việc điều hướng an toàn. Đọc thêm về việc sử dụng nó trong AI trên xe tự hành .
  2. Phân tích hình ảnh y tế: Trong chăm sóc sức khỏe, các mô hình DL hỗ trợ các bác sĩ X quang bằng cách phân tích các hình ảnh chụp cắt lớp y tế. Mạng nơ-ron tích chập (CNN) , một kiến trúc DL phổ biến cho thị giác, có thể được đào tạo để phát hiện các bất thường như khối u trong ảnh chụp MRI não hoặc các dấu hiệu bệnh lý trên phim X-quang với độ chính xác cao. Điều này có thể dẫn đến chẩn đoán sớm hơn và cải thiện kết quả điều trị cho bệnh nhân, như đã thấy trong các ứng dụng như phát hiện khối u não .

Công cụ và Khung

Việc phát triển các mô hình DL được hỗ trợ bởi nhiều thư viện phần mềm và nền tảng khác nhau. Các khuôn khổ mã nguồn mở phổ biến bao gồm:

  • PyTorch : Được biết đến với tính linh hoạt và phương pháp tiếp cận ưu tiên Python ( trang chủ PyTorch ). Các mô hình Ultralytics được xây dựng bằng PyTorch.
  • TensorFlow : Được phát triển bởi Google AI , cung cấp hệ sinh thái toàn diện ( trang chủ TensorFlow ).
  • Keras : Một API cấp cao có thể chạy trên TensorFlow, được biết đến vì tính thân thiện với người dùng ( trang chủ Keras ).

Các nền tảng như Ultralytics HUB cung cấp môi trường tích hợp để đào tạo các mô hình tùy chỉnh , triển khai và quản lý các mô hình DL, đặc biệt là cho các tác vụ thị giác máy tính sử dụng các mô hình như YOLO11 . Phát triển hiệu quả thường bao gồm các thực hành như tinh chỉnh siêu tham số nghiêm ngặt, hiểu rõ các chỉ số hiệu suất và sử dụng khả năng tăng tốc GPU để đào tạo mô hình hiệu quả. Việc phát triển và triển khai các hệ thống phức tạp này thường được quản lý thông qua các thực hành MLOps .

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard