Thuật ngữ

Học sâu (DL)

Khám phá sức mạnh của học sâu: tìm hiểu mạng lưới nơ-ron, kỹ thuật đào tạo và các ứng dụng thực tế trong AI, chăm sóc sức khỏe, v.v.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Học sâu (DL) là một lĩnh vực chuyên biệt của Học máy (ML) , bản thân nó nằm trong phạm vi rộng hơn của Trí tuệ nhân tạo (AI) . Các thuật toán DL lấy cảm hứng từ cấu trúc và chức năng của não người, đặc biệt là sử dụng mạng nơ-ron nhân tạo (NN) với nhiều lớp (do đó là "sâu"). Các kiến trúc sâu này cho phép các mô hình học các mẫu phức tạp và biểu diễn phân cấp trực tiếp từ dữ liệu thô như hình ảnh, văn bản hoặc âm thanh, thường vượt trội hơn các kỹ thuật ML truyền thống, đặc biệt là trên các tập dữ liệu lớn và phức tạp.

Học sâu hoạt động như thế nào

Các thành phần cốt lõi của Học sâu là mạng nơ-ron sâu, bao gồm một lớp đầu vào, nhiều lớp ẩn và một lớp đầu ra. Mỗi lớp chứa các nút hoặc 'nơ-ron' được kết nối với nhau để xử lý thông tin. Không giống như các mạng nông hơn, độ sâu của các mô hình này cho phép chúng học các tính năng theo thứ bậc. Ví dụ, trong nhận dạng hình ảnh , các lớp ban đầu có thể phát hiện các cạnh đơn giản, các lớp tiếp theo kết hợp chúng thành các hình dạng và các lớp sâu hơn nhận dạng các đối tượng phức tạp. Quá trình trích xuất tính năng tự động này loại bỏ nhu cầu thiết kế tính năng thủ công, một lợi thế đáng kể so với nhiều phương pháp ML truyền thống. Việc đào tạo các mạng này thường bao gồm việc cung cấp cho chúng một lượng lớn dữ liệu được gắn nhãn ( Học có giám sát ) và sử dụng các thuật toán như truyền ngượcgiảm dần độ dốc để điều chỉnh trọng số mô hình và giảm thiểu lỗi ( hàm mất mát ). Quá trình tính toán chuyên sâu này phụ thuộc rất nhiều vào phần cứng mạnh mẽ, đặc biệt là GPU , để đào tạo mô hình hiệu quả.

Tầm quan trọng trong AI và thị giác máy tính

Học sâu là động lực chính thúc đẩy sự tiến bộ trong AI, đặc biệt là trong Thị giác máy tính (CV) . Khả năng học các biểu diễn có ý nghĩa từ các tập dữ liệu lớn, chẳng hạn như tập dữ liệu COCO hoặc ImageNet , đã dẫn đến những đột phá trong các lĩnh vực trước đây được coi là thách thức đối với máy móc. Các mô hình như Ultralytics YOLO tận dụng DL để phát hiện đối tượng , phân đoạn hình ảnhphân loại hình ảnh hiệu suất cao. Các kỹ thuật như học chuyển giao cho phép tận dụng các mô hình được đào tạo trước (các mô hình đã được đào tạo trên các tập dữ liệu lớn) để đẩy nhanh quá trình phát triển các tác vụ mới có liên quan, ngay cả khi có ít dữ liệu hơn. Lĩnh vực này nợ rất nhiều cho những người tiên phong như Geoffrey Hinton , Yann LeCunYoshua Bengio , thường được gọi là "cha đẻ của AI". Các tổ chức như DeepLearning.AIHiệp hội vì sự tiến bộ của trí tuệ nhân tạo (AAAI) tiếp tục thúc đẩy nghiên cứu và giáo dục trong lĩnh vực đang phát triển nhanh chóng này.

Phân biệt từ các thuật ngữ liên quan

  • Học máy (ML) : DL là một tập hợp con của ML. Mặc dù tất cả DL đều là ML, nhưng không phải tất cả ML đều là DL. ML bao gồm nhiều thuật toán hơn, bao gồm các phương pháp không phải mạng nơ-ron như Support Vector Machines (SVM) , Decision TreesLinear Regression , thường yêu cầu kỹ thuật tính năng thủ công. DL vượt trội trong các tác vụ liên quan đến dữ liệu phi cấu trúc và học tính năng tự động thông qua kiến trúc sâu.
  • Trí tuệ nhân tạo (AI) : AI là lĩnh vực bao quát tập trung vào việc tạo ra các hệ thống thể hiện hành vi thông minh. ML là một cách tiếp cận để đạt được AI bằng cách cho phép các hệ thống học hỏi từ dữ liệu. DL là một tập hợp các kỹ thuật cụ thể trong ML sử dụng mạng nơ-ron sâu. Hãy nghĩ về nó như các khái niệm lồng nhau: AI > ML > DL.

Ứng dụng trong thế giới thực

Học sâu hỗ trợ nhiều ứng dụng AI hiện đại:

Công cụ và Khung

Việc phát triển các mô hình DL được hỗ trợ bởi nhiều thư viện phần mềm và nền tảng khác nhau. Các khuôn khổ mã nguồn mở phổ biến bao gồm:

  • PyTorch : Được biết đến với tính linh hoạt và Python -Cách tiếp cận đầu tiên ( trang chủ PyTorch ). Ultralytics các mô hình được xây dựng bằng cách sử dụng PyTorch .,
  • TensorFlow : Được phát triển bởi Google , cung cấp một hệ sinh thái toàn diện ( trang chủ TensorFlow ).
  • Keras : Một API cấp cao có thể chạy trên TensorFlow , được biết đến vì tính thân thiện với người dùng ( trang chủ Keras ).

Các nền tảng như Ultralytics HUB cung cấp môi trường tích hợp để đào tạo các mô hình tùy chỉnh , triển khai và quản lý các mô hình DL, đặc biệt là đối với các tác vụ thị giác máy tính sử dụng các mô hình như YOLO11 . Phát triển hiệu quả thường liên quan đến các hoạt động như điều chỉnh siêu tham số nghiêm ngặt, hiểu các số liệu hiệu suất và sử dụng khả năng tăng tốc GPU để đào tạo mô hình hiệu quả.

Đọc tất cả