Thuật ngữ

Mạng nơ-ron (NN)

Khám phá sức mạnh của Mạng nơ-ron nhân tạo - chìa khóa cho những cải tiến về AI và ML như thị giác máy tính, NLP và đột phá về học sâu.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Mạng nơ-ron (NN), thường được gọi là Mạng nơ-ron nhân tạo (ANN), là các mô hình tính toán lấy cảm hứng từ cấu trúc và chức năng phức tạp của não người . Chúng tạo thành nền tảng của Trí tuệ nhân tạo (AI)Học máy (ML) hiện đại, được thiết kế chủ yếu để nhận dạng các mẫu phức tạp trong dữ liệu. Các mạng này cung cấp năng lượng cho nhiều hệ thống thông minh mà chúng ta tương tác hàng ngày, từ các công cụ nhận dạng hình ảnh tinh vi đến các dịch vụ dịch ngôn ngữ tiên tiến.

Hiểu về mạng nơ-ron

Mạng nơ-ron bao gồm các lớp nút được kết nối với nhau, hay nơ-ron . Các lớp này thường bao gồm một lớp đầu vào nhận dữ liệu thô, một hoặc nhiều lớp ẩn xử lý dữ liệu và một lớp đầu ra tạo ra kết quả cuối cùng, chẳng hạn như phân loại hoặc dự đoán. Mỗi kết nối giữa các nơ-ron đều mang một trọng số, biểu thị tầm quan trọng của kết nối. Các nơ-ron xử lý các đầu vào của chúng bằng Hàm kích hoạt để xác định tín hiệu đầu ra mà chúng truyền đi. Mạng học bằng cách điều chỉnh các trọng số này trong quá trình đào tạo , thường sử dụng các thuật toán như giảm dần độ dốclan truyền ngược , để giảm thiểu lỗi giữa các dự đoán của nó và các giá trị mục tiêu thực tế. Để biết hướng dẫn về đào tạo hiệu quả, hãy xem Mẹo đào tạo mô hình của chúng tôi.

Các mô hình sử dụng Học sâu về cơ bản là các mạng nơ-ron với nhiều lớp ẩn (do đó là "sâu"). Độ sâu này cho phép chúng học các mẫu cực kỳ phức tạp và các tính năng phân cấp từ các tập dữ liệu lớn, khiến chúng cực kỳ hiệu quả cho các tác vụ như phát hiện đối tượngphân đoạn hình ảnh . Không giống như các mô hình ML đơn giản hơn có thể yêu cầu kỹ thuật tính năng thủ công, NNs xuất sắc trong việc tự động trích xuất các tính năng có liên quan từ dữ liệu phi cấu trúc như hình ảnh và văn bản.

Ứng dụng của mạng nơ-ron

Mạng nơ-ron cực kỳ linh hoạt và đã được áp dụng trên nhiều lĩnh vực. Sau đây là hai ví dụ chính:

  1. Thị giác máy tính : Trong lĩnh vực thị giác máy tính (CV) , NN, đặc biệt là các loại chuyên biệt như CNN, được sử dụng để phân tích và diễn giải thông tin trực quan. Các mô hình tiên tiến như Ultralytics YOLO tận dụng mạng nơ-ron sâu để phát hiện đối tượng theo thời gian thực, phân đoạn hình ảnh và ước tính tư thế, cho phép các ứng dụng từ lái xe tự động đến phân tích hình ảnh y tế. Bạn có thể đào tạo và triển khai các mô hình như vậy bằng các nền tảng như Ultralytics HUB .
  2. Xử lý ngôn ngữ tự nhiên : NN là nền tảng của Xử lý ngôn ngữ tự nhiên (NLP) , cho phép máy móc hiểu và tạo ra ngôn ngữ của con người. Các ứng dụng bao gồm dịch máy , phân tích tình cảm và phát triển chatbot. Các mô hình như BERT và nhiều mô hình GPT khác nhau dựa trên kiến trúc mạng nơ-ron phức tạp, cụ thể là Transformers.

Mạng nơ-ron so với các khái niệm tương tự

Sẽ rất hữu ích khi phân biệt NN với các khái niệm AI liên quan:

  • Trí tuệ nhân tạo (AI) : AI là lĩnh vực rộng lớn trong việc tạo ra các máy móc thông minh. NN là một kỹ thuật cụ thể được sử dụng trong AI để đạt được khả năng học tập.
  • Học máy (ML) : ML là một tập hợp con của AI tập trung vào các thuật toán học từ dữ liệu. NN là một lớp chính của các mô hình ML, đặc biệt chiếm ưu thế trong học sâu.
  • Học sâu (DL) : DL là một lĩnh vực con của ML, chuyên sử dụng NN với nhiều lớp (kiến trúc sâu) để mô hình hóa các mẫu phức tạp. Tất cả các mô hình học sâu đều là mạng nơ-ron, nhưng không phải tất cả các mạng nơ-ron đều sâu.
  • Mạng nơ-ron tích chập (CNN) : CNN là một loại NN chuyên biệt được thiết kế chủ yếu để xử lý dữ liệu dạng lưới, chẳng hạn như hình ảnh, khiến chúng trở nên cực kỳ hiệu quả cho các tác vụ về thị giác máy tính.
  • Mạng nơ-ron hồi quy (RNN) : RNN được thiết kế để xử lý dữ liệu tuần tự, như văn bản hoặc chuỗi thời gian, bằng cách có các kết nối tạo thành chu kỳ, cho phép thông tin được lưu giữ.
  • Transformers : Transformers là một kiến trúc mới hơn, phụ thuộc nhiều vào cơ chế chú ý, đã trở thành công nghệ tiên tiến nhất cho nhiều tác vụ NLP và ngày càng được sử dụng nhiều trong thị giác máy tính.

Tóm lại, Mạng nơ-ron là những mô hình mạnh mẽ lấy cảm hứng từ não bộ, cho phép máy móc học các mẫu phức tạp từ dữ liệu. Chúng là những khối xây dựng cơ bản cho việc học sâu và thúc đẩy tiến trình trên nhiều ứng dụng AI khác nhau, từ việc hiểu hình ảnh bằng thị giác máy tính đến xử lý ngôn ngữ trong NLP.

Đọc tất cả