Thuật ngữ

Mạng nơ-ron (NN)

Khám phá sức mạnh của Mạng nơ-ron nhân tạo - chìa khóa cho những cải tiến về AI và ML như thị giác máy tính, NLP và đột phá về học sâu.

Mạng nơ-ron (NN), thường được gọi là Mạng nơ-ron nhân tạo (ANN), là các mô hình tính toán lấy cảm hứng từ cấu trúc và chức năng phức tạp của não người . Chúng tạo thành nền tảng của Trí tuệ nhân tạo (AI) và Học máy (ML) hiện đại, được thiết kế chủ yếu để nhận dạng các mẫu phức tạp trong dữ liệu. Các mạng này cung cấp năng lượng cho nhiều hệ thống thông minh mà chúng ta tương tác hàng ngày, từ các công cụ nhận dạng hình ảnh tinh vi đến các dịch vụ dịch ngôn ngữ tiên tiến và là nền tảng cho các lĩnh vực như thị giác máy tính (CV) và Xử lý ngôn ngữ tự nhiên (NLP) .

Hiểu về mạng nơ-ron

Một mạng nơ-ron bao gồm các lớp nút được kết nối với nhau, hay còn gọi là nơ-ron . Các lớp này thường bao gồm một lớp đầu vào nhận dữ liệu thô (như giá trị pixel trong hình ảnh hoặc từ trong câu), một hoặc nhiều lớp ẩn xử lý dữ liệu thông qua các phép tính và một lớp đầu ra tạo ra kết quả cuối cùng, chẳng hạn như nhãn phân loại hoặc giá trị dự đoán. Mỗi kết nối giữa các nơ-ron mang một 'trọng số', một giá trị số biểu thị tầm quan trọng của kết nối trong các phép tính của mạng.

Các neuron xử lý các đầu vào kết hợp của chúng bằng một hàm kích hoạt , như ReLU hoặc Sigmoid , xác định tín hiệu đầu ra mà chúng truyền tiếp đến lớp tiếp theo. Mạng 'học' bằng cách điều chỉnh các trọng số này trong quá trình đào tạo , thường sử dụng các ví dụ được gắn nhãn trong bối cảnh học có giám sát . Các thuật toán như gradient descent và thuật toán backpropagation thường được sử dụng để điều chỉnh trọng số theo từng bước nhằm giảm thiểu hàm mất mát , đo lường sự khác biệt giữa các dự đoán của mạng và các giá trị mục tiêu thực tế. Đào tạo mô hình hiệu quả thường đòi hỏi phải điều chỉnh siêu tham số cẩn thận và các chiến lược được nêu trong các hướng dẫn như Mẹo đào tạo mô hình của chúng tôi.

Các mô hình sử dụng Học sâu (DL) về cơ bản là các NN có nhiều lớp ẩn (do đó là "sâu"). Độ sâu này cho phép chúng học các mẫu cực kỳ phức tạp và các tính năng phân cấp từ các tập dữ liệu lớn, khiến chúng cực kỳ hiệu quả cho các tác vụ như phát hiện đối tượng và phân đoạn thể hiện . Không giống như các mô hình ML đơn giản hơn như Hồi quy tuyến tính hoặc Máy vectơ hỗ trợ (SVM) có thể yêu cầu kỹ thuật tính năng thủ công, NN vượt trội trong việc tự động thực hiện trích xuất tính năng từ dữ liệu thô, không có cấu trúc như hình ảnh và văn bản.

Các loại mạng nơ-ron và sự khác biệt

Mặc dù cấu trúc cơ bản được mô tả ở trên thường được áp dụng, nhưng vẫn tồn tại một số kiến trúc NN chuyên biệt:

Mạng nơ-ron tích chập (CNN) : Đặc biệt hiệu quả đối với dữ liệu dạng lưới như hình ảnh. Chúng sử dụng các lớp tích chập để tìm hiểu các phân cấp không gian của các đặc điểm. Nhiều kiến trúc phát hiện đối tượng tận dụng CNN làm xương sống của chúng.
Mạng nơ-ron hồi quy (RNN) : Được thiết kế cho dữ liệu tuần tự như văn bản hoặc chuỗi thời gian , có các kết nối tạo thành chu kỳ có hướng, cho phép thông tin tồn tại. Các biến thể như LSTM rất phổ biến.
Transformers : Ban đầu được phát triển cho các nhiệm vụ NLP, chúng dựa nhiều vào các cơ chế tự chú ý và đã cho thấy hiệu suất đáng chú ý trên nhiều lĩnh vực khác nhau, bao gồm cả thị giác (ViT) .

NN khác biệt đáng kể so với các thuật toán truyền thống như Cây quyết định hoặc KNN (K-Nearest Neighbors) , hoạt động theo các nguyên tắc khác nhau và thường ít phù hợp với dữ liệu phức tạp, có nhiều chiều như hình ảnh mà không có quá trình xử lý trước mở rộng.

Ứng dụng của mạng nơ-ron

Mạng nơ-ron cực kỳ linh hoạt và đã được áp dụng trên nhiều lĩnh vực. Sau đây là hai ví dụ chính:

Thị giác máy tính (CV): NN, đặc biệt là CNN, là động lực thúc đẩy những tiến bộ lớn trong CV. Chúng được sử dụng cho:
- Phân loại hình ảnh : Gán nhãn cho toàn bộ hình ảnh (ví dụ: xác định mèo hoặc chó).
- Phát hiện đối tượng : Xác định và định vị các đối tượng trong hình ảnh bằng hộp giới hạn , như được chứng minh bằng các mô hình YOLO Ultralytics như YOLO11 . Điều này rất quan trọng đối với các ứng dụng như AI trong xe tự lái và quản lý hàng tồn kho do AI điều khiển .
- Phân đoạn hình ảnh : Phân loại từng pixel trong hình ảnh, cho phép hiểu chi tiết về cảnh cho các tác vụ như phân tích hình ảnh y tế . Khám phá các tác vụ phân đoạn với tài liệu Ultralytics .
Xử lý ngôn ngữ tự nhiên (NLP): NN, bao gồm RNN và Transformer, đã cách mạng hóa cách máy móc hiểu và tạo ra ngôn ngữ của con người. Các ứng dụng bao gồm:
- Dịch máy : Tự động dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác (ví dụ: Google Dịch ).
- Phân tích tình cảm : Xác định tông điệu cảm xúc trong văn bản (tích cực, tiêu cực, trung tính).
- Tạo văn bản : Tạo văn bản giống con người, hỗ trợ chatbot và các công cụ tạo nội dung dựa trên các mô hình như mô hình BERT và GPT .

Công cụ và Khung

Việc phát triển và triển khai NN được hỗ trợ bởi nhiều công cụ và khuôn khổ học sâu mạnh mẽ:

Thư viện: Các khuôn khổ như PyTorch và TensorFlow cung cấp các khối xây dựng cốt lõi và khả năng phân biệt tự động cần thiết để đào tạo NN. Keras cung cấp API cấp cao thường được sử dụng với TensorFlow .
Nền tảng: Ultralytics HUB cung cấp nền tảng đào tạo YOLO mô hình, quản lý tập dữ liệu và hợp lý hóa quy trình triển khai mô hình .
Mô hình: Các mô hình được đào tạo trước như trong họ Ultralytics YOLO cung cấp điểm khởi đầu mạnh mẽ cho nhiều tác vụ CV khác nhau, thường chỉ yêu cầu tinh chỉnh trên các tập dữ liệu cụ thể. Bạn có thể tìm thấy các so sánh giữa các mô hình YOLO khác nhau trong tài liệu của chúng tôi.

Việc hiểu về NN rất quan trọng đối với bất kỳ ai làm việc trong lĩnh vực AI hoặc ML, vì chúng tạo thành nền tảng cho nhiều giải pháp tiên tiến trong nhiều ngành công nghiệp khác nhau, từ AI trong chăm sóc sức khỏe đến AI trong nông nghiệp .

Mạng nơ-ron (NN)

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Xe lửa YOLO mô hình đơn giản với Ultralytics TRUNG TÂM

Hiểu về mạng nơ-ron

Các loại mạng nơ-ron và sự khác biệt

Ứng dụng của mạng nơ-ron

Công cụ và Khung

Đọc thêm blog

Tham gia Ultralytics cộng đồng