Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Mạng Nơ-ron (NN)

Khám phá những nguyên lý cơ bản của Mạng nơ-ron. Tìm hiểu cách chúng thúc đẩy trí tuệ nhân tạo (AI), sự khác biệt so với học sâu (deep learning) và động lực tạo ra các mô hình tiên tiến như... Ultralytics YOLO26.

Mạng nơ-ron (NN) là một mô hình tính toán cốt lõi của Trí tuệ nhân tạo (AI), được thiết kế để nhận dạng các mẫu, diễn giải dữ liệu cảm giác và phân nhóm thông tin. Lấy cảm hứng từ cấu trúc sinh học của bộ não con người, các mạng này bao gồm các nút được kết nối với nhau, hay còn gọi là "nơ-ron", được tổ chức thành các lớp. Trong khi bộ não sinh học sử dụng tín hiệu hóa học để giao tiếp qua các khớp thần kinh, mạng nơ-ron kỹ thuật số sử dụng các phép toán học để truyền thông tin. Các hệ thống này là công nghệ nền tảng đằng sau Học máy (ML) hiện đại, cho phép máy tính giải quyết các vấn đề phức tạp như nhận dạng khuôn mặt, dịch ngôn ngữ và điều khiển xe tự hành mà không cần được lập trình rõ ràng cho từng quy tắc cụ thể.

Mạng nơ-ron so với Học sâu

Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau, nhưng điều quan trọng là phải phân biệt giữa Mạng thần kinh cơ bản và Học sâu (Deep Learning - DL) . Sự khác biệt chính nằm ở độ sâu và độ phức tạp. Một mạng thần kinh tiêu chuẩn hoặc "nông" có thể chỉ có một hoặc hai lớp ẩn giữa đầu vào và đầu ra. Ngược lại, Học sâu liên quan đến các mạng thần kinh "sâu" với hàng chục hoặc thậm chí hàng trăm lớp. Độ sâu này cho phép trích xuất đặc trưng diễn ra tự động, cho phép mô hình hiểu được các mẫu phân cấp — các cạnh đơn giản trở thành hình dạng, và các hình dạng trở thành các đối tượng có thể nhận dạng được. Để tìm hiểu sâu hơn về mặt kỹ thuật, MIT News giải thích về học sâu và sự phát triển của nó từ các mạng cơ bản.

Mạng nơ-ron học như thế nào?

Quá trình "học" trong mạng nơ-ron bao gồm việc điều chỉnh các tham số bên trong để giảm thiểu lỗi. Dữ liệu đi vào qua lớp đầu vào, đi qua một hoặc nhiều lớp ẩn nơi diễn ra các phép tính, và đi ra qua lớp đầu ra dưới dạng dự đoán.

  • Weights and Biases : Mỗi kết nối giữa các nơ-ron có một "trọng số" xác định cường độ tín hiệu. Trong quá trình huấn luyện, mạng nơ-ron điều chỉnh các trọng số này dựa trên dữ liệu huấn luyện .
  • Hàm kích hoạt: Để quyết định xem một nơ-ron có nên "phát xung" hay kích hoạt hay không, mạng sử dụng một hàm kích hoạt như ReLU hoặc Sigmoid. Điều này tạo ra tính phi tuyến tính, cho phép mạng học được các ranh giới phức tạp.
  • Lan truyền ngược: Khi mạng nơ-ron đưa ra dự đoán, nó so sánh kết quả với câu trả lời chính xác thực tế. Nếu có lỗi, thuật toán lan truyền ngược sẽ gửi tín hiệu ngược trở lại mạng để tinh chỉnh trọng số, cải thiện độ chính xác theo thời gian.
  • Tối ưu hóa: Các thuật toán như Giảm độ dốc ngẫu nhiên ( SGD ) giúp tìm ra tập hợp trọng số tối ưu để giảm thiểu hàm mất mát. Bạn có thể tìm hiểu thêm về các thuật toán tối ưu hóa trên AWS .

Các Ứng dụng Thực tế

Mạng nơ-ron là động lực đằng sau nhiều công nghệ định hình kỷ nguyên hiện đại.

  1. Thị giác máy tính: Trong lĩnh vực Thị giác máy tính (CV) , các mạng chuyên dụng được gọi là Mạng thần kinh tích chập (CNN) được sử dụng để phân tích dữ liệu hình ảnh. Các mô hình tiên tiến như Ultralytics YOLO26 sử dụng kiến trúc mạng thần kinh sâu để phát hiện đối tượng trong thời gian thực. Các hệ thống này rất quan trọng đối với trí tuệ nhân tạo trong nông nghiệp , nơi chúng giám sát sức khỏe cây trồng, và trong các hệ thống an ninh để phát hiện các bất thường.
  2. Xử lý ngôn ngữ tự nhiên: Đối với các tác vụ liên quan đến văn bản, các kiến trúc như Mạng thần kinh hồi quy (RNN)Transformer đã cách mạng hóa cách máy móc hiểu ngôn ngữ con người. Các mạng này cung cấp sức mạnh cho các công cụ dịch máy và trợ lý ảo. Bạn có thể thấy tác động của các công nghệ này trong trí tuệ nhân tạo trong lĩnh vực chăm sóc sức khỏe , nơi chúng hỗ trợ việc phiên âm các ghi chú y tế và phân tích hồ sơ bệnh nhân.
  3. Phân tích dự đoán: Các doanh nghiệp sử dụng mạng nơ-ron để phân tích chuỗi thời gian nhằm dự báo giá cổ phiếu hoặc nhu cầu hàng tồn kho. IBM cung cấp một tổng quan tuyệt vời về mạng nơ-ron trong phân tích kinh doanh .

Triển khai thực tế

Các thư viện phần mềm hiện đại giúp việc triển khai mạng nơ-ron trở nên dễ dàng hơn mà không cần phải tự viết các phép toán từ đầu. Các công cụ như... Ultralytics Nền tảng Cho phép người dùng dễ dàng huấn luyện các mạng này trên các tập dữ liệu tùy chỉnh. Những điều sau đây Python Đoạn mã này minh họa cách tải một mạng nơ-ron đã được huấn luyện trước (cụ thể là mô hình YOLO26 hiện đại nhất) và chạy suy luận trên một hình ảnh bằng cách sử dụng... ultralytics bưu kiện.

from ultralytics import YOLO

# Load a pretrained YOLO26 neural network model
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
# The model processes the image through its layers to predict bounding boxes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Những thách thức và cân nhắc

Mặc dù mạnh mẽ, mạng nơ-ron vẫn đặt ra những thách thức cụ thể. Chúng thường yêu cầu lượng lớn dữ liệu được gắn nhãn cho Học có giám sát . Nếu không có đủ sự đa dạng dữ liệu, mạng dễ bị quá khớp (Overfitting ), nghĩa là nó ghi nhớ các ví dụ huấn luyện thay vì học cách khái quát hóa. Thêm vào đó, mạng nơ-ron sâu thường được gọi là "hộp đen" vì việc giải thích chính xác cách chúng đưa ra một quyết định cụ thể có thể rất khó khăn, dẫn đến nghiên cứu về Trí tuệ nhân tạo có thể giải thích (Explainable AI - XAI) . Các tổ chức như Hiệp hội Tiêu chuẩn IEEE đang tích cực nghiên cứu các tiêu chuẩn để đảm bảo các mạng mạnh mẽ này được sử dụng một cách có đạo đức và an toàn.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay