Khám phá những nguyên lý cơ bản của Mạng nơ-ron. Tìm hiểu cách chúng thúc đẩy trí tuệ nhân tạo (AI), sự khác biệt so với học sâu (deep learning) và động lực tạo ra các mô hình tiên tiến như... Ultralytics YOLO26.
Mạng nơ-ron (NN) là một mô hình tính toán cốt lõi của Trí tuệ nhân tạo (AI), được thiết kế để nhận dạng các mẫu, diễn giải dữ liệu cảm giác và phân nhóm thông tin. Lấy cảm hứng từ cấu trúc sinh học của bộ não con người, các mạng này bao gồm các nút được kết nối với nhau, hay còn gọi là "nơ-ron", được tổ chức thành các lớp. Trong khi bộ não sinh học sử dụng tín hiệu hóa học để giao tiếp qua các khớp thần kinh, mạng nơ-ron kỹ thuật số sử dụng các phép toán học để truyền thông tin. Các hệ thống này là công nghệ nền tảng đằng sau Học máy (ML) hiện đại, cho phép máy tính giải quyết các vấn đề phức tạp như nhận dạng khuôn mặt, dịch ngôn ngữ và điều khiển xe tự hành mà không cần được lập trình rõ ràng cho từng quy tắc cụ thể.
Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau, nhưng điều quan trọng là phải phân biệt giữa Mạng thần kinh cơ bản và Học sâu (Deep Learning - DL) . Sự khác biệt chính nằm ở độ sâu và độ phức tạp. Một mạng thần kinh tiêu chuẩn hoặc "nông" có thể chỉ có một hoặc hai lớp ẩn giữa đầu vào và đầu ra. Ngược lại, Học sâu liên quan đến các mạng thần kinh "sâu" với hàng chục hoặc thậm chí hàng trăm lớp. Độ sâu này cho phép trích xuất đặc trưng diễn ra tự động, cho phép mô hình hiểu được các mẫu phân cấp — các cạnh đơn giản trở thành hình dạng, và các hình dạng trở thành các đối tượng có thể nhận dạng được. Để tìm hiểu sâu hơn về mặt kỹ thuật, MIT News giải thích về học sâu và sự phát triển của nó từ các mạng cơ bản.
Quá trình "học" trong mạng nơ-ron bao gồm việc điều chỉnh các tham số bên trong để giảm thiểu lỗi. Dữ liệu đi vào qua lớp đầu vào, đi qua một hoặc nhiều lớp ẩn nơi diễn ra các phép tính, và đi ra qua lớp đầu ra dưới dạng dự đoán.
Mạng nơ-ron là động lực đằng sau nhiều công nghệ định hình kỷ nguyên hiện đại.
Các thư viện phần mềm hiện đại giúp việc triển khai mạng nơ-ron trở nên dễ dàng hơn mà không cần phải tự viết các phép toán từ đầu. Các công cụ như... Ultralytics Nền tảng Cho phép người dùng dễ dàng huấn luyện các mạng này trên các tập dữ liệu tùy chỉnh. Những điều sau đây Python Đoạn mã này minh họa cách tải một mạng nơ-ron đã được huấn luyện trước (cụ thể là mô hình YOLO26 hiện đại nhất) và chạy suy luận trên một hình ảnh bằng cách sử dụng...
ultralytics bưu kiện.
from ultralytics import YOLO
# Load a pretrained YOLO26 neural network model
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
# The model processes the image through its layers to predict bounding boxes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
Mặc dù mạnh mẽ, mạng nơ-ron vẫn đặt ra những thách thức cụ thể. Chúng thường yêu cầu lượng lớn dữ liệu được gắn nhãn cho Học có giám sát . Nếu không có đủ sự đa dạng dữ liệu, mạng dễ bị quá khớp (Overfitting ), nghĩa là nó ghi nhớ các ví dụ huấn luyện thay vì học cách khái quát hóa. Thêm vào đó, mạng nơ-ron sâu thường được gọi là "hộp đen" vì việc giải thích chính xác cách chúng đưa ra một quyết định cụ thể có thể rất khó khăn, dẫn đến nghiên cứu về Trí tuệ nhân tạo có thể giải thích (Explainable AI - XAI) . Các tổ chức như Hiệp hội Tiêu chuẩn IEEE đang tích cực nghiên cứu các tiêu chuẩn để đảm bảo các mạng mạnh mẽ này được sử dụng một cách có đạo đức và an toàn.