Thuật ngữ

Mạng nơ-ron (NN)

Khám phá sức mạnh của Mạng nơ-ron nhân tạo - chìa khóa cho những cải tiến về AI và ML như thị giác máy tính, NLP và đột phá về học sâu.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Về bản chất, Mạng nơ-ron (NN) là các mô hình tính toán lấy cảm hứng từ cấu trúc và chức năng của não người. Được thiết kế để nhận dạng các mẫu trong dữ liệu, chúng là nền tảng cho nhiều ứng dụng Trí tuệ nhân tạo (AI)Học máy (ML) mà chúng ta sử dụng hàng ngày. Từ việc cung cấp năng lượng cho nhận dạng hình ảnh đến cho phép hiểu ngôn ngữ phức tạp, mạng nơ-ron là công cụ đắc lực đằng sau phần lớn công nghệ thông minh ngày nay.

Hiểu về mạng nơ-ron

Mạng nơ-ron bao gồm các nút được kết nối với nhau, hay nơ-ron, được sắp xếp theo lớp. Các lớp này thường bao gồm một lớp đầu vào, một hoặc nhiều lớp ẩn và một lớp đầu ra. Mỗi kết nối giữa các nơ-ron có một trọng số liên quan đến nó, biểu thị cường độ của kết nối. Các nơ-ron cũng có một hàm kích hoạt xác định xem nơ-ron có nên được kích hoạt hay không dựa trên đầu vào mà nó nhận được. Mạng học bằng cách điều chỉnh các trọng số này thông qua một quá trình gọi là đào tạo, thường sử dụng các thuật toán như gradient descentbackpropagation , để giảm thiểu sự khác biệt giữa các dự đoán của mạng và các giá trị thực tế.

Các mô hình học sâu là mạng nơ-ron có nhiều lớp ẩn, cho phép chúng học các mẫu và biểu diễn phức tạp hơn từ lượng dữ liệu khổng lồ. Độ sâu này cho phép chúng thực hiện các tác vụ phức tạp như phát hiện đối tượngphân đoạn hình ảnh với độ chính xác cao. Trong khi các mô hình học máy đơn giản hơn có thể gặp khó khăn với dữ liệu phi cấu trúc như hình ảnh hoặc văn bản, thì mạng nơ-ron lại vượt trội trong việc tự động trích xuất các tính năng có liên quan từ dữ liệu đó, khiến chúng trở nên cực kỳ linh hoạt.

Ứng dụng của mạng nơ-ron

Mạng nơ-ron được ứng dụng trong nhiều lĩnh vực, cách mạng hóa cách máy móc nhận thức và tương tác với thế giới. Sau đây là một vài ví dụ:

  • Thị giác máy tính: Mạng nơ-ron là xương sống của các hệ thống thị giác máy tính (CV) hiện đại. Ví dụ, các mô hình YOLO Ultralytics tận dụng Mạng nơ-ron tích chập (CNN) — một loại mạng nơ-ron chuyên dụng đặc biệt hiệu quả cho xử lý hình ảnh — để đạt được hiệu suất tiên tiến trong các tác vụ như phát hiện vật thể theo thời gian thực. Các mô hình này có thể được triển khai thông qua Ultralytics HUB cho nhiều ứng dụng khác nhau, từ hệ thống an ninh đến xe tự hành.
  • Xử lý ngôn ngữ tự nhiên (NLP): Mạng nơ-ron, đặc biệt là Mạng nơ-ron hồi quy (RNN) và Bộ chuyển đổi, đóng vai trò quan trọng trong Xử lý ngôn ngữ tự nhiên (NLP) . Chúng cho phép các ứng dụng như dịch máy, phân tích tình cảm và chatbot. Các mô hình như GPT-3BERT , dựa trên mạng chuyển đổi, chứng minh sức mạnh của mạng nơ-ron trong việc hiểu và tạo ra ngôn ngữ của con người.

Mạng nơ-ron so với các khái niệm tương tự

Điều quan trọng là phải phân biệt mạng nơ-ron với các thuật ngữ liên quan:

  • Mạng nơ-ron tích chập (CNN) : CNN là một loại kiến trúc mạng nơ-ron cụ thể đặc biệt phù hợp để xử lý dữ liệu dạng lưới, chẳng hạn như hình ảnh. Mặc dù tất cả các CNN đều là mạng nơ-ron, nhưng không phải tất cả các mạng nơ-ron đều là CNN.
  • Trí tuệ nhân tạo (AI) : AI là một lĩnh vực rộng hơn bao gồm sự phát triển của các tác nhân thông minh. Mạng nơ-ron là một công cụ trong AI, cụ thể là trong lĩnh vực học máy, được sử dụng để tạo ra các hệ thống thông minh.

Tóm lại, Mạng nơ-ron là công cụ mạnh mẽ cho phép máy tính học từ dữ liệu, thúc đẩy sự tiến bộ trong nhiều ứng dụng AI. Khả năng mô hình hóa các mối quan hệ phức tạp của chúng khiến chúng trở nên không thể thiếu trong các lĩnh vực từ thị giác máy tính đến xử lý ngôn ngữ tự nhiên và chúng tiếp tục phát triển như một nền tảng của nghiên cứu và phát triển AI hiện đại.

Đọc tất cả