Khám phá sức mạnh của Mạng nơ-ron nhân tạo - chìa khóa cho những cải tiến về AI và ML như thị giác máy tính, NLP và đột phá về học sâu.
Mạng nơ-ron (NN), thường được gọi là Mạng nơ-ron nhân tạo (ANN), là các mô hình tính toán lấy cảm hứng từ cấu trúc và chức năng phức tạp của não người . Chúng tạo thành nền tảng của Trí tuệ nhân tạo (AI) và Học máy (ML) hiện đại, được thiết kế chủ yếu để nhận dạng các mẫu phức tạp trong dữ liệu. Các mạng này cung cấp năng lượng cho nhiều hệ thống thông minh mà chúng ta tương tác hàng ngày, từ các công cụ nhận dạng hình ảnh tinh vi đến các dịch vụ dịch ngôn ngữ tiên tiến và là nền tảng cho các lĩnh vực như thị giác máy tính (CV) và Xử lý ngôn ngữ tự nhiên (NLP) .
Một mạng nơ-ron bao gồm các lớp nút được kết nối với nhau, hay còn gọi là nơ-ron . Các lớp này thường bao gồm một lớp đầu vào nhận dữ liệu thô (như giá trị pixel trong hình ảnh hoặc từ trong câu), một hoặc nhiều lớp ẩn xử lý dữ liệu thông qua các phép tính và một lớp đầu ra tạo ra kết quả cuối cùng, chẳng hạn như nhãn phân loại hoặc giá trị dự đoán. Mỗi kết nối giữa các nơ-ron mang một 'trọng số', một giá trị số biểu thị tầm quan trọng của kết nối trong các phép tính của mạng.
Các neuron xử lý các đầu vào kết hợp của chúng bằng một hàm kích hoạt , như ReLU hoặc Sigmoid , xác định tín hiệu đầu ra mà chúng truyền tiếp đến lớp tiếp theo. Mạng 'học' bằng cách điều chỉnh các trọng số này trong quá trình đào tạo , thường sử dụng các ví dụ được gắn nhãn trong bối cảnh học có giám sát . Các thuật toán như gradient descent và thuật toán backpropagation thường được sử dụng để điều chỉnh trọng số theo từng bước nhằm giảm thiểu hàm mất mát , đo lường sự khác biệt giữa các dự đoán của mạng và các giá trị mục tiêu thực tế. Đào tạo mô hình hiệu quả thường đòi hỏi phải điều chỉnh siêu tham số cẩn thận và các chiến lược được nêu trong các hướng dẫn như Mẹo đào tạo mô hình của chúng tôi.
Các mô hình sử dụng Học sâu (DL) về cơ bản là các NN có nhiều lớp ẩn (do đó là "sâu"). Độ sâu này cho phép chúng học các mẫu cực kỳ phức tạp và các tính năng phân cấp từ các tập dữ liệu lớn, khiến chúng cực kỳ hiệu quả cho các tác vụ như phát hiện đối tượng và phân đoạn thể hiện . Không giống như các mô hình ML đơn giản hơn như Hồi quy tuyến tính hoặc Máy vectơ hỗ trợ (SVM) có thể yêu cầu kỹ thuật tính năng thủ công, NN vượt trội trong việc tự động thực hiện trích xuất tính năng từ dữ liệu thô, không có cấu trúc như hình ảnh và văn bản.
Mặc dù cấu trúc cơ bản được mô tả ở trên thường được áp dụng, nhưng vẫn tồn tại một số kiến trúc NN chuyên biệt:
NN khác biệt đáng kể so với các thuật toán truyền thống như Cây quyết định hoặc KNN (K-Nearest Neighbors) , hoạt động theo các nguyên tắc khác nhau và thường ít phù hợp với dữ liệu phức tạp, có nhiều chiều như hình ảnh mà không có quá trình xử lý trước mở rộng.
Mạng nơ-ron cực kỳ linh hoạt và đã được áp dụng trên nhiều lĩnh vực. Sau đây là hai ví dụ chính:
Thị giác máy tính (CV): NN, đặc biệt là CNN, là động lực thúc đẩy những tiến bộ lớn trong CV. Chúng được sử dụng cho:
Xử lý ngôn ngữ tự nhiên (NLP): NN, bao gồm RNN và Transformer, đã cách mạng hóa cách máy móc hiểu và tạo ra ngôn ngữ của con người. Các ứng dụng bao gồm:
Việc phát triển và triển khai NN được hỗ trợ bởi nhiều công cụ và khuôn khổ học sâu mạnh mẽ:
Việc hiểu về NN rất quan trọng đối với bất kỳ ai làm việc trong lĩnh vực AI hoặc ML, vì chúng tạo thành nền tảng cho nhiều giải pháp tiên tiến trong nhiều ngành công nghiệp khác nhau, từ AI trong chăm sóc sức khỏe đến AI trong nông nghiệp .