Khám phá cách Neural Architecture Search (NAS) tự động hóa thiết kế mạng nơ-ron để tối ưu hóa hiệu suất trong phát hiện đối tượng, AI, v.v.
Neural Architecture Search (NAS) là một kỹ thuật tự động trong lĩnh vực học máy (ML) tập trung vào việc thiết kế cấu trúc hoặc kiến trúc tối ưu của mạng nơ-ron (NN) . Thay vì dựa vào các chuyên gia con người để thiết kế thủ công các bố cục mạng thông qua thử nghiệm và sai sót, NAS sử dụng các thuật toán để khám phá không gian rộng lớn các kiến trúc khả thi và xác định kiến trúc hiệu quả nhất cho một tác vụ và tập dữ liệu nhất định. Tự động hóa này đẩy nhanh quá trình phát triển và có thể khám phá ra các kiến trúc mới, hiệu suất cao mà các nhà thiết kế con người có thể không nhận ra một cách trực quan, tối ưu hóa các số liệu như độ chính xác , tốc độ ( độ trễ suy luận ) hoặc hiệu quả tính toán.
Quá trình cơ bản của NAS bao gồm ba thành phần chính: không gian tìm kiếm, chiến lược tìm kiếm và chiến lược ước tính hiệu suất. Không gian tìm kiếm xác định tập hợp các kiến trúc mạng có thể được thiết kế, về cơ bản phác thảo các khối xây dựng (như các loại hàm tích chập hoặc hàm kích hoạt khác nhau) và cách chúng có thể được kết nối. Chiến lược tìm kiếm hướng dẫn việc khám phá không gian này, sử dụng các phương pháp từ tìm kiếm ngẫu nhiên và học tăng cường đến các thuật toán tiến hóa . Cuối cùng, chiến lược ước tính hiệu suất đánh giá hiệu suất của một kiến trúc ứng viên, thường bao gồm đào tạo mạng một phần hoặc toàn bộ trên một tập dữ liệu và đo lường hiệu suất của nó, mặc dù các kỹ thuật như chia sẻ trọng số hoặc dự đoán hiệu suất được sử dụng để tăng tốc quá trình này, như được trình bày chi tiết trong nghiên cứu từ Google AI .
Tự động hóa thiết kế kiến trúc với NAS mang lại những lợi thế đáng kể:
Một ví dụ nổi bật là YOLO -NAS , được phát triển bởi Deci AI sử dụng công nghệ NAS. Mô hình này đặc biệt nhắm mục tiêu vào những hạn chế trong Ultralytics YOLO phiên bản bằng cách kết hợp các khối thân thiện với lượng tử hóa được tìm thấy thông qua NAS. Điều này dẫn đến các mô hình cung cấp sự cân bằng vượt trội giữa độ chính xác và độ trễ, khiến chúng trở nên cực kỳ hiệu quả đối với các ứng dụng thời gian thực như AI trong các giải pháp ô tô và quản lý giao thông thông minh, ngay cả sau khi lượng tử hóa mô hình sang các định dạng như INT8 để triển khai hiệu quả. Có thể tìm thêm thông tin về các kỹ thuật lượng tử hóa trong các tài nguyên như tài liệu NVIDIA TensorRT .
Trong chăm sóc sức khỏe, NAS được sử dụng để thiết kế Mạng nơ-ron tích chập (CNN) tùy chỉnh để phân tích hình ảnh y tế. Ví dụ, NAS có thể tối ưu hóa kiến trúc cho các tác vụ như phát hiện khối u trong quét MRI hoặc phân đoạn các cơ quan trong hình ảnh CT, có khả năng dẫn đến các công cụ chẩn đoán nhanh hơn và chính xác hơn để hỗ trợ các bác sĩ lâm sàng. Ứng dụng AI trong phân tích hình ảnh y tế là một lĩnh vực đang phát triển nhanh chóng, như được nêu bật bởi các tổ chức như Viện Y tế Quốc gia (NIH) . Việc quản lý các mô hình và tập dữ liệu chuyên biệt như vậy có thể được hợp lý hóa bằng cách sử dụng các nền tảng như Ultralytics HUB .
NAS là một thành phần cụ thể trong lĩnh vực rộng hơn của Automated Machine Learning (AutoML) . Trong khi NAS chỉ tập trung vào việc tìm ra kiến trúc mạng nơ-ron tốt nhất, AutoML hướng đến mục tiêu tự động hóa toàn bộ quy trình ML, bao gồm các bước như xử lý trước dữ liệu , thiết kế tính năng , lựa chọn mô hình và điều chỉnh siêu tham số . Điều quan trọng là phải phân biệt NAS với điều chỉnh siêu tham số: điều chỉnh siêu tham số tối ưu hóa các thiết lập cấu hình (như tốc độ học hoặc kích thước lô ) cho một kiến trúc mô hình cố định nhất định, trong khi NAS tìm kiếm chính kiến trúc đó. Cả hai kỹ thuật thường được sử dụng cùng nhau để đạt được hiệu suất mô hình tối ưu. Các công cụ như Optuna hoặc Ray Tune rất phổ biến để tối ưu hóa siêu tham số.