Thuật ngữ

Thuật toán tối ưu hóa

Khám phá cách các thuật toán tối ưu hóa nâng cao hiệu suất AI và ML, từ đào tạo mạng nơ-ron đến các ứng dụng thực tế trong chăm sóc sức khỏe và nông nghiệp.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trong lĩnh vực trí tuệ nhân tạo (AI) và học máy (ML) , các thuật toán tối ưu hóa là những phương pháp thiết yếu được sử dụng để tinh chỉnh các mô hình và nâng cao hiệu suất của chúng. Các thuật toán này điều chỉnh các tham số (như weights and biases ) của một mô hình để giảm thiểu hàm mất mát được xác định trước, hàm này đo lường sự khác biệt giữa các dự đoán của mô hình và các giá trị mục tiêu thực tế. Quá trình này rất cơ bản để đào tạo các mô hình phức tạp như mạng nơ-ron , cho phép chúng học hiệu quả từ dữ liệu và cải thiện độ chính xác và độ tin cậy của chúng đối với các tác vụ từ nhận dạng hình ảnh đến xử lý ngôn ngữ tự nhiên.

Sự liên quan trong AI và Học máy

Thuật toán tối ưu hóa là động cơ thúc đẩy quá trình học trong hầu hết các mô hình ML, đặc biệt là trong học sâu (DL) . Các mô hình như Mạng nơ-ron tích chập (CNN)Mạng nơ-ron hồi quy (RNN) phụ thuộc rất nhiều vào các thuật toán này để điều hướng các không gian tham số rộng lớn và tìm ra các cấu hình mang lại hiệu suất tốt. Nếu không có tối ưu hóa hiệu quả, các mô hình sẽ khó hội tụ thành các giải pháp tối ưu, dẫn đến dự đoán kém. Ví dụ, các mô hình YOLO Ultralytics sử dụng các thuật toán tối ưu hóa phức tạp trong quá trình đào tạo để đạt được độ chính xác cao trong phát hiện đối tượng theo thời gian thực. Các thuật toán này cũng rất quan trọng để đào tạo các mô hình tiên tiến như GPT-4các mô hình ngôn ngữ lớn (LLM) khác, cho phép chúng có khả năng ấn tượng. Việc lựa chọn trình tối ưu hóa có thể ảnh hưởng đáng kể đến tốc độ đào tạo và hiệu suất mô hình cuối cùng, như đã thảo luận trong hướng dẫn về mẹo đào tạo mô hình .

Các khái niệm và thuật toán chính

Một số thuật toán tối ưu hóa được sử dụng rộng rãi trong học máy, mỗi thuật toán cung cấp các chiến lược khác nhau để điều hướng bối cảnh mất mát. Một số ví dụ phổ biến bao gồm:

  • Gradient Descent : Thuật toán cơ bản di chuyển các tham số theo hướng ngược lại với gradient của hàm mất mát.
  • Stochastic Gradient Descent (SGD) : Một biến thể của Gradient Descent cập nhật các tham số chỉ bằng một lô nhỏ hoặc một mẫu duy nhất ở mỗi bước, giúp phương pháp này nhanh hơn và phù hợp với các tập dữ liệu lớn.
  • Adam Optimizer : Một phương pháp tốc độ học tập thích ứng tính toán tốc độ học tập riêng lẻ cho các tham số khác nhau, thường dẫn đến sự hội tụ nhanh hơn. Nó kết hợp các ý tưởng từ RMSprop và AdaGrad.
  • RMSprop : Một thuật toán tốc độ học thích ứng khác chia tốc độ học cho giá trị trung bình giảm dần theo cấp số nhân của các bình phương độ dốc.

Các trình tối ưu hóa này thường là các tham số có thể cấu hình trong các nền tảng và khuôn khổ ML như Ultralytics HUB , cho phép người dùng lựa chọn giải pháp phù hợp nhất với nhiệm vụ và tập dữ liệu cụ thể của họ.

Sự khác biệt từ các khái niệm liên quan

Các thuật toán tối ưu hóa đôi khi bị nhầm lẫn với các khái niệm liên quan như điều chỉnh siêu tham số và chính quy hóa, nhưng chúng phục vụ các mục đích riêng biệt:

  • Thuật toán tối ưu hóa so với điều chỉnh siêu tham số : Thuật toán tối ưu hóa điều chỉnh các tham số mô hình ( weights and biases ) để giảm thiểu hàm mất mát trong quá trình đào tạo. Mặt khác, điều chỉnh siêu tham số tập trung vào việc tìm siêu tham số tốt nhất (ví dụ: tốc độ học, kích thước lô, lựa chọn kiến trúc mạng) xác định chính quá trình đào tạo. Các công cụ như Ray Tune có thể được tích hợp để tìm kiếm siêu tham số có hệ thống.
  • Thuật toán tối ưu hóa so với chính quy hóa : Tối ưu hóa nhằm mục đích tìm giá trị nhỏ nhất của hàm mất mát. Các kỹ thuật chính quy hóa (như hình phạt L1/L2 hoặc lớp bỏ qua ) được thêm vào hàm mất mát hoặc kiến trúc mô hình để ngăn chặn quá khớp và cải thiện khả năng khái quát hóa của mô hình đối với dữ liệu chưa biết. Mặc dù có liên quan, chính quy hóa sửa đổi mục tiêu mà thuật toán tối ưu hóa tìm cách giảm thiểu.

Ứng dụng trong thế giới thực

Các thuật toán tối ưu hóa là không thể thiếu trong nhiều ngành công nghiệp, thúc đẩy hiệu quả và cho phép áp dụng các ứng dụng AI phức tạp.

Ví dụ 1: Chẩn đoán chăm sóc sức khỏe

Trong AI dành cho chăm sóc sức khỏe , các thuật toán tối ưu hóa đóng vai trò quan trọng trong việc đào tạo các mô hình được sử dụng trong phân tích hình ảnh y tế . Ví dụ, khi đào tạo CNN để phát hiện khối u ung thư trong ảnh chụp MRI hoặc CT bằng các tập dữ liệu như tập dữ liệu Brain Tumor , các thuật toán tối ưu hóa như Adam giúp mô hình học cách phân biệt chính xác giữa mô ác tính và mô lành tính bằng cách giảm thiểu lỗi phân loại. Điều này dẫn đến các công cụ chẩn đoán đáng tin cậy hơn hỗ trợ các bác sĩ X quang, có khả năng cải thiện kết quả của bệnh nhân thông qua việc phát hiện sớm hơn, như đã khám phá trong các ứng dụng AI trong X quang .

Ví dụ 2: Tối ưu hóa hậu cần và tuyến đường

Các công ty tham gia vào lĩnh vực vận tải và hậu cần sử dụng rộng rãi các thuật toán tối ưu hóa. Đối với các vấn đề về định tuyến xe, các thuật toán hướng đến việc tìm ra các tuyến đường ngắn nhất hoặc tiết kiệm chi phí nhất cho đội xe giao hàng. Trong khi theo truyền thống được giải quyết bằng các phương pháp nghiên cứu hoạt động như các phương pháp được tìm thấy trong Google OR-Tools , các mô hình học máy được đào tạo bằng các thuật toán tối ưu hóa cũng có thể dự đoán các mẫu lưu lượng giao thông hoặc thời gian giao hàng để điều chỉnh tuyến đường một cách năng động, giảm thiểu mức tiêu thụ nhiên liệu và thời gian giao hàng. Điều này cải thiện hiệu quả trong quản lý chuỗi cung ứng .

Đọc tất cả