Điện toán không máy chủ là mô hình thực thi điện toán đám mây trong đó nhà cung cấp đám mây quản lý động việc phân bổ và cung cấp máy chủ. Các nhà phát triển có thể viết và triển khai mã dưới dạng các hàm riêng lẻ mà không cần phải quản lý cơ sở hạ tầng cơ bản như hệ điều hành hoặc phần cứng máy chủ. Trong khi máy chủ vẫn được sử dụng, việc quản lý chúng được trừu tượng hóa hoàn toàn, cho phép các nhóm tập trung vào việc xây dựng logic ứng dụng. Điều này đặc biệt có lợi cho việc lặp lại nhanh chóng các dự án Trí tuệ nhân tạo (AI) và Học máy (ML) , cho phép các chu kỳ phát triển nhanh hơn và sử dụng tài nguyên hiệu quả.
Hiểu về kiến trúc không máy chủ
Trong thiết lập không có máy chủ, các ứng dụng thường được cấu trúc như một tập hợp các chức năng độc lập được kích hoạt bởi các sự kiện cụ thể. Mô hình này thường được gọi là Chức năng dưới dạng Dịch vụ (FaaS) . Các sự kiện có thể bao gồm các yêu cầu HTTP (như lệnh gọi API), thay đổi cơ sở dữ liệu, tải tệp lên bộ lưu trữ đám mây hoặc tin nhắn từ hệ thống hàng đợi. Khi một sự kiện xảy ra, nhà cung cấp đám mây sẽ tự động phân bổ các tài nguyên tính toán cần thiết để chạy chức năng tương ứng. Sau khi thực thi hoàn tất, các tài nguyên này sẽ được thu nhỏ lại, thường là bằng không nếu không có yêu cầu nào đang chờ xử lý. Phương pháp tự động mở rộng theo sự kiện này khác đáng kể so với các kiến trúc truyền thống, trong đó máy chủ chạy liên tục, có khả năng dẫn đến tài nguyên nhàn rỗi và chi phí vận hành cao hơn. Nó phù hợp với nhu cầu thay đổi của nhiều trường hợp sử dụng AI .
Lợi ích cho AI và ML
Điện toán không máy chủ mang lại những lợi thế hấp dẫn cho khối lượng công việc AI và ML, vốn thường có nhu cầu tính toán thay đổi:
- Khả năng mở rộng tự động: Xử lý tải không thể đoán trước một cách liền mạch. Ví dụ, một công cụ suy luận phục vụ dự đoán có thể gặp phải tình trạng đột biến trong các yêu cầu. Các nền tảng không có máy chủ tự động mở rộng các trường hợp chức năng lên hoặc xuống để đáp ứng nhu cầu mà không cần can thiệp thủ công, đảm bảo hiệu suất nhất quán. Điều này rất quan trọng đối với các ứng dụng yêu cầu suy luận theo thời gian thực .
- Hiệu quả về chi phí: Hoạt động theo cơ sở trả tiền theo mức sử dụng. Bạn thường chỉ bị tính phí cho thời gian tính toán thực tế mà các chức năng của bạn sử dụng, tính đến mili giây. Điều này giúp loại bỏ chi phí liên quan đến công suất máy chủ nhàn rỗi, giúp tiết kiệm cho các tác vụ như đào tạo mô hình định kỳ hoặc các công việc xử lý dữ liệu không thường xuyên. Khám phá lợi ích của quy mô kinh tế .
- Chu kỳ phát triển nhanh hơn: Trừu tượng hóa việc quản lý cơ sở hạ tầng. Các nhà phát triển có thể tập trung hoàn toàn vào việc viết mã cho các tác vụ cụ thể như xử lý trước dữ liệu , trích xuất tính năng hoặc chạy logic dự đoán . Điều này đẩy nhanh quá trình phát triển và triển khai, tạo điều kiện thử nghiệm nhanh hơn với các mô hình khác nhau hoặc các chiến lược điều chỉnh siêu tham số ( hướng dẫn Ultralytics ).
- Hoạt động đơn giản hóa: Giảm chi phí vận hành. Các nhiệm vụ như vá hệ điều hành, quản lý dung lượng máy chủ và đảm bảo tính khả dụng cao được xử lý bởi nhà cung cấp đám mây, giải phóng tài nguyên cho các tác vụ ML cốt lõi. Tìm hiểu thêm về Hoạt động học máy (MLOps) .
Ứng dụng thực tế trong AI/ML
Kiến trúc không có máy chủ rất phù hợp cho nhiều tác vụ AI/ML khác nhau:
- Phân tích hình ảnh và video: Hãy xem xét một ứng dụng thực hiện phát hiện đối tượng trên hình ảnh do người dùng tải lên bằng mô hình YOLO Ultralytics . Một sự kiện tải lên lưu trữ đám mây (như Amazon S3 hoặc Google Cloud Storage ) kích hoạt một hàm không có máy chủ. Hàm này tải hình ảnh, chạy YOLO mô hình để phát hiện, có khả năng thực hiện phân đoạn hình ảnh và lưu trữ kết quả (ví dụ: hộp giới hạn, nhãn lớp) trong cơ sở dữ liệu hoặc trả về chúng qua API. Hệ thống tự động mở rộng dựa trên số lượng tải lên mà không cần máy chủ được cung cấp trước. Mẫu này hữu ích trong các ứng dụng từ kiểm duyệt nội dung đến phân tích hình ảnh y tế . Xem các giải pháp Ultralytics để biết thêm ví dụ.
- Chatbot Backends: Nhiều chatbot được hỗ trợ bởi Large Language Models (LLM) sử dụng các hàm không có máy chủ để xử lý tin nhắn người dùng đến. Mỗi tin nhắn kích hoạt một hàm xử lý văn bản, tương tác với API LLM (như GPT-4 ), thực hiện các hành động cần thiết (ví dụ: tra cứu cơ sở dữ liệu thông qua tìm kiếm vectơ ) và gửi lại phản hồi. Mô hình trả tiền theo yêu cầu lý tưởng cho các chatbot có mẫu sử dụng dao động. Khám phá các khái niệm Xử lý ngôn ngữ tự nhiên (NLP) .
Serverless so với các khái niệm liên quan
Điều quan trọng là phải phân biệt điện toán không máy chủ với các công nghệ liên quan:
- Điện toán đám mây so với không máy chủ: Điện toán đám mây là việc cung cấp rộng rãi các dịch vụ điện toán qua internet. Không máy chủ là một mô hình thực thi cụ thể trong điện toán đám mây nhấn mạnh vào quản lý tài nguyên tự động và các chức năng theo sự kiện (FaaS), trừu tượng hóa hoàn toàn việc quản lý máy chủ. Các mô hình đám mây khác như Cơ sở hạ tầng dưới dạng Dịch vụ (IaaS) vẫn yêu cầu người dùng quản lý máy ảo.
- Container hóa so với Serverless: Các công cụ container hóa như Docker đóng gói các ứng dụng và các phụ thuộc của chúng. Các nền tảng dàn dựng như Kubernetes tự động hóa việc triển khai, mở rộng quy mô và quản lý các container này. Trong khi Kubernetes giảm gánh nặng vận hành so với việc quản lý bare metal hoặc VM, bạn vẫn quản lý được cơ sở hạ tầng cụm cơ bản. Các nền tảng serverless trừu tượng hóa hoàn toàn lớp này; bạn chỉ quản lý mã chức năng. Xem cách sử dụng Docker với Ultralytics .
- Điện toán biên so với không máy chủ: Điện toán biên liên quan đến việc xử lý dữ liệu cục bộ trên các thiết bị gần nguồn dữ liệu ("biên") để giảm độ trễ và sử dụng băng thông. Điện toán không máy chủ thường chạy các chức năng trong các trung tâm dữ liệu đám mây tập trung. Mặc dù khác biệt, chúng có thể bổ sung cho nhau; một thiết bị AI biên (như thiết bị chạy trên NVIDIA Jetson ) có thể thực hiện xử lý hoặc lọc ban đầu và sau đó kích hoạt chức năng không máy chủ trên đám mây để phân tích hoặc tổng hợp phức tạp hơn. Đọc về camera an ninh hỗ trợ AI thường kết hợp xử lý biên và đám mây.
Các nền tảng không máy chủ hàng đầu bao gồm AWS Lambda , Google Cloud Functions và Azure Functions . Các dịch vụ này cung cấp cơ sở hạ tầng cần thiết để xây dựng và chạy các ứng dụng AI/ML không máy chủ một cách hiệu quả, thường tích hợp với các dịch vụ đám mây khác để lưu trữ, cơ sở dữ liệu và nhắn tin. Các nền tảng như Ultralytics HUB có thể hợp lý hóa hơn nữa việc triển khai và quản lý các mô hình trong nhiều kiến trúc khác nhau, bao gồm cả các thiết lập không máy chủ ( khám phá tài liệu HUB ).