Khám phá cách AI tạo ra nội dung gốc như văn bản, hình ảnh và âm thanh, chuyển đổi các ngành công nghiệp bằng các ứng dụng sáng tạo.
Trí tuệ nhân tạo tạo sinh (AI) đại diện cho một nhánh quan trọng trong lĩnh vực rộng lớn hơn của trí tuệ nhân tạo (AI) , tập trung cụ thể vào việc tạo ra các hệ thống có khả năng tạo ra nội dung hoàn toàn mới, gốc. Nội dung này có thể trải dài trên nhiều phương thức khác nhau, bao gồm văn bản, hình ảnh, âm thanh, mã và thậm chí cả dữ liệu tổng hợp . Không giống như các mô hình AI phân biệt, được đào tạo để phân loại hoặc đưa ra dự đoán dựa trên dữ liệu đầu vào (như xác định đối tượng trong hình ảnh bằng cách sử dụng phát hiện đối tượng ), các mô hình tạo sinh tìm hiểu các mẫu, cấu trúc và phân phối xác suất cơ bản trong tập dữ liệu đào tạo. Sau đó, chúng sử dụng kiến thức đã học này để tạo ra các đầu ra mới mô phỏng các đặc điểm của dữ liệu gốc. Những đột phá gần đây, đặc biệt là được thúc đẩy bởi các kiến trúc như Bộ biến đổi được đào tạo trước tạo sinh (GPT) và các mô hình khuếch tán , đã cho phép tạo ra nội dung cực kỳ chân thực và phức tạp, mở rộng ranh giới của khả năng sáng tạo của máy móc.
Ý tưởng cốt lõi đằng sau hầu hết các mô hình sinh là học cách biểu diễn phân phối dữ liệu. Sau khi học được phân phối này, mô hình có thể lấy mẫu từ đó để tạo ra các điểm dữ liệu mới có sự tương đồng về mặt thống kê với dữ liệu mà nó được đào tạo. Điều này liên quan đến kiến trúc mạng nơ-ron (NN) phức tạp và các kỹ thuật đào tạo tinh vi. Một số kiến trúc nổi bật bao gồm:
Mặc dù cả hai đều là các lĩnh vực con của AI, nhưng AI tạo sinh và Thị giác máy tính (CV) có các mục tiêu khác nhau về cơ bản. CV tập trung vào việc cho phép máy móc diễn giải và hiểu thông tin trực quan từ thế giới, thực hiện các nhiệm vụ như phân loại hình ảnh , phát hiện đối tượng và phân đoạn thể hiện . Ngược lại, AI tạo sinh tập trung vào việc tạo nội dung trực quan mới (hoặc nội dung khác).
Những khác biệt chính được nêu bật trong các cuộc thảo luận như tại YOLO Vision 2024 bao gồm:
Bất chấp những khác biệt này, các lĩnh vực này ngày càng được kết nối với nhau. AI tạo sinh đang chứng minh giá trị của nó đối với CV bằng cách tạo ra dữ liệu tổng hợp chất lượng cao. Dữ liệu tổng hợp này có thể tăng cường các tập dữ liệu thực tế, giúp đào tạo các mô hình CV mạnh mẽ và chính xác hơn, đặc biệt là đối với các tình huống mà dữ liệu thực tế khan hiếm hoặc khó có được, chẳng hạn như trong mô phỏng lái xe tự động hoặc hình ảnh tình trạng bệnh hiếm gặp ( AI trong chăm sóc sức khỏe ).
Trí tuệ nhân tạo (AI) đang chuyển đổi nhiều ngành công nghiệp:
Sự tiến bộ nhanh chóng của AI tạo sinh cũng mang lại những thách thức. Đảm bảo việc sử dụng có đạo đức các công cụ mạnh mẽ này là tối quan trọng, đặc biệt liên quan đến deepfake , thông tin sai lệch, quyền sở hữu trí tuệ và sự thiên vị cố hữu học được từ dữ liệu đào tạo. Để giải quyết những vấn đề này, cần phải phát triển mô hình cẩn thận, các phương pháp phát hiện mạnh mẽ và các hướng dẫn rõ ràng được nêu trong các nguyên tắc về đạo đức AI . Hơn nữa, các nguồn lực tính toán đáng kể cần thiết đặt ra các mối quan ngại về môi trường và khả năng tiếp cận. Các nền tảng như Ultralytics HUB hướng đến mục tiêu hợp lý hóa quy trình làm việc và có khả năng giảm bớt các rào cản gia nhập đối với một số tác vụ AI nhất định.