Khám phá công nghệ, ứng dụng và mối quan tâm về đạo đức của deepfake, từ giải trí đến thông tin sai lệch. Tìm hiểu các giải pháp phát hiện và AI.
Deepfake là phương tiện truyền thông tổng hợp—hình ảnh, video hoặc âm thanh—được tạo ra bằng trí tuệ nhân tạo (AI) , cụ thể là các kỹ thuật học sâu . Thuật ngữ này là sự kết hợp của "học sâu" và "giả". Các kỹ thuật này cho phép thao túng hoặc tạo ra nội dung hình ảnh và âm thanh với mức độ chân thực cao, giúp có thể mô tả những cá nhân nói hoặc làm những điều mà họ chưa từng nói hoặc làm. Mặc dù thường liên quan đến việc sử dụng có mục đích xấu, nhưng công nghệ cơ bản này cũng có những ứng dụng hợp pháp.
Các phương pháp phổ biến nhất để tạo deepfake liên quan đến các mô hình học sâu như Mạng đối nghịch tạo sinh (GAN) hoặc bộ mã hóa tự động. Trong thiết lập GAN, hai mạng nơ-ron cạnh tranh: một trình tạo tạo ra hình ảnh/video giả và một bộ phân biệt cố gắng phân biệt ảnh giả với dữ liệu đào tạo thực. Quá trình đối nghịch này thúc đẩy trình tạo tạo ra các ảnh giả ngày càng thuyết phục hơn. Bộ mã hóa tự động hoạt động bằng cách học các biểu diễn nén của khuôn mặt hoặc giọng nói, sau đó giải mã chúng để tái tạo hoặc hoán đổi các đặc điểm. Cả hai phương pháp thường yêu cầu một lượng lớn dữ liệu (hình ảnh hoặc clip âm thanh) của cá nhân mục tiêu để tìm hiểu sự giống nhau và phong cách ứng xử của họ một cách hiệu quả. Chất lượng và tính chân thực thường phụ thuộc vào khối lượng và tính đa dạng của dữ liệu này cũng như sức mạnh tính toán được sử dụng để đào tạo .
Công nghệ Deepfake có nhiều ứng dụng, bao gồm cả những ứng dụng có lợi và có hại:
Trong khi phần mềm chỉnh sửa ảnh và video đã tồn tại trong nhiều thập kỷ, deepfake đại diện cho một bước tiến đáng kể do chúng dựa vào AI để học và tạo ra nội dung mới, chân thực, thay vì chỉ thao tác các pixel hiện có theo cách thủ công. Chúng nằm trong phạm vi của AI tạo sinh , tập trung vào việc tạo dữ liệu mới. Điều này khác với các tác vụ AI phân biệt như phát hiện đối tượng hoặc phân loại hình ảnh , phổ biến trong thị giác máy tính (CV) , trong đó mục tiêu thường là xác định hoặc phân loại nội dung hiện có bằng các mô hình như Ultralytics YOLO .
Phát hiện deepfake là một thách thức liên tục, vì công nghệ được sử dụng để tạo ra chúng không ngừng được cải thiện. Các nhà nghiên cứu và tổ chức đang tích cực phát triển các kỹ thuật để xác định phương tiện truyền thông tổng hợp, thường tìm kiếm những điểm không nhất quán hoặc hiện vật tinh vi do quá trình tạo ra để lại ( Chương trình giám định phương tiện truyền thông của DARPA ). Sự gia tăng của deepfake làm dấy lên những lo ngại đáng kể về đạo đức AI liên quan đến sự đồng ý, quyền riêng tư dữ liệu , thông tin sai lệch và khả năng xói mòn lòng tin vào phương tiện truyền thông kỹ thuật số ( Phân tích của Viện Brookings ). Việc giải quyết sự thiên vị tiềm ẩn của tập dữ liệu trong cả mô hình tạo và phát hiện cũng rất quan trọng. Các nền tảng như Ultralytics HUB tạo điều kiện thuận lợi cho việc đào tạo và quản lý nhiều mô hình AI khác nhau, nêu bật nhu cầu thực hành phát triển có trách nhiệm trên toàn lĩnh vực AI. Để đọc thêm về những tiến bộ của AI, các nguồn như MIT Technology Review on AI cung cấp những hiểu biết sâu sắc.