Thuật ngữ

Deepfake (giả mạo sâu)

Khám phá công nghệ, ứng dụng và mối quan tâm về đạo đức của deepfake, từ giải trí đến thông tin sai lệch. Tìm hiểu các giải pháp phát hiện và AI.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Deepfake là video, hình ảnh hoặc bản ghi âm có độ chân thực cao, được tạo ra hoặc chỉnh sửa tổng hợp, được tạo ra bằng các kỹ thuật Trí tuệ nhân tạo (AI)Học máy (ML) tiên tiến, đặc biệt là Học sâu (DL) . Thuật ngữ này là sự kết hợp của "học sâu" và "giả mạo". Các kỹ thuật này cho phép thay thế hoặc tổng hợp một cách thuyết phục các khuôn mặt, giọng nói và hành động, khiến nó có vẻ như ai đó đã nói hoặc làm điều gì đó mà họ chưa từng thực sự làm. Mặc dù bắt nguồn từ các cộng đồng trực tuyến, công nghệ deepfake đã phát triển nhanh chóng, mang đến cả những cơ hội sáng tạo và những thách thức đáng kể về mặt đạo đức.

Deepfake được tạo ra như thế nào

Công nghệ cốt lõi đằng sau nhiều deepfake liên quan đến Mạng đối nghịch tạo sinh (GAN) . GAN bao gồm hai mạng nơ-ron cạnh tranh: một trình tạo tạo nội dung giả (ví dụ: hình ảnh có khuôn mặt bị hoán đổi) và một bộ phân biệt cố gắng phân biệt giữa nội dung thật và giả. Thông qua quá trình đào tạo lặp đi lặp lại, trình tạo ngày càng thành thạo trong việc tạo ra các bản sao giả thực tế có thể đánh lừa bộ phân biệt và cuối cùng là người quan sát. Bộ mã hóa tự động là một kỹ thuật phổ biến khác, học các biểu diễn nén (mã hóa) của khuôn mặt từ các tập dữ liệu lớn và sau đó giải mã các biểu diễn này để tái tạo hoặc hoán đổi khuôn mặt vào video mục tiêu. Việc tạo ra các deepfake thuyết phục thường yêu cầu dữ liệu đào tạo đáng kể (hình ảnh hoặc video clip của các cá nhân mục tiêu) và tài nguyên tính toán GPU đáng kể, thường được quản lý thông qua các nền tảng như Ultralytics HUB .

Ứng dụng và ví dụ

Công nghệ Deepfake có nhiều ứng dụng, từ những mục đích có lợi cho đến những hoạt động có hại:

  • Giải trí và phương tiện truyền thông: Được sử dụng trong làm phim để trẻ hóa diễn viên, tái tạo các nhân vật lịch sử hoặc cải thiện việc lồng tiếng bằng cách thay đổi chuyển động môi để khớp với âm thanh đã dịch. Ví dụ, các nhà làm phim đã sử dụng kỹ thuật deepfake trong The Mandalorian để tái tạo kỹ thuật số phiên bản trẻ hơn của một diễn viên. Một ví dụ khác là Synthesia , một nền tảng sử dụng hình đại diện AI để tạo video đào tạo và bài thuyết trình, tạo ra nội dung video tổng hợp hiệu quả.
  • Giáo dục và khả năng tiếp cận: Tạo ra các giảng viên ảo hoặc tái hiện các nhân vật lịch sử cho mục đích giáo dục. Nhân bản giọng nói có thể hỗ trợ những người mất giọng nói.
  • Tạo dữ liệu tổng hợp : Tạo các tập dữ liệu nhân tạo để đào tạo các mô hình ML khác, đặc biệt là trong thị giác máy tính , nơi dữ liệu thực có thể khan hiếm hoặc nhạy cảm. Điều này có thể giúp cải thiện tính mạnh mẽ của các mô hình như Ultralytics YOLO11 cho các tác vụ như nhận dạng khuôn mặt .
  • Thông tin sai lệch và ác ý: Phát tán thông tin sai lệch về chính trị, tạo ra sự chứng thực hoặc bê bối giả mạo của người nổi tiếng, tạo ra nội dung khiêu dâm không có sự đồng thuận và thực hiện hành vi gian lận thông qua việc mạo danh (ví dụ: deepfake giọng nói để ủy quyền giao dịch). Những điều này làm dấy lên mối lo ngại nghiêm trọng về đạo đức AIquyền riêng tư dữ liệu .

Phát hiện Deepfake

Sự gia tăng của deepfake đã thúc đẩy nghiên cứu về các phương pháp phát hiện. Những phương pháp này thường liên quan đến việc đào tạo các mô hình ML để xác định những điểm không nhất quán hoặc hiện tượng lạ đặc trưng của nội dung được tạo ra, chẳng hạn như các mẫu nhấp nháy bất thường, biểu cảm khuôn mặt không tự nhiên hoặc sự không nhất quán trong ánh sáng hoặc bóng tối. Các kỹ thuật Thị giác máy tính (CV) đóng vai trò trung tâm trong nỗ lực này. Tuy nhiên, phát hiện là một cuộc chạy đua vũ trang đang diễn ra, vì các kỹ thuật tạo deepfake liên tục được cải tiến để tránh bị phát hiện. Các tổ chức như Deepfake Detection Challenge (DFDC) của Meta AI và các sáng kiến từ các công ty như Microsoft nhằm mục đích thúc đẩy trạng thái của công nghệ phát hiện. Các chuẩn mựctập dữ liệu tiêu chuẩn rất quan trọng để phát triển và đánh giá các mô hình phát hiện này.

Sự khác biệt với các phương tiện truyền thông khác

Deepfake khác với chỉnh sửa ảnh hoặc video thông thường (như sử dụng Adobe Photoshop hoặc After Effects) chủ yếu ở chỗ chúng sử dụng học sâu để tạo ra các thành phần hình ảnh hoặc âm thanh hoàn toàn mới, chân thực dựa trên các mẫu đã học, thay vì chỉ thay đổi các pixel hiện có theo cách thủ công hoặc thông qua các thuật toán đơn giản hơn. Trong khi nhận dạng hình ảnh tập trung vào việc xác định các đối tượng hoặc đặc điểm trong hình ảnh, công nghệ deepfake tập trung vào việc tổng hợp các hình ảnh hoặc video hợp lý. Nó đại diện cho một ứng dụng tinh vi của AI tạo sinh trong phạm vi hình ảnh. Khả năng bị sử dụng sai mục đích nhấn mạnh tầm quan trọng của việc phát triển AI có trách nhiệm và nhận thức của công chúng.

Đọc tất cả