Thuật ngữ

Quyền riêng tư khác biệt

Tìm hiểu cách quyền riêng tư khác biệt bảo vệ dữ liệu nhạy cảm trong AI/ML, đảm bảo quyền riêng tư đồng thời cho phép phân tích chính xác và tuân thủ các quy định.

Differential Privacy là hệ thống chia sẻ thông tin công khai về một tập dữ liệu bằng cách mô tả các mẫu nhóm trong tập dữ liệu trong khi giữ lại thông tin về các cá nhân trong tập dữ liệu. Nó cung cấp các đảm bảo toán học mạnh mẽ rằng sự hiện diện hoặc vắng mặt của bất kỳ dữ liệu cá nhân nào trong tập dữ liệu sẽ không ảnh hưởng đáng kể đến kết quả của bất kỳ phân tích nào. Điều này rất quan trọng trong các lĩnh vực Trí tuệ nhân tạo (AI) và Học máy (ML) , nơi các mô hình thường được đào tạo trên một lượng lớn dữ liệu đào tạo có khả năng nhạy cảm. Đảm bảo quyền riêng tư của cá nhân sẽ xây dựng lòng tin và tạo điều kiện tuân thủ các quy định như Quy định bảo vệ dữ liệu chung (GDPR) .

Quyền riêng tư khác biệt hoạt động như thế nào

Ý tưởng cốt lõi đằng sau quyền riêng tư khác biệt là đưa một lượng ngẫu nhiên được kiểm soát, thường được gọi là "nhiễu", vào quy trình phân tích dữ liệu. Nhiễu này được hiệu chỉnh cẩn thận để che giấu các đóng góp của cá nhân trong khi vẫn cho phép trích xuất số liệu thống kê tổng hợp có ý nghĩa hoặc đào tạo các mô hình ML hữu ích. Mức độ riêng tư thường được kiểm soát bởi một tham số gọi là epsilon (ε), biểu thị "ngân sách riêng tư". Một epsilon nhỏ hơn có nghĩa là nhiều nhiễu hơn và đảm bảo quyền riêng tư mạnh hơn, nhưng có khả năng tiện ích hoặc độ chính xác thấp hơn trong kết quả. Khái niệm này đã được các nhà nghiên cứu như Cynthia Dwork chính thức hóa.

Tầm quan trọng trong AI và Học máy

Trong AI và ML, quyền riêng tư khác biệt là điều cần thiết khi xử lý các tập dữ liệu nhạy cảm, chẳng hạn như dữ liệu về hành vi của người dùng, thông tin liên lạc cá nhân hoặc hồ sơ y tế được sử dụng trong các ứng dụng như AI trong chăm sóc sức khỏe . Nó cho phép các tổ chức tận dụng các tập dữ liệu lớn để đào tạo các mô hình mạnh mẽ, như các mô hình được sử dụng để phát hiện đối tượng hoặc phân loại hình ảnh , mà không tiết lộ thông tin người dùng cá nhân. Các kỹ thuật như giảm dần độ dốc ngẫu nhiên riêng tư khác biệt (SGD) có thể được sử dụng để đào tạo các mô hình học sâu (DL) với các đảm bảo về quyền riêng tư. Việc triển khai các kỹ thuật như vậy là một khía cạnh quan trọng của quá trình phát triển AI có trách nhiệm và duy trì đạo đức AI .

Ứng dụng trong thế giới thực

Quyền riêng tư khác biệt được các công ty và tổ chức công nghệ lớn sử dụng:

Apple: Sử dụng quyền riêng tư khác biệt để thu thập số liệu thống kê sử dụng (như biểu tượng cảm xúc phổ biến hoặc loại dữ liệu sức khỏe) từ hàng triệu iOS và các thiết bị macOS mà không cần tìm hiểu thông tin cụ thể về từng người dùng. Tìm hiểu thêm về cách tiếp cận của Apple .
Google : Áp dụng quyền riêng tư khác biệt trong nhiều sản phẩm, bao gồm Google Chrome dùng để thu thập dữ liệu đo từ xa và đào tạo các mô hình ML trong các khuôn khổ như TensorFlow Privacy . Đây cũng là một thành phần thường được sử dụng cùng với Federated Learning để bảo vệ dữ liệu người dùng trong quá trình đào tạo mô hình phân tán.

Quyền riêng tư khác biệt so với các khái niệm liên quan

Điều quan trọng là phải phân biệt quyền riêng tư khác biệt với các kỹ thuật bảo vệ dữ liệu khác:

Ẩn danh: Các kỹ thuật ẩn danh truyền thống liên quan đến việc xóa hoặc thay đổi thông tin nhận dạng cá nhân (PII). Tuy nhiên, dữ liệu ẩn danh đôi khi có thể được xác định lại thông qua các cuộc tấn công liên kết . Quyền riêng tư khác biệt cung cấp sự đảm bảo mạnh mẽ hơn, có thể chứng minh được bằng toán học chống lại các rủi ro như vậy.
Bảo mật dữ liệu : Tập trung vào việc bảo vệ dữ liệu khỏi truy cập trái phép, vi phạm và các mối đe dọa mạng bằng các biện pháp như mã hóa và kiểm soát truy cập. Quyền riêng tư khác biệt bổ sung cho bảo mật dữ liệu bằng cách bảo vệ quyền riêng tư của cá nhân ngay cả khi dữ liệu được các bên được ủy quyền truy cập để phân tích.
Học liên bang : Một kỹ thuật đào tạo trong đó các mô hình được đào tạo trên các thiết bị phi tập trung mà không tập trung dữ liệu thô. Mặc dù nó tăng cường quyền riêng tư dữ liệu , quyền riêng tư khác biệt thường được thêm vào để bảo vệ thêm các bản cập nhật mô hình được gửi từ các thiết bị.

Thách thức và cân nhắc

Thách thức chính với quyền riêng tư khác biệt là quản lý sự đánh đổi vốn có giữa quyền riêng tư và tiện ích . Việc tăng quyền riêng tư (thêm nhiều nhiễu hơn) thường làm giảm độ chính xác hoặc tính hữu ích của phân tích hoặc mô hình ML kết quả. Việc lựa chọn mức nhiễu phù hợp (epsilon) và triển khai các cơ chế một cách chính xác đòi hỏi phải có chuyên môn. Các nguồn lực và công cụ như thư viện OpenDP nhằm mục đích giúp việc triển khai quyền riêng tư khác biệt trở nên dễ dàng hơn. Các tổ chức như Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ (NIST) cũng cung cấp hướng dẫn.

Quyền riêng tư khác biệt cung cấp một khuôn khổ mạnh mẽ để cho phép phân tích dữ liệu và học máy trong khi bảo vệ nghiêm ngặt quyền riêng tư của cá nhân, biến nó thành công nghệ nền tảng cho các hệ thống AI đáng tin cậy. Các nền tảng như Ultralytics HUB ưu tiên phát triển AI an toàn và có đạo đức, phù hợp với các nguyên tắc coi trọng việc bảo vệ dữ liệu người dùng.

Quyền riêng tư khác biệt

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Xe lửa YOLO mô hình đơn giản với Ultralytics TRUNG TÂM

Quyền riêng tư khác biệt hoạt động như thế nào

Tầm quan trọng trong AI và Học máy

Ứng dụng trong thế giới thực

Quyền riêng tư khác biệt so với các khái niệm liên quan

Thách thức và cân nhắc

Đọc thêm blog

Tham gia Ultralytics cộng đồng