Meta tái khởi động kế hoạch đào tạo AI bằng cách sử dụng bài đăng công khai trên Facebook và Instagram của người dùng tại Vương quốc Anh

Meta đã xác nhận rằng họ đang khởi động lại các nỗ lực để huấn luyện hệ thống AI của mình bằng cách sử dụng các bài đăng công khai trên Facebook và Instagram từ cơ sở người dùng tại Vương quốc Anh.

Công ty cho biết họ đã "đưa phản hồi của các cơ quan quản lý vào" vào một phương pháp "tự chọn ra ngoại lệ" đã được sửa đổi để đảm bảo rằng họ "rõ ràng hơn nữa," như được quảng cáo trong bài đăng trên blog của họ. Họ cũng đang cố gắng đưa ra động thái này như là để cho phép các mô hình AI sinh sản của họ "phản ánh văn hóa, lịch sử và ngôn ngữ của người Anh." Nhưng không rõ rằng điểm khác biệt cụ thể là gì đối với việc thu thập dữ liệu mới nhất này.

Từ tuần sau, Meta cho biết người dùng tại Vương quốc Anh sẽ bắt đầu thấy thông báo trên ứng dụng giải thích về việc họ đang làm gì. Sau đó, công ty dự định bắt đầu sử dụng nội dung công khai để huấn luyện hệ thống AI trong những tháng tới - hoặc ít nhất là huấn luyện trên dữ liệu mà người dùng không phản đối một cách tích cực thông qua quy trình mà Meta cung cấp.

Việc công bố này đến ba tháng sau khi công ty mẹ của Facebook tạm ngừng kế hoạch của mình do áp lực từ quy định tại Vương quốc Anh, với Cơ quan ủy ban Thông tin (ICO) bày tỏ lo ngại về việc Meta có thể sử dụng dữ liệu người dùng tại Vương quốc Anh để huấn luyện các thuật toán AI sinh sản của mình - và cách thức họ thu thập sự đồng ý của mọi người. Cơ quan Bảo vệ Dữ liệu của Ireland, cơ quan quyền riêng tư dẫn đầu của Meta tại Liên minh châu Âu (EU), cũng phản đối kế hoạch của Meta sau khi nhận phản hồi từ các cơ quan bảo vệ dữ liệu khác trên khối.

Trong ngữ cảnh này, Meta đã tăng cường AI của mình từ nội dung do người dùng tạo ra trên thị trường như Hoa Kỳ trong một thời gian nhưng các quy định bảo vệ quyền riêng tư chi tiết của châu Âu đã tạo ra thách thức cho nó - và cho các công ty công nghệ khác - đang tìm cách mở rộng các tập dữ liệu huấn luyện theo cách này.

Mặc dù đã có các luật bảo vệ quyền riêng tư của EU, vào tháng 5 Meta đã bắt đầu thông báo cho người dùng trong khu vực về một thay đổi chính sách bảo mật sắp tới, nói rằng họ sẽ bắt đầu sử dụng nội dung từ các bình luận, tương tác với các công ty, cập nhật trạng thái, hình ảnh và phần chú thích tương ứng để huấn luyện AI. Lý do để làm như vậy, họ lý giải, là họ cần phản ánh "những ngôn ngữ, địa lý và tham chiếu văn hóa đa dạng của người dân châu Âu."

Những thay đổi này dự kiến sẽ có hiệu lực vào ngày 26 tháng 6 nhưng thông báo của Meta đã khiến các tổ chức bảo vệ quyền riêng tư không có lợi nhuận như noyb (còn được biết đến là "none of your business") đệ trình một tái phẫu án với các quốc gia thành viên trong EU, tuyên bố rằng Meta đang vi phạm các khía cạnh khác nhau của Nghị định Bảo vệ Dữ liệu Chung của khối (GDPR) - cấu trúc pháp lý làm nền tảng cho các luật bảo vệ dữ liệu quốc gia của các quốc gia thành viên Liên minh châu Âu (và cũng, vẫn, Đạo Luật Bảo vệ Dữ liệu của Vương quốc Anh).

Ứng xử phản đối

Một trong những điểm tranh cãi về phương pháp của Meta lần đầu tiên là quá trình họ cung cấp cho người dùng Facebook và Instagram để "tự chọn ra ngoại lệ" của họ được sử dụng để huấn luyện các hệ thống AI của công ty.

Thay vì cho người dùng một hộp kiểm 'đồng ý/từ chối', công ty đã khiến người dùng phải bấm để tìm một biểu mẫu phản đối được ẩn sau nhiều lần nhấp hoặc chạm, ở điểm đó họ bị buộc phải nêu lý do tại sao họ không muốn dữ liệu của mình được xử lý. Họ cũng được thông báo rằng điều này hoàn toàn tùy thuộc vào quyền hạn của Meta để quyết định xem yêu cầu này có được thực hiện hay không. Mặc dù công ty tuyên bố công khai rằng họ sẽ thực hiện mỗi yêu cầu.

Biểu mẫu phản đối Facebook
Ảnh Hỗ Trợ: Meta / Screenshot

Lần này, Meta vẫn duy trì phương pháp biểu mẫu phản đối, nghĩa là người dùng vẫn phải nộp đơn chính thức cho Meta để thông báo rằng họ không muốn dữ liệu của mình được sử dụng để cải thiện hệ thống AI của công ty. Những người đã phản đối trước đó sẽ không phải nộp lại những phản đối của họ, theo Meta. Nhưng công ty cho biết họ đã làm cho biểu mẫu phản đối đơn giản hơn lần này, tích hợp các phản hồi từ ICO. Mặc dù họ vẫn chưa giải thích cụ thể làm cách nào quy trình này đơn giản hơn. Vì vậy, đến thời điểm này, chúng ta chỉ có tuyên bố của Meta rằng quy trình là dễ dàng hơn.

Stephen Almond, giám đốc công nghệ và sáng tạo của ICO, cho biết họ sẽ "theo dõi tình hình" khi công ty tiến triển với kế hoạch sử dụng dữ liệu của người dùng tại Vương quốc Anh để huấn luyện mô hình AI.

“Việc đảm bảo và tạo ra sự tuân thủ liên tục với luật bảo vệ dữ liệu là trách nhiệm của Meta,” Almond nói trong một tuyên bố. “Chúng tôi đã nói rõ rằng bất kỳ tổ chức nào sử dụng thông tin của người dùng để huấn luyện mô hình AI sinh sản [cần] phải rõ ràng về cách mà dữ liệu của mọi người được sử dụng. Các tổ chức nên tuân theo hướng dẫn của chúng tôi và đặt các biện pháp bảo vệ hiệu quả vào trước khi họ bắt đầu sử dụng dữ liệu cá nhân để huấn luyện mô hình, bao gồm cung cấp một con đường rõ ràng và đơn giản cho người dùng phản đối việc xử lý.”

}