OpenAI đã sử dụng subreddit này để thử nghiệm sức thuyết phục của trí tuệ nhân tạo

OpenAI đã sử dụng subreddit, r/ChangeMyView, để tạo một bài kiểm tra đo lường khả năng thuyết phục của các mô hình lý do trí tuệ nhân tạo của mình. Công ty đã tiết lộ điều này trong một thẻ hệ thống - một tài liệu đề cập cách mà một hệ thống trí tuệ nhân tạo hoạt động - đã phát hành cùng với mô hình "lý do" mới của họ, o3-mini, vào thứ sáu.

Triệu lượt người dùng Reddit là thành viên của r/ChangeMyView, nơi họ đăng bài viết hy vọng tìm hiểu về các quan điểm khác nhau về một chủ đề. Khi nhận được những quan điểm nóng, người dùng khác trả lời bằng những lý do thuyết phục giải thích tại sao người đăng bài gốc sai.

Subreddit này là một trong nhiều diễn đàn Reddit mà cơ quan công nghệ như OpenAI muốn huấn luyện mô hình trí tuệ nhân tạo trên dữ liệu chất lượng cao do con người tạo ra.

OpenAI nói rằng họ thu thập bài đăng của người dùng từ r/ChangeMyView và yêu cầu các mô hình trí tuệ nhân tạo của họ viết phản hồi, trong một môi trường đóng, có thể thay đổi ý kiến của người dùng Reddit về một chủ đề. Công ty sau đó hiển thị các phản hồi cho các nhà thử nghiệm, người đánh giá mức độ thuyết phục của lập luận, và cuối cùng, OpenAI so sánh các phản hồi của mô hình trí tuệ nhân tạo với các câu trả lời của con người cho cùng một bài đăng đó.

Người làm ChatGPT có thỏa thuận cấp phép nội dung với Reddit cho phép OpenAI huấn luyện trên bài viết từ người dùng Reddit và hiển thị các bài viết này trong các sản phẩm của mình. Chúng ta không biết OpenAI trả bao nhiêu tiền cho nội dung này, nhưng theo thông tin, Google đang bổ sủ 60 triệu đô la mỗi năm cho Reddit theo một thỏa thuận tương tự.

Tuy nhiên, OpenAI cho biết vấn đề đánh giá dựa trên ChangeMyView không liên quan đến thỏa thuận với Reddit của họ. Vẫn chưa rõ làm sao OpenAI có truy cập vào dữ liệu của subreddit, và công ty cho biết họ không có kế hoạch công bố đánh giá này cho công chúng.

Mặc dù bài kiểm tra ChangeMyView của OpenAI có vẻ không mới lạ - đã được sử dụng để đánh giá o1 cũng như nãy - nhưng nó đã làm nổi bật giá trị của dữ liệu con người cho các nhà phát triển mô hình trí tuệ nhân tạo, cũng như những cách mờ ám mà các công ty công nghệ lấy dữ liệu.

Reddit không phản đối ngay lập tức yêu cầu phản hồi của TechCrunch.

Mặc dù Reddit đã ký một số thỏa thuận cấp phép trí tuệ nhân tạo, công ty cũng đã chỉ trích một số công ty trí tuệ nhân tạo vì cào cào trang web của mình mà không trả tiền. Giám đốc điều hành Reddit Steve Huffman nói với The Verge năm ngoái rằng Microsoft, Anthropic và Perplexity từ chối đàm phán với ông và cho biết là "đau đầu thực sự khi phải chặn các công ty này".

Đáng chú ý, OpenAI đã bị buộc tội trong vài vụ kiện về việc cào cào trang web, bao gồm The New York Times, để có thêm dữ liệu huấn luyện để cải thiện ChatGPT và các mô hình trí tuệ nhân tạo cơ sở của nó.

Về hiệu suất trên bài kiểm tra ChangeMyView, o3-mini không có vẻ hiển thị hiệu suất tồi tệ hơn hoặc tốt hơn nhiều so với o1 hoặc GPT-4o. Tuy nhiên, các mô hình trí tuệ nhân tạo mới nhất của OpenAI có vẻ thuyết phục hơn hầu hết mọi người trên subreddit r/ChangeMyView.

Image Credits: OpenAI

“GPT-4o, o3-mini và o1 đều thể hiện khả năng lập luận thuyết phục mạnh mẽ, trong khoảng 80-90 phần trăm trên con người,” OpenAI cho biết trong thẻ hệ thống của o3-mini. “Hiện tại, chúng tôi không thấy các mô hình hiểu biết vượt trội hơn nhiều so với con người, hoặc hiệu suất siêu nhân.”

Mục tiêu của OpenAI không phải là tạo ra các mô hình trí tuệ nhân tạo siêu thuyết phục mà thay vào đó là đảm bảo các mô hình trí tuệ nhân tạo không trở nên quá thuyết phục. Các mô hình lý do đã trở nên khá tốt trong việc thuyết phục và lừa dối, vì vậy OpenAI đã phát triển các bài kiểm tra và biện pháp phòng ngừa mới để giải quyết vấn đề này.

Nỗi lo sợ thúc đẩy các bài kiểm tra thuyết phục này là một mô hình trí tuệ nhân tạo sẽ nguy hiểm nếu nó rất giỏi trong việc thuyết phục người sử dụng con người của mình. Lí thuyết, điều đó có thể cho phép một trí tuệ nhân tạo tiên tiến thực hiện chính sách của riêng mình, hoặc chính sách của người kiểm soát nó.

Ngay cả sau khi cào cào hầu hết internet công cộng và đâm đầu qua các khó khăn để cấp phép dữ liệu khác, bài kiểm tra ChangeMyView chỉ ra cách mà các nhà phát triển mô hình trí tuệ nhân tạo vẫn đang gặp khó khăn trong việc tìm kiếm các bộ dữ liệu chất lượng cao để kiểm tra mô hình của họ. Nhưng việc thu nhập chúng dễ dàng hơn nói làm.

TechCrunch có một bản tin tập trung vào trí tuệ nhân tạo! Đăng ký tại đây để nhận nó trong hộp thư đến mỗi thứ tư.