Dưới góc nhìn an ninh mạng và bảo mật dữ liệu, vụ việc mới đây giữa OpenAI và các nhà xuất bản lớn như The New York Times đang đặt ra nhiều vấn đề đáng quan tâm về quyền riêng tư người dùng, quản lý dữ liệu và ranh giới giữa quyền sở hữu trí tuệ và công nghệ AI.
OpenAI – tổ chức phát triển mô hình trí tuệ nhân tạo ChatGPT đã chính thức phản đối một lệnh tòa buộc họ phải lưu giữ toàn bộ các bản ghi cuộc hội thoại của người dùng. Yêu cầu này xuất phát từ vụ kiện vi phạm bản quyền do The New York Times và một số nhà xuất bản khác đệ trình, cáo buộc rằng ChatGPT đã hiển thị nội dung của họ trong phản hồi, khiến người dùng có thể đọc miễn phí thay vì truy cập nội dung trả phí.
Các nguyên đơn lập luận rằng việc cho phép xóa các cuộc hội thoại có thể che giấu bằng chứng rằng người dùng đã truy xuất trái phép nội dung sở hữu trí tuệ thông qua ChatGPT. Điều này đã dẫn đến phiên điều trần vào tháng 1, trong đó Thẩm phán Ona T. Wang bày tỏ lo ngại rằng người dùng, sau khi biết về vụ kiện, có thể chủ động xóa dữ liệu trò chuyện để “xóa dấu vết”.
Ban đầu, tòa bác yêu cầu lưu trữ, nhưng cũng chất vấn vì sao OpenAI không thể tách riêng và ẩn danh dữ liệu từ những người dùng đã yêu cầu xóa. Do OpenAI không cung cấp giải pháp thỏa đáng, đến ngày 13/5, thẩm phán đã ban hành lệnh buộc OpenAI phải bảo tồn và phân tách mọi dữ liệu đầu ra vốn sẽ bị xóa trong tương lai – bao gồm cả dữ liệu bị xóa theo yêu cầu người dùng hoặc vì các quy định pháp lý về quyền riêng tư.
Rủi ro bảo mật dữ liệu cá nhân – Một bước lùi trong bảo vệ quyền riêng tư
Về mặt kỹ thuật, ChatGPT mặc định lưu trữ nội dung trò chuyện của người dùng để phục vụ cho việc huấn luyện mô hình AI, nhưng cũng cung cấp tùy chọn tắt tính năng này để “quên” toàn bộ cuộc trò chuyện, cùng với chế độ “trò chuyện tạm thời” – nơi dữ liệu sẽ bị xóa ngay sau khi kết thúc phiên. Tuy nhiên, với lệnh bảo tồn dữ liệu mới, OpenAI không còn có thể đảm bảo quyền kiểm soát dữ liệu cá nhân cho người dùng như trước đây.
Trong văn bản phản đối gửi tòa án, OpenAI khẳng định:
“Chúng tôi bị buộc phải từ bỏ cam kết cho phép người dùng kiểm soát việc lưu trữ và sử dụng dữ liệu trò chuyện. Mỗi ngày lệnh bảo tồn này còn hiệu lực là một ngày người dùng mất đi các biện pháp bảo vệ quyền riêng tư mà chúng tôi đã dày công thiết lập.”
OpenAI cũng nhấn mạnh rằng người dùng thường chia sẻ nhiều thông tin nhạy cảm trong các cuộc trò chuyện, bao gồm dữ liệu tài chính, thông tin cá nhân, thậm chí cả nội dung riêng tư như lời thề trong lễ cưới – những điều vốn được kỳ vọng sẽ được hệ thống xóa ngay theo mặc định.
Bối cảnh pháp lý: Mâu thuẫn giữa bảo vệ quyền tác giả và quyền riêng tư
Các nhà xuất bản, bao gồm The New York Times, New York Daily News và Trung tâm Báo chí Điều tra (CIR), đã hợp nhất các vụ kiện riêng lẻ về vi phạm bản quyền thành một hồ sơ pháp lý chung nhằm chống lại OpenAI.
OpenAI phản biện rằng họ sử dụng nội dung dựa trên nguyên tắc “sử dụng hợp lý” (fair use), vì hệ thống AI đã chuyển đổi nội dung thành token và tái tổ hợp với các thông tin khác để tạo phản hồi mới.
Khuyến nghị bảo mật dành cho người dùng AI
Ngay cả khi người dùng xóa cuộc trò chuyện, hệ thống ChatGPT vẫn duy trì một “bộ nhớ ngữ cảnh” riêng – lưu giữ các chi tiết như tên bạn bè, sở thích định dạng phản hồi,… giúp cải thiện trải nghiệm. Người dùng có thể tắt hoặc xóa hoàn toàn tính năng này, nhưng cần lưu ý:
- Không chia sẻ thông tin nhạy cảm như mật khẩu, dữ liệu tài chính hay thông tin cá nhân qua các nền tảng AI.
- Hiểu rõ chính sách bảo mật dữ liệu và cơ chế lưu trữ của hệ thống trước khi sử dụng.
- Luôn đặt câu hỏi về quyền kiểm soát dữ liệu: Ai có thể truy cập? Khi nào bị xóa? Có được mã hóa không?