OpenAI vừa mã nguồn mở công cụ giúp loại bỏ thông tin nhạy cảm trước khi ChatGPT kịp tiếp cận

Mỗi ngày, hàng triệu người dán vào ChatGPT những nội dung lẽ ra không nên chia sẻ. Từ tờ khai thuế, hồ sơ y tế, email công việc chứa tên khách hàng, hình ảnh phát ban da lạ, cho đến các khóa API mà họ vẫn thường hứa \”sẽ đổi vào tuần sau\”.
Giờ đây, OpenAI đã công bố một công cụ miễn phí giúp \”làm sạch\” toàn bộ những dữ liệu nhạy cảm này trước khi chúng kịp đến tay chatbot.
Công cụ mang tên Privacy Filter, vừa được ra mắt trong tuần này dưới giấy phép Apache 2.0. Điều này có nghĩa là bất kỳ ai cũng có thể tải về, sử dụng, tùy chỉnh và thậm chí xây dựng các sản phẩm thương mại dựa trên nền tảng này. Mô hình được lưu trữ trên Hugging Face và GitHub, sở hữu 1,5 tỷ tham số (đơn vị đo lường quy mô kiến thức của mô hình) và đủ nhẹ để chạy mượt mà trên một chiếc laptop thông thường.
Hãy hình dung nó như một công cụ kiểm tra chính tả, nhưng dành riêng cho quyền riêng tư. Bạn chỉ cần đưa vào một đoạn văn bản, công cụ sẽ trả lại nội dung tương tự nhưng đã thay thế mọi thông tin nhạy cảm bằng các nhãn giữ chỗ chung chung như [PRIVATE_PERSON] (Người riêng tư) hay [ACCOUNT_NUMBER] (Số tài khoản).
Bạn còn nhớ vụ việc các phần bị bôi đen trong tài liệu về Jeffrey Epstein từng bị \”khôi phục\” chỉ vì chính quyền thời Donald Trump dùng bút dạ quang để che thay vì bút mực đen? Nếu họ sử dụng mô hình này, sự cố đó đã không bao giờ xảy ra.

Privacy Filter của OpenAI thực sự hoạt động như thế nào?

Privacy Filter quét và phát hiện tám loại thông tin cá nhân: họ tên, địa chỉ, email, số điện thoại, URL, ngày tháng, số tài khoản và các bí mật như mật khẩu hay khóa API. Nó đọc toàn bộ văn bản trong một lượt duy nhất, sau đó gắn thẻ (tag) cho các phần nhạy cảm để thực hiện việc che giấu hoặc xóa bỏ.
Dưới đây là một ví dụ thực tế từ thông báo của OpenAI. Khi bạn dán vào một email như sau:

“Thanks again for meeting earlier today. (…) For reference, the project file is listed under 4829-1037-5581. If anything changes on your side, feel free to reply here at [email protected] or call me at +1 (415) 555-0124..”

Privacy Filter sẽ trả về kết quả:

“Thanks again for meeting earlier today (…) For reference, the project file is listed under `[ACCOUNT_NUMBER]`. If anything changes on your side, feel free to reply here at `[PRIVATE_EMAIL]` or call me at `[PRIVATE_PHONE]`.”

Thay vì phải dùng các “hộp đen” kỹ thuật số hay bút dạ quang thủ công, công cụ này trực tiếp thay đổi nội dung văn bản.
Các công cụ cũ dựa trên so khớp mẫu (pattern-matching) có thể bắt được số điện thoại hay địa chỉ email rõ ràng, nhưng thường thất bại khi cần hiểu ngữ cảnh. Ví dụ, “Annie” là tên người hay tên thương hiệu? “123 Main Street” là nhà riêng hay địa chỉ cửa hàng? Privacy Filter có thể phân biệt được nhờ khả năng đọc và hiểu các câu văn xung quanh.
OpenAI cho biết mô hình của họ đạt độ chính xác 96% ngay từ lần đầu tiên trên bộ dữ liệu chuẩn PII-Masking-300k, và con số này tăng lên 97,43% ở phiên bản đã được tinh chỉnh. Nói cách khác, công cụ phát hiện thành công thông tin cá nhân trong 96% trường hợp. Nhiệm vụ của bạn, với tư cách là người quan tâm đến quyền riêng tư, là cẩn trọng với 4% còn lại.

Bí mật: Câu chuyện này còn thú vị hơn cả một vụ án tại tòa.

“Chạy cục bộ” là yếu tố then chốt

Những người am hiểu về bảo mật sẽ coi đây là tin vui: OpenAI đã tạo ra một mô hình đủ nhỏ gọn và mạnh mẽ để chạy ngay trên máy tính của bạn. Điều này đồng nghĩa với việc văn bản của bạn không bao giờ phải rời khỏi thiết bị để được “làm sạch”.
Đây là điểm khác biệt quan trọng, bởi giải pháp thay thế mà hầu hết các công ty đang dùng là gửi dữ liệu thô lên các dịch vụ đám mây cam kết “bảo mật” và đặt niềm tin vào họ – một sự tin tưởng không phải lúc nào cũng vững chắc.
Hơn nữa, mô hình này hoàn toàn miễn phí và mã nguồn mở, cho phép các nhà nghiên cứu tự do kiểm tra, cải tiến và ứng dụng mà không lo ngại các rào cản pháp lý.
Dữ liệu được xử lý và làm sạch ngay trên laptop của bạn; chỉ phiên bản đã an toàn mới được gửi đi nơi khác. Nếu bạn điều hành một doanh nghiệp nhỏ, bạn có thể dùng AI để tóm tắt email khách hàng mà không cần tiết lộ tên họ cho bên thứ ba. Luật sư tự do có thể nhập ghi chú vụ án vào chatbot mà không lo rò rỉ danh tính thân chủ. Bác sĩ có thể soạn thư giới thiệu mà không để lộ thông tin bệnh nhân. Lập trình viên có thể nhờ AI gỡ lỗi code mà không cần dán trực tiếp khóa API vào câu lệnh.
Đối với người dùng phổ thông, lợi ích còn đơn giản hơn: bạn muốn nhờ ChatGPT viết lại một email gay gắt gửi chủ nhà, nhưng không muốn tiết lộ địa chỉ nhà mình cho OpenAI. Privacy Filter giải quyết trọn vẹn vấn đề này chỉ trong một bước.
Trước đây, việc chạy các mô hình AI mã nguồn mở cục bộ chỉ là sân chơi của những người đam mê công nghệ với yêu cầu card đồ họa gaming đắt tiền. Giờ đây, mọi thứ đã thay đổi. Các công cụ như LM Studio đã biến quy trình này trở nên đơn giản và nhanh chóng chẳng khác nào cài đặt Spotify.

Bí mật: OpenAI Ngừng Cung Cấp GPT‑4o, Mô Hình Yêu Thích Của Nhiều Người Dùng

Những điều công cụ này không phải là

OpenAI cũng rất thẳng thắn về các giới hạn của công cụ. Công ty cảnh báo rằng Privacy Filter “không phải là công cụ ẩn danh, không phải chứng nhận tuân thủ, và cũng không thay thế cho việc rà soát chính sách.”
Hiểu đơn giản: đừng dựa hoàn toàn vào nó như lớp phòng thủ duy nhất trong bệnh viện, công ty luật hay ngân hàng. Công cụ có thể bỏ sót các định danh bất thường, che đi quá mức các câu ngắn, và hiệu suất có thể chênh lệch giữa các ngôn ngữ. Nó chỉ là một mắt xích trong quy trình, chứ không phải tấm vé “đạt chuẩn” tự động. Suy cho cùng, độ chính xác 96% không đồng nghĩa với sự hoàn hảo 100%.
Tags: privacy, OpenAI, data protection