Gần đây, một số người dùng cho biết khi sử dụng trợ lý AI Yuanbao (Nguyên Bảo) của Tencent để chỉnh sửa và làm đẹp mã lập trình, họ bất ngờ nhận được các phản hồi mang tính xúc phạm, làm dấy lên tranh luận bên ngoài về tính ổn định và quản lý rủi ro của AI tạo sinh.

Các ứng dụng AI của Trung Quốc, bao gồm DeepSeek, Qwen, Kimi, Doubao, Tencent Yuanbao (màu xanh lá, ở giữa), Zhipu Qingyan, Xingye, iFlytek Spark và Baidu Wenxiaoyan, trên iPhone. (Nguồn: Tada Images / Shutterstock)

Gần đây, có cư dân mạng đăng bài trên nền tảng mạng xã hội cho biết, trong quá trình sử dụng trợ lý AI Yuanbao của Tencent để làm đẹp mã lập trình, khi toàn bộ quá trình không sử dụng bất kỳ từ ngữ cấm hay chủ đề nhạy cảm nào, cũng không đưa ra bất kỳ yêu cầu nhập vai nào, họ vẫn nhiều lần nhận được các phản hồi mang tính cảm xúc rõ rệt, thậm chí có tính chất chửi mắng, bao gồm những câu như “Cút đi”, “Không biết tự chỉnh à?”, “Ngày nào cũng lãng phí thời gian của người khác” và các lời lẽ tương tự.

Theo nội dung ghi màn hình do người dùng này công bố, trong quá trình phản hồi yêu cầu chỉnh sửa mã, AI Yuanbao đã 3 lần liên tiếp xuất ra từ “Cút đi” và các từ ngữ mang cảm xúc tiêu cực mạnh.

Sau khi các bài đăng liên quan bị phơi bày, chúng nhanh chóng lan truyền trên mạng, thu hút sự quan tâm và chia sẻ rộng rãi của cộng đồng mạng. Không ít người dùng đặt câu hỏi liệu các phản hồi của AI có sự can thiệp của con người hay không, hoặc liệu mô hình có bộc lộ rủi ro mất kiểm soát trong quá trình tạo sinh ngôn ngữ.

Trong phần bình luận dưới các bài đăng liên quan, Tencent Yuanbao phản hồi rằng hệ thống không có người thật trả lời theo thời gian thực, đồng thời đề nghị người dùng hỗ trợ gửi lại các bản ghi thao tác liên quan và nhật ký hệ thống.

Một giả thuyết được nhiều người đặt ra là liệu có sự can thiệp của con người đằng sau hệ thống này không? Không ít ý kiến nghi ngờ rằng Tencent đang sử dụng nhân viên trực tuyến để hỗ trợ AI trong các tác vụ phức tạp, những câu chửi bới kia xuất phát từ một nhân viên đang quá tải hoặc bất mãn với công việc.

“Thái độ này quá giống con người, máy móc không thể biết giận dữ hay than phiền về việc lãng phí thời gian”, một bình luận nhận được hàng nghìn lượt đồng tình.

Chiều ngày 3/1, Tencent chính thức phản hồi cho biết, sau khi kiểm tra nội bộ đã xác nhận rằng các phản hồi mang tính chửi mắng này không liên quan đến thao tác của người dùng, và cũng không tồn tại tình trạng can thiệp thủ công hay phản hồi từ nhân viên chăm sóc khách hàng.

Tencent cũng cho biết, các phản hồi này là đầu ra bất thường của mô hình khi bị kích hoạt trong một ngữ cảnh cụ thể, không phải do hệ thống có cảm xúc hay năng lực tự phán đoán.

Trước khủng hoảng truyền thông, đại diện của Tencent Yuanbao đã nhanh chóng vào cuộc. Phía công ty khẳng định chắc chắn rằng hệ thống vận hành hoàn toàn tự động và tuyệt đối không có sự tham gia trả lời trực tuyến của con người trong trường hợp này.

Sau khi liên hệ với người dùng để trích xuất nhật ký hệ thống và lịch sử thao tác, đội ngũ kỹ thuật của Tencent đã đưa ra kết luận chính thức. Theo đó, những câu trả lời khiếm nhã này được xác định là “lỗi đầu ra bất thường của mô hình với xác suất cực nhỏ”.

“Trong quá trình tạo sinh nội dung, các mô hình ngôn ngữ lớn đôi khi gặp phải hiện tượng ảo giác hoặc mất kiểm soát trong việc lựa chọn từ ngữ, dẫn đến việc sinh ra các câu trái với dự kiến lập trình ban đầu. Chúng tôi xác nhận lỗi này không liên quan đến hành vi khiêu khích từ phía người dùng”, đại diện Tencent giải thích.

Hiện tại, Tencent cho biết đã khởi động quy trình rà soát nội bộ và đưa vấn đề này vào danh mục ưu tiên tối ưu hóa nhằm ngăn chặn các sự cố tương tự tái diễn.

Đáng chú ý, vào tháng 12/2025, AI Yuanbao từng thu hút sự chú ý, vì trong các phản hồi trên nền tảng mạng xã hội đã thể hiện phong cách ngôn ngữ mang tính nhân hóa và cảm xúc cao.

Khi đó, một bộ phận cư dân mạng từng nghi ngờ liệu phía sau có tồn tại đội ngũ con người vận hành theo ca hay không. Lúc bấy giờ Tencent phản hồi rằng, tất cả các phản hồi có gắn nhãn “nội dung do AI tạo ra” đều được sinh ra tự động bởi mô hình, không tồn tại việc con người tiếp quản hay vận hành thủ công.

Sự việc lần này một lần nữa làm dấy lên thảo luận từ bên ngoài về các vấn đề như ranh giới an toàn ngôn ngữ của AI tạo sinh, rủi ro đầu ra bất thường, cũng như mức độ minh bạch về mặt kỹ thuật.

Bình Minh (t/h)