Gã khổng lồ AI Anthropic gây sốc khi làm lộ hơn 500.000 dòng mã nguồn

Lý Ngọc
•
Thứ Sáu, 03/04/2026

Công ty AI Anthropic ngày 31/3 xác nhận đã vô tình làm rò rỉ một lượng lớn mã nguồn nội bộ của công cụ lập trình AI “Claude Code” trong quá trình cập nhật phần mềm. Sự cố bắt nguồn từ phiên bản gói @anthropic-ai/claude-code 2.1.88 được đăng tải trên kho NPM, do lỗi cấu hình đóng gói. Cụ thể, một tệp source map JavaScript dung lượng gần 60MB đã vô tình được đưa vào, cho phép truy ngược lại toàn bộ mã nguồn TypeScript phía sau. Kết quả là khoảng 510.000 dòng mã, thuộc 1.900–2.300 tệp, đã bị công khai.

Sự rò rỉ nhanh chóng bị phát hiện bởi một người dùng trên nền tảng X và lan truyền rộng rãi trên GitHub – nền tảng lưu trữ mã nguồn lớn nhất thế giới. Chỉ trong thời gian ngắn, mã nguồn này đã bị sao chép và đăng lại hàng chục nghìn lần trong nhiều kho lưu trữ khác nhau. Đến sáng 1/4, Anthropic đã sử dụng yêu cầu bản quyền để buộc GitHub xóa hơn 8.000 bản sao và biến thể của mã bị rò rỉ.

Anthropic khẳng định đây không phải là một cuộc tấn công mạng mà chỉ là “lỗi đóng gói khi phát hành”. Trong tuyên bố chính thức, công ty nhấn mạnh không có dữ liệu khách hàng nhạy cảm hay thông tin xác thực nào bị lộ, và sự cố hoàn toàn do lỗi con người trong quy trình phát hành. Công ty cũng cho biết đang triển khai các biện pháp để ngăn chặn sự việc tương tự trong tương lai.

Phần mã bị lộ chủ yếu liên quan đến lớp ứng dụng của Claude Code, bao gồm giao diện dòng lệnh (CLI) và hệ thống điều phối tác vụ (agent harness). Các thành phần này chứa nhiều logic quan trọng như cơ chế gọi công cụ, quản lý bộ nhớ, mô hình phân quyền, cách tính token, chế độ suy luận (thinking mode) và hệ thống thử lại (retry). Đây được xem là những công nghệ độc quyền giúp điều khiển và khai thác hiệu quả năng lực của AI. Tuy nhiên, Anthropic cho biết các yếu tố cốt lõi như mô hình ngôn ngữ lớn (LLM), dữ liệu huấn luyện và trọng số (weights) – phần giá trị nhất – không bị ảnh hưởng.

Dù vậy, giới chuyên gia nhận định sự cố vẫn có thể gây hậu quả đáng kể. Việc mã nguồn bị phân tích rộng rãi giúp các đối thủ và startup AI dễ dàng hiểu rõ cách Claude Code hoạt động, từ đó tìm ra điểm yếu hoặc xây dựng sản phẩm cạnh tranh. Đồng thời, tin tặc cũng có thể tận dụng thông tin này để phát hiện lỗ hổng và thiết kế cách vượt qua các cơ chế an toàn. Ví dụ, các hạn chế về nội dung nguy hiểm hay gian lận vốn được lập trình trong hệ thống có thể bị khai thác nếu bị hiểu rõ.

Sự cố có thể ảnh hưởng đến uy tín bảo mật của Anthropic và làm giảm niềm tin từ khách hàng. Trong bối cảnh cạnh tranh AI ngày càng khốc liệt, việc bảo vệ mã nguồn và quy trình phát hành an toàn trở nên đặc biệt quan trọng.

Lý Ngọc t/h