Khoa Học - Công Nghệ

Gã khổng lồ AI Anthropic gây sốc khi làm lộ hơn 500.000 dòng mã nguồn

Công ty AI Anthropic ngày 31/3 xác nhận đã vô tình làm rò rỉ một lượng lớn mã nguồn nội bộ của công cụ lập trình AI “Claude Code” trong quá trình cập nhật phần mềm. Sự cố bắt nguồn từ phiên bản gói @anthropic-ai/claude-code 2.1.88 được đăng tải trên kho NPM, do lỗi cấu hình đóng gói. Cụ thể, một tệp source map JavaScript dung lượng gần 60MB đã vô tình được đưa vào, cho phép truy ngược lại toàn bộ mã nguồn TypeScript phía sau. Kết quả là khoảng 510.000 dòng mã, thuộc 1.900–2.300 tệp, đã bị công khai.

Công ty AI Anthropic ngày 31/3 xác nhận đã vô tình làm rò rỉ một lượng lớn mã nguồn nội bộ của công cụ lập trình AI “Claude Code” trong quá trình cập nhật phần mềm. (Ảnh: Shutterstock)

Sự rò rỉ nhanh chóng bị phát hiện bởi một người dùng trên nền tảng X và lan truyền rộng rãi trên GitHub – nền tảng lưu trữ mã nguồn lớn nhất thế giới. Chỉ trong thời gian ngắn, mã nguồn này đã bị sao chép và đăng lại hàng chục nghìn lần trong nhiều kho lưu trữ khác nhau. Đến sáng 1/4, Anthropic đã sử dụng yêu cầu bản quyền để buộc GitHub xóa hơn 8.000 bản sao và biến thể của mã bị rò rỉ.

Anthropic khẳng định đây không phải là một cuộc tấn công mạng mà chỉ là “lỗi đóng gói khi phát hành”. Trong tuyên bố chính thức, công ty nhấn mạnh không có dữ liệu khách hàng nhạy cảm hay thông tin xác thực nào bị lộ, và sự cố hoàn toàn do lỗi con người trong quy trình phát hành. Công ty cũng cho biết đang triển khai các biện pháp để ngăn chặn sự việc tương tự trong tương lai.

Phần mã bị lộ chủ yếu liên quan đến lớp ứng dụng của Claude Code, bao gồm giao diện dòng lệnh (CLI) và hệ thống điều phối tác vụ (agent harness). Các thành phần này chứa nhiều logic quan trọng như cơ chế gọi công cụ, quản lý bộ nhớ, mô hình phân quyền, cách tính token, chế độ suy luận (thinking mode) và hệ thống thử lại (retry). Đây được xem là những công nghệ độc quyền giúp điều khiển và khai thác hiệu quả năng lực của AI. Tuy nhiên, Anthropic cho biết các yếu tố cốt lõi như mô hình ngôn ngữ lớn (LLM), dữ liệu huấn luyện và trọng số (weights) – phần giá trị nhất – không bị ảnh hưởng.

Dù vậy, giới chuyên gia nhận định sự cố vẫn có thể gây hậu quả đáng kể. Việc mã nguồn bị phân tích rộng rãi giúp các đối thủ và startup AI dễ dàng hiểu rõ cách Claude Code hoạt động, từ đó tìm ra điểm yếu hoặc xây dựng sản phẩm cạnh tranh. Đồng thời, tin tặc cũng có thể tận dụng thông tin này để phát hiện lỗ hổng và thiết kế cách vượt qua các cơ chế an toàn. Ví dụ, các hạn chế về nội dung nguy hiểm hay gian lận vốn được lập trình trong hệ thống có thể bị khai thác nếu bị hiểu rõ.

Sự cố có thể ảnh hưởng đến uy tín bảo mật của Anthropic và làm giảm niềm tin từ khách hàng. Trong bối cảnh cạnh tranh AI ngày càng khốc liệt, việc bảo vệ mã nguồn và quy trình phát hành an toàn trở nên đặc biệt quan trọng.

Lý Ngọc t/h
Lý Ngọc

Published by
Lý Ngọc

Recent Posts

Vụ đánh bom triệu phú Vadim Ermolaev ở Monaco: Nghi phạm là một phụ nữ Ukraine

Giới chức Monaco đã xác định một phụ nữ Ukraine là nghi phạm chính trong…

10 phút ago

Bộ GD-ĐT rà soát hiện tượng 147 điểm 10 môn Toán tập trung tại Tuyên Quang

Bộ GD-ĐT cho hay, qua rà soát, Bộ nhận thấy kết quả thi môn Toán…

37 phút ago

ICE đẩy mạnh thực thi luật nhập cư, hơn 10.000 người bị bắt trong 5 ngày

Cơ quan Thực thi Di trú và Hải quan (ICE) đã đẩy mạnh chiến dịch…

2 giờ ago

Chuyên gia: Cổ phiếu công nghệ TQ trượt dài, tín hiệu đáng lo của Alibaba và Tencent

Vào khoảng năm 2020, giá cổ phiếu Tencent từng tăng lên 775,5 đô la Hồng…

3 giờ ago

Canada: Bé trai tử vong vì bệnh dại do tiếp xúc với dơi khi đang ngủ

Vì đứa trẻ không có vết cắn hay trầy xước rõ ràng và có vẻ…

3 giờ ago

Văn hóa tiết kiệm: Không cần phúc lợi hào nhoáng Nvidia vẫn giữ chân được nhân tài

Môi trường làm việc tại Nvidia không khác gì một “nồi áp suất”, nơi mà…

3 giờ ago