DeepSeek (Ảnh minh họa: Melinda Nagy / Shutterstock)
Theo các nguồn tin mới nhất, công ty khởi nghiệp trí tuệ nhân tạo (AI) Trung Quốc DeepSeek đã buộc phải trì hoãn việc ra mắt mô hình R2 mới nhất do gặp phải các lỗi kỹ thuật khi sử dụng chip Huawei trong quá trình huấn luyện. Sự việc này làm nổi bật những thách thức nghiêm trọng mà Bắc Kinh phải đối mặt trong việc thúc đẩy phát triển AI nội địa.
Theo Financial Times dẫn lời ba nguồn tin thân cận, sau khi ra mắt mô hình R1 vào tháng Một năm nay, DeepSeek đã được cơ quan quản lý “khuyến khích” chuyển sang sử dụng bộ vi xử lý Ascend của Huawei thay vì hệ thống của Nvidia (của Mỹ).
Tuy nhiên, trong quá trình huấn luyện mô hình R2, chip Ascend liên tục gặp các vấn đề về độ ổn định và hiệu suất, khiến DeepSeek phải áp dụng giải pháp thỏa hiệp: sử dụng chip Nvidia cho huấn luyện và chip Huawei cho suy luận (inference). Kế hoạch ra mắt ban đầu vào tháng Năm đã bị hoãn, dẫn đến việc bỏ lỡ cơ hội thị trường.
Huấn luyện là quá trình cho phép mô hình học và tối ưu hóa các tham số thông qua lượng dữ liệu lớn; suy luận là việc sử dụng mô hình đã được huấn luyện để tạo ra kết quả hoặc dự đoán, chẳng hạn như phản hồi của chatbot.
Báo cáo cho biết, Huawei đã cử một đội ngũ kỹ sư đến văn phòng DeepSeek để hỗ trợ phát triển, nhưng vẫn không thể hoàn thành một lần huấn luyện thành công trên chip Ascend. DeepSeek hiện vẫn đang hợp tác với Huawei để cố gắng khiến mô hình R2 hoàn toàn tương thích với chip Ascend trong giai đoạn suy luận.
Các nguồn tin cho biết, nhà sáng lập DeepSeek, Lương Văn Phong (Liang Wenfeng), không hài lòng với tiến độ phát triển của R2 và đang thúc đẩy đầu tư thêm nguồn lực để xây dựng một mô hình tiên tiến, duy trì lợi thế dẫn đầu.
Một nguồn tin khác bổ sung rằng việc ra mắt mô hình R2 cũng bị trì hoãn do thời gian gắn nhãn dữ liệu để cập nhật mô hình kéo dài hơn dự kiến. Truyền thông Trung Quốc đưa tin rằng mô hình này sớm nhất có thể được phát hành trong vài tuần tới.
Theo RFI đưa tin, DeepSeek và Huawei vẫn chưa phản hồi yêu cầu bình luận.
Lần nâng cấp phiên bản mới nhất của DeepSeek là DeepSeek-R1-0528, được ra mắt vào ngày 29/5. So với DeepSeek-R1 trước đó, DeepSeek-R1-0528 vẫn sử dụng mô hình DeepSeek V3 Base được phát hành vào tháng 12/2024 làm nền tảng, nhưng trong quá trình huấn luyện sau đã đầu tư thêm nhiều năng lực tính toán, nâng cao độ sâu tư duy và khả năng suy luận của mô hình.
Dữ liệu từ nhà cung cấp dịch vụ dữ liệu lớn QuestMobile cho thấy, mặc dù DeepSeek vẫn là nền tảng công cụ trí tuệ nhân tạo có số lượng người dùng lớn nhất tại Trung Quốc, nhưng quy mô người dùng hoạt động hàng tháng trên thiết bị di động đã giảm từ 194 triệu người vào tháng 3/2025 xuống còn 163 triệu người vào tháng 6/2025. Dữ liệu thống kê từ Semianalysis cho thấy tỷ lệ sử dụng DeepSeek đã giảm từ mức cao nhất 7,5% vào đầu năm xuống còn 3% vào tháng 7/2025.
Gần đây, Nvidia đã đạt được thỏa thuận với Chính phủ Mỹ, đồng ý nộp 15% doanh thu từ việc bán chip H20 tại Trung Quốc để đổi lấy giấy phép xuất khẩu. Công ty nhấn mạnh rằng nếu rút hoàn toàn khỏi thị trường Trung Quốc và cộng đồng phát triển, điều này sẽ làm suy yếu khả năng cạnh tranh kinh tế toàn cầu và ảnh hưởng công nghệ của Mỹ.
Vào cuối tháng trước, Văn phòng Quản lý Không gian mạng Trung Quốc (CAC) đã triệu tập Nvidia, yêu cầu giải thích liệu chip H20 có chứa “cửa hậu” có thể theo dõi hoặc tắt từ xa hay không, đồng thời yêu cầu cung cấp tài liệu chứng minh liên quan.
Vào ngày 6/8, Nvidia đã đưa ra tuyên bố chính thức, phủ nhận hoàn toàn việc chip GPU của mình có chứa “cửa hậu”, công tắc tắt từ xa hoặc phần mềm gián điệp.
Theo Reuters, mặc dù chính quyền Trung Quốc chưa chính thức cấm bán H20 trên toàn quốc, họ đã yêu cầu các công ty công nghệ lớn như Tencent, ByteDance, Baidu và một số doanh nghiệp nhỏ hơn phải đưa ra “lý do hợp lý” khi sử dụng chip H20, đặc biệt khi liên quan đến các mục đích của chính phủ hoặc nhạy cảm.
Trí Đạt (t/h)
Phái đoàn Mỹ tới Alaska: Marco Rubio, Steve Witkoff, Howard Lutnick, John Ratcliffe, Scott Bessent,…
Các chuyên gia nhận định việc ĐCSTQ biến đất hiếm thành “vũ khí” để ứng…
Dòng nước thải đen ngòm, bốc mùi hôi thối dài hàng chục mét, từ Asteria…
Tính riêng 6 tháng đầu năm 2025, khoản thu từ đất đạt 243.644 tỷ đồng…
Trên tuyến đường tránh Đồng Hới (tỉnh Quảng Trị), một chiếc xe rơ-moóc bị phát…
Trong 7 tháng đầu năm 2025, Bamboo Airways dẫn đầu tỷ lệ đúng giờ với…