DeepSeek là gì và tại sao nó làm rối loạn ngành trí tuệ nhân tạo?

Một mô hình AI mới do công ty trí tuệ nhân tạo DeepSeek của Trung Quốc ra mắt đã thu hút sự chú ý ở Thung lũng Silicon. (Ảnh: Ghép từ ảnh Pixabay)

Việc công ty khởi nghiệp Trung Quốc DeepSeek ra mắt các mô hình trí tuệ nhân tạo (AI) mới nhất, được cho là ngang bằng hoặc tốt hơn các mô hình hàng đầu trong ngành này tại Hoa Kỳ với chi phí chỉ bằng một phần nhỏ, đang đe dọa làm đảo lộn trật tự thế giới công nghệ.

Một mô hình AI mới do công ty trí tuệ nhân tạo DeepSeek của Trung Quốc ra mắt đã thu hút sự chú ý ở Thung lũng Silicon. (Ảnh: Ghép từ ảnh Pixabay)

DeepSeek đã thu hút sự chú ý trong giới AI toàn cầu sau khi viết trong một bài báo vào tháng trước rằng việc huấn luyện DeepSeek-V3 chỉ cần chưa đến 6 triệu đô la cho năng lực tính toán từ chip Nvidia H800.

Mô hình DeepSeek-V3, ứng dụng trợ lý AI của công ty khởi nghiệp DeepSeek, đã vượt qua đối thủ ChatGPT để trở thành ứng dụng miễn phí được đánh giá cao nhất có sẵn trên App Store của Apple tại Hoa Kỳ.

Điều này đã làm dấy lên nghi ngờ về lý do đằng sau quyết định cam kết đầu tư hàng tỷ đô la vào AI của một số công ty công nghệ Hoa Kỳ, và cổ phiếu của một số công ty công nghệ lớn, bao gồm cả Nvidia, đã bị ảnh hưởng.

Dưới đây là một số thông tin về công ty đang làm rung chuyển ngành AI trên toàn thế giới:

Tại sao Deepseek lại gây ra sự náo loạn

Việc phát hành ChatGPT ra thị trường của OpenAI vào cuối năm 2022 đã gây ra một cuộc chạy đua giữa các công ty công nghệ Trung Quốc. Những công ty Trung Quốc đã vội vã tạo ra các chatbot của riêng mình được hỗ trợ bởi trí tuệ nhân tạo.

Nhưng sau khi phát hành phiên bản tương tự ChatGPT đầu tiên của Trung Quốc, do gã khổng lồ công cụ tìm kiếm Baidu tạo ra, đã có sự thất vọng rộng khắp ở Trung Quốc đối với sự chênh lệch về khả năng AI giữa các công ty Hoa Kỳ và Trung Quốc.

Chất lượng và hiệu quả về chi phí của các mô hình của DeepSeek đã đảo ngược câu chuyện này. Công ty khởi nghiệp Deepseek cho rằng hai mô hình DeepSeek-V3 và DeepSeek-R1 vốn được các giám đốc điều hành của Thung lũng Silicon và các kỹ sư công ty công nghệ Hoa Kỳ khen ngợi, là ngang bằng với các mô hình tiên tiến nhất của OpenAI và Meta.

Chúng cũng rẻ hơn khi sử dụng. Theo một bài đăng trên tài khoản WeChat chính thức của DeepSeek, DeepSeek-R1, được phát hành vào tuần trước, rẻ hơn từ 20 đến 50 lần khi sử dụng so với mô hình OpenAI o1, tùy thuộc vào nhiệm vụ.

Nhưng một số người đã công khai bày tỏ sự hoài nghi về câu chuyện thành công của DeepSeek.

Tổng giám đốc điều hành của Scale AI, Alexandr Wang, tuyên bố trong một cuộc phỏng vấn với CNBC vào thứ Năm (23/1), mà không đưa ra bằng chứng, rằng DeepSeek sử dụng 50.000 chip Nvidia H100, nhưng ông cho rằng nó đã không được tiết lộ vì điều đó sẽ vi phạm các biện pháp kiểm soát xuất khẩu của Washington, cấm bán các chip AI tiên tiến như vậy cho các công ty Trung Quốc. DeepSeek đã không trả lời ngay lập tức yêu cầu bình luận về cáo buộc này.

Các nhà phân tích của công ty Bernstein đã nêu bật trong một nghiên cứu vào thứ Hai (27/1), lưu ý rằng tổng chi phí đào tạo của DeepSeek cho mô hình V3 của họ là không rõ, nhưng cao hơn nhiều so với chi phí 5,58 triệu đô la mà công ty khởi nghiệp này tuyên bố, đã được sử dụng cho năng lực tính toán. Các nhà phân tích cũng cho rằng chi phí đào tạo của mô hình R1 vốn được ca ngợi không kém, đã không được tiết lộ.

Ai đứng sau Deepseek?

DeepSeek là một công ty khởi nghiệp có trụ sở tại Hàng Châu, có cổ đông kiểm soát là Lương Văn Phong (Liang Wenfeng), đồng sáng lập Quỹ đầu cơ định lượng High-Flyer, theo hồ sơ công ty ở Trung Quốc.

Quỹ của ông Lương thông báo vào tháng 3 năm 2023 trên tài khoản WeChat chính thức của mình rằng họ đang “bắt đầu lại“, không chỉ giới hạn ở kinh doanh mà còn tập trung nguồn lực vào việc tạo ra một “nhóm nghiên cứu mới và độc lập, để khám phá bản chất của AGI” (Trí tuệ nhân tạo tổng quát). DeepSeek được thành lập vào cuối năm đó.

Những người tạo ra ChatGPT là OpenAI định nghĩa AGI là các hệ thống tự động vượt qua con người trong hầu hết các nhiệm vụ có giá trị kinh tế.

Không rõ High-Flyer đã đầu tư bao nhiêu vào DeepSeek. Theo hồ sơ của công ty Trung Quốc, High-Flyer có một văn phòng đặt tại cùng tòa nhà với DeepSeek, và cũng sở hữu các bằng sáng chế liên quan đến cụm chip được sử dụng để đào tạo các mô hình AI.

Bộ phận AI của High-Flyer cho biết trên tài khoản WeChat chính thức của mình vào tháng 7 năm 2022 rằng họ sở hữu và vận hành một cụm gồm 10.000 chip A100.

Bắc Kinh đánh giá DeepSeek như thế nào?

Thành công của DeepSeek đã được ghi nhận trong các nhóm chính trị cấp cao của Trung Quốc. Vào ngày 20 tháng 1, ngày DeepSeek-R1 được công bố rộng rãi, nhà sáng lập Lương Văn Phong đã tham dự một hội nghị chuyên đề kín, dành cho các doanh nhân và chuyên gia do thủ tướng Trung Quốc Lý Cường chủ trì, theo hãng thông tấn nhà nước Tân Hoa Xã.

Sự hiện diện của ông Lương tại cuộc họp có khả năng là một dấu hiệu cho thấy thành công của DeepSeek có thể quan trọng đối với mục tiêu chính sách của Bắc Kinh, là vượt qua các biện pháp kiểm soát xuất khẩu của Washington và đạt được sự tự cung tự cấp trong các ngành công nghiệp chiến lược như AI.

Một hội nghị chuyên đề tương tự vào năm ngoái co sự tham gia của Tổng giám đốc điều hành Baidu Lý Ngạn Hoành (Robin Li).

Phạm Duy

Tôi yêu thích và quan tâm tình hình chính sự và thông tin thời cuộc thế giới, bình luận và phân tích về chính trị Mỹ, Trung và thế giới nói chung. Hiện tại tôi đang đóng góp cho chuyên mục Thế giới của báo trithucvn.org.

Next Tổng thống Nga Putin sẵn sàng gặp gỡ Tổng thống Hoa Kỳ Donald Trump »

Previous « Trước thềm năm mới Ất Tỵ 2025: 2.197 trẻ chào đời

Published by

Phạm Duy

Tags: trí tuệ nhân tạoDòng sự kiệnDeepSeek

1 năm ago