Alibaba tung mô hình AI, tuyên bố vượt qua DeepSeek
- Trí Đạt
- •
Cú sốc do công ty khởi nghiệp trí tuệ nhân tạo Trung Quốc Deepseek gây ra ở Thung lũng Silicon và Phố Wall vẫn chưa lắng xuống. Một ‘gã khổng lồ’ công nghệ khác là Alibaba cũng đã tung ra phiên bản mới của mô hình trí tuệ nhân tạo (AI) của mình vào thứ Tư, mô hình Tongyi Qianwen Qwen2.5-Max, được cho là vượt qua DeepSeek-V3.
Alibaba Cloud cho biết trong một tuyên bố trên tài khoản WeChat chính thức của mình: “Qwen 2.5-Max hoạt động gần như tốt hơn toàn diện so với OpenAI, mô hình AI nguồn mở tiên tiến nhất của Meta và cũng tốt hơn DeepSeek-V3 vừa được phát hành.”
Theo báo cáo, các công cụ AI mới của Alibaba có thể được truy cập thông qua API hoặc người dùng có thể đăng nhập vào Qwen Chat để trải nghiệm chúng, chẳng hạn như trò chuyện trực tiếp với mô hình hoặc sử dụng các tính năng như artifacts, tìm kiếm, v.v.
Reuters đưa tin và phân tích rằng sự gia tăng nhanh chóng của DeepSeek trong 3 tuần qua không chỉ gây áp lực lên các đối thủ nước ngoài mà còn cả các đối thủ trong nước. Vì thời điểm ra mắt của phiên bản chủ lực Alibaba Qianwen khá đặc biệt, trùng với ngày mùng 1 Tết Âm lịch, tức là thời điểm hầu hết người dân Trung Quốc về nhà nghỉ lễ để đoàn tụ cùng gia đình.
DeepSeek ra mắt trợ lý trí tuệ nhân tạo dựa trên mẫu DeepSeek-V3 vào ngày 10/1 và mẫu R1 vào ngày 20/1, một động thái gây chấn động Thung lũng Silicon và khiến cổ phiếu công nghệ lao dốc. Chi phí sử dụng và phát triển được cho là thấp của công ty khởi nghiệp Trung Quốc này đã khiến các nhà đầu tư đặt câu hỏi về kế hoạch chi tiêu lớn của các công ty trí tuệ nhân tạo hàng đầu của Mỹ.
Tuy nhiên, sự thành công của DeepSeek cũng khiến các đối thủ trong nước đua nhau nâng cấp mô hình AI của mình.
Hai ngày sau khi phát hành DeepSeek-R1, chủ sở hữu TikTok là ByteDance đã phát hành bản cập nhật cho mô hình AI hàng đầu của mình. Công ty tuyên bố rằng mô hình này vượt trội hơn OpenAI o1 (được Microsoft hỗ trợ) trong bài kiểm tra AIME, một tiêu chuẩn dùng để đánh giá khả năng hiểu và phản hồi các chỉ lệnh phức tạp của mô hình AI.
Điều này lặp lại tuyên bố của DeepSeek rằng mô hình R1 của họ có thể so sánh với OpenAI o1 ở nhiều điểm chuẩn hiệu suất.
DeepSeek và các đối thủ trong nước
Reuters đưa tin, DeepSeek-V2 – tiền thân của mẫu DeepSeek-V3 – đã gây ra cuộc chiến về giá mô hình AI trong nước sau khi phát hành vào tháng 5 năm ngoái.
Do DeepSeek-V2 là mã nguồn mở và có giá cực kỳ rẻ, chỉ 1 nhân dân tệ (0,14 USD) cho mỗi 1 triệu token (đơn vị dữ liệu mà mô hình AI xử lý); bộ phận đám mây của Alibaba đã tuyên bố giảm giá tới 97% cho nhiều phiên bản mô hình.
Các công ty công nghệ khác của Trung Quốc đã làm theo, bao gồm cả Baidu và Tencent, với việc Baidu phát hành phiên bản ChatGPT đầu tiên của Trung Quốc vào tháng 3/2023.
Theo Reuters, người sáng lập bí ẩn của DeepSeek, ông Lương Văn Phong (Liang Wenfeng), cho biết trong một cuộc phỏng vấn hiếm hoi với phương tiện truyền thông Waves của Trung Quốc vào tháng 7 rằng công ty khởi nghiệp “không quan tâm” đến cuộc chiến giá cả và việc đạt được trí tuệ nhân tạo tổng hợp (AGI) mới là mục tiêu chính của công ty.
OpenAI: Có bằng chứng DeepSeek dùng mô hình OpenAI để phát triển mô hình cạnh tranh
Mới đây OpenAI đã nói với Financial Times rằng họ đã thấy một số bằng chứng cho thấy DeepSeek bị nghi ngờ sử dụng công nghệ “chưng cất” (Distillation), cho phép các nhà phát triển sử dụng đầu ra từ các mô hình lớn hơn, mạnh hơn để cải thiện hiệu suất trên các mô hình nhỏ hơn. Nhờ đó, họ có thể đạt được kết quả tương tự trong các nhiệm vụ cụ thể với chi phí thấp hơn.
Financial Times cho biết, mặc dù “chưng cất” là cách làm thường thấy trong ngành, nhưng DeepSeek có thể sử dụng công nghệ này để xây dựng mô hình của riêng mình và cạnh tranh với OpenAI, điều này vi phạm điều khoản dịch vụ của OpenAI. OpenAI từ chối giải thích thêm hoặc cung cấp chi tiết về bằng chứng. Điều khoản dịch vụ của OpenAI nêu rõ người dùng không được “sao chép” bất kỳ dịch vụ nào của họ hoặc “sử dụng kết quả đầu ra để phát triển các mô hình cạnh tranh với OpenAI”.
Theo báo cáo của Bloomberg hôm 28/1, những người quen thuộc với vấn đề này tiết lộ rằng Microsoft và OpenAI đang điều tra xem liệu dữ liệu đầu ra bằng công nghệ OpenAI có bị một nhóm liên quan đến DeepSeek lấy trái phép hay không. Các nhà nghiên cứu bảo mật tại Microsoft vào mùa thu năm ngoái đã phát hiện, các cá nhân mà họ tin rằng có thể có liên quan đến DeepSeek đang xuất một lượng lớn dữ liệu bằng giao diện lập trình ứng dụng (API) OpenAI, người quen thuộc với vấn đề này cho biết.
Ông David Sacks, đặc phái viên của Nhà Trắng về trí tuệ nhân tạo và tiền điện tử, nói với Fox News hôm thứ Ba rằng hành vi trộm cắp tài sản trí tuệ là “có thể xảy ra”.
OpenAI cho biết trong tuyên bố mới nhất của mình: “Chúng tôi biết rằng các công ty (Trung Quốc) và các công ty khác đang không ngừng cố gắng cải tiến các mô hình từ các công ty AI hàng đầu của Mỹ”.
“Chúng tôi đã thực hiện các biện pháp đối phó để bảo vệ tài sản trí tuệ của mình, bao gồm cả việc xác định cẩn thận những khả năng tiên tiến nhất nào sẽ được đưa vào các mẫu đã được phát hành… Chúng tôi đang hợp tác chặt chẽ với Chính phủ Mỹ để bảo vệ tốt nhất các mô hình mạnh mẽ nhất, ngăn chặn các đối thủ cạnh tranh tìm cách tiếp cận công nghệ của Mỹ, đây là điều rất quan trọng”, công ty cho biết.
Trí Đạt (t/h)
Từ khóa trí tuệ nhân tạo Alibaba AI ChatGPT DeepSeek