DeepSeek Gây Chấn Động Thị Trường AI Với Mô Hình Thử Nghiệm V3.2-Exp và Giá API Rẻ "Không Tưởng"
Trong một động thái đầy bất ngờ, DeepSeek, startup trí tuệ nhân tạo (AI) có trụ sở tại Trung Quốc, vừa công bố ra mắt phiên bản thử nghiệm mới nhất của mình, DeepSeek-V3.2-Exp, cùng với việc cắt giảm giá API lên đến hơn 50%. Động thái này không chỉ đánh dấu một bước tiến quan trọng trong chiến lược phát triển mô hình ngôn ngữ lớn (LLM) của công ty mà còn gửi một thông điệp mạnh mẽ đến thị trường AI toàn cầu, nơi mà sự cạnh tranh về hiệu suất và chi phí đang ngày càng trở nên gay gắt.
DeepSeek-V3.2-Exp: Nâng Cấp Hiệu Suất, Tối Ưu Chi Phí
Phiên bản V3.2-Exp được DeepSeek giới thiệu như một bước đệm quan trọng, hướng tới thế hệ mô hình tiếp theo của hãng. Dựa trên nền tảng của DeepSeek-V3.1-Terminus đã được công bố trước đó, mô hình thử nghiệm này hứa hẹn mang lại hiệu suất tương đương, thậm chí nhỉnh hơn một chút trên các bài kiểm tra tiêu chuẩn. Điều đáng chú ý là V3.2-Exp được tối ưu hóa đặc biệt cho các tác vụ xử lý ngữ cảnh dài, với khả năng tiếp nhận lên đến 128.000 token – một con số ấn tượng, tương đương với việc xử lý một tập tài liệu dày khoảng 300-400 trang.
Cốt lõi của sự cải tiến này nằm ở việc áp dụng công nghệ "sparse attention" (chú ý thưa). Công nghệ này giúp giảm đáng kể gánh nặng tính toán trong quá trình suy luận, từ đó tăng tốc độ xử lý lên gấp 2-3 lần so với các mô hình truyền thống, đặc biệt hiệu quả khi làm việc với lượng dữ liệu lớn mà vẫn đảm bảo độ chính xác. DeepSeek cũng cho biết mô hình này được huấn luyện với chi phí thấp hơn nhờ các kỹ thuật tiên tiến như mixed precision và distilled reasoning, giúp họ duy trì lợi thế cạnh tranh về hiệu quả tài nguyên.
Một điểm cộng lớn nữa là DeepSeek-V3.2-Exp đã được mở nguồn hoàn toàn dưới giấy phép MIT, một giấy phép rất "thân thiện" với doanh nghiệp. Điều này có nghĩa là các nhà nghiên cứu, startup và doanh nghiệp trên toàn thế giới có thể tự do tải về, tùy chỉnh và tích hợp mô hình này vào các ứng dụng của mình, từ chatbot thông minh đến các công cụ phân tích dữ liệu phức tạp.
Giảm Giá API "Sốc": Mở Cửa AI Cho Mọi Đối Tượng
Tuy nhiên, điểm nhấn thực sự khiến thị trường AI "dậy sóng" chính là việc DeepSeek công bố giảm giá API lên đến hơn 50%. Cụ thể, chi phí cho mỗi triệu token đầu vào đã lưu trữ (cache hits) giảm từ 0,056 USD xuống chỉ còn 0,028 USD – một mức giá cực kỳ cạnh tranh. Các mức giá khác cũng được điều chỉnh giảm mạnh: 0,28 USD cho mỗi triệu token đầu vào mới (cache misses) và 0,42 USD cho mỗi triệu token đầu ra (output).
So sánh với các "ông lớn" như OpenAI hay Anthropic, mức giá mới của DeepSeek rẻ hơn gấp nhiều lần, đặc biệt khi xét đến khả năng xử lý ngữ cảnh dài. Điều này có nghĩa là chi phí để xử lý một tài liệu dài có thể chỉ còn dưới 3 cent cho mỗi triệu token đầu vào. DeepSeek khẳng định mức giá mới này đã có hiệu lực ngay lập tức trên API chính thức của họ, áp dụng cho cả người dùng cá nhân và doanh nghiệp.
Chiến lược giảm giá này không phải là lần đầu tiên từ DeepSeek trong năm 2025. Trước đó, họ đã liên tục điều chỉnh giảm giá, cho thấy cam kết mạnh mẽ với mục tiêu "dân chủ hóa AI". Việc tận dụng lợi thế từ chuỗi cung ứng phần cứng nội địa Trung Quốc, như chip Huawei Ascend 910B, được cho là yếu tố then chốt giúp DeepSeek giảm chi phí huấn luyện và triển khai, từ đó đưa ra mức giá hấp dẫn như hiện tại.
Cộng Đồng AI Lên Tiếng: "Giá Rẻ Nhưng Chất Lượng Vẫn Đỉnh Cao?"
Thông báo của DeepSeek nhanh chóng lan tỏa trên các diễn đàn và mạng xã hội công nghệ. Nhiều chuyên gia AI đã bày tỏ sự kinh ngạc và ca ngợi DeepSeek vì đã đưa AI trở thành một "hàng hóa thông thường" hơn. Các bình luận trên X (trước đây là Twitter) nhấn mạnh rằng với mức giá chỉ bằng 1/240 so với ChatGPT năm 2023, DeepSeek đang mở đường cho sự bùng nổ của các ứng dụng AI tại các thị trường mới nổi.
Nhiều nhà phát triển chia sẻ rằng mức giá mới này sẽ giúp họ tiết kiệm đáng kể chi phí cho các dự án dài hạn. Thậm chí, hiệu suất của V3.2-Exp trên các bài kiểm tra lập trình như SWE-Bench cũng đạt mức ấn tượng, khoảng 66%, ngang ngửa với các mô hình hàng đầu hiện nay.
Tuy nhiên, cũng có những ý kiến thận trọng. Một số chuyên gia cho rằng đây vẫn là phiên bản thử nghiệm, và có thể còn tồn tại những lỗi nhỏ trong quá trình xử lý các tác vụ phức tạp. Các nhà phân tích từ VentureBeat và TechCrunch nhận định rằng công nghệ sparse attention là một bước tiến lớn, nhưng DeepSeek cần chứng minh được sự ổn định lâu dài để có thể cạnh tranh sòng phẳng với các "gã khổng lồ" công nghệ của Mỹ. Tại châu Á, phản ứng nhìn chung là tích cực hơn, với nhiều startup tại Việt Nam và Ấn Độ bày tỏ sự quan tâm đến việc tích hợp mô hình này, dù chưa có thông tin cụ thể về hỗ trợ tiếng Việt nâng cao.
Tác Động Đến Thị Trường: Cuộc Chiến Giá Rẻ Mới Bắt Đầu
Sự kiện ra mắt DeepSeek-V3.2-Exp diễn ra đúng vào thời điểm thị trường AI đang chứng kiến một cuộc "chiến tranh giá cả" khốc liệt. DeepSeek, với các mô hình trước đó đã được chứng minh là có hiệu suất ngang ngửa GPT-4o với chi phí huấn luyện thấp hơn nhiều, tiếp tục thách thức sự thống trị của các công ty phương Tây. Theo Reuters, động thái này có thể sẽ thúc đẩy các đối thủ cạnh tranh như OpenAI và Google phải xem xét lại chiến lược giá của mình, đồng thời mở rộng đáng kể thị phần cho các mô hình AI mã nguồn mở, đặc biệt là tại châu Á.
Đối với thị trường Việt Nam, dù chưa có thông báo chính thức từ DeepSeek, các doanh nghiệp công nghệ trong nước có thể hưởng lợi rất lớn từ việc giảm chi phí này. Với sự phát triển mạnh mẽ của các startup AI tại Việt Nam, việc tiếp cận một mô hình AI mạnh mẽ với giá thành rẻ sẽ là động lực quan trọng để phát triển các ứng dụng mới, từ trợ lý ảo thông minh đến các công cụ phân tích dữ liệu chuyên sâu, giúp giảm sự phụ thuộc vào các giải pháp nước ngoài đắt đỏ.
Sự xuất hiện của DeepSeek-V3.2-Exp không chỉ là một bản cập nhật mô hình thông thường, mà còn là một lời tuyên bố về tương lai của AI: ngày càng mạnh mẽ, ngày càng dễ tiếp cận và ngày càng cạnh tranh về giá.