Mô hình AI mới mang lại hiệu suất vượt trội và tính năng linh hoạt cho nhà phát triển
Anthropic vừa ra mắt Claude Opus 4.8, phiên bản mới nhất của mô hình AI, tập trung vào cải thiện khả năng tác nhân, tốc độ xử lý nhanh hơn và các tính năng điều khiển tác vụ linh hoạt.
Phiên bản Claude Opus 4.8 được Anthropic công bố hôm nay, 29 tháng 5 năm 2026, mang đến những cải tiến đáng kể về hiệu suất, đặc biệt trong các tác vụ tác nhân (agentic tasks). Mô hình này hiện đã có mặt trên claude.ai, Nền tảng Claude và các nền tảng đám mây lớn, bao gồm Amazon Bedrock và Claude Platform trên AWS.
Claude Opus 4.8 được thiết kế để thực hiện các tác vụ tự động hóa dài hơn, suy luận sâu hơn và mang lại sự nhất quán cao, phù hợp cho các công việc sản xuất [4]. Anthropic nhấn mạnh đây là một "cải tiến khiêm tốn nhưng hữu hình" so với phiên bản 4.7, tập trung vào việc nâng cao khả năng giải quyết vấn đề phức tạp một cách độc lập.
Một trong những điểm nổi bật là chế độ "fast mode" cho Opus 4.8, cho phép mô hình hoạt động nhanh hơn 2,5 lần so với các phiên bản trước và chi phí giảm ba lần. Điều này đặc biệt có lợi cho người dùng gói Max trên Claude Code, những người giờ đây sẽ mặc định sử dụng chế độ nhanh trên Opus 4.8.
Opus 4.8 giới thiệu một loạt tính năng mới nhằm tối ưu hóa trải nghiệm người dùng và quy trình làm việc của nhà phát triển:
Tính năng "dynamic workflows" mới, hiện đang trong giai đoạn xem trước nghiên cứu, cho phép Claude Code xử lý các vấn đề quy mô rất lớn. Mô hình có thể chạy hàng trăm tác nhân phụ song song trong một phiên duy nhất và tự xác minh công việc trước khi báo cáo kết quả. Điều này mở ra khả năng giải quyết các dự án phức tạp hơn nhiều trong lĩnh vực lập trình và phát triển.
high trên tất cả các giao diện, bao gồm Claude Code và Messages API. Điều này cho phép người dùng điều chỉnh hiệu suất và chi phí tùy theo yêu cầu cụ thể của từng tác vụ, với các tùy chọn như "extra" (xhigh) hoặc "max" cho các tác vụ khó khăn và quy trình làm việc không đồng bộ dài hạn.role: "system" ở các vị trí không phải đầu tiên trong mảng messages. Tính năng này giúp bảo toàn bộ nhớ đệm lời nhắc (prompt cache) khi các hướng dẫn thay đổi trong một phiên làm việc dài, mang lại sự linh hoạt đáng kể trong việc điều chỉnh hành vi của AI mà không làm gián đoạn luồng công việc.Claude Opus 4.8 cũng cho thấy những cải tiến rõ rệt trong mã hóa tác nhân, sử dụng máy tính và khả năng suy luận so với Opus 4.7. Mô hình này có thể đọc các cơ sở mã như một kỹ sư, lập kế hoạch trước khi chỉnh sửa và duy trì ngữ cảnh trong các phiên làm việc dài trên các kho lưu trữ thực. Đối với công việc tri thức, Opus 4.8 tổng hợp tốt hơn từ các tài liệu dài và nguồn phức tạp, tự kiểm tra đầu ra và cung cấp các sản phẩm có cấu trúc chặt chẽ.
Ngoài ra, Opus 4.8 sử dụng "adaptive thinking" (tư duy thích ứng) để chỉ kích hoạt suy luận khi một lượt cần đến, giảm lãng phí token suy nghĩ so với Opus 4.7 ở cùng mức độ nỗ lực. Mô hình vẫn hỗ trợ đầu vào hình ảnh độ phân giải cao (lên đến 2576 pixel ở cạnh dài) và duy trì cửa sổ ngữ cảnh 1 triệu token cùng 128k token đầu ra tối đa, tương tự như Opus 4.7.