xAI, công ty trí tuệ nhân tạo do Elon Musk dẫn dắt, nổi tiếng với mô hình Grok, vừa chính thức giới thiệu một API (Application Programming Interface) mới. Điểm đặc biệt của API này là nó cung cấp khả năng tạo hình ảnh, biến nó trở thành công cụ đầu tiên dành cho nhà phát triển có tính năng này. Động thái này cho thấy xAI đang ngày càng tập trung vào cộng đồng nhà phát triển, thể hiện qua việc phát hành tới năm API kể từ tháng 11 năm 2024.Trước khi có sự bổ sung mới nhất này, xAI đã cung cấp bốn mô hình AI tùy chỉnh dưới dạng API. Hai trong số đó dựa trên phiên bản đầu tiên của mô hình ngôn ngữ lớn (LLM) Grok, và hai mô hình còn lại dựa trên Grok 2. Mặc dù công ty đã cung cấp tính năng hiểu hình ảnh, nhưng trước đây chưa có cách nào để tạo hình ảnh trực tiếp thông qua API.Điều này có thể là do xAI đã thuê ngoài khả năng tạo hình ảnh cho nền tảng trò chuyện của mình. Cho đến năm ngoái, việc tạo hình ảnh trên Grok được xử lý bởi startup AI Black Forest Labs. Tuy nhiên, vào tháng 12, xAI đã công bố Aurora, một mô hình tạo hình ảnh được xây dựng trên mạng lưới mixture of experts (MoE). Hiện tại, có vẻ như công ty đang mở rộng mô hình này cho cả các nhà phát triển.Trong tài liệu của mình, xAI hiện liệt kê một mô hình API mới có tên 'grok-2-image-1212', đi kèm với khả năng tạo hình ảnh. Chức năng này khá đơn giản: khi một yêu cầu văn bản được gửi đi, một mô hình trò chuyện sẽ tiếp nhận hướng dẫn và chỉnh sửa yêu cầu để có độ rõ ràng tốt hơn. Yêu cầu đã chỉnh sửa sau đó được chia sẻ với mô hình tạo hình ảnh, và kết quả đầu ra sẽ được tạo ra.Hiện tại, các nhà phát triển có thể tạo tối đa 10 hình ảnh với một yêu cầu duy nhất bằng cách điều chỉnh tham số. Có một giới hạn là năm yêu cầu mỗi giây, vượt quá giới hạn này sẽ trả về thông báo lỗi. Các hình ảnh được chia sẻ ở định dạng JPEG. Theo một báo cáo của TechCrunch, xAI sẽ tính phí $0.07 (khoảng 6 rupee Ấn Độ) cho mỗi hình ảnh.Mức giá này khiến dịch vụ của xAI nằm ở phân khúc cao cấp hơn, khi so sánh với Flux API của Black Forest Labs có giá $0.05 (khoảng 4 rupee Ấn Độ) cho mỗi hình ảnh và Imagen 3 của Google có giá $0.03 (khoảng 2.5 rupee Ấn Độ) cho mỗi hình ảnh. Tuy nhiên, Ideogram vẫn đắt hơn với giá $0.08 (khoảng 7 rupee Ấn Độ) cho mỗi hình ảnh.Ngoài ra, xAI nhấn mạnh rằng API hiện tại không hỗ trợ tùy chỉnh đầu ra, chẳng hạn như thay đổi chất lượng, kích thước hoặc kiểu dáng của hình ảnh. Đáng chú ý, điểm cuối của API tương thích với OpenAI SDK và người dùng có thể sử dụng cùng một base_url. Tuy nhiên, nó không tương thích với Anthropic SDK.Việc xAI giới thiệu API mới với khả năng tạo hình ảnh là một bước tiến đáng chú ý, cho thấy sự mở rộng của công ty sang lĩnh vực AI đa phương tiện. Mặc dù mức giá có phần cao hơn so với một số đối thủ, xAI vẫn có thể thu hút các nhà phát triển nhờ vào tính năng độc đáo và khả năng tích hợp với các công cụ phổ biến như OpenAI SDK. Sự phát triển này hứa hẹn sẽ mang lại nhiều ứng dụng sáng tạo trong tương lai.