Cuối cùng thì Google cũng chịu sửa quy trình tạo ảnh "cồng kềnh" trên Gemini
Nếu bạn từng phát bực vì phải tải một bức ảnh AI từ Gemini về máy, mở Paint hoặc Photoshop chỉ để khoanh tròn một chi tiết sai sót, rồi lại loay hoay tìm cách tải ngược lên để AI hiểu ý, thì tin vui sắp đến rồi. Một rò rỉ mới nhất cho thấy Google dường như đã thấu hiểu "nỗi đau" này và đang âm thầm chuẩn bị một liều thuốc giảm đau hiệu quả cho người dùng.
Vẽ, khoanh vùng và ra lệnh: Cuộc cách mạng Inpainting trên web
Theo nguồn tin từ TestingCatalog chia sẻ trên nền tảng X, Google đang tích cực thử nghiệm bộ công cụ cho phép người dùng vẽ và thêm văn bản trực tiếp lên các hình ảnh được tạo ra bởi Gemini ngay trên trình duyệt.
Tham vọng biến Gemini thành "Biên tập viên đồ họa"
Manh mối về tính năng này không chỉ xuất hiện trên phiên bản web. Các đoạn mã trong ứng dụng Gemini trên điện thoại cũng đã bắt đầu lộ diện các cửa sổ pop-up hỗ trợ nhập văn bản đi kèm khả năng đánh dấu (markup).
Động thái này cho thấy Google muốn biến Gemini từ một "máy vẽ tranh" thụ động thành một công cụ biên tập thực thụ. Khả năng "chỉnh sửa cục bộ dựa trên câu lệnh" (localized, prompt-based editing) cho phép người dùng can thiệp chính xác vào từng pixel, thay vì phải đánh cược với sự ngẫu nhiên của thuật toán khi tạo lại toàn bộ bức ảnh từ đầu chỉ vì một lỗi nhỏ.
Khi nào thì được dùng?
Dù các đoạn mã đã lộ diện khá rõ ràng, nhưng với lịch sử "thích thì thử nghiệm, chán thì khai tử" của Google, không có gì là chắc chắn 100% vào lúc này.
Tính năng này có thể xuất hiện trong bản cập nhật vài tuần tới để cạnh tranh với các đối thủ như Midjourney (vốn đã có tính năng Vary Region rất mạnh), hoặc cũng có thể bị Google "cất kho" nếu đội ngũ kỹ sư tìm thấy hướng đi khác tối ưu hơn. Vì vậy, lời khuyên chân thành là đừng vội xóa các app chỉnh sửa ảnh trong máy bạn, ít nhất là cho đến khi nút công cụ này thực sự sáng đèn trên màn hình Gemini.
