Google sắp sửa lỗi quy trình chỉnh sửa ảnh gây phiền toái trên Gemini

Tính năng mới giúp loại bỏ ứng dụng bên thứ ba

HM Journal

7 tháng trước3 min

...

Điểm chính

Google đang phát triển tính năng vẽ và thêm văn bản trực tiếp vào ảnh tạo bởi Gemini trên web
Người dùng có thể dùng công cụ này để khoanh vùng và yêu cầu chỉnh sửa ảnh cụ thể (localized editing)
Tính năng này khắc phục điểm yếu phải dùng app bên thứ ba của mô hình Nano Banana Pro hiện tại

Key Takeaways

Cuối cùng thì Google cũng chịu sửa quy trình tạo ảnh "cồng kềnh" trên Gemini

Nếu bạn từng phát bực vì phải tải một bức ảnh AI từ Gemini về máy, mở Paint hoặc Photoshop chỉ để khoanh tròn một chi tiết sai sót, rồi lại loay hoay tìm cách tải ngược lên để AI hiểu ý, thì tin vui sắp đến rồi. Một rò rỉ mới nhất cho thấy Google dường như đã thấu hiểu "nỗi đau" này và đang âm thầm chuẩn bị một liều thuốc giảm đau hiệu quả cho người dùng.

Vẽ, khoanh vùng và ra lệnh: Cuộc cách mạng Inpainting trên web

Theo nguồn tin từ TestingCatalog chia sẻ trên nền tảng X, Google đang tích cực thử nghiệm bộ công cụ cho phép người dùng vẽ và thêm văn bản trực tiếp lên các hình ảnh được tạo ra bởi Gemini ngay trên trình duyệt.

Đây là mảnh ghép còn thiếu nghiêm trọng trong hệ sinh thái AI của Google. Hiện tại, dù mô hình tạo ảnh Imagen 3 (được biết đến trong nội bộ với tên mã Banana) cho chất lượng đầu ra cực kỳ ấn tượng, nhưng quy trình chỉnh sửa (workflow) lại rời rạc và đứt gãy. Người dùng bị buộc phải phụ thuộc vào các ứng dụng bên thứ ba cho những thay đổi nhỏ nhặt nhất.

Với tính năng mới, hãy tưởng tượng một tình huống kinh điển: AI vẽ ra một bàn tay có 6 ngón. Thay vì phải hì hục gõ những dòng lệnh dài dòng mô tả vị trí ngón thừa, sắp tới bạn chỉ cần dùng chuột khoanh vùng bàn tay đó và ra lệnh ngắn gọn: "Sửa lại thành 5 ngón". Tính năng này được gọi là Inpainting kết hợp chú thích, giúp khép kín toàn bộ quy trình sáng tạo trong một tab trình duyệt duy nhất.

Tham vọng biến Gemini thành "Biên tập viên đồ họa"

Manh mối về tính năng này không chỉ xuất hiện trên phiên bản web. Các đoạn mã trong ứng dụng Gemini trên điện thoại cũng đã bắt đầu lộ diện các cửa sổ pop-up hỗ trợ nhập văn bản đi kèm khả năng đánh dấu (markup).

Động thái này cho thấy Google muốn biến Gemini từ một "máy vẽ tranh" thụ động thành một công cụ biên tập thực thụ. Khả năng "chỉnh sửa cục bộ dựa trên câu lệnh" (localized, prompt-based editing) cho phép người dùng can thiệp chính xác vào từng pixel, thay vì phải đánh cược với sự ngẫu nhiên của thuật toán khi tạo lại toàn bộ bức ảnh từ đầu chỉ vì một lỗi nhỏ.

Khi nào thì được dùng?

Dù các đoạn mã đã lộ diện khá rõ ràng, nhưng với lịch sử "thích thì thử nghiệm, chán thì khai tử" của Google, không có gì là chắc chắn 100% vào lúc này.

Tính năng này có thể xuất hiện trong bản cập nhật vài tuần tới để cạnh tranh với các đối thủ như Midjourney (vốn đã có tính năng Vary Region rất mạnh), hoặc cũng có thể bị Google "cất kho" nếu đội ngũ kỹ sư tìm thấy hướng đi khác tối ưu hơn. Vì vậy, lời khuyên chân thành là đừng vội xóa các app chỉnh sửa ảnh trong máy bạn, ít nhất là cho đến khi nút công cụ này thực sự sáng đèn trên màn hình Gemini.

Thẻ

#AI

#Google Gemini

#Chỉnh sửa ảnh

#công nghệ mới

#tin rò rỉ

Google sắp sửa lỗi quy trình chỉnh sửa ảnh gây phiền toái trên Gemini

Điểm chính

Key Takeaways

Cuối cùng thì Google cũng chịu sửa quy trình tạo ảnh "cồng kềnh" trên Gemini

Vẽ, khoanh vùng và ra lệnh: Cuộc cách mạng Inpainting trên web

Tham vọng biến Gemini thành "Biên tập viên đồ họa"

Khi nào thì được dùng?

Thẻ

Bài viết liên quan

Google sắp sửa lỗi quy trình chỉnh sửa ảnh gây phiền toái trên Gemini

Điểm chính

Cuối cùng thì Google cũng chịu sửa quy trình tạo ảnh "cồng kềnh" trên Gemini

Vẽ, khoanh vùng và ra lệnh: Cuộc cách mạng Inpainting trên web

Tham vọng biến Gemini thành "Biên tập viên đồ họa"

Khi nào thì được dùng?

Thẻ

Bài viết liên quan

HM Journal - Loading...

HM Journal - Loading...

Google sắp sửa lỗi quy trình chỉnh sửa ảnh gây phiền toái trên Gemini

Cuối cùng thì Google cũng chịu sửa quy trình tạo ảnh "cồng kềnh" trên Gemini

Vẽ, khoanh vùng và ra lệnh: Cuộc cách mạng Inpainting trên web

Tham vọng biến Gemini thành "Biên tập viên đồ họa"

Khi nào thì được dùng?

Thẻ

Google sắp sửa lỗi quy trình chỉnh sửa ảnh gây phiền toái trên Gemini

Cuối cùng thì Google cũng chịu sửa quy trình tạo ảnh "cồng kềnh" trên Gemini

Vẽ, khoanh vùng và ra lệnh: Cuộc cách mạng Inpainting trên web

Tham vọng biến Gemini thành "Biên tập viên đồ họa"

Khi nào thì được dùng?

Thẻ