OpenAI vừa chính thức ra mắt ChatGPT agent, một công cụ AI đa năng được kỳ vọng sẽ thay đổi đáng kể cách chúng ta tương tác với máy tính. Công ty cho biết, agent này có khả năng hoàn thành một loạt các tác vụ dựa trên máy tính thay mặt người dùng, từ việc tự động điều hướng lịch làm việc cho đến tạo các bài thuyết trình có thể chỉnh sửa và chạy mã lệnh. Đây được xem là nỗ lực táo bạo nhất của OpenAI nhằm biến ChatGPT từ một công cụ trả lời câu hỏi thành một sản phẩm có khả năng tự động thực hiện hành động và giảm tải công việc.
ChatGPT Agent: Trợ Lý Đa Năng Thế Hệ Mới
ChatGPT agent không chỉ là một chatbot thông thường. Nó là sự kết hợp của nhiều khả năng từ các công cụ agentic trước đây của OpenAI, bao gồm khả năng "nhấp chuột" trên các trang web của Operator và khả năng tổng hợp thông tin từ hàng chục trang web thành một báo cáo nghiên cứu súc tích của Deep Research. Điều này có nghĩa là người dùng giờ đây có thể tương tác với agent chỉ bằng cách đưa ra các yêu cầu bằng ngôn ngữ tự nhiên trong ChatGPT.
Việc ra mắt công cụ này đánh dấu một bước ngoặt quan trọng. Trong những năm gần đây, nhiều công ty công nghệ lớn như OpenAI, Google, và Perplexity đã giới thiệu hàng loạt AI agent với lời hứa hẹn sẽ tự động hóa công việc. Tuy nhiên, các phiên bản đầu tiên thường gặp khó khăn với những tác vụ phức tạp, và chưa thực sự thuyết phục như tầm nhìn mà các nhà điều hành công nghệ đã phác thảo. OpenAI khẳng định ChatGPT agent lần này có năng lực vượt trội hơn hẳn các sản phẩm trước đó của họ.
Nâng Tầm Khả Năng Tự Động Hóa và Tích Hợp
Một trong những điểm nổi bật của ChatGPT agent là khả năng truy cập vào các "ChatGPT connectors". Điều này cho phép người dùng kết nối các ứng dụng như Gmail và GitHub, giúp agent tìm kiếm thông tin liên quan đến yêu cầu của bạn một cách hiệu quả. Hơn nữa, ChatGPT agent còn có quyền truy cập vào một terminal và có thể sử dụng các API để tương tác với một số ứng dụng nhất định.
Hãy thử hình dung: bạn có thể yêu cầu ChatGPT agent "lên kế hoạch và mua nguyên liệu để làm bữa sáng kiểu Nhật cho bốn người" hoặc "phân tích ba đối thủ cạnh tranh và tạo một bộ slide thuyết trình". Những khả năng này đòi hỏi ChatGPT agent phải phân tích thông tin từ nhiều trang web, lên kế hoạch hành động cụ thể, và sử dụng các công cụ khác nhau – những tác vụ phức tạp hơn nhiều so với những gì OpenAI từng cố gắng giải quyết bằng các agent trước đây. Nó thực sự là một bước nhảy vọt, không chỉ là một cải tiến nhỏ.
Hiệu Suất Ấn Tượng Qua Các Bài Kiểm Tra
Để chứng minh năng lực của mình, mô hình nền tảng của ChatGPT agent đã đạt được hiệu suất "đỉnh" trên một số tiêu chuẩn đánh giá quan trọng. Theo OpenAI, mô hình này đạt 41.6% trên Humanity’s Last Exam (pass@1), một bài kiểm tra cực kỳ khó với hàng nghìn câu hỏi thuộc hơn một trăm môn học. Con số này cao gấp đôi so với điểm số của các mô hình o3 và o4-mini trước đây của OpenAI.
Trên FrontierMath, một trong những tiêu chuẩn toán học khó nhất hiện có, ChatGPT agent đạt 27.4% khi có quyền truy cập vào các công cụ như terminal để thực thi mã. Để dễ hình dung, điểm số cao nhất trước đó trên FrontierMath chỉ là 6.3% của o4-mini. Những kết quả này cho thấy một sự tiến bộ đáng kể về khả năng giải quyết vấn đề và thực thi tác vụ của AI.
An Toàn Là Ưu Tiên Hàng Đầu
Với những khả năng mới mạnh mẽ, OpenAI đã đặc biệt chú trọng đến yếu tố an toàn khi phát triển ChatGPT agent. Công ty từng cảnh báo rằng các mô hình agentic có thể tiềm ẩn những khả năng nguy hiểm hơn nếu rơi vào tay kẻ xấu. Trong một báo cáo an toàn dành cho ChatGPT agent, OpenAI đã xếp mô hình này vào loại "khả năng cao" trong các lĩnh vực vũ khí sinh học và hóa học. Điều này được định nghĩa trong Khung Chuẩn bị của OpenAI là một mô hình có khả năng "khuếch đại các con đường hiện có dẫn đến tác hại nghiêm trọng". Dù không có bằng chứng trực tiếp, OpenAI đã chọn cách tiếp cận phòng ngừa và kích hoạt các biện pháp bảo vệ mới.
Các biện pháp bảo vệ mới bao gồm một hệ thống giám sát hoạt động theo thời gian thực khi người dùng tương tác với sản phẩm. OpenAI cho biết họ chạy một bộ phân loại trên mọi yêu cầu nhập vào ChatGPT agent để xác định xem liệu yêu cầu đó có liên quan đến sinh học hay không. Nếu có, phản hồi của ChatGPT agent sẽ được chạy qua một bộ giám sát thứ hai để xác định xem nội dung đó có thể được sử dụng để gây ra mối đe dọa sinh học hay không.
Một điểm đáng chú ý khác là OpenAI đã vô hiệu hóa tính năng bộ nhớ của ChatGPT đối với agent này để ngăn chặn việc lạm dụng. Ở các phần khác của ChatGPT, tính năng bộ nhớ cho phép chatbot tham chiếu thông tin từ các cuộc trò chuyện trước đó của người dùng. Tuy nhiên, OpenAI lo ngại rằng những kẻ xấu có thể lợi dụng tính năng này trong ChatGPT agent để đánh cắp dữ liệu nhạy cảm thông qua các cuộc tấn công tiêm nhiễm lời nhắc (prompt injection). Công ty cho biết họ có thể xem xét lại việc thêm tính năng này trong tương lai, nhưng hiện tại, an toàn vẫn là ưu tiên hàng đầu.
Triển Vọng và Những Điều Cần Chờ Đợi
ChatGPT agent đang được triển khai cho các thuê bao của gói Pro, Plus và Team của OpenAI. Để kích hoạt công cụ, người dùng chỉ cần chọn "agent mode" trong menu thả xuống của ChatGPT.
Dù những gì ChatGPT agent hứa hẹn nghe có vẻ rất ấn tượng, nhưng khả năng thực sự của nó trong thế giới thực vẫn còn là một câu hỏi lớn. Cho đến nay, công nghệ agent đã chứng tỏ sự "mong manh" tương đối khi tương tác với thế giới thực. Tuy nhiên, OpenAI tự tin rằng họ đã phát triển một mô hình có năng lực hơn, đủ sức hiện thực hóa lời hứa về các AI agent. Liệu đây có phải là bước đột phá mà ngành công nghiệp AI đang tìm kiếm? Thời gian sẽ trả lời.