Nghiên cứu mới nhất cảnh báo về sự méo mó thông tin từ các mô hình ngôn ngữ lớn
Một nghiên cứu mới đây, được công bố vào đầu tháng 7 năm 2025, đã gióng lên hồi chuông cảnh báo về một vấn đề đáng lo ngại trong thế giới công nghệ: các chatbot AI, những công cụ đang ngày càng trở nên phổ biến trong cuộc sống hàng ngày của chúng ta, lại thường xuyên làm sai lệch hồ sơ nhân quyền của các quốc gia. Đây không phải là một lỗi nhỏ, mà là một sự méo mó thông tin nghiêm trọng, có thể ảnh hưởng đến nhận thức của công chúng và thậm chí là các quyết sách quan trọng.
Theo phát hiện từ nghiên cứu được đăng tải trên Mashable, các mô hình ngôn ngữ lớn (LLM) – nền tảng cốt lõi của hầu hết các chatbot hiện nay – có xu hướng phản ánh và khuếch đại những thiên lệch sẵn có trong dữ liệu mà chúng được huấn luyện. Điều này dẫn đến việc khi người dùng hỏi về tình hình nhân quyền của một quốc gia nào đó, chatbot có thể đưa ra thông tin không chính xác, thiếu khách quan, hoặc thậm chí là sai lệch hoàn toàn. Chuyện này không đùa được đâu, bởi vì nó trực tiếp tác động đến cách chúng ta nhìn nhận về quyền con người trên toàn cầu.
Vấn đề không chỉ dừng lại ở hồ sơ nhân quyền. Cùng ngày, một nghiên cứu khác từ MIT cũng chỉ ra rằng các chatbot này thường xuyên làm sai lệch thông tin về tự do và độc lập của báo chí trên khắp thế giới. Hãy thử nghĩ xem, nếu những công cụ mà chúng ta tin tưởng để tìm kiếm thông tin lại bóp méo sự thật về một trong những trụ cột của xã hội dân chủ, thì hậu quả sẽ như thế nào? Điều này thực sự làm dấy lên những câu hỏi lớn về tính đáng tin cậy của AI trong việc cung cấp thông tin khách quan.
Để hiểu rõ hơn, chúng ta cần nhìn vào cách các mô hình AI này hoạt động. Chúng học hỏi từ một lượng dữ liệu khổng lồ trên internet, bao gồm sách, bài báo, trang web, và nhiều nguồn khác.
Vấn đề chính nằm ở chỗ, dữ liệu huấn luyện này không phải lúc nào cũng hoàn hảo hay khách quan. Nó có thể chứa đựng những thiên lệch lịch sử, văn hóa, chính trị, hoặc thậm chí là những thông tin sai lệch đã tồn tại từ trước. Khi một LLM được "nuôi" bằng dữ liệu như vậy, nó sẽ hấp thụ và tái tạo lại những thiên lệch đó. Giống như một đứa trẻ học từ những gì nó thấy và nghe, AI cũng vậy. Nếu nguồn thông tin ban đầu đã có vấn đề, thì đầu ra của AI cũng sẽ có vấn đề.
LLM hoạt động bằng cách dự đoán từ tiếp theo dựa trên các mẫu mà chúng đã học. Chúng không "hiểu" thông tin theo cách con người hiểu, mà chỉ tái tạo lại các mối liên hệ thống kê. Vì thế, nếu một quan điểm sai lệch hoặc một thông tin không chính xác xuất hiện đủ thường xuyên trong dữ liệu huấn luyện, LLM sẽ coi đó là "sự thật" và lặp lại nó. Điều này đặc biệt nguy hiểm khi nói đến các chủ đề nhạy cảm như nhân quyền, nơi mà sự thật thường bị che giấu hoặc bóp méo bởi các yếu tố chính trị.
Sự sai lệch thông tin do chatbot AI gây ra không chỉ là một vấn đề kỹ thuật đơn thuần; nó có những tác động sâu rộng đến xã hội và chính trị.
Khi người dùng nhận được thông tin sai lệch từ các chatbot, niềm tin của họ vào các nguồn thông tin đáng tin cậy khác, bao gồm cả truyền thông chính thống, có thể bị xói mòn. Một nghiên cứu từ MIT đã nhấn mạnh rằng sự sai lệch này có thể làm giảm niềm tin của công chúng vào truyền thông, góp phần vào sự hoài nghi và bất ổn xã hội. Trong một thế giới nơi thông tin là sức mạnh, việc mất niềm tin vào nguồn tin có thể dẫn đến những hệ lụy khó lường.
Hãy hình dung kịch bản này: trong bối cảnh bầu cử căng thẳng, một chatbot được sử dụng rộng rãi lại vô tình (hoặc cố ý) lan truyền thông tin sai lệch về các ứng cử viên hoặc chính sách. Một bài báo từ The New York Times vào tháng 5 năm 2024 đã chỉ ra rằng các chatbot có thể dễ dàng tạo ra nội dung gây chia rẽ trên mạng xã hội. Điều này không chỉ gây nhiễu loạn thông tin mà còn có thể ảnh hưởng trực tiếp đến kết quả bầu cử, làm suy yếu nền dân chủ và gây ra sự phân cực trong xã hội.
Vấn đề chatbot tạo ra thông tin sai lệch không phải là mới, nhưng nghiên cứu gần đây cho thấy mức độ nghiêm trọng và phạm vi của nó đang ngày càng gia tăng.
Trước đây, chúng ta đã từng thấy các trường hợp chatbot "bịa đặt" thông tin hoặc đưa ra những câu trả lời kỳ quặc. Nhưng việc chúng làm sai lệch một cách có hệ thống các vấn đề nhạy cảm như nhân quyền và tự do báo chí lại là một cấp độ khác. Điều này cho thấy rằng, khi AI ngày càng trở nên tinh vi hơn, khả năng gây hại của nó cũng tăng lên đáng kể. Nó không chỉ là một lỗi kỹ thuật đơn thuần nữa, mà là một thách thức đạo đức và xã hội.
Cộng đồng các nhà khoa học AI, chuyên gia nhân quyền và các nhà hoạt động xã hội đã bày tỏ mối lo ngại sâu sắc. Nhiều người đang kêu gọi các biện pháp kiểm soát và giám sát chặt chẽ hơn đối với việc phát triển và triển khai các mô hình AI. Họ nhấn mạnh rằng cần có sự minh bạch hơn về dữ liệu huấn luyện, cũng như các cơ chế để kiểm tra và hiệu chỉnh các thiên lệch. Liệu các công ty công nghệ có lắng nghe không? Đó là một câu hỏi lớn.
Để giải quyết vấn đề này, cần có sự phối hợp từ nhiều phía, từ nhà phát triển đến người dùng và các cơ quan quản lý.
Các công ty phát triển AI phải chịu trách nhiệm chính trong việc đảm bảo tính chính xác và công bằng của các mô hình của họ. Điều này bao gồm việc:
Người dùng cũng cần nâng cao nhận thức và không nên tin tưởng tuyệt đối vào mọi thông tin do AI cung cấp. Luôn luôn kiểm tra chéo thông tin từ nhiều nguồn đáng tin cậy. Ngoài ra, các tổ chức độc lập và chính phủ cần thiết lập các khuôn khổ pháp lý và đạo đức để giám sát sự phát triển của AI, đảm bảo rằng công nghệ này phục vụ lợi ích chung của nhân loại chứ không phải là công cụ để lan truyền thông tin sai lệch. Đây là một cuộc đua không ngừng nghỉ giữa sự tiến bộ công nghệ và trách nhiệm đạo đức.
Tóm lại, việc các chatbot AI làm sai lệch hồ sơ nhân quyền là một lời nhắc nhở mạnh mẽ rằng công nghệ, dù mạnh mẽ đến đâu, vẫn cần sự giám sát và định hướng từ con người. Chúng ta không thể để những thuật toán vô tri quyết định cách chúng ta nhìn nhận về những giá trị cốt lõi như nhân quyền và tự do.