Wikipedia Yêu Cầu Các Công Ty AI Dùng API Trả Phí, Ngừng Scraping Miễn Phí

Quyết định đến sau khi lượng xem giảm và hoạt động thu thập dữ liệu bất hợp pháp gia tăng

HM Journal

7 tháng trước5 min

...

Điểm chính

Wikipedia kêu gọi công ty AI sử dụng API Enterprise trả phí, ngừng scraping nội dung miễn phí.
Lưu lượng xem trang của người dùng giảm 8% được Wikipedia cho là do chatbot AI.
Nền tảng đã nâng cấp hệ thống phát hiện bot và có chính sách xóa bài do AI tạo.
API Enterprise cung cấp quyền truy cập được cấp phép, khối lượng lớn cho mục đích thương mại.

Key Takeaways

Wikipedia vừa đưa ra lời kêu gọi trực tiếp các công ty AI dừng việc khai thác nội dung miễn phí từ nền tảng này, thay vào đó sử dụng API Wikimedia Enterprise trả phí của mình. Động thái này diễn ra trong bối cảnh Wikipedia ghi nhận lượng xem trang của người dùng giảm 8% so với cùng kỳ năm trước, mà họ cho rằng là do các chatbot AI ngày càng trả lời các truy vấn của người dùng, khiến họ không cần truy cập trực tiếp vào trang nữa.

Kêu Gọi Trả Phí và Thực Trạng Scraping

Vào ngày 10 tháng 11 năm 2025, Quỹ Wikimedia đã công bố một bài đăng trên blog, kêu gọi các nhà phát triển AI truy cập nội dung Wikipedia một cách "có trách nhiệm" thông qua API Enterprise của mình. Đây là một dịch vụ trả phí được thiết kế để xử lý các yêu cầu dữ liệu quy mô lớn mà không làm quá tải cơ sở hạ tầng của Wikipedia. Tổ chức này nhấn mạnh rằng hành động này không chỉ vì doanh thu mà còn để bảo vệ cơ sở hạ tầng của Wikipedia và đảm bảo sự bền vững cho sứ mệnh của họ.

Quỹ Wikimedia tuyên bố rõ ràng: "Nếu bạn đang huấn luyện các mô hình AI trị giá hàng tỷ đô la bằng nội dung của chúng tôi, bạn cần phải trả tiền cho nó." Lãnh đạo Wikipedia cũng cho biết các công ty AI đã bị "bắt quả tang" khi scraping nội dung và Quỹ đã nâng cấp hệ thống phát hiện bot để chống lại lưu lượng truy cập lừa đảo. Cụ thể, vào khoảng tháng 5 đến tháng 6 năm 2025, Wikipedia đã phát hiện các đợt tăng lưu lượng truy cập bất thường, sau đó được xác định là do các bot AI tinh vi cố gắng né tránh phát hiện bằng cách bắt chước hành vi của con người, khai thác nội dung ở quy mô lớn, bỏ qua các kênh chính thức. Phản ánh những lo ngại ngày càng tăng về tính toàn vẹn của nội dung trong kỷ nguyên AI, Wikipedia vào tháng 8 năm 2025 đã thông qua chính sách cho phép các biên tập viên đề cử các bài viết nghi ngờ do AI tạo ra để xóa nhanh.

Vai Trò của Wikimedia Enterprise API

API Wikimedia Enterprise được tạo ra với mục đích cung cấp quyền truy cập được cấp phép, khối lượng lớn vào nội dung của Wikipedia cho mục đích thương mại, đặc biệt là để huấn luyện AI và đáp ứng nhu cầu dữ liệu quy mô lớn. Mặc dù các báo cáo gần đây không nêu chi tiết giá hiện tại, nhưng các tiết lộ trước đó chỉ ra rằng các hợp đồng có thể dao động từ hàng chục nghìn đến hàng triệu đô la mỗi năm, tùy thuộc vào mức độ sử dụng và quy mô. Google và Microsoft được báo cáo là những khách hàng lớn đã trả tiền để truy cập trong quá khứ.

API này cung cấp các tính năng nổi bật như cập nhật theo thời gian thực, độ tin cậy cao và các tính năng tùy chọn cho khách hàng, đảm bảo rằng các công ty AI không gây quá tải cho các máy chủ công cộng của Wikipedia. Đây là một trong số ít các nguồn dữ liệu bách khoa toàn thư quy mô lớn, thời gian thực và được cấp phép chính thức có sẵn cho mục đích sử dụng AI thương mại.

Bối Cảnh Rộng Hơn và Phản Ứng

Động thái của Wikipedia phản ánh một xu hướng rộng lớn hơn của các nhà cung cấp nội dung trong việc yêu cầu bồi thường từ các công ty AI, khi giá trị của dữ liệu chất lượng cao, được con người quản lý ngày càng trở nên rõ ràng trong cuộc đua AI. Các nhà phân tích trong ngành lưu ý rằng dữ liệu được con người sắp xếp cẩn thận này là tài sản quý giá cho việc huấn luyện các mô hình AI.

Một số nhà phát triển AI lập luận rằng việc truy cập mở vào nội dung Wikipedia là nền tảng cho internet, nhưng họ cũng thừa nhận rằng quy mô và lợi ích thương mại của AI hiện đại đòi hỏi các mô hình cấp phép mới. Phản ứng của người dùng trên mạng xã hội và các diễn đàn khá đa chiều: một số ủng hộ quyền được bồi thường của Wikipedia, trong khi những người khác lo ngại về những tác động tiềm ẩn đối với sự cởi mở của web.

Không giống như hầu hết các nhà cung cấp dữ liệu thương mại, Wikipedia là một tổ chức phi lợi nhuận và phụ thuộc nhiều vào các khoản đóng góp. Sự gia tăng các câu trả lời do AI tạo ra đã làm giảm lưu lượng truy cập trực tiếp, đe dọa mô hình tài trợ truyền thống của nó. Các nền tảng nội dung khác, như các nhà xuất bản tin tức, cũng đã bắt đầu đàm phán các thỏa thuận cấp phép với các công ty AI, nhưng trường hợp của Wikipedia đặc biệt đáng chú ý do quy mô và tư cách phi lợi nhuận của nó. Các biện pháp phát hiện bot và chống scraping của Wikipedia đã trở nên tinh vi hơn vào năm 2025, phản ánh cuộc chiến kỹ thuật ngày càng leo thang giữa các nhà cung cấp nội dung và các nhà thu thập dữ liệu AI.

Thẻ

#Wikimedia Enterprise

#Scraping

#Cấp Phép Dữ Liệu

Wikipedia Yêu Cầu Các Công Ty AI Dùng API Trả Phí, Ngừng Scraping Miễn Phí

Điểm chính

Key Takeaways

Kêu Gọi Trả Phí và Thực Trạng Scraping

Vai Trò của Wikimedia Enterprise API

Bối Cảnh Rộng Hơn và Phản Ứng

Thẻ

Bài viết liên quan

Wikipedia Yêu Cầu Các Công Ty AI Dùng API Trả Phí, Ngừng Scraping Miễn Phí

Điểm chính

Kêu Gọi Trả Phí và Thực Trạng Scraping

Vai Trò của Wikimedia Enterprise API

Bối Cảnh Rộng Hơn và Phản Ứng

Thẻ

Bài viết liên quan

HM Journal - Loading...

HM Journal - Loading...

Wikipedia Yêu Cầu Các Công Ty AI Dùng API Trả Phí, Ngừng Scraping Miễn Phí

Kêu Gọi Trả Phí và Thực Trạng Scraping

Vai Trò của Wikimedia Enterprise API

Bối Cảnh Rộng Hơn và Phản Ứng

Thẻ

Wikipedia Yêu Cầu Các Công Ty AI Dùng API Trả Phí, Ngừng Scraping Miễn Phí

Kêu Gọi Trả Phí và Thực Trạng Scraping

Vai Trò của Wikimedia Enterprise API

Bối Cảnh Rộng Hơn và Phản Ứng

Thẻ