Các trang tin lớn chặn công cụ thu thập dữ liệu của OpenAI

Chỉ một tuần sau khi OpenAI ra mắt SearchGPT – một công cụ tìm kiếm tiên tiến, cung cấp người dùng thông tin chính xác từ các nguồn trên internet. Một số trang tin hàng đầu đã thể hiện rõ họ không muốn dính dáng gì đến công cụ này của OpenAI. Cùng Techie tìm hiểu tại sao nhé!

The New York Times và ít nhất 13 trang tin khác đã chặn SearchBot. Đây là công cụ thu thập dữ liệu web giúp OpenAI có thể truy xuất và hiển thị các kết quả liên quan cho người dùng SearchGPT.

Giao diện người dùng tối giản của SearchGPT
Giao diện người dùng tối giản của SearchGPT

Originality.ai đã phát hiện ra rằng 14 trong số 1.000 nhà xuất bản website hàng đầu đã chặn SearchBot. Các tờ báo khác trong danh sách bao gồm Wired, The New Yorker, Vogue, Vanity Fair và GQ.

Ông Jon Gillham, Giám đốc điều hành của Originality.ai cho rằng đây là một điều khó hiểu: “Tôi không chắc tại sao bất kỳ nhà xuất bản nào lại chặn nó”. Ông nói với Business Insider: “Họ đã ngăn chặn một nguồn lưu lượng truy cập cực lớn; mà các nhà xuất bản rất cần.”

Khi OpenAI ra mắt SearchGPT, công ty cũng đã nhấn mạnh rằng OAI-SearchBot không thu thập dữ liệu web để đào tạo các mô hình AI của mình như GPT-5. Và họ khuyên các chủ sở hữu website nên cho phép bot mới hoạt động để “đảm bảo trang web của bạn xuất hiện trong kết quả tìm kiếm”. Nếu không có quyền truy cập thu thập dữ liệu web đến mọi website, dịch vụ SearchGPT của OpenAI có nguy cơ kém hoàn thiện hơn công cụ tìm kiếm của Google.

Các công ty đang mất lòng tin vào OpenAI?

OpenAI có một công cụ thu thập dữ liệu web khác, được gọi là GPTbot, chuyên thu thập dữ liệu trực tuyến để đào tạo mô hình AI. Hàng trăm website đã chặn công cụ này. Bởi lẽ những tờ báo biết rằng: Lưu lượng truy cập cao là cần thiết, nhưng họ càng không muốn cung cấp nội dung của mình để đào tạo ra các mô hình AI có khả năng cạnh tranh với họ.

Tuy nhiên, OpenAI đã dành nhiều năm để thu thập dữ liệu trực tuyến mà không được phép. Có lẽ các nhà xuất bản chỉ đơn giản là không tin OpenAI khi họ nói rằng bot tìm kiếm mới của họ sẽ không bí mật lấy nội dung của họ để đào tạo dữ liệu AI.

Khiếu nại từ The New York Times

Khiếu nại từ The New York Times đối với OpenAI và Microsoft
Tờ Times cho biết trong đơn khiếu nại: “Thật không công bằng khi các công ty sử dụng nội dung của The Times mà không trả tiền để tạo ra các sản phẩm thay thế The Times và cướp đi khán giả của The Times”

Gillham cũng lưu ý rằng, trong năm 2024 OpenAI đã cố gắng ký kết thỏa thuận với các nhà xuất bản để sử dụng kho lưu trữ nội dung của họ. Đây giống như một chuỗi các bước có chủ ý của OpenAI, trước tiên là xoa dịu các nhà xuất bản bằng cách ký kết tất cả các thỏa thuận hợp tác này và sau đó tuyên bố ra mắt SearchGPT.

Người phản đối chính trong số các nhà xuất bản là The New York Times. Họ đã kiện OpenAI và Microsoft, cáo buộc các công ty công nghệ sử dụng trái phép tác phẩm của họ để tạo ra các sản phẩm cạnh tranh.

Trong đơn kiện, tờ báo The NYTimes cáo buộc Microsoft đã sử dụng công cụ tìm kiếm Bing để sao chép toàn bộ các bài báo của họ và sắp xếp chúng vào một hệ thống. Sau đó, Microsoft sử dụng hệ thống này để tạo ra những câu trả lời cho các câu hỏi tìm kiếm, trong đó có cả những đoạn văn trích dẫn nguyên văn từ bài báo của The Times. Những câu trả lời này dài và chi tiết hơn nhiều so với những gì bạn có thể tìm thấy trên các công cụ tìm kiếm thông thường khác.

The NYTimes cho rằng hành động này của Microsoft là không đúng đắn vì họ đã sử dụng nội dung của báo mà không được phép. Điều này khiến độc giả không còn muốn mua báo nữa và làm giảm doanh thu của tờ báo từ nhiều nguồn khác nhau, như tiền đăng ký, tiền bản quyền, quảng cáo và các liên kết hợp tác.

Hiện tại OpenAI chưa trả lời các yêu cầu bình luận.

Xem thêm: Cựu giám đốc khoa học OpenAI ra mắt công ty trí tuệ nhân tạo cạnh tranh với ChatGPT

Khám phá thêm
“Chúng ta đang sống trong thế giới VUCA” – Câu nói này đã diễn tả đúng tình trạng thế giới...
Trong bài viết này, Techie sẽ giới thiệu đến bạn bản chất của tính năng constraints và auto-layout figma, cũng...
Temu, một ứng dụng mua sắm Trung Quốc, đang gây chấn động trên internet với những sản phẩm rất rẻ....
Mối quan hệ tình yêu luôn là một chủ đề hấp dẫn và phức tạp. Cũng dễ hiểu khi nhiều...
Theo một “nguồn tin mật” cho hay, Ghibli chính thức công bố trailer phần tiếp theo của tựa phim Vùng...
Cảm biến sinh học (Biosensor) đã đánh dấu một thành tựu quan trọng trong cuộc chiến chống đại dịch COVID-19 khi...
Thuật toán Dijkstra là một công cụ quan trọng trong lý thuyết đồ thị và tối ưu hóa. Với khả...
Thời gian gần đây, công nghệ AI đang trở thành chủ đề được nhân loại đặc biệt quan tâm. Trên...