Một “cuốn từ điển” khởi kiện OpenAI

Kim, doisongphapluat.nguoiduatin.vn 

ChatGPT cũng bị cáo buộc là đang đe dọa "khả năng tiếp cận của công chúng đối với các thông tin trực tuyến chất lượng cao và đáng tin cậy".

Hình minh họa.

Tổ chức uy tín trong lĩnh vực từ điển và bách khoa toàn thư vừa chính thức đệ đơn kiện OpenAI, cáo buộc công ty phát triển ChatGPT đã thực hiện hành vi vi phạm bản quyền trên quy mô lớn.

Theo đơn kiện, Britannica (công ty mẹ của Merriam-Webster) hiện đang nắm giữ bản quyền của gần 100.000 bài viết trực tuyến. Nhà xuất bản này cáo buộc OpenAI đã tự ý thu thập và sử dụng lượng dữ liệu khổng lồ này để huấn luyện các mô hình ngôn ngữ lớn (LLM) mà không hề xin phép.

Hồ sơ pháp lý cũng chỉ ra rằng OpenAI vi phạm luật bản quyền khi tạo ra các đầu ra sao chép "nguyên văn toàn bộ hoặc một phần" nội dung của Britannica. Sự vi phạm này cũng diễn ra khi công ty AI sử dụng các bài viết của Britannica trong quy trình RAG (Retrieval-Augmented Generation - hệ thống tăng cường truy xuất), một công cụ giúp LLM quét web hoặc các cơ sở dữ liệu để tìm thông tin cập nhật khi trả lời truy vấn của người dùng.

Bên cạnh đó, OpenAI còn bị cáo buộc vi phạm Đạo luật Lanham, một quy chế về nhãn hiệu, khi hệ thống AI tạo ra các thông tin bịa đặt nhưng lại trích dẫn sai sự thật rằng chúng xuất phát từ nhà xuất bản.

Trong hồ sơ kiện, Britannica nhấn mạnh rằng ChatGPT đang làm suy kiệt doanh thu của các nhà xuất bản web. Chatbot này tạo ra các câu trả lời có khả năng thay thế và cạnh tranh trực tiếp với nội dung gốc từ các nhà xuất bản như Britannica. Đồng thời, tình trạng cung cấp thông tin sai lệch (qua hiện tượng ảo tưởng) của ChatGPT cũng bị cáo buộc là đang đe dọa "khả năng tiếp cận của công chúng đối với các thông tin trực tuyến chất lượng cao và đáng tin cậy".

Động thái này của Britannica đã nối dài danh sách các nhà xuất bản và tác giả đang khởi kiện OpenAI về vấn đề bản quyền. Trước đó, The New York Times, Ziff Davis (đơn vị chủ quản của Mashable, CNET, IGN, PC Mag...), cùng hơn một chục tờ báo lớn tại Mỹ và Canada như Chicago Tribune, Denver Post, Sun Sentinel, Toronto Star và Đài Phát thanh Truyền hình Canada (CBC) cũng đã tiến hành các bước pháp lý tương tự. Được biết, một vụ kiện với lý do tương tự của Britannica nhằm vào công ty AI Perplexity hiện cũng đang chờ giải quyết.

Tuy nhiên, cho đến nay, hệ thống tư pháp vẫn chưa có án lệ nào để xác định chính xác liệu việc sử dụng nội dung có bản quyền để huấn luyện các mô hình ngôn ngữ AI có bị coi là vi phạm bản quyền hay không.

Trong một vụ việc hiếm hoi có liên quan, công ty công nghệ Anthropic đã thuyết phục thành công Thẩm phán liên bang William Alsup rằng việc sử dụng nội dung có bản quyền làm dữ liệu huấn luyện có tính "chuyển đổi" đủ lớn để được coi là hợp pháp. 

Mặc dù vậy, Thẩm phán Alsup vẫn phán quyết rằng Anthropic vi phạm pháp luật vì đã tải xuống bất hợp pháp hàng triệu cuốn sách thay vì trả tiền mua chúng. Phán quyết này đã dẫn đến một thỏa thuận dàn xếp bồi thường tập thể trị giá lên tới 1,5 tỷ USD dành cho các tác giả bị ảnh hưởng.

Tin cùng chuyên mục
Xem theo ngày

NỔI BẬT TRANG CHỦ