Thư viện sao chép bất hợp pháp lớn nhất|Tòa án Mỹ phạt Anna’s Archive 19,5 triệu USD, chặn toàn cầu tên miền, AI được huấn luyện bằng dữ liệu của họ có gặp khó khăn?

Liên bang Tòa án quận Nam New York ra phán quyết vắng mặt đối với thư viện bóng tối Anna’s Archive, yêu cầu bồi thường 19,5 triệu USD và lệnh cấm vĩnh viễn tên miền toàn cầu; nhà xuất bản cũng cáo buộc Anna’s Archive là nguồn dữ liệu huấn luyện chính của các công ty AI như Meta, NVIDIA.
(Tiểu sử: Hồ sơ IPO của SpaceX tiết lộ sở hữu 18,7 nghìn Bitcoin! Trung bình 35.320 USD, dự kiến trở thành công ty niêm yết BTC lớn thứ bảy toàn cầu vào tháng 6)
(Bổ sung nền: Báo cáo tài chính Q1 của Nvidia vượt kỳ vọng! Doanh thu 81,6 tỷ USD lập kỷ lục, Jensen Huang hân hoan tuyên bố “Thời đại AI Tác Nhân đã đến”, cổ tức tăng vọt 24 lần)

Mục lục bài viết

Toggle

  • 1,95 triệu USD trên giấy, và 322 triệu USD không thể lấy lại
  • Mục tiêu thực sự: Cloudflare, nhà đăng ký tên miền và trung gian nước ngoài
  • Chiến trường mới của dữ liệu huấn luyện AI

19,5 triệu USD, lệnh cấm tên miền toàn cầu, thẩm phán Tòa án liên bang quận Nam New York Jed S. Rakoff ký ban hành vào ngày 19, đã biến giá trị pháp lý của thư viện bóng tối Anna’s Archive thành con số cụ thể, nhưng vụ việc không đơn giản như vậy.

1,95 triệu USD trên giấy, và 322 triệu USD không thể lấy lại

Thẩm phán Rakoff xử phạt 130 “tác phẩm kiện cáo” mỗi tác 150.000 USD theo mức bồi thường tối đa pháp lý, tổng cộng 19,5 triệu USD. Luật bản quyền Mỹ cho phép phán quyết tối đa 150.000 USD cho mỗi tác phẩm vi phạm, Rakoff đã xử theo đúng quy định.

Tuy nhiên, việc thu hồi số tiền này là chuyện khác. Người vận hành Anna’s Archive đến nay vẫn giữ bí mật danh tính, từng công khai nói rằng việc ẩn danh là để tránh “án tù kéo dài hàng chục năm”. Phán quyết vắng mặt yêu cầu họ tiết lộ danh tính trong vòng 10 ngày, nhưng gần như chắc chắn sẽ bị phớt lờ.

Trong các vụ kiện liên quan đến Spotify, ngành công nghiệp âm nhạc đã đạt được phán quyết vắng mặt trị giá tới 322 triệu USD, nhưng đến nay chưa có dấu hiệu nào cho thấy đã thu hồi được một đồng nào.

19,5 triệu USD so với 322 triệu USD, điểm chung của hai con số này là: chúng đều là “chiến thắng trên giấy tờ”, thực lực thực sự đến từ nơi khác.

Mục tiêu thực sự: Cloudflare, nhà đăng ký tên miền và trung gian nước ngoài

Nhà xuất bản đã nhìn thấu chiêu “đổi tên miền dự phòng khi bị chặn” của Anna’s Archive nhiều năm qua, do đó, điểm mấu chốt của phán quyết lần này không phải là tiền bồi thường, mà là lệnh cấm vĩnh viễn: yêu cầu “tất cả tổ chức quản lý và đăng ký tên miền” ngưng hoạt động vĩnh viễn các tên miền của họ và ngăn chặn chuyển nhượng, tương đương với việc đóng băng khả năng tên miền tiếp tục lưu hành trong hệ thống tên miền toàn cầu.

Văn bản phán quyết nêu tên hơn 20 công ty và tổ chức, bao gồm:

  • Cloudflare (dịch vụ CDN và phòng chống DDoS)
  • Njalla (dịch vụ ẩn danh đăng ký tên miền)
  • DDOS-Guard (dịch vụ bảo vệ lưu lượng)
  • TELE Greenland / Tusass (quản lý tên miền .gl)
  • PKNIC (quản lý tên miền .pk)
  • Ủy ban Quản lý Viễn thông Quốc gia Grenada (quản lý tên miền .gd)

Tuy nhiên, danh sách này tiết lộ một điểm khác biệt quan trọng: phạm vi thẩm quyền của tòa án Mỹ hiệu quả nhất đối với các công ty trong nước, còn phần lớn trong danh sách là các thực thể nước ngoài, liệu họ có tự nguyện tuân thủ lệnh của tòa án Mỹ hay không vẫn còn là ẩn số.

Chiến trường mới của dữ liệu huấn luyện AI

Ngoài ra, điều đáng theo dõi lâu dài trong vụ kiện này là trong đơn kiện của nhà xuất bản: họ rõ ràng khẳng định rằng, Anna’s Archive không chỉ cung cấp sách điện tử miễn phí cho độc giả, mà còn là nguồn dữ liệu huấn luyện chính cho các công ty trí tuệ nhân tạo như Meta, NVIDIA.

Hiện tại, cáo buộc này vẫn chỉ là lời của nhà xuất bản, chưa từng được kiểm tra đối chất trong phiên tòa vì chưa mở phiên xét xử, bị cáo từ đầu đến cuối vắng mặt. Nhưng logic mà nó tiết lộ chính là vấn đề mà toàn ngành AI đều tránh né: nếu dữ liệu sách dùng để huấn luyện mô hình xuất phát từ nguồn không rõ bản quyền, thì mô hình được huấn luyện từ dữ liệu này có bị coi là vi phạm gián tiếp bản quyền hay không?

Điều đáng so sánh là trong các vụ kiện liên quan đến Spotify trước đây, sau khi Anna’s Archive thắng kiện trong ngành công nghiệp âm nhạc, họ đã chủ động xóa dữ liệu lấy từ Spotify; nhưng sách của nhà xuất bản vẫn còn có thể truy cập bình thường trên website. Sự khác biệt này khiến các trung gian tên miền khó tránh khỏi việc bị xem là đã “tự sửa đổi” để né tránh thi hành lệnh cấm.

Vấn đề lớn hơn là về mặt thời gian: tốc độ xử lý các vụ kiện về bản quyền luôn chậm hơn tốc độ các công ty AI tiêu thụ dữ liệu huấn luyện. Đến khi tòa xác nhận vi phạm, truy đòi bồi thường, thì dữ liệu đó đã bị nén vào trọng số mô hình, không thể “trả lại” về mặt vật lý.

Cơ chế quản lý luôn đi sau công nghệ, nhưng cuối cùng cũng sẽ đến. Những gì Anna’s Archive gặp hôm nay chỉ là phần đầu tiên của chuỗi trách nhiệm về bản quyền bị chính thức kết án. Ai sẽ là bị cáo tiếp theo, mới là câu hỏi thực sự để lại từ phán quyết này.

BTC-2,78%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim