Pencipta dan penerbit Kanada ingin pemerintah melakukan sesuatu terhadap penggunaan konten mereka yang tidak sah dan biasanya tidak dilaporkan untuk melatih sistem kecerdasan buatan generatif.

Namun perusahaan AI bersikeras bahwa penggunaan materi tersebut untuk melatih sistem mereka tidak melanggar hak cipta, dan mengatakan pembatasan penggunaannya akan menghambat pengembangan AI di Kanada.

Kedua belah pihak menyampaikan argumen mereka dalam pengajuan yang diterbitkan baru-baru ini pada konsultasi tentang hak cipta dan AI yang dilakukan oleh pemerintah federal saat mempertimbangkan bagaimana undang-undang hak cipta Kanada harus menangani munculnya sistem AI generatif seperti ChatGPT milik OpenAI.

AI generatif dapat membuat teks, gambar, video, dan kode komputer berdasarkan perintah sederhana, tetapi untuk melakukannya, sistem harus terlebih dahulu mempelajari sejumlah besar konten yang ada.

Dalam pengajuannya kepada pemerintah, Access Copyright berpendapat bahwa sebagian besar dan mungkin semua model bahasa besar “saat ini mengambil keuntungan dari penggunaan tidak sah dan reproduksi karya yang dilindungi hak cipta.”

Hal ini terjadi di “kotak hitam”, menurut Access Copyright, yang mewakili penulis, seniman visual, dan penerbit.

“Pemegang hak cipta tahu hal ini tengah terjadi, tetapi karena adanya asimetri informasi antara mereka dan platform AI, mereka tidak dapat menentukan siapa yang melakukan aktivitas tersebut, dengan karya siapa, dan tidak memiliki mekanisme untuk menghentikannya terjadi.”

Music Canada, yang mewakili label rekaman besar di negara tersebut, mengatakan tahun lalu, lagu palsu buatan AI yang meniru suara Drake dan The Weeknd “memperjelas satu hal: model dan sistem AI telah menyerap sejumlah besar kumpulan data milik perusahaan tanpa izin. dari sumber data atau pemegang hak.”

Serikat Penulis Kanada meminta pemerintah untuk mulai menerapkan kewajiban pengungkapan dan pelaporan dasar. Dikatakan bahwa pengembang memiliki semua pengetahuan tentang karya yang ditambang dan bagaimana karya tersebut digunakan, sementara kreator tidak memiliki informasi tersebut.

Beberapa organisasi telah menandatangani perjanjian lisensi dengan perusahaan AI. Namun, Asosiasi Penulis Kanada mengatakan pemegang hak cipta menghadapi “kendala besar” dalam melisensikan konten mereka “karena mereka tidak diberi tahu perusahaan mana yang menggunakan karya mereka”.

Ia meminta Kanada untuk mengklarifikasi bahwa penambangan teks dan data tunduk pada undang-undang hak cipta.

Banyak tuntutan hukum sedang dilakukan di Amerika Serikat atas penggunaan materi berhak cipta oleh sistem AI generatif, termasuk tuntutan hukum yang diluncurkan minggu ini oleh label rekaman terbesar di dunia terhadap dua generator musik AI.

Asosiasi Produsen Media Kanada mengatakan kasus hukum menggambarkan masalah yang disebabkan oleh kurangnya transparansi, mengutip satu kasus di mana perusahaan AI berpendapat pemegang hak tidak dapat melanjutkan tuduhan pelanggaran kecuali mereka dapat menentukan karya yang digunakan untuk pelatihan secara pasti.

“Pemegang hak cipta juga pasti akan menghadapi masalah pembuktian serupa karena banyak kumpulan data yang digunakan untuk melatih sistem AI Generatif konon dimusnahkan setelah pelatihan awal selesai,” katanya.

Kelompok tersebut mengatakan bahwa ini adalah masalah yang “membutuhkan perhatian segera” dan meminta pemerintah untuk menerapkan persyaratan transparansi.

Namun perusahaan AI berpendapat bahwa transparansi yang diminta oleh pemegang hak cipta tidaklah realistis.

Microsoft mengatakan kepada pemerintah bahwa pelatihan sistem AI skala besar melibatkan “volume data yang sangat besar”, dan perusahaan tidak perlu menyimpan catatan tersebut atau mengungkapkan konten yang digunakan untuk pelatihan.

“Tidak mungkin untuk mencatat informasi seperti itu dan persyaratan seperti itu akan menghambat pengembangan AI,” katanya.

Perusahaan berpendapat bahwa menganalisis karya dan mempelajari konsep dan fakta bukanlah “pelanggaran hak cipta.”

Google mengatakan pelatihan AI sudah dikecualikan berdasarkan undang-undang hak cipta yang berlaku, meskipun pemerintah harus mengadopsi pengecualian untuk membuatnya eksplisit.

Google mengatakan bahwa mewajibkan izin untuk menggunakan konten untuk tujuan pelatihan akan mengekspos informasi sensitif yang kompetitif dan “akan secara efektif memblokir pengembangan dan penggunaan model bahasa besar dan jenis AI mutakhir lainnya.”

Dikatakan juga pengembang AI tidak memiliki akses ke informasi akurat tentang status hak cipta.

Faktanya, tidak ada sumber kebenaran seperti itu di mana pun di dunia. Oleh karena itu, mematuhi aturan pengungkapan mungkin terbukti mustahil sejak awal.

Perusahaan AI Kanada Cohere mengatakan penggunaan konten untuk melatih sistem AI bekerja serupa dengan cara seseorang membaca buku untuk memperoleh lebih banyak informasi.

Perusahaan tersebut mengatakan proses tersebut tidak melanggar hak cipta, dan berpendapat bahwa hal itu harus dijelaskan dalam undang-undang. Jika tidak, “ambisi Kanada untuk menjadi rumah bagi perusahaan dan ekosistem AI terkemuka di dunia” dapat dirusak.

Dewan Inovator Kanada, yang mewakili sektor teknologi Kanada, mengatakan persyaratan pengungkapan akan merugikan perusahaan-perusahaan kecil dibandingkan dengan pesaing mereka dari Big Tech. Dewan memperingatkan bahwa hal ini akan “sangat menghambat potensi perusahaan-perusahaan Kanada untuk berkembang secara signifikan.”


Laporan oleh The Canadian Press ini pertama kali diterbitkan pada 30 Juni 2024.

Sumber