OpenAI dan Reddit punya mencapai kesepakatan untuk memungkinkan OpenAI melatih model AI generatifnya pada data Reddit.

Di sebuah postingan blog di situs hubungan pers OpenAI, OpenAI mengatakan bahwa, melalui kemitraan yang baru dibentuk dengan Reddit, mereka akan mendapatkan akses ke “konten real-time, terstruktur, dan unik” — misalnya postingan dan balasan — dari Reddit, sehingga alat dan modelnya dapat “ lebih memahami dan menampilkan” konten Reddit. Konten dari Reddit akan dimasukkan ke dalam ChatGPT, platform chatbot bertenaga AI OpenAI, dan OpenAI akan bekerja sama dengan Reddit untuk menghadirkan “fitur bertenaga AI” baru yang tidak ditentukan untuk pengguna dan moderator Reddit.

OpenAI juga akan menjadi mitra periklanan Reddit.

“Reddit akan membangun platform model AI OpenAI untuk mewujudkan visi kuatnya,” tulis OpenAI dalam postingannya. “Menggunakan LLM, ML, dan AI memungkinkan Reddit meningkatkan pengalaman pengguna untuk semua orang.”

OpenAI memiliki beberapa kesepakatan lisensi serupa dengan penyedia konten mulai dari perpustakaan media stok hingga penerbit berita. Namun sudut pandang yang tidak biasa dari hal ini adalah Sam Altman, CEO OpenAI, memiliki 8,7% saham di Redditmenjadikannya pemegang saham terbesar ketiga, dan pernah menjadi anggota dewan direksi perusahaan.

Dalam upaya untuk tidak mengundang pengawasan, OpenAI mengatakan dalam siaran persnya bahwa, meskipun Altman tetap menjadi pemegang saham Reddit, kemitraan tersebut “dipimpin oleh COO OpenAI. [Brad Lightcap]” dan “disetujui oleh [OpenAI’s] dewan direksi independen.” (Saya perhatikan di sini bahwa Altman sendiri adalah anggota dewan OpenAI.)

Reddit telah menjadikan perjanjian lisensi data sebagai bagian yang semakin penting dari strategi pertumbuhannya seiring dengan menavigasi pasar sebagai perusahaan publik.

Dalam prospektus IPO-nya, Reddit mengungkapkan bahwa mereka memiliki perjanjian kontrak untuk melisensikan datanya pelanggan termasuk Google bernilai gabungan lebih dari $200 juta. Dan, dalam laporan pendapatan pertamanya sebagai perusahaan publik, Reddit melaporkan peningkatan pendapatan non-iklan sebesar 450% dari tahun ke tahun, terutama disebabkan oleh perjanjian tersebut.

Saham Reddit naik 11% dalam perdagangan yang diperpanjang setelah pengumuman kesepakatan OpenAI.

“Paradoks yang saya lihat adalah, seiring dengan semakin banyaknya konten di internet yang ditulis oleh mesin, ada peningkatan premium pada konten yang berasal dari orang-orang nyata,” kata CEO Reddit Steve Huffman saat laporan pendapatan perusahaan pada bulan Maret. “Dan kami memiliki percakapan otentik selama hampir dua dekade.”

Platform Reddit — yang memiliki lebih dari 1 miliar postingan dan lebih dari 16 miliar komentar, angka yang terus bertambah setiap hari berkat ratusan juta pengguna aktif mingguannya — adalah tambang emas bagi perusahaan AI generatif, yang modelnya belajar dari contoh konten untuk menghasilkan konten baru. konten, seperti teks dan gambar.

Namun perusahaan tersebut dapat menghadapi penolakan dari pengguna yang khawatir tentang cara mereka memonetisasi data mereka.

Penting untuk melihat Stack Overflow, forum tanya jawab untuk pengembang perangkat lunak, yang baru-baru ini menandatangani perjanjian dengan OpenAI untuk menyediakan data untuk pelatihan model OpenAI. Sebagai bentuk protes, beberapa pengguna menghapus jawaban-jawaban mereka yang berperingkat teratas atas pertanyaan-pertanyaan di komunitas. Namun Stack Overflow memulihkan postingan yang dihapus dan melarang pengguna tersebut, mengklaim bahwa mereka tidak mematuhi persyaratan layanannya.

Reddit telah menyuarakan ketidaksenangannya dengan upaya untuk memberi pengguna Reddit kontrol yang lebih besar atas data mereka sendiri.

Vana, sebuah startup yang dibangun di atas blockchain, mencoba meluncurkan data “DAO” (Organisasi Otonomi Digital) untuk memungkinkan pengguna Reddit mengumpulkan data mereka dan membiarkan mereka memutuskan bersama bagaimana data gabungan tersebut digunakan (atau dijual). Reddit melarang subreddit Vana yang didedikasikan untuk diskusi tentang DAO, dalam sebuah pernyataan kepada TechCrunch, dan menuduh perusahaan tersebut “mengeksploitasi” kontrol ekspor datanya.

Sumber