Mengikuti perkembangan industri yang bergerak cepat seperti AI adalah hal yang sulit. Jadi hingga AI dapat melakukannya untuk Anda, berikut adalah ringkasan praktis dari kisah-kisah terkini di dunia pembelajaran mesin, bersama dengan penelitian dan eksperimen penting yang tidak kami bahas sendiri.

Omong-omong — TechCrunch berencana segera meluncurkan buletin AI. Pantau terus.

Minggu ini di AI, delapan surat kabar terkemuka AS yang dimiliki oleh raksasa investasi Alden Global Capital, termasuk New York Daily News, Chicago Tribune, dan Orlando Sentinel, menggugat OpenAI dan Microsoft atas pelanggaran hak cipta terkait dengan penggunaan teknologi AI generatif oleh perusahaan tersebut. Mereka, seperti The New York Times dalam gugatannya yang sedang berlangsung terhadap OpenAI, menuduh OpenAI dan Microsoft menghapus IP mereka tanpa izin atau kompensasi untuk membangun dan mengkomersialkan model generatif seperti GPT-4.

“Kami telah menghabiskan miliaran dolar untuk mengumpulkan informasi dan melaporkan berita di publikasi kami, dan kami tidak bisa membiarkan OpenAI dan Microsoft memperluas pedoman teknologi besar dengan mencuri pekerjaan kami untuk membangun bisnis mereka sendiri dengan mengorbankan kami,” Frank Pine, direktur editor eksekutif yang mengawasi surat kabar Alden, mengatakan dalam sebuah pernyataan.

Gugatan tersebut tampaknya akan berakhir dengan penyelesaian dan kesepakatan lisensi, mengingat kemitraan OpenAI dengan penerbit dan keengganannya untuk bergantung pada keseluruhan model bisnisnya pada argumen penggunaan wajar. Namun bagaimana dengan pembuat konten lainnya yang karyanya diikutsertakan dalam pelatihan model tanpa bayaran?

Tampaknya OpenAI sedang memikirkan hal itu.

Sebuah penelitian yang baru-baru ini diterbitkan kertas ditulis bersama oleh Boaz Barak, seorang ilmuwan di tim Superalignment OpenAI, mengusulkan kerangka kerja untuk memberikan kompensasi kepada pemilik hak cipta “sebanding dengan kontribusi mereka terhadap pembuatan konten yang dihasilkan AI.” Bagaimana? Melalui teori permainan kooperatif.

Kerangka kerja ini mengevaluasi sejauh mana konten dalam kumpulan data pelatihan — misalnya teks, gambar, atau data lainnya — memengaruhi apa yang dihasilkan model, menggunakan konsep teori permainan yang dikenal sebagai Nilai Shapley. Kemudian, berdasarkan evaluasi tersebut, ditentukan “bagian yang sah” dari pemilik konten (yaitu kompensasi).

Katakanlah Anda memiliki model penghasil gambar yang dilatih menggunakan karya seni dari empat seniman: John, Jacob, Jack, dan Jebediah. Anda memintanya menggambar bunga dengan gaya Jack. Dengan kerangka tersebut, Anda dapat menentukan pengaruh karya masing-masing seniman terhadap karya seni yang dihasilkan model dan, dengan demikian, kompensasi yang harus diterima masing-masing seniman.

Di sana adalah Namun, ada kelemahan pada kerangka ini — biaya komputasinya mahal. Solusi yang dilakukan para peneliti bergantung pada perkiraan kompensasi, bukan perhitungan pasti. Apakah hal itu akan memuaskan para pembuat konten? Saya tidak yakin. Jika OpenAI suatu hari nanti mempraktikkannya, kita pasti akan mengetahuinya.

Berikut adalah beberapa kisah AI lainnya yang perlu diperhatikan dalam beberapa hari terakhir:

  • Microsoft menegaskan kembali larangan pengenalan wajah: Bahasa yang ditambahkan ke persyaratan layanan untuk Layanan Azure OpenAI, yang merupakan paket teknologi OpenAI yang dikelola sepenuhnya oleh Microsoft, secara lebih jelas melarang integrasi digunakan “oleh atau untuk” departemen kepolisian untuk pengenalan wajah di AS
  • Sifat startup yang berbasis AI: Startup AI menghadapi serangkaian tantangan yang berbeda dari perusahaan software-as-a-service pada umumnya. Demikian pesan dari Rudina Seseri, pendiri dan Managing Partner di Glasswing Ventures, minggu lalu di acara TechCrunch Early Stage di Boston; Ron memiliki cerita lengkapnya.
  • Anthropic meluncurkan rencana bisnis: Startup AI Anthropic meluncurkan paket berbayar baru yang ditujukan untuk perusahaan serta aplikasi iOS baru. Tim — paket perusahaan — memberi pelanggan akses dengan prioritas lebih tinggi ke rangkaian model AI generatif Claude 3 Anthropic ditambah kontrol admin dan manajemen pengguna tambahan.
  • Tidak ada lagi CodeWhisperer: Amazon CodeWhisperer sekarang Pengembang Qbagian dari keluarga Q chatbot AI generatif yang berorientasi bisnis dari Amazon. Tersedia melalui AWS, Q ​​Developer membantu beberapa tugas yang dilakukan pengembang dalam pekerjaan sehari-hari mereka, seperti melakukan debug dan meningkatkan aplikasi — seperti yang dilakukan CodeWhisperer.
  • Keluar saja dari Sam's Club: Sam's Club milik Walmart mengatakan mereka beralih ke AI untuk membantu mempercepat “teknologi keluar” mereka. Daripada mengharuskan staf toko untuk memeriksa pembelian anggota terhadap kuitansi mereka ketika meninggalkan toko, pelanggan Sam's Club yang membayar baik di kasir atau melalui aplikasi seluler Scan & Go kini dapat keluar dari lokasi toko tertentu tanpa harus memeriksa ulang pembelian mereka. .
  • Pemanenan ikan, otomatis: Memanen ikan pada dasarnya adalah bisnis yang berantakan. Shinkei sedang berupaya memperbaikinya dengan sistem otomatis yang dapat mengirim ikan dengan lebih manusiawi dan andal, sehingga menghasilkan perekonomian makanan laut yang benar-benar berbeda, lapor Devin.
  • Asisten AI Yelp: Yelp minggu ini mengumumkan chatbot baru yang didukung AI untuk konsumen – didukung oleh model OpenAI, kata perusahaan – yang membantu mereka terhubung dengan bisnis yang relevan untuk tugas mereka (seperti memasang perlengkapan pencahayaan, meningkatkan ruang luar, dan sebagainya). Perusahaan ini meluncurkan asisten AI pada aplikasi iOS-nya di bawah tab “Proyek”, dengan rencana untuk memperluas ke Android akhir tahun ini.

Lebih banyak pembelajaran mesin

Kredit Gambar: Departemen Energi AS

Sepertinya memang ada pesta yang cukup meriah di Argonne National Lab pada musim dingin ini ketika mereka mengundang seratus pakar AI dan sektor energi untuk berdiskusi tentang bagaimana teknologi yang berkembang pesat dapat bermanfaat bagi infrastruktur dan penelitian dan pengembangan negara di bidang tersebut. Laporan yang dihasilkan kurang lebih seperti yang Anda harapkan dari kerumunan itu: banyak hal yang menarik, namun tetap informatif.

Melihat tenaga nuklir, jaringan listrik, pengelolaan karbon, penyimpanan energi, dan material, tema yang muncul dari pertemuan ini adalah, pertama, bahwa para peneliti memerlukan akses ke alat dan sumber daya komputasi berdaya tinggi; kedua, belajar mengenali titik lemah dari simulasi dan prediksi (termasuk kelemahan yang dimungkinkan oleh hal pertama); ketiga, perlunya alat AI yang dapat mengintegrasikan dan membuat data dapat diakses dari berbagai sumber dan dalam banyak format. Kita telah melihat semua hal ini terjadi di seluruh industri dalam berbagai cara, jadi ini bukan kejutan besar, tapi tidak ada yang bisa dilakukan di tingkat federal tanpa beberapa ahli yang menerbitkan makalahnya, jadi ada baiknya jika hal ini dicatat.

Georgia Tech dan Meta sedang mengerjakan sebagian darinya dengan database besar baru yang disebut OpenDAC, kumpulan reaksi, material, dan penghitungan yang dimaksudkan untuk membantu para ilmuwan merancang proses penangkapan karbon agar dapat dilakukan dengan lebih mudah. Fokusnya adalah pada kerangka logam-organik, jenis material yang menjanjikan dan populer untuk menangkap karbon, namun memiliki ribuan variasi dan belum diuji secara mendalam.

Tim Georgia Tech bekerja sama dengan Oak Ridge National Lab dan Meta's FAIR untuk mensimulasikan interaksi kimia kuantum pada material ini, menggunakan sekitar 400 juta jam komputasi — jauh lebih banyak daripada yang dapat dikumpulkan dengan mudah oleh universitas. Semoga bermanfaat bagi para peneliti iklim yang bekerja di bidang ini. Semuanya didokumentasikan di sini.

Kami banyak mendengar tentang penerapan AI di bidang medis, meskipun sebagian besar berperan sebagai penasihat, membantu para ahli memperhatikan hal-hal yang mungkin tidak mereka lihat, atau menemukan pola yang membutuhkan waktu berjam-jam untuk ditemukan oleh teknologi. Hal ini sebagian karena model pembelajaran mesin ini hanya menemukan hubungan antar statistik tanpa memahami apa yang menyebabkan atau menyebabkan hal tersebut. Peneliti Cambridge dan Ludwig Maximilian University of Munich sedang mengupayakannya, karena melupakan hubungan korelatif dasar bisa sangat membantu dalam membuat rencana pengobatan.

Pekerjaan yang dipimpin oleh Profesor Stefan Feuerriegel dari LMU ini bertujuan untuk membuat model yang dapat mengidentifikasi mekanisme sebab akibat, bukan hanya korelasi: “Kami memberikan aturan mesin untuk mengenali struktur sebab akibat dan memformalkan masalah dengan benar. Kemudian mesin harus belajar mengenali dampak intervensi dan memahami, bagaimana konsekuensi di kehidupan nyata tercermin dalam data yang telah dimasukkan ke dalam komputer,” katanya. Ini masih merupakan tahap awal bagi mereka, dan mereka menyadarinya, namun mereka yakin pekerjaan mereka adalah bagian dari periode pembangunan berskala satu dekade yang penting.

Di University of Pennsylvania, mahasiswa pascasarjana Ro Encarnación sedang mengerjakan sudut pandang baru di bidang “keadilan algoritmik”. kita telah melihatnya dirintis (terutama oleh perempuan dan orang kulit berwarna) dalam 7-8 tahun terakhir. Pekerjaannya lebih fokus pada pengguna dibandingkan platform, dan ia mendokumentasikan apa yang ia sebut sebagai “emergent auditing.”

Ketika Tiktok atau Instagram mengeluarkan filter yang agak rasis, atau pembuat gambar yang menghasilkan sesuatu yang menakjubkan, apa yang dilakukan pengguna? Mengeluh, tentu saja, tapi mereka juga terus menggunakannya, dan belajar bagaimana menghindari atau bahkan memperburuk masalah yang ada di dalamnya. Ini mungkin bukan “solusi” seperti yang kita pikirkan, namun ini menunjukkan keragaman dan ketahanan dari sisi pengguna — mereka tidak rapuh atau pasif seperti yang Anda bayangkan.

Sumber