Di antara pertanyaan terbesar seputar model seperti ChatGPT, Gemini, dan Midjourney sejak diluncurkan adalah peran apa (jika ada) yang akan mereka mainkan dalam kehidupan kita sehari-hari. Ini adalah sesuatu yang ingin dijawab oleh Apple dengan pendekatannya sendiri pada kategori tersebut, Apple Intelligence, yang secara resmi diluncurkan minggu ini di WWDC 2024.

Perusahaan memimpin dengan cepat pada presentasi hari Senin; begitulah cara kerja ceramah. Ketika SVP Craig Federighi tidak melakukan terjun payung atau melakukan parkour dengan bantuan keajaiban Hollywood (well, Cupertino), Apple bertekad untuk menunjukkan bahwa model internalnya sama mumpuninya dengan pesaingnya.

Juri masih belum bisa menjawab pertanyaan tersebut, karena versi beta baru dirilis pada hari Senin, namun perusahaan tersebut telah mengungkapkan beberapa hal yang membuat pendekatan mereka terhadap AI generatif berbeda. Yang pertama dan terpenting adalah ruang lingkup. Banyak perusahaan terkemuka di dunia ini mengambil pendekatan yang lebih besar dan lebih baik terhadap model mereka. Tujuan dari sistem ini adalah untuk menjadi semacam toko serba ada bagi informasi dunia.

Sebaliknya, pendekatan Apple terhadap kategori ini didasarkan pada sesuatu yang lebih pragmatis. Apple Intelligence adalah pendekatan yang lebih khusus untuk AI generatif, yang dibangun secara khusus dengan berbagai sistem operasi perusahaan sebagai fondasinya. Ini adalah pendekatan Apple dalam artian mengutamakan pengalaman pengguna tanpa hambatan di atas segalanya.

Apple Intelligence di satu sisi merupakan upaya branding, namun di sisi lain, perusahaan lebih memilih aspek AI generatif untuk menyatu dengan sistem operasi. Tidak masalah – atau bahkan lebih disukai – jika pengguna tidak memiliki konsep tentang teknologi dasar yang menggerakkan sistem ini. Begitulah cara kerja produk Apple.

Menjaga model tetap kecil

Kunci dari hal ini adalah menciptakan model yang lebih kecil: melatih sistem pada kumpulan data khusus yang dirancang khusus untuk jenis fungsionalitas yang dibutuhkan oleh pengguna sistem operasinya. Belum jelas seberapa besar pengaruh ukuran model ini terhadap masalah kotak hitam, namun Apple berpendapat bahwa, paling tidak, memiliki lebih banyak model dengan topik spesifik akan meningkatkan transparansi mengenai alasan sistem mengambil keputusan tertentu.

Karena sifat model ini yang relatif terbatas, Apple tidak memperkirakan akan ada banyak variasi saat meminta sistem untuk, misalnya, meringkas teks. Namun pada akhirnya, variasi dari perintah ke perintah bergantung pada panjang teks yang diringkas. Sistem operasi juga dilengkapi mekanisme umpan balik di mana pengguna dapat melaporkan masalah dengan sistem AI generatif.

Meskipun Apple Intelligence jauh lebih fokus dibandingkan model yang lebih besar, Apple Intelligence dapat mencakup spektrum permintaan, berkat penyertaan “adaptor”, yang dikhususkan untuk berbagai tugas dan gaya. Namun secara umum, pendekatan Apple bukanlah pendekatan “lebih besar, lebih baik” dalam membuat model, karena hal-hal seperti ukuran, kecepatan, dan daya komputasi perlu dipertimbangkan — terutama ketika menangani model pada perangkat.

ChatGPT, Gemini dan lainnya

Membuka diri terhadap model pihak ketiga seperti ChatGPT OpenAI masuk akal ketika mempertimbangkan terbatasnya fokus model Apple. Perusahaan melatih sistemnya secara khusus untuk pengalaman macOS/iOS, jadi akan ada banyak informasi yang berada di luar cakupannya. Jika sistem menganggap aplikasi pihak ketiga lebih cocok untuk memberikan respons, perintah sistem akan menanyakan apakah Anda ingin membagikan informasi tersebut secara eksternal. Jika Anda tidak menerima perintah seperti ini, permintaan sedang diproses dengan model internal Apple.

Ini harus berfungsi sama dengan semua model eksternal yang bermitra dengan Apple, termasuk Google Gemini. Ini adalah salah satu contoh langka di mana sistem akan menarik perhatian pada penggunaan AI generatif dengan cara ini. Keputusan ini dibuat, sebagian, untuk meredam segala masalah privasi. Setiap perusahaan memiliki standar berbeda dalam hal pengumpulan dan pelatihan data pengguna.

Mewajibkan pengguna untuk ikut serta setiap kali akan menghilangkan sebagian tanggung jawab dari Apple, meskipun hal itu menambah hambatan dalam prosesnya. Anda juga dapat memilih untuk tidak menggunakan platform pihak ketiga di seluruh sistem, meskipun hal ini akan membatasi jumlah data yang dapat diakses oleh sistem operasi/Siri. Namun, Anda tidak dapat memilih keluar dari Apple Intelligence sekaligus. Sebaliknya, Anda harus melakukannya berdasarkan fitur demi fitur.

Komputasi Cloud Pribadi

Sebaliknya, apakah sistem memproses kueri tertentu pada perangkat atau melalui server jarak jauh dengan Private Cloud Compute, tidak akan dijelaskan. Filosofi Apple adalah bahwa pengungkapan seperti itu tidak diperlukan, karena servernya memiliki standar privasi yang sama dengan perangkatnya, hingga silikon pihak pertama yang digunakannya.

Salah satu cara untuk mengetahui dengan pasti apakah kueri dikelola di dalam atau di luar perangkat adalah dengan memutuskan sambungan mesin Anda dari internet. Jika masalah memerlukan komputasi awan untuk menyelesaikannya, tetapi mesin tidak dapat menemukan jaringan, mesin akan memunculkan kesalahan yang menyatakan bahwa mesin tidak dapat menyelesaikan tindakan yang diminta.

Apple menguraikan secara spesifik seputar tindakan mana yang memerlukan pemrosesan berbasis cloud. Ada beberapa faktor yang berperan dalam hal ini, dan sifat sistem yang selalu berubah berarti bahwa sesuatu yang memerlukan komputasi awan saat ini mungkin dapat diselesaikan di perangkat besok. Komputasi pada perangkat tidak selalu menjadi pilihan yang lebih cepat, karena kecepatan adalah salah satu parameter yang diperhitungkan oleh Intelijen Apple saat menentukan tempat memproses perintah.

Namun, ada operasi tertentu yang akan selalu dilakukan di perangkat. Yang paling menonjol adalah Image Playground, karena model difusi penuh disimpan secara lokal. Apple mengubah modelnya sehingga menghasilkan gambar dalam tiga gaya rumah berbeda: animasi, ilustrasi, dan sketsa. Gaya animasinya terlihat mirip dengan gaya rumah perusahaan lain yang didirikan Steve Jobs. Demikian pula, pembuatan teks saat ini tersedia dalam tiga gaya: ramah, profesional, dan ringkas.

Bahkan pada tahap beta awal ini, pembuatan Image Playground sangat cepat, seringkali hanya membutuhkan waktu beberapa detik. Mengenai pertanyaan tentang inklusi saat membuat gambar orang, sistem mengharuskan Anda memasukkan input secara spesifik, bukan hanya menebak-nebak hal-hal seperti etnis.

Bagaimana Apple akan menangani kumpulan data

Model Apple dilatih berdasarkan kombinasi kumpulan data berlisensi dan dengan merayapi informasi yang dapat diakses publik. Yang terakhir ini dicapai dengan AppleBot. Perayap web perusahaan telah ada selama beberapa waktu sekarang, menyediakan data kontekstual ke aplikasi seperti Spotlight, Siri dan Safari. Perayap sudah memiliki fitur penyisihan untuk penerbit.

“Dengan Applebot-Exended,” catatan Apple, “penerbit web dapat memilih untuk tidak mengizinkan konten situs web mereka digunakan untuk melatih model dasar Apple yang mendukung fitur AI generatif di seluruh produk Apple, termasuk Intelijen, Layanan, dan Alat Pengembang Apple.”

Hal ini dicapai dengan memasukkan prompt dalam kode situs web. Dengan munculnya Apple Intelligence, perusahaan telah memperkenalkan perintah kedua, yang memungkinkan situs dimasukkan dalam hasil pencarian tetapi dikecualikan untuk pelatihan model AI generatif.

AI yang bertanggung jawab

Apple merilis whitepaper pada hari pertama WWDC berjudul, “Memperkenalkan Model Fondasi Pada Perangkat dan Server Apple.” Hal ini antara lain menyoroti prinsip-prinsip yang mengatur model AI perusahaan. Secara khusus, Apple menyoroti empat hal:

  1. “Berdayakan pengguna dengan alat cerdas: Kami mengidentifikasi area di mana AI dapat digunakan secara bertanggung jawab untuk menciptakan alat guna memenuhi kebutuhan spesifik pengguna. Kami menghormati cara pengguna kami memilih untuk menggunakan alat ini untuk mencapai tujuan mereka.”
  2. “Mewakili pengguna kami: Kami menciptakan produk yang sangat personal dengan tujuan mewakili pengguna di seluruh dunia secara autentik. Kami bekerja terus menerus untuk menghindari melanggengkan stereotip dan bias sistemik di seluruh alat dan model AI kami.”
  3. “Desain dengan hati-hati: Kami melakukan tindakan pencegahan di setiap tahap proses kami, termasuk desain, pelatihan model, pengembangan fitur, dan evaluasi kualitas untuk mengidentifikasi bagaimana alat AI kami dapat disalahgunakan atau berpotensi menimbulkan bahaya. Kami akan terus dan secara proaktif meningkatkan alat AI kami dengan bantuan masukan dari pengguna.”
  4. “Melindungi privasi: Kami melindungi privasi pengguna kami dengan pemrosesan pada perangkat yang kuat dan infrastruktur inovatif seperti Private Cloud Compute. Kami tidak menggunakan data pribadi pribadi atau interaksi pengguna saat melatih model dasar kami.”

Pendekatan khusus Apple terhadap model dasar memungkinkan sistem disesuaikan secara khusus dengan pengalaman pengguna. Perusahaan telah menerapkan pendekatan UX-first ini sejak kedatangan Mac pertama. Memberikan pengalaman senyaman mungkin akan bermanfaat bagi pengguna, namun hal ini tidak boleh dilakukan dengan mengorbankan privasi.

Ini akan menjadi aplikasi penyeimbang yang sulit yang harus dinavigasi oleh perusahaan karena versi OS beta saat ini mencapai ketersediaan umum tahun ini. Pendekatan yang ideal adalah memberikan informasi sebanyak — atau sedikit — sesuai kebutuhan pengguna akhir. Tentu saja akan ada banyak orang yang tidak peduli, misalnya, apakah kueri dijalankan di mesin atau di cloud atau tidak. Mereka puas dengan sistem default yang paling akurat dan efisien.

Bagi pendukung privasi dan pihak lain yang tertarik dengan hal-hal spesifik tersebut, Apple harus mengupayakan transparansi sebanyak mungkin kepada pengguna — belum lagi transparansi bagi penerbit yang mungkin memilih untuk tidak menggunakan sumber konten mereka untuk melatih model-model ini. Ada beberapa aspek yang membuat masalah kotak hitam saat ini tidak dapat dihindari, namun dalam kasus di mana transparansi dapat ditawarkan, hal tersebut harus tersedia berdasarkan permintaan pengguna.

Sumber