X.ai, startup AI milik Elon Musk, telah meluncurkan model AI generatif terbarunya, Grok-1.5. Ditetapkan untuk mendukung chatbot Grok jaringan sosial X dalam waktu yang tidak lama lagi (“dalam beberapa hari mendatang,” tulis X.ai dalam a postingan blog), Grok-1.5 tampaknya merupakan peningkatan yang terukur dibandingkan pendahulunya, Grok-1 — setidaknya dilihat dari hasil benchmark dan spesifikasi yang diterbitkan X.

Grok-1.5 mendapat manfaat dari “peningkatan penalaran,” menurut X.ai, terutama dalam hal pengkodean dan tugas-tugas yang berhubungan dengan matematika. Model ini menggandakan skor Grok-1 lebih dari dua kali lipat pada tolok ukur matematika populer, MATH, dan mendapat skor lebih dari sepuluh poin persentase lebih baik pada tes HumanEval dalam pembuatan bahasa pemrograman dan kemampuan pemecahan masalah.

Tentu saja, sulit untuk memprediksi bagaimana hasil tersebut akan diterapkan dalam penggunaan sebenarnya. Seperti yang baru-baru ini kami tulis, tolok ukur AI yang umum digunakan, yang mengukur hal-hal esoteris seperti kinerja pada soal-soal ujian kimia tingkat pascasarjana, kurang mampu menangkap bagaimana rata-rata orang berinteraksi dengan model saat ini.

Satu perbaikan itu sebaiknya menghasilkan keuntungan yang dapat diamati adalah jumlah konteks yang dapat diambil oleh Grok-1.5 dibandingkan dengan Grok-1.

Grok-1.5 memiliki konteks 128.000 token — “token” mengacu pada potongan teks mentah (misalnya, kata “fantastis” dibagi menjadi “fan,” “tas” dan “tic”). Konteks, atau jendela konteks, mengacu pada data masukan (dalam hal ini, teks) yang dipertimbangkan model sebelum menghasilkan keluaran (lebih banyak teks). Model dengan jendela konteks kecil cenderung melupakan konten percakapan terkini, sedangkan model dengan konteks lebih besar menghindari kesalahan ini — dan, sebagai manfaat tambahan, lebih memahami aliran data yang diambil.

“[Grok-1.5 can] memanfaatkan informasi dari dokumen yang jauh lebih panjang,” tulis X.ai dalam postingan blog tersebut di atas. “Selain itu, model ini dapat menangani perintah yang lebih panjang dan kompleks sambil tetap mempertahankan kemampuan mengikuti instruksi seiring dengan perluasan jendela konteksnya.”

Yang secara historis membedakan model Grok X.ai dengan model AI generatif lainnya adalah model tersebut menjawab pertanyaan tentang topik yang biasanya tidak dapat diakses oleh model lain, seperti konspirasi dan gagasan politik yang lebih kontroversial. Para model juga menjawab pertanyaan dengan “sifat memberontak,” seperti yang digambarkan Musk, dan dengan bahasa kasar jika diminta.

Tidak jelas perubahan apa, jika ada, yang dibawa oleh Grok-1.5 di area ini. X.ai tidak menyinggung hal ini di postingan blognya.

Grok-1.5 akan segera tersedia untuk penguji awal X, kata X.ai, disertai dengan “beberapa fitur baru.” Musk sebelumnya mengisyaratkan untuk meringkas rangkaian pesan dan balasan serta menyarankan konten untuk postingan.

Pengumuman Grok-1.5 muncul setelah X.ai membuat Grok-1 menjadi open source, meskipun tanpa kode yang diperlukan untuk menyempurnakan atau melatihnya lebih lanjut. Baru-baru ini, Musk mengatakan bahwa lebih banyak pengguna di X – khususnya mereka yang membayar paket Premium X sebesar $8 per bulan – akan mendapatkan akses ke Grok, chatbot, yang sebelumnya hanya tersedia untuk pelanggan X Premium+ (yang membayar $16 per bulan).

Sumber