Di laut gadget berkemampuan AI di CES, the kelinci r1 (semuanya menggunakan huruf kecil, tegas mereka) menonjol bukan hanya karena hasil catnya yang tinggi dan faktor bentuknya yang unik, namun juga karena dedikasinya terhadap hal tersebut. Perusahaan berharap Anda akan membawa perangkat kedua untuk menghindari kesulitan membuka ponsel — dan telah melakukan upaya teknis yang luar biasa untuk membuatnya berfungsi.

Ide di balik $200 r1 sederhana: ini memungkinkan Anda menyimpan ponsel di saku saat Anda perlu melakukan beberapa tugas sederhana seperti memesan mobil ke lokasi Anda, mencari beberapa tempat makan di mana Anda bertemu teman, atau mencari beberapa pilihan penginapan untuk akhir pekan di pinggir pantai.

“Kami tidak mencoba mematikan ponsel Anda,” kata CEO dan pendiri Jesse Lyu dalam panggilan telepon dengan pers menjelang pameran teknologi di Las Vegas. “Ponsel adalah perangkat hiburan, namun jika Anda mencoba menyelesaikan sesuatu, ponsel bukanlah mesin dengan efisiensi tertinggi. Untuk mengatur makan malam bersama rekan kerja, kami memerlukan 4-5 aplikasi berbeda untuk bekerja sama. Model bahasa besar adalah solusi universal untuk bahasa alami, kami menginginkan solusi universal untuk layanan ini — mereka seharusnya dapat memahami Anda.”

Alih-alih mengeluarkan ponsel Anda, membuka kuncinya, menemukan aplikasi, membukanya, dan mengerjakan UI Anda (sangat melelahkan!), Anda malah mengeluarkan r1 dan memberinya perintah dalam bahasa alami:

“Hubungi Uber XL untuk membawa kami ke Museum of Modern Art.”

“Beri saya daftar 5 restoran murah dalam jarak 10 menit berjalan kaki dari sana.”

“Buat daftar kabin dengan ulasan terbaik untuk 6 orang dewasa di Airbnb dalam jarak 10 mil dari Seaside, tidak lebih dari $300 per malam.”

R1 melakukan apa yang Anda minta dan beberapa detik kemudian memberikan konfirmasi dan konten apa pun yang mungkin Anda minta.

Kedengarannya familiar, bukan? Bagaimanapun, itulah yang seharusnya dilakukan oleh apa yang disebut “asisten AI” kami selama lima atau enam tahun terakhir. “Siri, lakukan ini”, “Hai Google, lakukan itu.” Kamu benar! Namun ada satu perbedaan besar.

Siri dan Google Assistant dan Alexa dan yang lainnya akan lebih baik dijelaskan pada “antarmuka suara untuk aplikasi mini khusus,” sama sekali tidak seperti model bahasa yang banyak dari kita mulai ngobrol selama setahun terakhir. Saat Anda meminta Google untuk mengambilkan Lyft ke lokasi Anda saat ini, Google menggunakan Lyft API resmi untuk mengirimkan informasi yang relevan dan mendapatkan respons kembali — pada dasarnya ini hanya dua mesin yang berbicara satu sama lain.

Bukan berarti ada yang salah dengan hal itu — namun apa yang dapat Anda lakukan melalui API seringkali sangat terbatas. Dan tentu saja harus ada hubungan resmi antara asisten dan aplikasi, koneksi yang disetujui dan berbayar. Jika aplikasi yang Anda sukai tidak berfungsi dengan Siri, atau API yang dapat diakses Alexa sudah usang, Anda kurang beruntung. Dan bagaimana dengan beberapa aplikasi khusus yang terlalu kecil untuk mendapatkan kesepakatan resmi dengan Google?

Apa yang dirancang oleh kelinci lebih mirip dengan tipe AI “agen” yang telah kita lihat selama setahun terakhir, yaitu model pembelajaran mesin yang dilatih pada antarmuka pengguna biasa seperti situs web dan aplikasi. Hasilnya, mereka dapat memesan pizza tidak melalui API khusus Domino, namun dengan cara yang sama seperti yang dilakukan manusia: dengan mengeklik tombol dan kolom biasa di web atau aplikasi seluler biasa.

Kredit Gambar: kelinci

Perusahaan ini melatih “model aksi besar” atau LAM miliknya pada tangkapan layar dan video aplikasi umum yang tak terhitung jumlahnya, dan sebagai hasilnya, ketika Anda memintanya untuk memutar album lama Bob Dylan di Spotify, perusahaan tersebut tidak tersesat di tengah jalan. Ia dapat membuka halaman artis Dylan, mengatur album berdasarkan tanggal rilis, menggulir ke bawah, dan mengantri ke salah satu album terlama. Atau bagaimanapun Anda melakukannya.

Anda dapat melihat prosesnya di video dalam video kelinci di sini.

Ia sudah mengetahui cara bekerja dengan banyak aplikasi dan layanan umum, namun jika Anda memilikinya, ia tidak mengetahuinya, kelinci mengklaim r1 dapat belajar hanya dengan melihat Anda menggunakan aplikasi tersebut sebentar — meskipun mode pengajaran ini tidak akan berhasil. tidak tersedia saat peluncuran. (Lyu bilang mereka membuatnya berfungsi di Diablo 4, jadi mungkin bisa menangani AllTrails.)

Namun tentu saja r1 tidak bisa menekan tombol-tombol tersebut di aplikasi sendiri — karena satu hal, ia tidak memiliki jari untuk menekannya, dan satu lagi, ia tidak memiliki akun. Untuk masalah kedua, kelinci menyiapkan apa yang disebutnya “lubang kelinci”, sebuah platform tempat Anda mengaktifkan layanan dengan kredensial login Anda, yang tidak disimpan. Setelah aktif, server mengoperasikan aplikasi menggunakan penekanan tombol biasa seperti yang Anda lakukan, tetapi dalam lingkungan yang ditiru (mereka tidak terlalu spesifik tentang hal ini).

“Anggap saja seperti memberikan ponsel Anda ke asisten Anda,” kata Lyu, dengan asumsi kita semua sudah familiar dengan kemudahan tersebut. “Yang kami lakukan hanyalah menekan tombol ini untuk Anda. Dan yang mereka lihat di backend mereka hanyalah Anda mencoba melakukan sesuatu. Ini sepenuhnya legal dan sesuai dengan ketentuan layanan mereka.”

Lebih kecil, lebih murah, lebih cepat

Perusahaan jelas melakukan banyak pekerjaan di sisi teknis, tetapi pertanyaan sebenarnya adalah apakah ada orang yang benar-benar ingin membawa benda ini selain telepon. Harganya $200, tanpa berlangganan, meskipun Anda harus menyediakan kartu SIM. Itu lebih murah daripada AirPods, dan memberikan banyak janji menyenangkan.

Kredit Gambar: kelinci

Satu hal yang jelas menariknya adalah tampilannya. Seperti jika Playdate memiliki sepupu pendiri startup yang mengendarai Tesla berwarna merah cerah dengan pelat rias (Anda pasti tahu tipenya). Ini dirancang oleh Teenage Engineering, yang menjadikan segalanya berharga saat ini.

Anda mungkin bertanya, mengapa ada layar pada sesuatu yang seharusnya Anda ajak bicara? Nah, layar tersebut diperlukan untuk menampilkan hal-hal visual seperti hasil pencariannya, atau mengonfirmasi lokasi Anda. Saya punya dua pikiran di sini. Seseorang berpikir, bagaimana lagi Anda akan melakukannya? Yang lain berpikir, jika Anda perlu mengonfirmasi semua hal ini terlebih dahulu mengapa tidak menggunakan ponsel di saku Anda yang lain saja?

Jelas sekali kru di kelinci berpikir bahwa memunculkan gadget kecil (3″x3″x0.5″) dan ringan (115 gram) ini dan mengatakan apa yang Anda inginkan, lalu menggunakan roda gulir dan tombol untuk menavigasi hasilnya adalah pengalaman yang lebih sederhana daripada menggunakan aplikasi dalam banyak kasus. Dan saya dapat melihat bahwa hal tersebut mungkin benar adanya — banyak aplikasi yang dirancang dengan buruk dan kini juga mempunyai bahaya tambahan berupa iklan.

Tapi kenapa kameranya? Itu salah satu fitur yang saya tidak bisa mendapatkan jawaban langsungnya. Ia memiliki poros magnet/mengambang bebas yang menarik sehingga berputar sejajar dan mengarah ke arah mana pun yang Anda inginkan. Tampaknya ada beberapa fitur yang belum siap diluncurkan, tetapi pikirkan “berapa banyak kalori yang ada dalam sekantong permen ini?” atau “siapa yang merancang bangunan ini?” dan hal semacam itu. Panggilan video dan media sosial mungkin akan segera hadir.

Perangkat ini sudah tersedia untuk pre-order sekarang, dan Lyu mengatakan mereka berencana mengirimkannya ke AS pada akhir Maret.

Persaingan yang menakutkan

Pertanyaan besarnya pada akhirnya bukanlah apakah kelinci r1 berhasil dalam apa yang telah direncanakannya – dari apa yang saya tahu, ia berhasil – tetapi apakah pendekatan tersebut dapat dilakukan dalam menghadapi tantangan yang sangat kuat. kompetisi.

Google, Apple, Microsoft, OpenAI, Anthropic, Amazon, Meta — masing-masing dari mereka dan banyak lagi lainnya bekerja keras untuk menciptakan agen pembelajaran mesin yang lebih hebat setiap hari. Bahaya terbesar bagi kelinci bukanlah tidak ada yang mau membelinya, tapi dalam enam bulan, perusahaan bernilai seratus miliar dolar membuat agen tindakannya sendiri yang melakukan 80% dari apa yang dilakukan kelinci dan membuatnya dapat diakses secara gratis di perangkat Anda. telepon pintar.

Saya bertanya kepada Lyu apakah hal ini mengkhawatirkan dia dan perusahaannya, yang memiliki 17 karyawan dan skalanya tidak sama.

“Tentu saja kami khawatir,” jawabnya, “Kami adalah sebuah startup. namun hanya karena mereka mampu melakukannya bukan berarti kita harus berhenti.”

Dia menunjukkan bahwa meskipun sumber daya mereka sangat besar, perusahaan-perusahaan ini juga tidak memiliki ketangkasan sebagai sebuah startup, yang saat ini mengirimkan apa yang mungkin akan mereka kirimkan nanti, dan juga datanya. Model bahasa, ujarnya, “didasarkan pada resep terbuka – lima makalah, itu saja.” Kecil kemungkinannya untuk membuat parit di sana. Namun LAM kelinci dibuat berdasarkan data kepemilikan dan ditujukan untuk pengalaman pengguna yang sangat spesifik pada perangkat yang sangat spesifik.

Meski begitu, meskipun kelinci r1 lebih bagus atau imut, orang lebih menyukai kesederhanaan dan kenyamanan. Mengapa mereka membayar uang untuk membawa perangkat kedua padahal perangkat pertama mereka melakukan sebagian besar tugas tersebut? Dalam jangka pendek, jawabannya adalah ya: Lyu mengatakan pre-order sedang menumpuk. Akankah kelinci hidup untuk menghasilkan generasi berikutnya, mungkin r2? Bahkan jika tidak, perangkat kecil yang menarik ini mungkin akan tetap hidup dalam ingatan kita sebagai contoh ambisius yang sesuai dari hype zeitgest AI.

Baca selengkapnya tentang CES 2024 di TechCrunch

Sumber