Betaworks merangkul tren AI bukan dengan LLM lain, melainkan serangkaian model tipe agen yang mengotomatiskan tugas sehari-hari yang tidak mudah untuk didefinisikan. Inkubator “Camp” terbaru milik investor ini melatih dan mendanai 9 startup agen AI yang mereka harap dapat melakukan tugas-tugas yang lebih membosankan saat ini.

Kasus penggunaan di banyak perusahaan ini terdengar menjanjikan, namun AI cenderung kesulitan menepati janjinya. Apakah Anda memercayai AI baru yang cemerlang untuk menyortir email untuk Anda? Bagaimana dengan mengekstraksi dan menyusun informasi dari halaman web? Adakah yang keberatan dengan pertemuan penempatan AI di tempat kerja?

Ada elemen kepercayaan yang belum dibangun pada layanan ini, sesuatu yang terjadi pada sebagian besar teknologi yang mengubah cara kita bertindak. Menanyakan arah pada MapQuest terasa aneh hingga akhirnya tidak terjadi — dan kini navigasi GPS menjadi alat sehari-hari. Namun apakah agen AI berada pada tahap itu? CEO dan pendiri Betaworks John Borthwick berpendapat demikian. (Pengungkapan: Mantan editor TechCrunch dan pembawa acara Disrupt Jordan Crook meninggalkan TC untuk bekerja di perusahaan tersebut.)

“Anda memasukkan sesuatu yang telah kami habiskan banyak waktu untuk memikirkannya,” katanya kepada TechCrunch. “Meskipun AI agen masih dalam tahap awal – dan terdapat permasalahan seputar tingkat keberhasilan agen, dll – kami melihat kemajuan luar biasa bahkan sejak Camp dimulai.”

Meskipun teknologinya akan terus meningkat, Borthwick menjelaskan beberapa pelanggan siap menerimanya dalam kondisi saat ini.

“Secara historis, kami telah melihat pelanggan melakukan lompatan keyakinan, bahkan dengan tugas yang berisiko lebih tinggi, jika suatu produk 'cukup baik'. Bill.com yang asli, meskipun melakukan hal-hal menarik dengan OCR dan pengikisan email, tidak selalu melakukannya dengan benar, dan pengguna masih memercayainya dengan transaksi senilai ribuan dolar karena membuat tugas yang buruk menjadi tidak terlalu buruk. Dan seiring waktu, melalui desain antarmuka yang sangat komunikatif, umpan balik dari pelanggan tersebut menciptakan produk yang lebih baik dan lebih dapat diandalkan,” katanya.

“Untuk saat ini, sebagian besar pengguna awal produk di Camp adalah pengembang, pendiri, dan pengguna teknologi awal, dan kelompok tersebut selalu bersedia dengan sabar menguji dan memberikan umpan balik terhadap produk-produk ini, yang pada akhirnya melompat ke arus utama.”

Betaworks Camp adalah akselerator tiga bulan di mana perusahaan terpilih dalam tema yang dipilih mendapatkan bantuan langsung dengan produk, strategi, dan koneksi mereka sebelum dikeluarkan dengan cek $500K — milik Betaworks sendiri, Mozilla Ventures, Differential Ventura, dan Batang AI. Namun sebelumnya para startup memamerkan karya mereka pada hari demo, 7 Mei.

Namun, kami telah melihat susunan pemainnya sebelumnya. Inilah tiga hal yang paling menarik bagi saya.

Twin mengotomatiskan tugas-tugas menggunakan “model tindakan” seperti yang telah kita dengar dari Rabbit selama beberapa bulan sekarang (tetapi belum dikirimkan). Dengan melatih model pada banyak data yang mewakili antarmuka perangkat lunak, model tersebut (klaim perusahaan-perusahaan ini) dapat mempelajari cara menyelesaikan tugas-tugas umum, hal-hal yang lebih kompleks daripada yang dapat ditangani oleh API, namun tidak terlalu banyak sehingga tidak dapat didelegasikan ke a “magang yang cerdas.” Kami sebenarnya menulisnya pada bulan Januari.

Jadi, alih-alih meminta teknisi backend membuat skrip khusus untuk melakukan tugas tertentu, Anda dapat mendemonstrasikan atau mendeskripsikan dalam bahasa biasa. Hal-hal seperti “letakkan semua resume yang kita dapatkan hari ini ke dalam folder di Dropbox dan ganti namanya dengan nama pelamar, lalu DM saya tautan berbagi di Slack.” Dan setelah Anda mengubah alur kerja tersebut (“Ups, kali ini tambahkan tanggal aplikasi ke nama file”), ini bisa menjadi cara baru agar proses tersebut bekerja. Mengotomatiskan 20% tugas yang menghabiskan 80% waktu kita adalah tujuan perusahaan — apakah perusahaan dapat melakukannya dengan biaya terjangkau mungkin merupakan pertanyaan sebenarnya. (Twin menolak menguraikan sifat model dan proses pelatihan mereka.)

Main ski bertujuan untuk memperbaiki proses yang terkadang menyakitkan dalam menemukan waktu pertemuan yang cocok untuk dua (atau tiga, atau empat…) orang. Anda cukup meng-cc bot di email atau thread Slack dan bot akan memulai proses merekonsiliasi ketersediaan dan preferensi semua orang. Jika ia memiliki akses ke jadwal, ia akan memeriksanya; jika seseorang mengatakan mereka lebih suka sore hari jika pada hari Kamis, itu berlaku; bisa dibilang beberapa orang mendapat prioritas; dan seterusnya. Siapa pun yang bekerja dengan asisten eksekutif yang terampil tahu bahwa mereka tidak dapat digantikan, tetapi kemungkinan besar setiap EA di luar sana lebih suka menghabiskan lebih sedikit waktu untuk tugas-tugas yang hanya berupa pertanyaan “Bagaimana kalau ini? TIDAK? Bagaimana dengan ini?”

Kredit Gambar: Main ski

Sebagai seorang misanthrope, saya tidak memiliki masalah penjadwalan ini, tapi saya menghargai orang lain yang memilikinya, dan juga lebih memilih solusi tipe “atur dan lupakan” di mana mereka hanya menyetujui hasilnya. Dan hal ini sesuai dengan kemampuan agen AI saat ini, yang tugas utamanya adalah memahami bahasa alami, bukan bentuk.

Jsonify adalah evolusi dari scraper situs web yang dapat mengekstrak data dari konteks yang relatif tidak terstruktur. Hal ini telah dilakukan sejak lama, namun mesin yang mengekstrak informasi tidak pernah secerdas ini. Jika dokumennya besar dan datar, dokumen tersebut akan berfungsi dengan baik — jika dokumen tersebut ada di tab di tempat atau daftar visual dengan kode buruk yang dimaksudkan agar manusia dapat mengkliknya, maka dokumen tersebut bisa gagal. Jsonify menggunakan pemahaman yang lebih baik tentang model AI visual saat ini untuk mengurai dan mengurutkan data dengan lebih baik yang mungkin tidak dapat diakses oleh crawler sederhana.

Kredit Gambar: Jsonify

Jadi Anda dapat melakukan pencarian opsi Airbnb di area tertentu, lalu meminta Jsonify memasukkan semuanya ke dalam daftar terstruktur dengan kolom harga, jarak dari bandara, peringkat, biaya tersembunyi, dll. Kemudian Anda dapat melakukan hal yang sama di Vacasa dan mengekstrak data yang sama — mungkin untuk tempat yang sama (saya melakukan ini dan menghemat sekitar $150 beberapa hari yang lalu, namun saya berharap dapat mengotomatiskan prosesnya). Atau, Anda tahu, melakukan hal-hal profesional.

Tapi bukankah ketidaktepatan yang melekat pada LLM membuat mereka menjadi alat yang patut dipertanyakan untuk pekerjaan itu? “Kami telah berhasil membangun pagar pembatas dan sistem pemeriksaan silang yang cukup kuat,” kata pendiri Ananth Manivannan. “Kami menggunakan beberapa model berbeda saat runtime untuk memahami halaman, yang memberikan beberapa validasi — dan LLM yang kami gunakan telah disesuaikan dengan kasus penggunaan kami, sehingga biasanya cukup andal bahkan tanpa lapisan pagar pembatas. Biasanya kami melihat akurasi ekstraksi 95%+, bergantung pada kasus penggunaan.”

Saya melihat semua ini mungkin berguna dalam bisnis teknologi apa pun. Kelompok lain sedikit lebih teknis atau situasional — berikut 6 sisanya:

  • AI yang terselesaikan – otomatisasi agen alur kerja cloud. Terasa berguna sampai integrasi yang dipesan lebih dahulu dapat menyusulnya.
  • Banjir – pengatur kotak masuk AI yang membaca email Anda dan menemukan hal-hal penting sambil menyiapkan tanggapan dan tindakan yang tepat.
  • AI yang dapat diperluas – apakah AI Anda mengalami kemunduran? Tanyakan kepada dokter Anda apakah Extensible adalah infra pengujian dan pencatatan yang tepat untuk penerapan Anda.
  • Lawan – karakter virtual yang dimaksudkan agar anak-anak dapat berinteraksi dan bermain secara ekstensif. Terasa seperti ladang ranjau secara etis dan legal, tetapi seseorang harus melewatinya.
  • Penelitian Dimensi Tinggi – pemutaran infra. Kerangka kerja untuk agen AI berbasis web dengan model bayar sesuai pemakaian, jadi jika eksperimen perusahaan Anda gagal, Anda hanya berhutang beberapa dolar.
  • Tubuh – AI generatif untuk robotika, bidang yang data pelatihannya relatif langka. Saya pikir itu adalah kata Afrika, tetapi itu hanya “mewujudkan.”

Tidak ada keraguan bahwa agen AI akan berperan dalam alur kerja perangkat lunak yang semakin terotomatisasi di masa depan, namun sifat dan cakupan peran tersebut masih belum tertulis. Jelas sekali bahwa Betaworks bertujuan untuk meluncurkannya lebih awal meskipun beberapa produknya belum siap untuk debut pasar massal.

Anda akan dapat melihat perusahaan tersebut memamerkan produk keagenan mereka pada tanggal 7 Mei.

Sumber