Sebuah startup asal Finlandia menelepon Komputasi Aliran membuat salah satu klaim paling liar yang pernah terdengar dalam rekayasa silikon: dengan menambahkan chip pendamping miliknya, CPU apa pun dapat langsung melipatgandakan kinerjanya, meningkat hingga 100x dengan penyesuaian perangkat lunak.

Jika berhasil, hal ini dapat membantu industri memenuhi permintaan komputasi yang tak terpuaskan dari para pembuat AI.

Flow adalah hasil dari VTT, sebuah organisasi penelitian yang didukung negara Finlandia yang mirip dengan laboratorium nasional. Teknologi chip yang dikomersialkan, yang diberi nama Parallel Processing Unit, adalah hasil penelitian yang dilakukan di lab tersebut (walaupun VTT adalah investor, IP-nya dimiliki oleh Flow).

Klaim tersebut, yang pertama kali diakui oleh Flow, memang menggelikan. Anda tidak bisa secara ajaib memeras kinerja ekstra dari CPU di seluruh arsitektur dan basis kode. Jika demikian, Intel atau AMD atau siapa pun telah melakukannya bertahun-tahun yang lalu.

Tapi Flow telah mengerjakan sesuatu itu memiliki secara teori mungkin terjadi — hanya saja belum ada yang mampu melakukannya.

Unit Pemrosesan Pusat (Central Processing Unit) telah mengalami banyak kemajuan sejak masa awal munculnya tabung vakum dan kartu berlubang, namun dalam beberapa hal mendasar, unit ini masih tetap sama. Keterbatasan utama mereka adalah sebagai prosesor serial dan bukan paralel, mereka hanya dapat melakukan satu hal dalam satu waktu. Tentu saja, mereka mengalihkan hal tersebut satu miliar kali per detik ke berbagai inti dan jalur — namun semua ini adalah cara untuk mengakomodasi sifat satu jalur dari CPU. (Sebaliknya, GPU melakukan banyak kalkulasi terkait sekaligus, namun dikhususkan pada operasi tertentu.)

“CPU adalah mata rantai terlemah dalam komputasi,” kata salah satu pendiri dan CEO Flow, Timo Valtonen. “Hal ini tidak sesuai dengan tugasnya, dan hal ini perlu diubah.”

CPU menjadi sangat cepat, namun bahkan dengan responsivitas tingkat nanodetik, terdapat banyak sekali pemborosan dalam cara pelaksanaan instruksi hanya karena keterbatasan dasar bahwa satu tugas harus diselesaikan sebelum tugas berikutnya dimulai. (Saya menyederhanakannya di sini, bukan menjadi insinyur chip sendiri.)

Apa yang Flow klaim telah lakukan adalah menghilangkan batasan ini, mengubah CPU dari jalan satu jalur menjadi jalan raya multi jalur. CPU masih terbatas untuk melakukan satu tugas pada satu waktu, namun PPU Flow, begitu mereka menyebutnya, pada dasarnya melakukan manajemen lalu lintas skala nanodetik untuk memindahkan tugas ke dalam dan ke luar prosesor lebih cepat dari yang mungkin dilakukan sebelumnya.

Bayangkan CPU sebagai koki yang bekerja di dapur. Koki hanya bisa bekerja begitu cepat, tapi bagaimana jika orang tersebut memiliki asisten manusia super yang menukarkan pisau dan peralatan keluar-masuk tangan koki, membersihkan makanan yang sudah disiapkan dan memasukkan bahan-bahan baru, menghapus semua tugas yang bukan merupakan tugas koki sebenarnya? Koki masih hanya memiliki dua tangan, namun kini koki dapat bekerja sepuluh kali lebih cepat.

Bagan (dalam log, catatan) menunjukkan peningkatan pada chip yang ditingkatkan FPGA PPU vs chip Intel yang tidak dimodifikasi. Meningkatkan jumlah inti PPU terus meningkatkan kinerja.
Kredit Gambar: Komputasi Aliran

Ini bukan analogi yang sempurna, tetapi ini memberi Anda gambaran tentang apa yang terjadi di sini, setidaknya menurut pengujian internal dan demo Flow dengan industri (dan mereka berbicara dengan semua orang). PPU tidak meningkatkan frekuensi clock atau mendorong sistem dengan cara lain yang dapat menyebabkan panas atau daya ekstra; dengan kata lain, koki tidak diminta memotong dua kali lebih cepat. Itu hanya menggunakan siklus CPU yang sudah berlangsung secara lebih efisien.

Hal semacam ini bukanlah hal baru, kata Valtonen. “Ini telah dipelajari dan dibahas di kalangan akademisi tingkat tinggi. Anda sudah dapat melakukan paralelisasi, tetapi itu merusak kode lama, dan kemudian tidak ada gunanya.”

Jadi itu bisa dilakukan. Itu tidak bisa dilakukan tanpa menulis ulang semua kode di dunia dari awal, yang membuatnya tidak dapat dimulai. Masalah serupa diselesaikan oleh perusahaan komputasi Nordik lainnya, ZeroPoint, yang mencapai kompresi memori tingkat tinggi sekaligus menjaga transparansi data dengan seluruh sistem.

Dengan kata lain, pencapaian besar Flow bukanlah manajemen lalu lintas berkecepatan tinggi, melainkan melakukannya tanpa harus mengubah kode apa pun pada CPU atau arsitektur apa pun yang telah diuji. Kedengarannya tidak masuk akal untuk mengatakan bahwa kode arbitrer dapat dieksekusi dua kali lebih cepat pada chip apa pun tanpa modifikasi apa pun selain mengintegrasikan PPU dengan dadu.

Di sinilah letak tantangan utama keberhasilan Flow sebagai sebuah bisnis: tidak seperti produk perangkat lunak, teknologi Flow perlu disertakan pada tingkat desain chip, yang berarti teknologi tersebut tidak berfungsi secara surut, dan chip pertama dengan PPU tentu saja akan menjadi solusi yang tepat. di jalan. Flow telah menunjukkan bahwa teknologi tersebut berfungsi dalam pengaturan pengujian berbasis FPGA, namun pembuat chip harus mengerahkan cukup banyak sumber daya untuk melihat keuntungan yang dimaksud.

Tim pendiri Flow, dari kiri: Jussi Roivainen, Martti Forsell, dan Timo Valtonen.
Kredit Gambar: Komputasi Aliran

Besarnya keuntungan tersebut, dan fakta bahwa peningkatan CPU bersifat iteratif dan fraksional selama beberapa tahun terakhir, mungkin akan membuat para pembuat chip tersebut segera mengetuk pintu Flow. Jika Anda benar-benar dapat menggandakan kinerja Anda dalam satu generasi dengan satu perubahan tata letak, itu adalah hal yang mudah.

Peningkatan kinerja lebih lanjut berasal dari pemfaktoran ulang dan kompilasi ulang perangkat lunak agar bekerja lebih baik dengan kombinasi PPU-CPU. Flow mengatakan telah terjadi peningkatan hingga 100x dengan kode yang telah dimodifikasi (meskipun belum tentu ditulis ulang sepenuhnya) untuk memanfaatkan teknologinya. Perusahaan berupaya menawarkan alat kompilasi ulang untuk mempermudah tugas ini bagi pembuat perangkat lunak yang ingin mengoptimalkan chip yang mendukung Flow.

Analis Kevin Krewell dari Penelitian Tiriasyang diberi pengarahan tentang teknologi Flow dan disebut sebagai perspektif luar mengenai masalah ini, lebih mengkhawatirkan penyerapan industri dibandingkan fundamentalnya.

Dia menunjukkan, dengan tepat, bahwa akselerasi AI adalah pasar terbesar saat ini, sesuatu yang dapat ditargetkan dengan silikon khusus seperti H100 milik Nvidia yang populer. Meskipun CPU dengan akselerasi PPU akan menghasilkan keuntungan secara keseluruhan, para pembuat chip mungkin tidak ingin terlalu memaksakan diri. Dan yang menjadi pertanyaan adalah apakah perusahaan-perusahaan tersebut bersedia menginvestasikan sumber daya yang signifikan pada teknologi yang sebagian besar belum terbukti ketika mereka mungkin memiliki rencana lima tahun yang akan kecewa dengan pilihan tersebut.

Akankah teknologi Flow menjadi komponen yang wajib dimiliki oleh setiap pembuat chip di luar sana, sehingga melambungkannya menjadi kaya dan terkenal? Atau akankah para pembuat chip yang mempunyai dana terbatas memutuskan untuk tetap mengikuti jalur dan terus mengambil keuntungan dari pasar komputasi yang terus berkembang? Mungkin berada di antara keduanya – namun hal ini menunjukkan bahwa, meskipun Flow telah mencapai prestasi teknik yang besar di sini, seperti semua startup, masa depan perusahaan bergantung pada pelanggannya.

Flow kini muncul secara diam-diam, dengan pendanaan awal sebesar €4 juta (sekitar $4,3 juta) yang dipimpin oleh Butterfly Ventures, dengan partisipasi dari FOV Ventures, Sarsia, Stephen Industries, Superhero Capital, dan Business Finland.

Sumber