Tahun 2025 seharusnya menjadi tahun agen AI, bukan?
Kurang tepat, akui Google Cloud dan Replit — dua pemain besar di bidang agen AI dan bermitra dalam “pengkodean getaran” gerakan — di acara VB Impact Series baru-baru ini.
Bahkan ketika mereka membangun alat agen sendiri, para pemimpin dari kedua perusahaan tersebut mengatakan bahwa kemampuan mereka masih belum cukup.
Kenyataan yang terbatas ini disebabkan oleh permasalahan alur kerja lama, data yang terfragmentasi, dan model tata kelola yang belum matang. Selain itu, perusahaan pada dasarnya salah paham bahwa agen tidak seperti teknologi lainnya: Agen memerlukan pemikiran ulang dan pengerjaan ulang alur kerja dan proses secara mendasar.
Ketika perusahaan membangun agen untuk mengotomatisasi pekerjaan, “kebanyakan dari mereka adalah contoh mainan,” kata Amjad Masad, CEO dan pendiri Replit, dalam acara tersebut. “Mereka bersemangat, tapi ketika mereka mulai meluncurkannya, hasilnya tidak terlalu baik.”
Agen bangunan berdasarkan kesalahan Replit sendiri
Keandalan dan integrasi, bukan kecerdasan itu sendiri, adalah dua hambatan utama keberhasilan agen AI, kata Masad. Agen sering kali gagal ketika dijalankan dalam jangka waktu lama, menumpuk kesalahan, atau tidak memiliki akses ke data yang bersih dan terstruktur dengan baik.
Masalah dengan data perusahaan adalah datanya berantakan — terstruktur, tidak terstruktur, dan disimpan di mana-mana — dan merayapinya merupakan sebuah tantangan. Selain itu, ada banyak hal tidak tertulis yang dilakukan orang yang sulit dikodekan oleh agen, kata Masad.
“Gagasan bahwa perusahaan hanya akan mempekerjakan agen dan agen akan mengganti pekerja atau melakukan otomatisasi alur kerja secara otomatis, hal tersebut tidak terjadi saat ini,” katanya. “Peralatannya tidak ada.”
Melampaui agen adalah alat penggunaan komputer, yang dapat mengambil alih ruang kerja pengguna untuk tugas-tugas dasar seperti penelusuran web. Namun hal ini masih dalam tahap awal dan bisa jadi bermasalah, tidak dapat diandalkan, dan bahkan berbahaya, meskipun ada peningkatan yang pesat.
“Masalahnya adalah model penggunaan komputer saat ini sangat buruk,” kata Masad. “Harganya mahal, lambat, dan mengalami kemajuan, namun usianya baru sekitar satu tahun.”
Replit belajar dari kesalahannya awal tahun ini, ketika pembuat kode AI-nya dihapus seluruh basis kode perusahaan dalam uji coba. Masad mengakui: “Peralatannya belum cukup matang,” dan mencatat bahwa perusahaan telah mengisolasi pengembangan dari produksi.
Teknik seperti pengujian dalam loop, eksekusi yang dapat diverifikasi, dan isolasi pengembangan sangat penting, katanya, meskipun teknik tersebut membutuhkan banyak sumber daya. Replit menggabungkan kemampuan in-the-loop ke dalam versi 3 agennya, dan Masad mengatakan bahwa agen generasi berikutnya dapat bekerja secara mandiri selama 200 menit; beberapa telah menjalankannya selama 20 jam.
Namun, dia mengakui bahwa pengguna telah menyatakan rasa frustrasinya terhadap jeda waktu. Saat mereka memberikan “perintah yang besar dan kuat”, mereka mungkin harus menunggu 20 menit atau lebih. Idealnya, mereka telah menyatakan bahwa mereka ingin terlibat dalam lebih banyak lingkaran kreatif di mana mereka dapat memasukkan banyak perintah, mengerjakan banyak tugas sekaligus, dan menyesuaikan desain saat agen bekerja.
“Cara untuk mengatasinya adalah dengan paralelisme, dengan membuat banyak agen loop dan meminta mereka bekerja pada fitur-fitur independen ini sambil memungkinkan Anda melakukan pekerjaan kreatif pada saat yang sama,” katanya.
Agen membutuhkan perubahan budaya
Di luar perspektif teknis, terdapat kendala budaya: Agen beroperasi secara probabilistik, namun perusahaan tradisional disusun berdasarkan proses deterministik, kata Mike Clark, direktur pengembangan produk di Google Cloud. Hal ini menciptakan ketidakcocokan budaya dan operasional ketika LLM mulai menggunakan alat, kerangka kerja orkestrasi, dan proses yang semuanya baru.
“Kami tidak tahu bagaimana memikirkan agen,” kata Clark. “Kami tidak tahu bagaimana memecahkan masalah yang bisa dilakukan agen.”
Perusahaan yang melakukan hal yang benar didorong oleh proses yang bersifat bottom-up, katanya: pembuatan perangkat lunak dan alat tanpa kode dan rendah kode di saluran yang disalurkan ke agen yang lebih besar. Sampai saat ini, penerapan yang berhasil masih bersifat sempit, cakupannya sangat hati-hati, dan diawasi secara ketat.
“Jika saya melihat tahun 2025 dan janji untuk menjadi tahun agen, itu adalah tahun dimana banyak orang menghabiskan waktu untuk membuat prototipe,” kata Clark. “Sekarang kita berada di tengah-tengah fase skala besar ini.”
Bagaimana Anda mengamankan dunia tanpa padang rumput?
Perjuangan lainnya adalah keamanan agen AI, yang juga memerlukan pemikiran ulang terhadap proses tradisional, kata Clark.
Batasan keamanan telah diterapkan pada segala hal — namun hal tersebut tidak akan berhasil ketika agen harus dapat mengakses banyak sumber daya yang berbeda untuk membuat keputusan terbaik, kata Clark.
“Ini benar-benar mengubah model keamanan kami, mengubah tingkat dasar kami,” katanya. “Apa arti hak istimewa yang paling kecil di dunia yang tidak memiliki padang rumput dan tidak berdaya?”
Pada akhirnya, harus ada pemikiran ulang tata kelola di seluruh industri, dan perusahaan harus menyelaraskan model ancaman terhadap agen.
Clark menunjukkan perbedaannya: “Jika Anda melihat beberapa proses tata kelola Anda, Anda akan sangat terkejut bahwa asal mula proses tersebut adalah seseorang yang menggunakan mesin tik listrik IBM mengetik rangkap tiga dan menyerahkannya kepada tiga orang. Itu bukanlah dunia yang kita tinggali saat ini.”












