Beranda Teknologi Mengapa sebagian besar uji coba pengkodean AI perusahaan berkinerja buruk (Petunjuk: Ini...

Teknologi

Mengapa sebagian besar uji coba pengkodean AI perusahaan berkinerja buruk (Petunjuk: Ini bukan modelnya)

Penulis

14 Desember 2025

Gen AI dalam rekayasa perangkat lunak telah melampaui pelengkapan otomatis. Batasan yang muncul adalah pengkodean agen: sistem AI yang mampu merencanakan perubahan, melaksanakannya dalam beberapa langkah, dan mengulanginya berdasarkan masukan. Namun meskipun ada kehebohan seputar “agen AI yang membuat kode”, sebagian besar penerapan di perusahaan berkinerja buruk. Faktor pembatasnya bukan lagi modelnya. Dia konteks: Struktur, riwayat, dan maksud seputar kode diubah. Dengan kata lain, perusahaan kini menghadapi masalah desain sistem: Mereka belum merancang lingkungan di mana agen tersebut beroperasi.

Peralihan dari bantuan ke agensi

Setahun terakhir telah terjadi evolusi pesat dari alat bantu pengkodean menjadi alur kerja agenik. Penelitian telah mulai memformalkan apa yang dimaksud dengan perilaku agen dalam praktiknya: Kemampuan untuk mempertimbangkan seluruh desain, pengujian, pelaksanaan, dan validasi daripada menghasilkan cuplikan yang terisolasi. Pekerjaan seperti pengambilan sampel ulang tindakan dinamis menunjukkan bahwa mengizinkan agen untuk melakukan cabang, mempertimbangkan kembali, dan merevisi keputusan mereka sendiri secara signifikan akan meningkatkan hasil dalam basis kode yang besar dan saling bergantung. Di tingkat platform, penyedia seperti GitHub kini membangun lingkungan orkestrasi agen khusus, seperti Agen Kopilot dan Markas Agenuntuk mendukung kolaborasi multi-agen di dalam jaringan perusahaan nyata.

Namun hasil awal di lapangan memberikan sebuah peringatan. Ketika organisasi memperkenalkan alat agen tanpa memperhatikan alur kerja dan lingkungan, produktivitas dapat menurun. Sebuah studi kontrol acak tahun ini menunjukkan bahwa pengembang yang menggunakan bantuan AI dalam alur kerja yang tidak berubah menyelesaikan tugas lebih lambat, sebagian besar disebabkan oleh verifikasi, pengerjaan ulang, dan kebingungan seputar niat. Pelajaran yang dapat diambil sangatlah jelas: Otonomi tanpa orkestrasi jarang menghasilkan efisiensi.

Mengapa rekayasa konteks adalah solusi sebenarnya

Dalam setiap penerapan yang gagal yang saya amati, kegagalan tersebut berasal dari konteks. Ketika agen tidak memiliki pemahaman terstruktur tentang basis kode, khususnya modul yang relevan, grafik ketergantungan, rangkaian pengujian, konvensi arsitektur, dan riwayat perubahan. Mereka sering kali menghasilkan keluaran yang tampaknya benar tetapi tidak sesuai dengan kenyataan. Terlalu banyak informasi membuat agen kewalahan; terlalu sedikit memaksanya untuk menebak. Tujuannya bukan untuk memberi model lebih banyak token. Tujuannya adalah untuk menentukan apa yang harus terlihat oleh agen, kapan dan dalam bentuk apa.

Tim yang melihat kemajuan berarti memperlakukan konteks sebagai permukaan rekayasa. Mereka menciptakan alat untuk memotret, memadatkan, dan membuat versi memori kerja agen: Apa yang bertahan di seluruh putaran, apa yang dibuang, apa yang diringkas, dan apa yang dihubungkan, bukan disisipkan. Mereka merancang langkah-langkah musyawarah, bukan sesi dorongan. Mereka menjadikan spesifikasi sebagai artefak kelas satu, sesuatu yang dapat ditinjau, diuji, dan dimiliki, bukan riwayat obrolan sementara. Pergeseran ini sejalan dengan tren yang lebih luas yang digambarkan oleh beberapa peneliti sebagai “spesifikasi menjadi sumber kebenaran baru.”

Alur kerja harus berubah seiring dengan perkakas

Namun konteks saja tidak cukup. Perusahaan harus merancang ulang alur kerja di sekitar agen-agen ini. Sebagai Laporan McKinsey tahun 2025 “Satu Tahun AI Agentik” Perlu dicatat, peningkatan produktivitas tidak muncul dari penerapan AI pada proses yang sudah ada, namun dari pemikiran ulang terhadap proses itu sendiri. Ketika sebuah tim memasukkan agen ke dalam alur kerja yang tidak berubah, hal ini akan mengundang gesekan: Insinyur menghabiskan lebih banyak waktu untuk memverifikasi kode yang ditulis oleh AI daripada menulisnya sendiri. Agen hanya dapat memperkuat apa yang sudah terstruktur: basis kode modular yang teruji dengan kepemilikan dan dokumentasi yang jelas. Tanpa landasan tersebut, otonomi menjadi kacau.

Keamanan dan tata kelola juga memerlukan perubahan pola pikir. Kode yang dihasilkan AI menimbulkan bentuk risiko baru: Ketergantungan yang tidak diperiksa, pelanggaran lisensi yang tidak kentara, dan modul tidak terdokumentasi yang lolos dari tinjauan sejawat. Tim yang matang mulai mengintegrasikan aktivitas agen langsung ke dalam saluran CI/CD mereka, memperlakukan agen sebagai kontributor otonom yang pekerjaannya harus melewati analisis statis, pencatatan audit, dan gerbang persetujuan yang sama seperti pengembang manusia mana pun. Dokumentasi GitHub sendiri menyoroti lintasan ini, memposisikan Agen Kopilot bukan sebagai pengganti insinyur namun sebagai peserta yang diatur dalam alur kerja yang aman dan dapat ditinjau. Tujuannya bukan untuk membiarkan AI “menulis segalanya,” namun untuk memastikan bahwa ketika ia bertindak, ia melakukannya di dalam batasan yang ditentukan.

Apa yang harus menjadi fokus para pengambil keputusan saat ini

Bagi para pemimpin teknis, langkah ke depan dimulai dengan kesiapan, bukan hype. Monolit dengan pengujian yang jarang jarang menghasilkan keuntungan bersih; agen berkembang pesat jika pengujian bersifat otoritatif dan dapat mendorong penyempurnaan berulang. Inilah perulangannya Antropis memanggil agen pengkodean. Percontohan dalam domain dengan cakupan yang ketat (pembuatan pengujian, modernisasi lama, pemfaktoran ulang yang terisolasi); perlakukan setiap penerapan sebagai eksperimen dengan metrik eksplisit (tingkat pelepasan cacat, waktu siklus PR, tingkat kegagalan perubahan, temuan keamanan dihilangkan). Seiring bertambahnya penggunaan Anda, perlakukan agen sebagai infrastruktur data: Setiap rencana, cuplikan konteks, log tindakan, dan pengujian yang dijalankan adalah data yang disusun menjadi memori tujuan teknis yang dapat dicari, dan keunggulan kompetitif yang tahan lama.

Pada dasarnya, pengkodean agen bukanlah masalah perkakas melainkan masalah data. Setiap cuplikan konteks, iterasi pengujian, dan revisi kode menjadi suatu bentuk data terstruktur yang harus disimpan, diindeks, dan digunakan kembali. Ketika agen-agen ini berkembang biak, perusahaan-perusahaan akan mendapati diri mereka mengelola lapisan data yang benar-benar baru: Lapisan yang tidak hanya menangkap apa yang dibangun, namun juga bagaimana hal tersebut dipikirkan. Pergeseran ini mengubah log teknik menjadi grafik pengetahuan tentang niat, pengambilan keputusan, dan validasi. Pada waktunya, organisasi yang dapat mencari dan memutar ulang memori kontekstual ini akan melampaui organisasi yang masih memperlakukan kode sebagai teks statis.

Tahun mendatang kemungkinan besar akan menentukan apakah pengkodean agen menjadi landasan pengembangan perusahaan atau janji lain yang berlebihan. Perbedaannya akan bergantung pada rekayasa konteks: seberapa cerdas tim merancang substrat informasi yang diandalkan oleh agen mereka. Pemenangnya adalah mereka yang melihat otonomi bukan sebagai sesuatu yang ajaib, namun sebagai perpanjangan dari desain sistem yang disiplin: Alur kerja yang jelas, umpan balik yang terukur, dan tata kelola yang ketat.

Intinya

Platform menyatu dalam orkestrasi dan pagar pembatas, dan penelitian terus meningkatkan kontrol konteks pada waktu inferensi. Pemenang dalam 12 hingga 24 bulan ke depan bukanlah tim dengan model paling mencolok; merekalah yang merekayasa konteks sebagai aset dan memperlakukan alur kerja sebagai produk. Lakukan itu, dan otonomi akan bertambah. Lewati saja, dan antrian peninjauan akan melakukannya.

Konteks + agen = leverage. Lewati babak pertama, dan sisanya akan runtuh.

Dhyey Mavani mempercepat AI generatif di LinkedIn.

Baca lebih lanjut dari kami penulis tamu. Atau, pertimbangkan untuk mengirimkan postingan Anda sendiri! Lihat kami pedoman di sini.

avotas

Mengapa sebagian besar uji coba pengkodean AI perusahaan berkinerja buruk (Petunjuk: Ini bukan modelnya)

Peralihan dari bantuan ke agensi

Mengapa rekayasa konteks adalah solusi sebenarnya

Alur kerja harus berubah seiring dengan perkakas

Apa yang harus menjadi fokus para pengambil keputusan saat ini

Intinya

Terkini

Tiga wanita Tamil Nadu dituduh dalam dua kasus pencurian berantai yang...

Burnley rue melewatkan peluang saat bermain imbang melawan Everton

agama Mora Namdar? Pertanyaan yang paling banyak dicari di Google tentang...

Laporan: Giannis Antetokounmpo dari Bucks diperkirakan akan kembali melawan Bulls

‘Tidak tahu’: Pemegang visa H-1B melakukan perjalanan ke India pada 2...

Berube dari Maple Leafs memberikan kabar terbaru tentang cedera Stolarz, Carlo

Asmongold mempertanyakan keadilan moderasi Twitch "orang kulit hitam" setelah kembalinya Nina...

Caps, Setan melanjutkan dorongan playoff di tengah masa sulit

Pakar Psikologi: Pasangan paling cerdas secara emosional melakukan 3 hal berbeda...

Ksatria mencoba mencari cara untuk menenangkan Longsor terbaik NHL