Beranda Teknologi Google meluncurkan agen penelitian AI terdalamnya — pada hari yang sama OpenAI...

Google meluncurkan agen penelitian AI terdalamnya — pada hari yang sama OpenAI meluncurkan GPT-5.2

23
0

 

Google dilepaskan pada hari Kamis versi “yang dirancang ulang” dari agen penelitiannya Gemini Deep Research berdasarkan model fondasi canggih yang banyak digemari, Gemini 3 Pro.

Agen baru ini tidak hanya dirancang untuk menghasilkan laporan penelitian – meskipun masih bisa melakukan hal itu. Sekarang memungkinkan pengembang untuk menanamkan kemampuan penelitian model SATA Google ke dalam aplikasi mereka sendiri. Kemampuan itu dimungkinkan melalui Google yang baru API Interaksiyang dirancang untuk memberikan kontrol lebih besar kepada pengembang di era AI agen yang akan datang.

Alat Gemini Deep Research yang baru adalah agen yang dilengkapi untuk mensintesis segudang informasi dan menangani dump konteks besar dalam sekejap. Google mengatakan itu digunakan oleh pelanggan untuk berbagai tugas mulai dari uji tuntas hingga penelitian keamanan toksisitas obat.

Google juga mengatakan akan segera mengintegrasikan agen penelitian mendalam baru ini ke dalam layanan, termasuk Google Penelusuran, Google Finance, Aplikasi Gemini, dan NotebookLM yang populer. Ini adalah langkah lain menuju persiapan menghadapi dunia di mana manusia tidak lagi menggunakan Google apa pun — agen AI mereka yang melakukannya.

Raksasa teknologi tersebut mengatakan bahwa Deep Research mendapat manfaat dari status Gemini 3 Pro sebagai model “paling faktual” yang dilatih untuk meminimalkan halusinasi selama tugas-tugas kompleks.

Halusinasi AI – di mana LLM hanya mengada-ada – adalah masalah yang sangat krusial untuk tugas-tugas agen yang bersifat jangka panjang dan memiliki penalaran yang mendalam, di mana banyak keputusan otonom dibuat dalam hitungan menit, jam, atau lebih lama. Semakin banyak pilihan yang harus diambil oleh LLM, semakin besar kemungkinan bahwa satu pilihan halusinasi saja akan membatalkan keseluruhan output.

Untuk membuktikan klaim kemajuannya, Google juga telah membuat tolok ukur lain (seolah-olah dunia AI memerlukan tolok ukur lain). Tolok ukur baru ini diberi nama DeepSearchQA dan dimaksudkan untuk menguji agen pada tugas pencarian informasi multi-langkah yang kompleks. Google telah membuat benchmark ini menjadi sumber terbuka.

acara Techcrunch

San Fransisco
|
13-15 Oktober 2026

Ini juga menguji Penelitian Mendalam tentang Ujian Terakhir Kemanusiaan, sebuah tolok ukur independen yang jauh lebih menarik dari pengetahuan umum yang diisi dengan tugas-tugas khusus yang mustahil; dan BrowserComp, tolok ukur untuk tugas agen berbasis browser.

Seperti yang Anda duga, agen baru Google mengalahkan persaingan berdasarkan tolok ukurnya sendiri, dan tolok ukur Kemanusiaan. Namun, ChatGPT 5 Pro OpenAI secara mengejutkan berada di posisi kedua dan sedikit mengungguli Google di BrowserComp.

Namun perbandingan benchmark tersebut sudah tidak berlaku lagi ketika Google menerbitkannya. Karena pada hari yang sama, OpenAI meluncurkan GPT 5.2 yang sangat dinantikan — dengan nama sandi Bawang Putih. OpenAI mengatakan model terbarunya mengungguli para pesaingnya – terutama Google – dalam serangkaian tolok ukur umum, termasuk yang dikembangkan sendiri oleh OpenAI.

Mungkin salah satu bagian paling menarik dari pengumuman ini adalah waktunya. Mengetahui bahwa dunia sedang menunggu peluncuran Bawang Putih, Google merilis beberapa berita AI-nya sendiri.

avotas