OpenAI menjadikan penawaran pembuatan gambarnya lebih tepat dan konsisten pada versi terbarunya perbarui ke Gambar ChatGPTkarena semakin banyak perusahaan dan merek yang menggunakan pembuatan gambar AI untuk membantu visualisasi desain.
Pembaruan akan diluncurkan ke semua pengguna ChatGPT dan APInya sebagai Gambar GPT 1.5. Perusahaan mengatakan bahwa ini didukung oleh GPT 5.2, yang menurut banyak pengguna awal merupakan pembaruan yang kuat untuk kasus penggunaan bisnis.
“Pengalaman pertama banyak orang dengan ChatGPT melibatkan mengubah perintah teks menjadi gambar,” kata Fidji Simo, CEO Aplikasi OpenAI, di postingan Substack. “Ini adalah cara ajaib untuk melihat apa yang bisa dilakukan teknologi ini, namun antarmuka obrolan pada awalnya tidak dirancang untuk ini. Membuat dan mengedit gambar adalah jenis tugas yang berbeda dan layak mendapatkan ruang yang dibangun untuk visual.”
Pembaruan ramah bisnis dalam pengeditan yang tepat dan mengikuti instruksi
Salah satu pembaruan terbesar pada Gambar ChatGPT adalah pengeditan yang lebih bertarget, meskipun gambar dibuat di platform obrolan daripada melalui API. Model pembuatan gambar seperti Gambar ChatGPT, Nano Banana Google, dan Difusi Stabil menawarkan penyesuaian berbasis permintaan pada gambar buatan AI, di mana pengguna dapat menentukan bagian tertentu dari foto yang akan diubah. Namun fitur-fitur tersebut terkadang bisa jadi untung-untungan.
Dengan pembaruan tersebut, OpenAI mengatakan model tersebut lebih sesuai dengan apa yang diinginkan pengguna “sambil menjaga elemen seperti pencahayaan, komposisi, dan penampilan orang tetap konsisten di seluruh input, output, dan pengeditan selanjutnya.”
Pengguna dapat menginstruksikan model untuk melakukan sebagian besar jenis pengeditan gambar, seperti menambah atau mengurangi elemen, menggabungkan, memadukan, dan mengubah posisi.
OpenAI mengatakan bahwa model ini “mengikuti instruksi dengan lebih andal” dibandingkan versi sebelumnya. Ini juga mampu merender teks dengan lebih baik dan menghasilkan huruf yang sebenarnya dan dapat dibaca, meskipun hurufnya lebih padat atau lebih kecil. OpenAI memperbarui modelnya untuk menciptakan wajah yang lebih baik dan lebih kecil dalam foto yang menampilkan sekelompok besar orang.
“Transformasi ini berfungsi baik untuk konsep yang sederhana maupun yang lebih rumit, dan mudah untuk dicoba menggunakan gaya dan ide yang telah ditetapkan sebelumnya dalam fitur Gambar ChatGPT yang baru — tidak diperlukan perintah tertulis,” menurut OpenAI.
Pertempuran generator gambar
Pembaruan model gambar OpenAI hadir setelah Google Nano Banana Pro yang sangat dipuji model gambar, yang mendapat pujian dari komunitas pengembang.
Perusahaan harus bersaing dengan model penghasil citra lainnya yang terus berkembang dan terus ditingkatkan yang bertujuan untuk menarik lebih banyak pengguna perusahaan. Dan bukan hanya Google yang harus dihadapi oleh OpenAI. Pada bulan Agustus, Alibaba mengumumkan Gambar Qwen itu dapat membuat teks yang dapat dibaca dalam bahasa Cina dan Inggris. Lab Black Forest dirilis Fluks.2yang juga menawarkan model gambar sumber terbuka yang tangguh.












