Generator Gambar AI: Siapkah AI Pengganti Seniman?



Generator Gambar AI: Siapkah AI Pengganti Seniman? - picture origin: androidauthority - pibitek.biz - Pixel

picture origin: androidauthority


336-280
TL;DR
  • Generator gambar AI mengalami perkembangan pesat dan dapat menciptakan gambar yang realistis dan menawan, bahkan telah berhasil memenangkan penghargaan fotografi.
  • Imagen 3 dari Google dan Grok menunjukkan kemampuan yang unggul dalam menghasilkan gambar yang kompleks, detail, dan realistis, serta dapat menghasilkan teks pada objek dengan akurat.
  • Generator gambar AI memiliki keterbatasan dan bias, serta dapat digunakan untuk memanipulasi opini publik, sehingga perlu diwaspadai dan digunakan secara bertanggung jawab dan etis.

pibitek.biz -Generasi gambar berbasis AI mengalami perkembangan pesat. Kemampuannya dalam menciptakan gambar yang realistis dan menawan telah melampaui batas imajinasi, bahkan telah berhasil memenangkan penghargaan fotografi dan membingungkan para ahli di bidangnya. Kemajuan teknologi AI dalam menghasilkan gambar ini membuka peluang bagi siapa pun untuk menjadi seniman digital. Meskipun tidak memerlukan keahlian khusus dalam seni atau teknologi, memilih generator gambar AI yang tepat menjadi kunci untuk mendapatkan hasil yang memuaskan.

Tidak semua generator gambar AI diciptakan sama, beberapa unggul dalam menciptakan realisme, sementara yang lain menunjukkan kesalahan yang mudah terlihat. Salah satu tantangan terbesar yang dihadapi oleh teknologi AI dalam menghasilkan gambar adalah kemampuannya dalam menghasilkan teks. Sebagian besar generator gambar AI masih kesulitan dalam mereplikasi teks dengan akurat. Untuk menentukan generator gambar AI terbaik, perlu dilakukan serangkaian pengujian yang menantang, menguji kemampuannya dalam menghasilkan gambar yang kompleks, detail, dan realistis.

Untuk menguji generator gambar AI, peneliti memilih lima aplikasi populer, yaitu Imagen 3 dari Google, Imagine dari Meta, DALL-E 3 yang diintegrasikan ke dalam Microsoft Designer dan ChatGPT, serta Grok. Pengujian dilakukan dengan memberikan serangkaian perintah yang semakin kompleks, dimulai dengan meminta generator gambar AI untuk menghasilkan gambar orang yang menangis. Perintah yang sederhana ini, menghasilkan variasi gambar yang menarik, membuktikan perbedaan kemampuan setiap generator gambar AI.

Meskipun perintahnya sederhana, setiap generator gambar AI telah dilatih dengan kumpulan data yang berbeda. Misalnya, Meta menggunakan gambar publik dari Facebook dan Instagram, sedangkan sumber data pelatihan untuk generator gambar AI lainnya kurang jelas. Merekayasa anatomi tubuh manusia selalu menjadi tantangan bagi generator gambar AI. Dari hasil pengujian, Imagen 3 menghasilkan gambar yang sangat realistis, sementara Imagine dari Meta menampilkan hasil yang kurang memuaskan. Uji coba berulang dengan variasinya dilakukan untuk memastikan hasil yang akurat, dan Imagen 3 tetap menjadi yang terbaik dalam setiap pengujian.

Microsoft Designer menggunakan model DALL-E 3 dari OpenAI, sehingga diharapkan dapat menghasilkan hasil yang mirip dengan ChatGPT. Pengujian yang dilakukan menunjukkan hasil yang serupa, keduanya memberikan hasil yang cukup baik. Pada tahap selanjutnya, pengujian dilakukan dengan perintah yang lebih kompleks dan detail, tetap melibatkan subjek manusia dalam bingkai gambar. Imagen 3 kembali menghasilkan gambar yang luar biasa, hanya sedikit kesalahan pada jari-jari salah satu subjek. Sebaliknya, Imagine dari Meta menampilkan kesalahan yang signifikan pada kaki dan wajah salah satu penari, sehingga hasilnya dianggap tidak dapat digunakan.

Microsoft Designer menampilkan hasil bergaya kartun, yang tergolong baik, tetapi tidak sesuai dengan yang diharapkan. Upaya ChatGPT jauh lebih buruk, dengan anggota tubuh tambahan muncul pada salah satu penari. Untungnya, Grok menghasilkan hasil yang layak, selain kesalahan pada jari-jari yang saling terkait. Kemampuan untuk menghasilkan teks pada objek menjadi tantangan selanjutnya. Imagen 3 berhasil menghasilkan gambar yang luar biasa, dengan teks pada badan pesawat yang dihasilkan dengan sempurna.

Selain sedikit kesalahan pada tanda taxiway landasan pacu, hampir tidak mungkin untuk membedakan gambar AI dari foto asli. Grok juga memberikan hasil yang mengesankan, meskipun tidak pada percobaan pertama, dan masih mengalami kesalahan pada beberapa jendela di bagian atas pesawat. Grok menggunakan generator gambar yang relatif baru bernama Flux, yang dikembangkan oleh peneliti yang juga menciptakan Stable Diffusion. Karena reputasi Stable Diffusion dalam dunia generator gambar AI, tidak mengherankan jika Grok mampu menghasilkan hasil yang luar biasa.

Generator gambar AI lainnya menghasilkan hasil yang di bawah standar, bahkan terkesan lucu. Imagine dari Meta menghasilkan teks yang kacau dan pesawat yang salah. DALL-E 3 melalui ChatGPT hampir berhasil menghasilkan teks di sisi pesawat, tetapi menampilkan tanda landasan pacu yang cacat. Microsoft Designer menggunakan model DALL-E 3 yang sama, tetapi menghasilkan gambar yang lebih buruk dan tidak realistis. Menariknya, menambahkan istilah seperti "fotorealistis" atau "HD" tidak banyak membantu dalam meningkatkan realisme atau keaslian gambar yang dihasilkan AI.

Dampaknya minimal, meskipun biasanya merupakan praktik umum untuk memasukkan istilah-istilah ini sebagai bagian dari perintah yang efektif. Generator gambar AI memiliki sisi gelap yang perlu diwaspadai. Kemampuannya untuk memanipulasi opini publik dengan narasi palsu menjadi perhatian utama. Untuk mengatasi masalah ini, sebagian besar platform AI Generatif menerapkan batasan, mencegah pengguna meminta gambar yang meniru orang tertentu. Tidak mengherankan, perintah untuk menghasilkan gambar yang meniru orang tertentu ditolak oleh semua generator gambar AI, kecuali Grok.

Elon Musk menciptakan Grok sebagai AI yang mengedepankan "pencarian kebenaran", yang berarti chatbot ini memiliki batasan yang lebih sedikit dibandingkan dengan kompetitornya. Kurangnya batasan ini juga berlaku untuk gambar yang dihasilkan AI, yang memungkinkan pengguna untuk membuat gambar tokoh dunia, selebriti, bahkan Musk sendiri dalam pengaturan yang meragukan. Setiap generator gambar AI memiliki kekuatan unik yang membuatnya lebih unggul dari yang lain. Namun, dari sudut pandang praktis, generator gambar AI terbaik mungkin sudah ada di perangkat kamu.

Misalnya, Meta AI sudah terintegrasi dalam WhatsApp dan Facebook Messenger. Jika kamu sudah menggunakan aplikasi tersebut, Meta Imagine dapat memenuhi kebutuhan dasar kamu dalam menghasilkan gambar. Demikian pula, seri Pixel 9 dilengkapi dengan aplikasi Pixel Studio terbaru yang didukung oleh Imagen 3. Atau, kamu dapat juga meminta gambar yang dihasilkan AI melalui aplikasi Gemini di perangkat Android. Gemini masih menggunakan Imagen 2 versi lama saat ini, tetapi akan segera beralih ke model Google terbaru.

Generator gambar AI menawarkan potensi besar dalam berbagai bidang, mulai dari seni hingga desain produk. Namun, penting untuk mengingat bahwa teknologi ini masih dalam tahap awal pengembangan dan memiliki keterbatasan. Kemampuan generator gambar AI dalam mereplikasi realitas fisik dan sosial, seperti ekspresi wajah, bahasa tubuh, dan teks, masih perlu ditingkatkan. Selain itu, pengujian ini menunjukkan bahwa generator gambar AI memiliki bias dan kecenderungan yang dipengaruhi oleh kumpulan data pelatihan.

Data yang bias dapat menghasilkan gambar yang merefleksikan stereotipe dan prasangka yang tidak adil. Hal ini menjadi perhatian penting dalam penggunaan generator gambar AI untuk tujuan kreatif dan komersial. Perkembangan teknologi AI terus berlanjut dengan kecepatan yang luar biasa. Generator gambar AI terus diperbarui dan ditingkatkan, dengan kemampuan yang semakin canggih. Sebagai pengguna, kita perlu memahami kekuatan dan keterbatasan teknologi ini, dan menggunakannya secara bertanggung jawab dan etis.