AI Gambar: Bye Bye Jari Lemot dan Wajah Aneh!



AI Gambar: Bye Bye Jari Lemot dan Wajah Aneh - picture source: rice - pibitek.biz - Global

picture source: rice


336-280
TL;DR
  • AI Generator gambar sering bikin gambar yang jelek karena keterbatasan teknologi.
  • Teknik ElasticDiffusion dapat membantu AI Generator gambar membuat gambar yang lebih rapi dan proporsional.
  • ElasticDiffusion masih punya kelemahan, seperti waktu yang dibutuhkan untuk bikin gambar yang lebih lama.

pibitek.biz -Bayangkan ini: kamu pengen gambar robot keren buat sampul album, tapi ujung jarinya malah berantakan, dan muka robotnya ngga karuan. Kamu kecewa dan ngerasa rugi karena harus ngulang proses pembuatan gambarnya. Itulah derita yang biasa dialami para pengguna AI Generator gambar. Kesenangan mereka dalam menciptakan karya visual terusik oleh hasil yang jauh dari sempurna. Kenapa? AI Generator gambar kayak Stable Diffusion, Midjourney, atau DALL-E emang jago bikin gambar yang mirip nyata, tapi ada satu kelemahan: mereka cuman bisa bikin gambar kotak.

Mau bikin gambar untuk monitor yang bentuknya memanjang? Eh, malah muncul tangan robot yang punya enam jari atau mobil yang ketarik ke belakang. Gambar yang seharusnya keren malah jadi terlihat aneh dan kurang proporsional. Rasa frustrasi pun tak terhindarkan. Para ilmuwan komputer di Rice University udah punya solusinya. Mereka menciptakan teknik baru yang disebut ElasticDiffusion. Teknik ini bisa bikin AI Generator gambar jadi lebih cerdas, dan ngga gampang bikin gambar jelek lagi. Mereka ingin membebaskan para pengguna dari kekecewaan yang seringkali muncul akibat penggunaan AI Generator gambar.

Mereka berusaha untuk melepaskan AI Generator gambar dari keterbatasan yang menghambat potensi kreatif mereka. ElasticDiffusion emang terinspirasi dari cara kerja AI Generator gambar yang udah ada. AI ini belajar dengan cara menambahkan noise ke gambar, terus ngilangin noise tersebut buat menghasilkan gambar baru. Teknik ini disebut diffusion model. Teknik ini memungkinkan AI untuk belajar mengenali pola dan detail dalam gambar. Dengan mempelajari noise, AI Generator gambar bisa menciptakan gambar baru yang memiliki karakteristik mirip dengan gambar asli.

Pembaca pasti bertanya, "noise itu apa sih?". Noise itu kayak distorsi di gambar, kayak blur atau grain. AI belajar dari noise ini buat ngerti tentang gambar. Noise ini seperti kode yang memungkinkan AI untuk memahami bentuk, tekstur, dan warna dalam gambar. Bayangkan aja, AI itu kayak anak kecil yang diajarin mengenali bentuk dengan cara diraba. Noise itu ibaratnya permukaan kasar yang dipegang oleh AI. AI belajar melalui sentuhan dan pengamatan, sehingga dia bisa memahami bentuk dan karakteristik objek dalam gambar.

Teknik ElasticDiffusion ini punya cara yang unik. Mereka memisahkan noise menjadi dua bagian: noise lokal dan global. Noise lokal berisi informasi tentang detail gambar, kayak bentuk mata atau tekstur bulu anjing. Noise lokal ini penting untuk membangun detail gambar. Sedangkan noise global berisi informasi tentang bentuk keseluruhan gambar. Noise global ini menentukan bentuk dan proporsi gambar secara keseluruhan. Biasanya, AI Generator gambar ngebungkus noise lokal dan global menjadi satu.

Nah, kalau AI diminta buat bikin gambar yang ngga kotak, dia ngelakuin hal yang sama: menggandakan noise. Tapi karena noise lokal dan global tergabung, jadinya gambarnya berantakan, seperti yang dialami oleh robot enam jari dan mobil aneh tadi. Hal ini terjadi karena AI kesulitan dalam memahami dan menerapkan noise global secara proporsional pada gambar yang tidak kotak. ElasticDiffusion punya trik jitu: memisahkan noise lokal dan global. Teknik ini ngebersihin gambar dengan cara ngelakuin dua hal.

Pertama, ElasticDiffusion menghilangkan noise lokal dari gambar. Langkah ini memungkinkan AI untuk fokus pada informasi global. Kedua, ElasticDiffusion menambahkan noise global secara merata ke gambar. Langkah ini memungkinkan AI untuk menciptakan gambar dengan proporsi yang benar. Hasilnya, gambar yang dihasilkan jauh lebih rapi, tanpa perlu tambahan pelatihan. Teknik ElasticDiffusion ini bisa dipakai buat bikin gambar dengan berbagai bentuk, mulai dari kotak hingga persegi panjang. Ini memberikan fleksibilitas bagi pengguna AI Generator gambar untuk menciptakan gambar dengan bentuk dan proporsi yang diinginkan.

Tapi, ElasticDiffusion masih punya kelemahan. Waktu yang dibutuhkan untuk bikin gambar dengan teknik ini jauh lebih lama dibandingkan dengan AI Generator gambar yang lain. Dibutuhkan 6-9 kali lebih lama untuk menghasilkan sebuah gambar. Kelemahan ini menjadi tantangan yang perlu diatasi untuk membuat teknik ini lebih efisien dan praktis. Para ilmuwan di Rice University sedang berusaha untuk ngebuat ElasticDiffusion lebih cepat. Mereka pengen teknik ini bisa menghasilkan gambar dengan kecepatan yang sama dengan AI Generator gambar lainnya.

Mereka percaya bahwa di masa depan, ElasticDiffusion bisa bikin AI Generator gambar jadi lebih cerdas dan mudah diakses. Mereka berharap bahwa teknik ini bisa menjadi solusi yang efektif dan efisien untuk masalah yang dihadapi AI Generator gambar saat ini. AI Generator gambar, terutama Diffusion model, masih belum sempurna. Banyak kekurangan yang mereka miliki. Salah satunya adalah kecenderungan untuk membuat gambar yang tidak realistis. Hal ini terjadi karena AI Generator gambar dilatih dengan data yang terbatas, sehingga mereka tidak bisa meniru realitas dengan sempurna.

Mereka seringkali mengulang pola yang sama, sehingga menghasilkan gambar yang monoton dan tidak menarik. Selain itu, AI Generator gambar juga rentan terhadap bias. Mereka seringkali menghasilkan gambar yang merefleksikan bias dan prasangka yang ada di dalam data pelatihan. Hal ini membuat mereka tidak adil dalam memodelkan dunia nyata. AI Generator gambar harus dilatih dengan data yang lebih beragam dan representatif untuk meminimalkan bias dan menghasilkan gambar yang lebih realistis.

AI Generator gambar masih harus banyak belajar. Teknik baru seperti ElasticDiffusion bisa jadi jalan keluar. Tapi, AI Generator gambar harus dikembangakan secara etis dan bertanggung jawab. Kita tidak ingin mereka hanya menjadi alat untuk menghasilkan gambar yang indah tapi tidak bermakna. AI Generator gambar harus digunakan dengan bijak dan bertanggung jawab untuk menciptakan karya visual yang bermakna dan bermanfaat bagi masyarakat.