- Video yang dihasilkan AI sudah membantu perusahaan dan individu membuat konten video berkualitas profesional tanpa perlu biaya besar, kru produksi, aktor, atau keterampilan teknis.
- Meskipun sangat mengesankan, pembuatan video AI terhambat oleh beberapa keterbatasan, terutama dalam menciptakan karakter manusia yang tampak realistis.
- AI kesulitan menghasilkan gerakan manusia yang konsisten dan menarik karena arsitektur model yang mendasar, bagaimana kumpulan data dilatih, dan kurangnya data pelatihan khusus yang tersedia.
pibitek.biz -Akhir-akhir ini, penggunaan AI untuk membuat konten visual berkembang pesat. Model AI terus membaik dan dapat membuat gambar yang sangat realistis. Selain itu, model ini telah diintegrasikan ke dalam aplikasi seluler yang mudah digunakan. Pada tahun 2024, model teks-ke-video yang lebih canggih telah memberikan bisnis dan pembuat konten alat yang jauh lebih kuat untuk membuat konten video profesional dan realistis dalam jumlah besar.
2 – Google Kerjasama dengan Reaktor Nuklir untuk AI 2 – Google Kerjasama dengan Reaktor Nuklir untuk AI
3 – Apple Tertinggal dalam Pengembangan AI 3 – Apple Tertinggal dalam Pengembangan AI
Meskipun potensinya masih jauh dari kenyataan, industri ini terus berkembang pesat, seperti yang terlihat pada model seperti Sora dari OpenAI dan Vidu dari Shengshu Technology serta aplikasi seperti Runway dan LTX Studio dari Lightricks. Video yang dihasilkan dengan AI sudah memberikan dampak, membantu perusahaan dan individu untuk membuat konten video berkualitas profesional, tanpa perlu anggaran besar, kru produksi, aktor, atau bahkan keterampilan teknis. Untuk memulai pembuatan video AI, kita bahkan tidak memerlukan ide yang matang, karena semuanya dapat dimulai dari deskripsi sederhana.
Meskipun masih dalam tahap awal, video yang dihasilkan AI sudah unggul dalam beberapa hal. Dalam hal menciptakan fenomena alam seperti api, cuaca, ombak, dan efek angin pada lanskap, teknologi ini sudah menghasilkan video yang sangat realistis yang tampak seperti difilmkan, berkat pelatihan pada sejumlah besar data video.AI juga dapat membuat rekaman "tingkat tinggi" yang sangat menarik dari hal-hal seperti pemandangan kota dari udara, kerumunan besar, dan alam, yang sangat berguna mengingat biaya dan kesulitan menggunakan citra yang dihasilkan komputer (CGI) untuk menyempurnakan fotografi biasa dan meniru efek ini.
Konsistensi karakter adalah area lain di mana AI menyaingi video tradisional, dengan model yang ada mampu menghasilkan dan mempertahankan identitas dan gaya karakter unik di banyak bingkai dan adegan dalam konteks berbeda. Selain itu, pembuat video AI Generatiferatiferasi sekarang unggul dalam hal gerakan kamera, memberikan alat penting bagi pembuat film. Dengan kemampuan ini, pembuat konten dapat mewujudkan visi mereka dengan tepat seperti yang mereka bayangkan.
Namun, video yang dihasilkan AI masih memiliki keterbatasan. Media sosial dipenuhi dengan contoh video AI yang memukau yang mengilustrasikan potensi luar biasa dari teknologi ini. Namun, meskipun contoh-contoh awal ini mengesankan, jelas bahwa pembuatan video AI terhambat oleh beberapa keterbatasan yang harus diatasi oleh industri ini jika ingin menjadi alternatif yang layak untuk produksi video tradisional. Secara khusus, video yang dibuat AI dikritik karena kegagalannya menciptakan karakter manusia yang tampak realistis.
Meskipun tantangan teknis ini lebih atau kurang teratasi dalam hal foto diam, dalam video, wajah yang dihasilkan AI menjadi tantangan tersendiri, begitu juga elemen seperti tangan dan kaki manusia, serta interaksi, gerak tubuh, dan emosi mereka. Meskipun beberapa kemajuan telah dibuat di bidang ini baru-baru ini, karakter manusia yang dihasilkan AI masih cenderung jatuh ke dalam apa yang dikenal sebagai "lembah uncanny", karena kurangnya kehalusan dan keaslian. Sebuah studi baru-baru ini oleh peneliti di Universitas Cambridge menemukan bahwa efek lembah uncanny dan penyimpangannya dari realisme dapat sangat mengganggu penonton manusia.AI mengalami kesulitan dalam menghasilkan gerakan manusia yang konsisten dan menarik karena arsitektur model yang mendasar, bagaimana kumpulan data dilatih, dan kurangnya data pelatihan khusus yang tersedia. Model AI Generatif membutuhkan kumpulan data yang sangat besar dan beragam untuk pelatihan dan tidak ada cukup informasi berkualitas tinggi dan tidak bias yang tersedia untuk membuatnya. Kurangnya keragaman dalam kumpulan data pelatihan menyebabkan pelestarian karakter stereotip dan representasi yang tidak adil dalam konten yang dihasilkan AI.
Misalnya, sebuah studi baru-baru ini oleh MIT menunjukkan bahwa model AI yang dilatih pada kumpulan data yang bias mencerminkan bias tersebut dalam konten yang mereka hasilkan. Manusia adalah makhluk yang sangat kompleks dan tugas menciptakan makhluk buatan berarti mencerminkan ratusan nuansa, seperti ekspresi wajah dan gerak tubuh. Namun, kurangnya data pelatihan yang berguna mencegah generator video AI menangkap skala kompleksitas yang diperlukan untuk menciptakan kembali sifat-sifat manusia ini secara efektif.
Demikian pula, tidak ada cukup data yang tersedia untuk mereplikasi ucapan alami manusia atau memahami konteks lingkungan yang berbeda.AI juga masih kurang dalam hal nuansa budaya, ekspresi kreatif, dan pengambilan keputusan yang kompleks, dan sekali lagi, hal ini disebabkan oleh kurangnya data berkualitas tinggi. Solusi untuk keterbatasan pembuatan video AI mudah diidentifikasi.
Kita hanya perlu mengumpulkan lebih banyak data pelatihan yang berkualitas tinggi. Tetapi mendapatkan data ini tidak semudah kelihatannya. Beberapa pihak telah mempromosikan gagasan penggunaan kumpulan data sintetis daripada data dunia nyata untuk melatih model AI video, tetapi penelitian menunjukkan bahwa ini bukan alternatif yang layak.
Sebuah artikel di New Scientist memperingatkan bahwa ketika internet dipenuhi dengan manusia yang diciptakan oleh AI dan gambar sintetis lainnya, itu akan menyebabkan AI dilatih pada datanya sendiri yang dibuat secara artifisial, menciptakan lingkaran yang mengonsumsi dirinya sendiri yang menghentikan kemajuan apa pun dalam hal gambar dan kualitas video. Solusi yang lebih baik mungkin adalah dengan menutup kesenjangan dalam kumpulan data yang ada dengan citra khusus yang dihasilkan menggunakan alat CGI.
Pada dasarnya ini adalah pembuatan video-ke-video daripada pembuatan teks-ke-video. Premisnya adalah bahwa AI dapat digabungkan dengan CGI, dengan AI menangani hal-hal yang CGI sulit dibuat secara meyakinkan, seperti mata manusia, dan CGI digunakan untuk menciptakan kembali hal-hal yang AI tidak melakukannya dengan baik, seperti janggut atau reaksi emosional. Pembuatan video AI memiliki potensi untuk mempercepat kreativitas dan produktivitas manusia ke tingkat yang belum pernah terjadi sebelumnya, tetapi jalan untuk mewujudkan impian ini bergantung pada jumlah dan kualitas data yang menggerakkan sistem baru ini.
Untungnya, kemungkinan teknologi ini sangat besar sehingga tidak ada yang tinggal diam dan kita telah membuat kemajuan besar dalam mengatasi tantangan data pelatihan AI. Kemajuan itu hanya akan semakin cepat karena semakin banyak inovator menghadapi tantangan, tergoda oleh manfaat yang dapat ditawarkan AI. Perjalanan ini baru saja dimulai dan kita sudah melangkah sangat jauh, tetapi jalan yang harus ditempuh masih panjang. Pada saat kita mencapai akhir jalan itu, kemungkinan kreatif AI Generatif akan jauh melampaui batas imajinasi kita.