Genie, Model AI yang Bisa Bikin Game dari Gambar



TL;DR
  • Genie, AI DeepMind yang bikin game dari gambar.
  • Genie belajar dari video game 2D dan robotik.
  • Genie bisa transfer aksi laten ke lingkungan baru.
Genie, Model AI yang Bisa Bikin Game dari Gambar - picture origin: aibusiness - pibitek.biz - Internet

picture origin: aibusiness


336-280

pibitek.biz - Genie adalah model AI terbaru dari DeepMind, perusahaan yang terkenal dengan risetnya di bidang game. Genie bisa mengubah gambar, video, atau sketsa menjadi adegan game yang bisa dimainkan. Genie belajar dari video game 2D seperti Super Mario dan data robotik. Genie singkatan dari Generative Interactive Environments. Genie dilatih dengan video internet, tapi bisa membuat adegan game dari gambar, video, atau sketsa yang belum pernah dilihat sebelumnya. Pengguna bisa memasukkan foto benda nyata, misalnya patung tanah liat, dan Genie bisa menghasilkan representasi 2D ala game platformer.

Genie bisa membangun lingkungan game ini dari satu gambar saja. DeepMind percaya bahwa model generatif ini punya potensi untuk agen generalis, yaitu sistem AI yang bisa menangani berbagai macam tugas AI. Ideanya adalah Genie adalah metode umum yang bisa belajar aksi laten dari video dan mentransfernya ke lingkungan yang dirancang manusia.

Metode ini bisa diterapkan ke domain lain tanpa perlu pengetahuan domain tambahan. DeepMind juga mencoba Genie ke skenario berbeda dengan melatihnya dengan video yang tidak punya aksi spesifik. Model ini bisa memahami aksi-aksi itu dan belajar dari lingkungan baru tanpa perlu instruksi ekstra.

Tim di balik Genie bilang proyek ini baru permulaan dari apa yang mungkin di masa depan. Kredit: DeepMind Genie disuapi 200 ribu jam video internet game 2D platformer seperti Super Mario dan data robotik (RT-1). Meski video internet sering tidak berlabel, Genie bisa belajar kontrol halus, termasuk bagian mana dari input yang bisa dikontrol dan juga menyimpulkan aksi laten yang beragam dan konsisten di lingkungan yang dihasilkan.

Model ini belajar dari menonton ribuan video internet, memahami aksi seperti melompat dan menerapkannya ke lingkungan game. Tunjukkan Genie gambar karakter di dekat jurang, misalnya, dan model ini akan menyimpulkan bahwa karakter itu akan melompat dan menghasilkan adegan berdasarkan aksi itu. Ini mirip dengan cara manusia belajar dari video.

Kita nonton dan akhirnya kita paham. Genie juga begitu, bahkan bisa mengerti sketsa yang digambar manusia dan mengubahnya jadi representasi game. Genie punya 11 miliar parameter, dan DeepMind menyebutnya sebagai "model dunia dasar", yaitu sistem yang belajar dari cara kerja dunia.

Untuk penjelasan detail, baca definisi Yann LeCun, Kepala Ilmuwan AI Meta, di X. Tim Rocktäschel, ilmuwan riset DeepMind yang kerja di proyek Genie, memuji Sora, model generasi video baru dari OpenAI, bilang di X (Twitter) kalau Sora "sangat mengesankan dan memukau secara visual, tapi seperti kata Yann LeCun, model dunia butuh aksi". Belum ada kabar apakah model Genie akan dibuka untuk umum, atau apakah akan jadi fitur di produk Google.