AudioCraft: AI Pembuat Musik dan Suara dari Imajinasi Terdalam Anda



TL;DR
  • AudioCraft oleh Meta adalah rangkaian AI pembuat musik dan suara.
  • Transformer-XL dapat menghasilkan kualitas audio sebanding dengan manusia.
  • Meta berharap AudioCraft mendemokratisasi produksi audio untuk ekspresi artistik yang inklusif.
AudioCraft: AI Pembuat Musik dan Suara dari Imajinasi Terdalam Anda - picture origin: gigadgets - pibitek.biz - Manusia

picture origin: gigadgets


336-280

pibitek.biz -Meta telah merilis AudioCraft, sebuah rangkaian AI generatif sumber terbuka yang dapat menghasilkan musik dan audio dari teks sederhana. AudioCraft bertujuan untuk merevolusi pembuatan musik dan audio dengan memberdayakan musisi profesional, pengembang game independen, pemilik usaha kecil, dan siapa pun yang ingin menciptakan soundtrack atau efek suara. Hanya dengan beberapa kata, AudioCraft dapat menciptakan trek elektronik yang berdenyut yang cocok untuk klub, suara latar atmosferis yang memindahkan Anda ke hutan terpencil, dan teriakan menyeramkan yang akan membuat penggemar horor melompat dari kursi mereka.

AudioCraft adalah kumpulan dari tiga model tangguh: MusicGen, AudioGen, dan EnCodec. MusicGen menggunakan masukan pengguna berbasis teks untuk menghasilkan musik, seperti "Saya ingin lagu yang terdengar seperti pembukaan 'The Good, the Bad, and the Ugly.'" AudioGen melakukan hal serupa untuk suara latar, seperti "suara seribu langkah kecil di pantai yang disinari bulan". Kedua model dilatih dengan musik milik Meta dan efek suara publik yang dilisensikan khusus, masing-masing. EnCodec adalah codec kompresi audio berbasis jaringan saraf yang dapat mengurangi ukuran file audio tanpa mengorbankan kualitas.

Menghasilkan audio dengan kualitas tinggi dari sinyal audio mentah adalah tugas yang menantang. Audio melibatkan pemodelan kompleks dari sinyal dan pola pada skala yang bervariasi, dan metode tradisional telah mengandalkan representasi simbolis seperti MIDI atau gulungan piano. Namun, metode-metode ini tidak mampu menangkap nuansa ekspresif yang rumit dan unsur gaya yang ditemukan dalam musik.

AudioCraft diklaim sebagai rangkaian AI baru yang mengatasi keterbatasan ini melalui pendekatan baru yang disebut Transformer-XL. Transformer-XL adalah perluasan dari arsitektur Transformer yang populer yang dapat menangani urutan data panjang. Hal ini memungkinkan AudioCraft untuk belajar dari ketergantungan lokal dan global dalam sinyal audio, menghasilkan hasil yang lebih koheren dan beragam. Selain Transformer-XL, AudioCraft juga menggunakan teknik yang disebut pembelajaran kontras. Pembelajaran kontras membantu model untuk belajar dari contoh positif dan negatif dari generasi audio. Hal ini memungkinkan AudioCraft untuk menghasilkan output audio yang lebih realistis dan meyakinkan.

Meta mengklaim bahwa AudioCraft dapat menghasilkan musik dan audio yang sebanding atau lebih unggul dari komposisi buatan manusia dari segi kualitas, keberagaman, dan kreativitas. Meta telah merilis beberapa contoh hasil AudioCraft di situs webnya, di mana pengguna juga dapat mencoba framework ini sendiri. Meta juga telah membuat kode sumber AudioCraft tersedia di GitHub sehingga para peneliti dan praktisi dapat mengakses model-model ini dan melatihnya dengan dataset mereka sendiri.

Meta berharap AudioCraft akan mendorong lebih banyak inovasi dan kolaborasi dalam bidang AI generatif untuk audio dan musik. Meta yakin AudioCraft dapat mendemokratisasi produksi audio dan memungkinkan bentuk-bentuk baru ekspresi artistik dan bercerita. Meta juga berharap bahwa AudioCraft akan memiliki dampak sosial positif dengan membuat musik dan audio lebih mudah diakses dan inklusif bagi semua.