Jakarta, SELULAR.ID – NVIDIA mendemonstrasikan cara baru menciptakan suara yang belum pernah didengar sebelumnya. AI musik baru tersebut bernama Fugatto yang merupakan kependekan dari Foundational Generative Audio Transformer Opus 1.
Fugatto dapat menghasilkan musik, efek suara, dan bahkan ucapan dengan menginterpretasikan perintah dalam format teks dan audio. AI NVIDIA ini tidak hanya menciptakan kembali lanskap suara yang sudah ada, namun model ini dapat menghasilkan lanskap suara yang benar-benar baru, yang bisa melampaui batasan pembuatan audio secara tradisional.
Dalam demonstrasinya di YouTube NVIDIA Developer, Fugatto bisa ‘membuang’ musik pada sebuah lagu, dan hanya menyisakan vokal penyanyinya saja. Suara kereta api yang disambung dengan orkestra, hingga lolongan binatang yang bernyanyi, juga bisa diciptakan.
Model AI Fugatto NVIDIA yang digunakan untuk mengedit suara ini disebut ‘Swiss Army knife for sound’, yang menggunakan teknik unik disebut ComposableART.
Hal ini memungkinkan pengguna untuk mengontrol atribut audio yang dihasilkan—seperti aksen, emosi, atau bahkan suara campuran—menggunakan perintah bentuk bebas. Hal ini yang bisa membuat satu perintah suara bisa dihasilkan ke dalam suara sedang marah, atau sedang gembira.
Fugatto dibuat oleh sekelompok orang yang beragam dari seluruh dunia, termasuk India, Brasil, Tiongkok, Yordania, dan Korea Selatan. Kolaborasi mereka membuat kemampuan multi-aksen dan multibahasa Fugatto semakin kuat.
Menurut makalah penelitian dirilis NVIDIA Developer, Fugatto dilatih pada kumpulan data besar yang terdiri lebih dari 50.000 jam audio dari berbagai koleksi sumber terbuka.
Data pelatihan mencakup beberapa kategori termasuk ucapan, musik, dan suara lingkungan, dengan perhatian cermat diberikan pada keragaman dan kualitas kumpulan data.
Sayangnya, NVIDIA Developer tidak memberitahukan kapan AI Fugatto akan dirilis, serta bagaimana mengaksesnya. (***)
Baca Juga: Blueprint Terbaru NVIDIA, Permudah Pencarian dan Meringkas Video