Format audio sumber terbuka Opus Xiph.Org untuk pengkodean audio lossy telah meluncurkan Opus 1.5 sebagai pembaruan besar yang kini lebih memanfaatkan pembelajaran mesin.
Opus 1.5 menghadirkan "peningkatan pembelajaran mesin yang serius" berdasarkan pengumuman rilis hari ini. Halaman demo 1.5 merangkum penggunaan pembelajaran mesin yang lebih besar sebagai:
"Rilis 1.5 ini tidak seperti rilis sebelumnya. Rilis ini menghadirkan banyak fitur baru yang dapat meningkatkan kualitas dan pengalaman audio secara umum. Hal ini dicapai melalui pembelajaran mesin. Meskipun Opus telah menyertakan pembelajaran mesin — dan bahkan pembelajaran mendalam — sebelumnya (misalnya untuk deteksi ucapan/musik), ini adalah pertama kalinya ia menggunakan teknik pembelajaran mendalam untuk memproses atau menghasilkan sinyal itu sendiri.
Daripada merancang codec berbasis ML baru dari awal, kami lebih memilih untuk meningkatkan Opus dengan cara yang sepenuhnya kompatibel. Itu adalah tujuan desain yang penting untuk ML di Opus. Hal ini tidak hanya memastikan Opus tetap bekerja pada perangkat yang lebih lama/lebih lambat, namun juga menyediakan jalur peningkatan yang mudah. Menerapkan codec baru bisa menjadi proses yang panjang dan menyakitkan. Kompatibilitas berarti versi Opus yang lebih lama dan lebih baru dapat hidup berdampingan, sambil tetap memberikan manfaat dari versi baru jika tersedia.
Pembelajaran mendalam juga sering dikaitkan dengan GPU yang kuat, namun di Opus, kami telah mengoptimalkan semuanya sehingga dapat dijalankan dengan mudah di sebagian besar CPU, termasuk ponsel. Kami telah berhati-hati untuk menghindari model berukuran besar (tidak seperti LLM dengan ratusan miliar parameternya!). Pada akhirnya, sebagian besar pengguna tidak akan menyadari biaya tambahan tersebut, namun orang yang menggunakan ponsel atau mikrokontroler yang lebih tua (5+ tahun) mungkin akan menyadari hal tersebut. Oleh karena itu, semua fitur baru berbasis ML dinonaktifkan secara default di Opus 1.5. Mereka memerlukan saklar waktu kompilasi (untuk alasan ukuran) dan kemudian saklar run-time (untuk alasan CPU). "Tetapi seperti disebutkan, fungsi pembelajaran mesin baru dinonaktifkan secara default.
Opus 1.5 juga menghadirkan peningkatan pengoptimalan AVX2, lebih banyak pengoptimalan ARM NEON, ketahanan kehilangan paket yang jauh lebih baik, peningkatan kualitas ucapan dengan kecepatan bit rendah, dan dukungan untuk ambisonik urutan ke-4 dan ke-5.
Unduhan Opus 1.5 dan informasi lebih lanjut melalui Opus-Codec.org.
Itulah berita seputar Opus 1.5 Audio Codec Mampu Memanfaatkan Pembelajaran Mesin Secara Luas, semoga bermanfaat. Disadur dari Phoronix.com.Artikel Diperbarui pada: March 04, 2024
Kontributor: Syauqi Wiryahasana
Model: Haifa Manik Intani