Google Merilis AOM-AV1 3.5 Dengan Lebih Banyak Percepatan & Pengoptimalan Memori

  • Post author:
  • Post category:Linux

Insinyur Google pada hari Rabu merilis AOM-AV1 3.5 sebagai versi terbaru dari encoder video AV1 open-source mereka. Dengan AOM-AV1 3.5 hadir lebih banyak peningkatan kinerja serta optimalisasi memori. Pertama, AOM-AV1 3.5 mendukung penyandian paralel bingkai untuk jumlah utas yang lebih banyak. Ini adalah opsi “–fp-mt” yang ditambahkan di rilis sebelumnya tetapi pada saat itu diperlukan opsi waktu pembuatan khusus. Opsi FP-MT sekarang tersedia secara default dan multi-threading paralel bingkai ini akan sangat membantu dengan threading untuk encoder AV1 ini. Dan ada banyak pekerjaan pengoptimalan kinerja yang dilakukan pada rilis v3.5:    * Percepat encoding multithreaded untuk mode kualitas yang baik untuk jumlah  thread yang lebih besar melalui encoding frame parallel:      – 30-34% pengurangan waktu encode untuk 1080p, 16 threads, 1×1 tile  configuration (tile_rows x tile_columns)      – 18-28% pengurangan waktu encode untuk 1080p, 16 threads, konfigurasi tile 2×4      – 18-20% pengurangan waktu encode untuk 2160p, 32 thread, konfigurasi ubin 2×4    * 16-20% percepatan untuk kecepatan=6 hingga 8 dalam mode penyandian gambar diam    * Pengurangan memori tumpukan 5-6% untuk kecepatan=6 hingga 10 dalam mode penyandian waktu nyata    * Peningkatan kecepatan untuk kecepatan=7, 8 dalam waktu nyata mode penyandian    * Peningkatan kecepatan untuk kecepatan=9, 10 dalam mode penyandian layar waktu nyata    * Pengoptimalan untuk meningkatkan efisiensi multi-utas dalam mode penyandian waktu nyata    * Percepatan 10-15% untuk SVC dengan lapisan temporal    * Pengoptimalan SIMD: – Tingkatkan av1_quantize_fp_32x32_neon() 1,05x menjadi 1. 24x lebih cepat      – Tambahkan aom_highbd_quantize_b{,_32x32,_64x64}_adaptive_neon() 3,15x hingga 5,6x lebih cepat dari “C”      – Tingkatkan av1_quantize_fp_64x64_neon() 1,17x hingga 1,66x lebih cepat    _ 1.7xb_omb_quantize() Tambahkan aombx2() lebih cepat  _ 1.7xb_omb_quantize – Add aom_quantize_b_32x32_avx2() 1.4x to 2.3x faster than aom_quantize_b_32x32_avx()      – Add aom_quantize_b_64x64_avx2() 2.0x to 2.4x faster than aom_quantize_b_64x64_ssse3()      – Add aom_highbd_quantize_b_32x32_avx2() 9.0x to 10.5x faster than aom_highbd_quantize_b_32x32_c()      – Add aom_highbd_quantize_b_64x64_avx2() 7.3x to 9.7x faster than aom_highbd_quantize_b_64x64_c()      – Improve aom_highbd_quantize_b_avx2() 1.07x to 1.20x faster      – Improve av1_quantize_fp_avx2() 1.13x to 1.49x faster      – Improve av1_quantize_fp_32x32_avx2() 1.07x to 1.54x faster      – Improve av1_quantize_fp_64x64_avx2()  1.03x menjadi 1,25x lebih cepat      – Tingkatkan av1_quantize_lp_avx2() 1,07x menjadi 1,16x lebih cepatPlus perbaikan bug dan peningkatan lainnya ma ke untuk rilis AOM-AV1 3.5 ini cukup seru. Daftar perubahan v3.5 dapat ditemukan melalui komit Git ini. Saya akan segera mengerjakan beberapa benchmark CPU encode AV1 yang diperbarui.

Itulah berita seputar Google Merilis AOM-AV1 3.5 Dengan Lebih Banyak Percepatan & Pengoptimalan Memori, semoga bermanfaat. Disadur dari Phoronix.com.