Insinyur Google Memperkenalkan Dukungan "Light AVX" Dalam LLVM

Insinyur Google Ilya Tocar telah memperkenalkan gagasan dukungan AVX "ringan" dalam infrastruktur kompiler LLVM untuk memanfaatkan beberapa manfaat Advanced Vector Extensions (AVX) tetapi mencoba untuk menghindari dampak daya/frekuensi yang dimiliki oleh penggunaan AVX-512 pada generasi Intel yang lebih lama prosesor. Digabung ke LLVM 16 Git kemarin -- sesaat sebelum berakhirnya pengembangan fitur LLVM 16 -- apakah ini memperkenalkan konsep AVX "ringan" ke kompiler sumber terbuka ini. Mode AVX ringan ini memungkinkan untuk menghasilkan beban/penyimpanan 256-bit bahkan jika preferensi diatur (melalui opsi kompiler -mprefer-vector-width=128) untuk memilih lebar vektor 128-bit.

Mode ringan AVX ini dapat diaktifkan untuk kompiler Dentang dengan meneruskan +allow-light-256-bit ke opsi kompiler -mattr=. Mode AVX ringan ini dihubungkan untuk digunakan pada prosesor Intel Icelake dan yang lebih lama di mana mungkin ada dampak kinerja (daya/frekuensi) saat menghadapi penggunaan AVX 256-bit/512-bit. CPU Intel yang lebih baru tidak memiliki masalah besar dengan penggunaan AVX-512 -- jika Anda melewatkannya, lihat perbandingan benchmark AVX-512 Sapphire Rapids saya. Demikian pula, dukungan AVX-512 AMD yang diperkenalkan dengan prosesor Zen 4 juga tidak memiliki masalah frekuensi/daya dengan AVX-512. Ilya Tocar menyimpulkan pekerjaan AVX ringan ini untuk LLVM dengan pesan komit: Instruksi AVX/AVX512 dapat menyebabkan penurunan frekuensi, mis. Skylake. Besarnya penurunan frekuensi/kinerja tergantung pada instruksi (perkalian vs beban/penyimpanan) dan lebar vektor. Saat ini pengguna yang ingin menghindari penurunan ini dapat menentukan -mprefer-vector-width=128. Namun ini juga mencegah pembuatan instruksi selebar 256-bit, yang tidak memiliki penurunan frekuensi terkait (terutama memuat/menyimpan). Tambahkan bendera penyetelan yang memungkinkan pembuatan/penyimpanan AVX 256-bit, bahkan ketika -mprefer-vector-width=128 disetel, untuk mempercepat memcpy&co. Diverifikasi bahwa menjalankan memcpy loop pada semua inti tidak memiliki dampak frekuensi dan nol penghitung perf CORE_POWER:LVL[12]_TURBO_LICENSE. Membuat coping memory lebih cepat misalnya: BM_memcpy_aligned/256 80,7 GB/dtk ± 3% 96,3 GB/dtk ± 9% +19,33% (p=0,000 n=9+9) Opsi AVX "ringan" ini untuk CPU Intel generasi sebelumnya akan ditemukan di LLVM 16.0 yaitu diharapkan untuk rilis sekitar 7 Maret.

Itulah berita seputar Insinyur Google Memperkenalkan Dukungan "Light AVX" Dalam LLVM, semoga bermanfaat. Disadur dari Phoronix.com.