Insinyur kompiler SUSE Jan Hubicka telah mendapatkan beberapa penyetelan target CPU AMD Zen 4 "znver4" tambahan menjelang rilis kompiler stabil GCC 13 yang akan datang.
Sejak Desember, pengembang lama GNU Compiler Collection telah meluncurkan berbagai patch penyetelan Zen 4 untuk GCC 13, menebus dukungan kompiler Zen 4 yang agak mendasar yang dikontribusikan oleh AMD pada bulan Oktober yang pada dasarnya membawa target Zen 3 dan mengaktifkan ekstensi ISA CPU baru ditemukan dengan Zen 4.
Selama beberapa minggu terakhir kami telah melihat beberapa putaran penyetelan Zen 4 oleh Hubicka untuk memasukkan apa yang akan menjadi rilis stabil GCC 13.1. Pada hari Senin tambalan terbaru digabungkan:
tambalan ini menambahkan lebih banyak lagu untuk zen4:
- nada baru untuk instruksi pencar avx512. Dalam tolok ukur mikro, ini tampaknya merupakan kerugian yang konsisten dibandingkan dengan coe berkode terbuka
- Nonaktifkan penggunaan gathering untuk zen4. Meskipun ini adalah kemenangan untuk tolok ukur mikro (berdasarkan TSVC), mengaktifkan pengumpulan adalah kerugian bagi parest. Jadi untuk saat ini tampaknya aman untuk mempertahankannya.
- nonaktifkan pass untuk menghindari rantai FMA untuk znver4 karena fmadd dioptimalkan dan tampaknya tidak menyebabkan regresi. Setelah GCC 13 siap untuk dirilis, akan menarik untuk melihat bagaimana penyetelan AMD Zen 4 ini dibandingkan dengan kompiler AOCC 4.0 AMD sebagai hilir LLVM/Dentang. AMD melakukan upstream pengaktifan Zen 4 awal mereka ke LLVM/Clang yang mendarat pada awal Desember tetapi saat penulisan belum ada tambalan lanjutan di sana.
Dengan rilis kompiler putaran berikutnya, -march=znver4 dapat digunakan jika ingin memenuhi instruksi dan pengoptimalan kompiler untuk prosesor seri AMD Ryzen 7000 dan seri AMD EPYC 9004.
Itulah berita seputar Lebih Banyak Pekerjaan Tuning Kompiler AMD Zen 4 Di GCC 13, semoga bermanfaat. Disadur dari Phoronix.com.