Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

AMD Zen 4 Tuning Patch Mulai Mendarat Di GCC 13

Posted on December 22, 2022

Mengikuti pengaktifan target dasar AMD Zen 4 “znver4” yang digabungkan untuk kompiler GCC 13 pada bulan Oktober, tambalan untuk mulai memberikan dukungan yang disesuaikan telah mulai digabungkan untuk rilis Koleksi Penyusun GNU berikutnya. Seperti disebutkan dalam artikel Phoronix sebelumnya, pengaktifan Znver4 awal di GCC 13 membalikkan instruksi baru yang didukung oleh seri Ryzen 7000 dan prosesor seri EPYC 9004 tetapi disalin melalui penyetelan yang ada dari Zen 3. Awal bulan ini seorang insinyur SUSE kemudian mulai mengerjakan sebuah tabel biaya Zen 4 yang tepat dan penyetelan untuk prosesor Zen 4 mengingat karakteristiknya yang berbeda dari Zen 3. Tambalan dari SUSE itulah yang telah digabungkan sejak kemarin ke GCC 13. Tambalan

Jan Hubicka untuk biaya Znver4 telah tersedia untuk tabel biaya instruksi yang sesuai untuk kompiler: “Biaya pembaruan znver4 sebagian besar didasarkan pada data yang diukur oleh Agner Fog. Dibandingkan dengan generasi sebelumnya, x87 menjadi sedikit lebih lambat yang mungkin bukan masalah besar (dan kami memiliki cakupan pembandingan minimal untuk itu). Satu peningkatan yang menarik adalah pengurangan biaya FMA. Saya juga memperbarui biaya pemuatan/penyimpanan AVX256 berdasarkan latensi (bukan throughput yang dua kali lipat dari avx256). Vektorisasi keseluruhan AVX512 tampaknya mengesankan Saya telah melihat beberapa tolok ukur TSVC tetapi karena secara internal 512 vektor dipecah menjadi 256 vektor, ini agak berisiko dan tidak menang dalam skor SPEC (kebanyakan dengan meregresi tolok ukur dengan loop yang memiliki jumlah perjalanan kecil seperti x264 dan pertukaran), jadi untuk saat ini saya akan menyetel tune AVX256_OPTIMAL tetapi saya masih memainkannya. Kami meningkatkan sejak ZNVER1 dalam memilih ukuran vektorisasi dan juga memiliki prolog/epilog yang divektorisasi sehingga dimungkinkan untuk membuat avx512 menang kecil secara keseluruhan.”Dan kemudian set penyetelan kedua untuk Zen 4 juga telah digabungkan:”Menambahkan nada yang diperlukan untuk mikroarsitektur zen4 . Saya menambahkan dua kenop baru. TARGET_AVX512_SPLIT_REGS yang digunakan untuk menentukan bahwa secara internal 512 vektor dibagi menjadi 256 vektor. Ini memengaruhi biaya vektorisasi dan lebar reasosiasi. Ini mungkin juga mempengaruhi biaya RTX namun saya ragu ini sangat berguna karena pengoptimal RTL biasanya tidak menilai antara 256 dan 512 vektor. Saya juga menambahkan X86_TUNE_AVOID_256FMA_CHAINS. Karena fma telah meningkat di zen4, bendera ini mungkin bukan kemenangan kecuali untuk tolok ukur yang sangat spesifik. Saya masih melakukan beberapa pengujian yang lebih rinci di sini. Kalau tidak, saya menonaktifkan pengumpulan di zen4 untuk 2 bagian dan 4 bagian. Kami dapat membuka kodenya dan karena latensi hanya meningkat sejak opencoding zen3 lebih baik daripada instruksi sebenarnya. Ini menunjukkan pada 4 tolok ukur tsvc. Saya akhirnya mengatur AVX256_OPTIMAL. Ini adalah kompromi. Ada beberapa tolok ukur tsvc yang meningkat secara nyata (hingga 250%) namun ada juga sedikit regresi. Sebagian besar dapat diselesaikan dengan meningkatkan biaya vec_perm di vektorizer. Namun ini tidak menyembuhkan regresi sekitar 14% pada x264 yang cukup penting. Di sini kami menghasilkan loop vektor untuk avx512 yang mungkin akan lebih cepat jika loop tersebut memiliki jumlah iterasi yang cukup tinggi. Kami menemukan masalah ini dengan avx256 juga: karena perulangan berulang beberapa kali, hanya prolog/epilog yang digunakan. Menambahkan putaran kode prolog/epilog lagi tidak membuatnya lebih baik. Akhirnya saya mengaktifkan penyimpanan avx untuk memcpy dan memset berukuran constnat. Saya tidak yakin mengapa ini adalah fitur keikutsertaan. Saya pikir untuk sebagian besar perangkat keras ini adalah kemenangan.” untuk GCC 13. Sementara itu AMD menawarkan kompiler AOCC 4.0 bagi mereka yang menginginkan kompiler optimal Zen 4 yang siap produksi sekarang. Saya akan mengerjakan beberapa tolok ukur GCC Git baru pada Zen 4 selama Natal.

Itulah berita seputar AMD Zen 4 Tuning Patch Mulai Mendarat Di GCC 13, semoga bermanfaat. Disadur dari Phoronix.com.

Terbaru

  • Apple Dikabarkan Bikin iPhone Layar Lengkung 4 Sisi, Niru Xiaomi?
  • Inikah HP Samsung Terawet? Samsung Diam-diam Uji Baterai 20.000 mAh
  • Ini Deretan HP Murah RAM 12 GB yang Bisa Bikin Multitasking Ngebut!
  • Ini Trik Rahasia Dapat Candy Blossom di Grow a Garden, Nggak Cuma dari Event!
  • Siap-siap Boros! Ini Bocoran Skin Starlight Januari 2026 dan Update Seru M7
  • Moto X70 Air Pro Bakal Punya Kamera Periskop Canggih!
  • Ternyata Nggak Semua Aplikasi Bisa QRIS CPM di Alfamart, Ini Penjelasannya!
  • Lagi Order Tiba-tiba Gojek Error? Jangan Panik Dulu, Coba Langkah Praktis Ini!
  • Belum Tahu? Inilah Cara Melihat Kode Verifikasi Email Saya 6 Digit yang Sering Bikin Bingung!
  • Belum Tahu? Ini Cara Dapat Akses Premium Viu & Vidio Gratis Pakai Axis!
  • Belum Tahu? Inilah Fakta Kamera 0,5 di Samsung Galaxy A05s, Jangan Salah Beli!
  • Nggak Perlu Panik! Ini Trik Jitu Mengatasi Preview Pane PDF yang Hilang di Windows 10 & 11
  • Ini Video Cikgu Nisa Viral di TikTok? Awas Jangan Asal Klik Link Nonton!
  • Kok Menu Undang Teman di Melolo Hilang? Gini Cara Mengembalikannya!
  • Apa Itu Putlocker? Ini Pengertian dan Deretan Alternatif Penggantinya
  • Apa Itu Extend Volume? Ini Cara Memperluas Drive C di Windows 11
  • Ini Trik AFK Fish It Roblox Pakai LDCloud, Auto Panen Ikan Tanpa Bikin HP Panas!
  • Apa itu Game Zenless Zone Zero (ZZZ) HoYoVerse? Ini Cara Mainnya
  • Cuma Kurang 1 Rupiah! Misteri Lucky Draw Akulaku Rp300 Ribu, Bisa Cair Nggak Sih?
  • Video Melolo Cuma Layar Hitam? Ini Trik Ampuh Mengatasinya, Pasti Berhasil!
  • Mau Simpan Video Twitter dan TikTok Tanpa Aplikasi? Begini Cara Praktis Pakai VidsSave!
  • Mau Gaji Dolar? Gini Caranya Tembus Kerja di Australia, Jangan Sampai Salah Visa!
  • Belum Tahu? Inilah Fakta MigoReels, Katanya Nonton Drama Bisa Dapat Rp700 Ribu!
  • Apa Itu Event Invite Friends CapCut? Ini Pengertian dan Cara Kerjanya Biar Cuan
  • Apa Itu MJ di FF? Ini Pengertian, Asal-Usul, dan Risiko di Balik Istilah Tersebut
  • Apa Itu Pengertian Penonaktifan SPayLater? Ini Durasi Blokir Akibat Telat Bayar
  • Apa Itu Rasio Gambar Ukuran 1:1 di Canva? Ini Pengertian dan Cara Buatnya
  • Pengiriman Shopee Express Hemat itu Berapa Lama? Ini Pengertian dan Estimasi Sampainya
  • Android 2025: Aplikasi Baru dan Smartphone Impian yang Akan Datang!
  • Apa Itu Google AI Pro Ultra? Ini Pengertian dan Penjelasan Lengkapnya
  • Apa itu Cosmic Desktop: Pengertian dan Cara Pasangnya di Ubuntu 26.04?
  • Apa Itu Auvidea X242? Pengertian Carrier Board Jetson T5000 dengan Dual 10Gbe
  • Elementary OS 8.1 Resmi Rilis: Kini Pakai Wayland Secara Standar!
  • Apa Itu Raspberry Pi Imager? Pengertian dan Pembaruan Versi 2.0.3 yang Wajib Kalian Tahu
  • Performa Maksimal! Ini Cara Manual Update Ubuntu ke Linux Kernel 6.18 LTS
  • Begini Cara Buat Generator Stiker WhatsApp Otomatis Menggunakan Python dan OpenAI GPT-Image-1
  • Inilah Cara Kerja AI Instagram Deteksi Konten Berbahaya dan Spam Secara Otomatis
  • Prompt AI Tahun Baruan di Bundaran HI
  • Prompt AI Pamer iPhone 17 Pro Max Orange
  • Apa itu GPT 5.2 di Microsoft Copilot? Ini Pengertian dan Keunggulannya
  • Apa Itu Paket WhatsApp API Palsu di NPM? Ini Pengertian dan Bahayanya
  • Apa Itu Serangan Spear-Phishing Microsoft 365? Ini Pengertian dan Modusnya
  • Apa Itu Ploutus? Mengenal Ransomware P0ADUS yang Baru Saja Ditindak DOJ
  • Apa itu CVE-2025-68664? Memahami Celah Keamanan LangGrinch pada LangChain
  • Kronologi Kasus Pencurian Data Karyawan Data Breach Korean Air 2025
Beli Morning Star Kursi Gaming/Kantor disini: https://s.shopee.co.id/805iTUOPRV
Beli Pemotong Rumput dengan Baterai IRONHOOF 588V Mesin Potong Rumput 88V disini https://s.shopee.co.id/70DBGTHtuJ

©2026 emka.web.id | Design: Newspaperly WordPress Theme