Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Makalah
  • Ke-NU-an
  • Kabar
  • Search
Menu

GCC 13 Sekarang Mengaktifkan Vektor 512-bit Untuk AMD Zen 4 Tuning

Posted on February 7, 2023

Pakar kompiler GNU Compiler Collection Jan Hubicka di SUSE terus mengerjakan tweak menit-menit terakhir ke GCC 13 untuk memanfaatkan prosesor AMD Zen 4 terbaru. Kembali pada bulan Oktober AMD memberikan dukungan dasar Zen 4 “znver4” ke GCC 13 sementara selama dua bulan terakhir ini telah banyak pekerjaan penyetelan yang dilakukan oleh SUSE untuk mengaktifkan lebih banyak pengoptimalan dan penyetelan dibandingkan dengan dukungan awal Znver4 yang mengikuti jalur dan tabel biaya yang sama dengan Zen 3.

Selama beberapa minggu terakhir telah banyak penyetelan GCC 13 untuk Zen 4 dan setidaknya satu pengoptimalan lagi mendarat hari ini menjelang rilis stabil GCC 13.1 yang akan keluar dalam satu atau dua bulan ke depan. Tambalan baru

Hubicka memungkinkan vektor 512-bit untuk Zen 4. Hingga saat ini penyetelan kompiler untuk Zen 4 lebih disukai menggunakan instruksi AVX 256-bit daripada instruksi AVX 512-bit di vektorizer otomatis. Namun, pengujian lebih lanjut telah membuktikan bahwa menggunakan vektor 512-bit memang merupakan pendekatan yang paling optimal. Hubicka menjelaskan dengan komit yang membuat perubahan satu baris kode: Aktifkan vektor 512 bit untuk zen4 Sementara register internal 512 dibagi menjadi dua bagian 256 bit vektor 512 bit mengurangi jumlah instruksi untuk dihentikan dan memiliki peluang untuk meningkatkan paralelisme. Ada beberapa tolok ukur TSVC yang meningkat secara signifikan: runtime benchmark 256bit 512bit S2275 48.57 20.67 -58% S311 32.29 16.06 -50% S312 32.30 16.42% SUMR 32.30 16.07 -50% S314.4.42% SMSUMR 32.30 16.07 -50% S314.4.42% S3.4.4.4.4.4.30% S314.42.50% S314. 43.05 21.69 -50% S316 10.80 5.64 -48% S235 61.72 33.91 -45% S161 15.91 9.95 -38% S3251 32.13 20.31 -36% dan tidak ada tolok ukur dengan regresi off-noise. Loop perkalian matriks dasar meningkat sebesar 32%. Diharapkan juga bahwa vektor 512 bit lebih hemat daya (Saya tidak dapat memastikannya). Kelemahannya adalah loop dengan jumlah perjalanan rendah mungkin menjadi lebih lambat saat prolog dan epilog yang tidak divektor lebih sering dipukul. Dengan SPECfp masalah ini terjadi dengan x264 (12% regresi) dan bwaves (6% regresi) dan ini lacak di https://gcc.gnu.org/bugzilla/show_bug.cgi?id=108410 dan akan memerlukan lebih banyak pekerjaan pada vectorizer untuk mendukung epilog bertopeng. Setelah beberapa pengujian tambahan tampaknya menggunakan vektor 512 bit secara default sekarang secara keseluruhan lebih baik pilihan. Sangat menyenangkan melihat penyetelan menit terakhir ini berhasil untuk target Znver4 berlanjut menjelang rilis fitur tahunan GCC 13.1 yang akan datang pada bulan Maret~April. (Memang, idealnya, ini akan melihat pekerjaan ini ditangani pra-peluncuran untuk Zen 4 dan agar kompiler yang dirilis sudah tersedia akan memiliki dukungan yang disetel ini untuk mereka yang ingin mengeksploitasi penanganan “-march=znver4”.) Ini akan menyenangkan untuk melihat bagaimana kinerja kompiler GCC 13.1 dibandingkan dengan kompiler AOCC 4.0 AMD pada prosesor seri Ryzen 7000 dan seri EPYC 9004. Di sisi LLVM/Clang hulu, (sayangnya) tidak ada sesuatu yang baru dalam antrean tinjauan dengan satu-satunya komit Znver4 di sana adalah pengaktifan awal dari bulan Desember yang menyalin penyetelan dari Zen 3 dan membalikkan instruksi baru.

Itulah berita seputar GCC 13 Sekarang Mengaktifkan Vektor 512-bit Untuk AMD Zen 4 Tuning, semoga bermanfaat. Disadur dari Phoronix.com.

Terbaru

  • Profil Farida Farichah, Wakil Menteri Koperasi Kabinet Merah Putih Reshuffle 17 September 2025
  • Ini Info Terbaru Pencairan BSU BPJS Ketenagakerjaan 2025!
  • Cara Reset Printer Epson L3110 2025
  • WhatsApp Tiba-tiba Keluar dan Meminta Verifikasi: Apa yang Harus Dilakukan?
  • Bisakah Saldo BNI Kamu Nol? Fakta dan Cara Mengatasinya
  • Inilah Tanda-tanda Chat Audio di Grup WhatsApp Sudah Disadap
  • Cara Mengatasi Tidak Bisa Live Instagram Karena Tidak Memenuhi Syarat
  • 7 Spek Laptop yang Ideal untuk Coding & Ngoding Web/App
  • Keuntungan dan Kerugian Menggunakan PayPal: Panduan Lengkap
  • Cara Menggunakan Stellarium Web
  • Cara Menghapus Data KTP Pribadi di Pinjol yang Belum Lunas
  • Cara Mengganti Nomor TikTok yang Tidak Aktif atau Hilang Tanpa Verifikasi
  • Cara Menggunakan BCA PayLater Terbaru 2025
  • Cara Mendapatkan IMPoint Indosat IM3 Ooredoo Gratis via MyIM3
  • Apa Arti TikTok ‘Shared With You’?
  • Cara Menghapus Data KTP di Pinjol: Panduan Lengkap
  • Cara Download WhatsApp GB Terbaru 2025 – Fitur Lengkap & Aman
  • Review WhatsApp Beta: Apakah Aman? Cara Instal dan Cara Keluar
  • Bebong: Makna, Asal Usul, dan Penggunaan dalam Bahasa Indonesia
  • Spinjam dan Spaylater: Apa yang Terjadi Jika Terlambat Membayar dan Bisakah Meminjam Lagi?
  • Cara Download dan Menonton Dood Stream Tanpa Iklan – Doods Pro
  • Cara Menghentikan dan Mengatasi Pinjol Ilegal
  • Kode Bank BRI untuk Transfer ke PayPal
  • Cara Menyadap WhatsApp Tanpa Aplikasi dan Kode QR
  • Apa yang Terjadi Jika Telat Bayar Shopee PayLater?
  • Telat Bayar Listrik 1 Hari: Apa yang Terjadi?
  • Cara Mengunduh Foto Profil WhatsApp Teman di Android, iPhone, dan PC/Mac
  • Rekomendasi Aplikasi Edit Foto Ringan Terbaik untuk PC Windows dan macOS
  • Cara Membeli Diamond Mobile Legends Menggunakan Pulsa Telkomsel
  • Tutorial Menggunakan Aplikasi Dana: Cara Top Up Dana dengan Mudah, Cepat, dan Murah untuk Pemula
  • Profil Farida Farichah, Wakil Menteri Koperasi Kabinet Merah Putih Reshuffle 17 September 2025
  • Ini Info Terbaru Pencairan BSU BPJS Ketenagakerjaan 2025!
  • Cara Reset Printer Epson L3110 2025

©2025 emka.web.id | Design: Newspaperly WordPress Theme