Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

GCC 13 Sekarang Mengaktifkan Vektor 512-bit Untuk AMD Zen 4 Tuning

Posted on February 7, 2023

Pakar kompiler GNU Compiler Collection Jan Hubicka di SUSE terus mengerjakan tweak menit-menit terakhir ke GCC 13 untuk memanfaatkan prosesor AMD Zen 4 terbaru. Kembali pada bulan Oktober AMD memberikan dukungan dasar Zen 4 “znver4” ke GCC 13 sementara selama dua bulan terakhir ini telah banyak pekerjaan penyetelan yang dilakukan oleh SUSE untuk mengaktifkan lebih banyak pengoptimalan dan penyetelan dibandingkan dengan dukungan awal Znver4 yang mengikuti jalur dan tabel biaya yang sama dengan Zen 3.

Selama beberapa minggu terakhir telah banyak penyetelan GCC 13 untuk Zen 4 dan setidaknya satu pengoptimalan lagi mendarat hari ini menjelang rilis stabil GCC 13.1 yang akan keluar dalam satu atau dua bulan ke depan. Tambalan baru

Hubicka memungkinkan vektor 512-bit untuk Zen 4. Hingga saat ini penyetelan kompiler untuk Zen 4 lebih disukai menggunakan instruksi AVX 256-bit daripada instruksi AVX 512-bit di vektorizer otomatis. Namun, pengujian lebih lanjut telah membuktikan bahwa menggunakan vektor 512-bit memang merupakan pendekatan yang paling optimal. Hubicka menjelaskan dengan komit yang membuat perubahan satu baris kode: Aktifkan vektor 512 bit untuk zen4 Sementara register internal 512 dibagi menjadi dua bagian 256 bit vektor 512 bit mengurangi jumlah instruksi untuk dihentikan dan memiliki peluang untuk meningkatkan paralelisme. Ada beberapa tolok ukur TSVC yang meningkat secara signifikan: runtime benchmark 256bit 512bit S2275 48.57 20.67 -58% S311 32.29 16.06 -50% S312 32.30 16.42% SUMR 32.30 16.07 -50% S314.4.42% SMSUMR 32.30 16.07 -50% S314.4.42% S3.4.4.4.4.4.30% S314.42.50% S314. 43.05 21.69 -50% S316 10.80 5.64 -48% S235 61.72 33.91 -45% S161 15.91 9.95 -38% S3251 32.13 20.31 -36% dan tidak ada tolok ukur dengan regresi off-noise. Loop perkalian matriks dasar meningkat sebesar 32%. Diharapkan juga bahwa vektor 512 bit lebih hemat daya (Saya tidak dapat memastikannya). Kelemahannya adalah loop dengan jumlah perjalanan rendah mungkin menjadi lebih lambat saat prolog dan epilog yang tidak divektor lebih sering dipukul. Dengan SPECfp masalah ini terjadi dengan x264 (12% regresi) dan bwaves (6% regresi) dan ini lacak di https://gcc.gnu.org/bugzilla/show_bug.cgi?id=108410 dan akan memerlukan lebih banyak pekerjaan pada vectorizer untuk mendukung epilog bertopeng. Setelah beberapa pengujian tambahan tampaknya menggunakan vektor 512 bit secara default sekarang secara keseluruhan lebih baik pilihan. Sangat menyenangkan melihat penyetelan menit terakhir ini berhasil untuk target Znver4 berlanjut menjelang rilis fitur tahunan GCC 13.1 yang akan datang pada bulan Maret~April. (Memang, idealnya, ini akan melihat pekerjaan ini ditangani pra-peluncuran untuk Zen 4 dan agar kompiler yang dirilis sudah tersedia akan memiliki dukungan yang disetel ini untuk mereka yang ingin mengeksploitasi penanganan “-march=znver4”.) Ini akan menyenangkan untuk melihat bagaimana kinerja kompiler GCC 13.1 dibandingkan dengan kompiler AOCC 4.0 AMD pada prosesor seri Ryzen 7000 dan seri EPYC 9004. Di sisi LLVM/Clang hulu, (sayangnya) tidak ada sesuatu yang baru dalam antrean tinjauan dengan satu-satunya komit Znver4 di sana adalah pengaktifan awal dari bulan Desember yang menyalin penyetelan dari Zen 3 dan membalikkan instruksi baru.

Itulah berita seputar GCC 13 Sekarang Mengaktifkan Vektor 512-bit Untuk AMD Zen 4 Tuning, semoga bermanfaat. Disadur dari Phoronix.com.

Terbaru

  • Survei Parpol Terbaru: Gerindra Unggul, PDIP Ketiga, PKB 5%
  • PKB Resmi Jalin Kerjasama dengan Institut Teknologi & Sains NU Kalimantan
  • Inilah Urutan Terbaru Pangkat TNI Angkatan Darat! (Update 2026)
  • Inilah Panduan Lengkap Operator Sekolah Mengelola SPTJM e-Ijazah dan Menghindari Kesalahan Fatal Data Kelulusan
  • Inilah Syarat dan Penilaian Seleksi Siswa Unggul ITB Jalur UTBK
  • Download Video Viral Guru Bahasa Inggris? Awas Berisi Virus!
  • PKB Minta Kasus C4bul Pendiri Ponpes Pati Tidak Ada Ampunan & Tuntutan Maksimal
  • Inilah Kronologi Video Viral Preman vs Sopir Di Sumedang
  • Ini Alasan UKP Pariwisata Disindir Konten Kreator Drone Gunung Rinjani
  • Inilah Kronologi Viral Video Dugaan Asusila Pegawai Disdik Pasuruan di Mobil Dinas
  • Polisi Polda Sumut Resmi Dipecat: Dari Video Viral Sampai Sidang Etik Ini Kronologinya
  • ASUS ExpertBook Ultra: Produk Flagship yang Cerminkan Kepemimpinan ASUS di Pasar Global
  • Inilah Tahapan dan Syarat Pendaftaran Beasiswa Garuda 2026 Gelombang II (25 Mei – 25 Juni 2026)
  • Ini Maksud Soal Tugas Guru Non-ASN Berakhir 2027!
  • Apa Itu Siscamling? Inilah Cara Mengaktifkan Paket Anti Spam Telkomsel
  • Sah, Nilai TKA Jadi Salah Satu Komponen Seleksi Siswa SPMB Secara Nasional 2026
  • Inilah 3 Lagi Pinjol Ilegal Menurut OJK Tahun 2026
  • Cara Login Proktor Browser OSN Mode Online, Uji Coba OSN Semua Jenjang Terbaru
  • Inilah Link Web Komunikasi OSN 2026 anbk.kemendikdasmen.go.id/osnk ANBK Kemendikdasmen untuk Simulasi
  • Inilah Jadwal Pembagian Deviden BBRI 2026, Siap-siap!
  • Ini Alasan Kenapa Followers IG Berkurang Sendiri Mei 2026?
  • Panduan Download vhd-osnk-2025_fresh versi 29.25.5.0 untuk Uji Coba OSN-K SMA SMP Sederajat 2026
  • Iniloh Syarat dan Komponen Nilai Seleksi Siswa Unggul ITB Jalur Nilai Rapor 2026/2027
  • Inilah Syarat dan Prosedur Ikut Seleksi Siswa Unggul ITB Jalur Tes Tulis 2026/2027
  • Inilah Kronologi & Latar Belakang Kasus Erin Taulany vs ART Hera: Masalah Facebook Pro?
  • Inilah Alasan Kenapa Ending Film Children of Heaven diubah di Indonesia
  • Ini Alasan Hanny Kristianto Cabut Sertifikat Mualaf Richard Lee
  • Inilah Syarat Dokumen SSU ITB 2024-2026 yang Wajib Kalian Siapkan Supaya Nggak Gagal Seleksi Administrasi
  • Inilah Episyrphus Balteatus, Lalat Unik Penyamar yang Sangat Bermanfaat bagi Taman Kalian
  • Inilah Cara Lolos Seleksi Siswa Unggul ITB Lewat Jalur Tes Tulis Biar Jadi Mahasiswa Ganesha
  • How to build a high-performance private photo cloud with Immich and TrueNAS SCALE
  • How to Build an Endgame Local AI Agent Setup Using an 8-Node NVIDIA Cluster with 1TB Memory
  • How to Master Windows Event Logs to Level Up Your Cybersecurity Investigations and SOC Career
  • How to Build Ultra-Resilient Databases with Amazon Aurora Global Database and RDS Proxy for Maximum Uptime and Performance
  • How to Build Real-Time Personalization Systems Using AWS Agentic AI to Make Every User Feel Special
  • How to Use Anthropic’s New AI Agents to Automate Your Financial Workflows Like a Pro
  • How to Secure Brand Deals Easily Using AI-Powered Professional Pitch Estimates in Just a Few Clicks
  • How to Master Google’s NotebookLM and Its Revolutionary AI Features for Smarter Learning
  • How to Use Claude AI in PowerPoint to Create Amazing Presentations Automatically
  • How to Utilize OpenAI’s Advanced Real-time Voice Models for Interactive Applications
  • Apa itu Spear-Phishing via npm? Ini Pengertian dan Cara Kerjanya yang Makin Licin
  • Apa Itu Predator Spyware? Ini Pengertian dan Kontroversi Penghapusan Sanksinya
  • Mengenal Apa itu TONESHELL: Backdoor Berbahaya dari Kelompok Mustang Panda
  • Siapa itu Kelompok Hacker Silver Fox?
  • Apa itu CVE-2025-52691 SmarterMail? Celah Keamanan Paling Berbahaya Tahun 2025

©2026 emka.web.id | Design: Newspaperly WordPress Theme