Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

GCC 13 Sekarang Mengaktifkan Vektor 512-bit Untuk AMD Zen 4 Tuning

Posted on February 7, 2023

Pakar kompiler GNU Compiler Collection Jan Hubicka di SUSE terus mengerjakan tweak menit-menit terakhir ke GCC 13 untuk memanfaatkan prosesor AMD Zen 4 terbaru. Kembali pada bulan Oktober AMD memberikan dukungan dasar Zen 4 “znver4” ke GCC 13 sementara selama dua bulan terakhir ini telah banyak pekerjaan penyetelan yang dilakukan oleh SUSE untuk mengaktifkan lebih banyak pengoptimalan dan penyetelan dibandingkan dengan dukungan awal Znver4 yang mengikuti jalur dan tabel biaya yang sama dengan Zen 3.

Selama beberapa minggu terakhir telah banyak penyetelan GCC 13 untuk Zen 4 dan setidaknya satu pengoptimalan lagi mendarat hari ini menjelang rilis stabil GCC 13.1 yang akan keluar dalam satu atau dua bulan ke depan. Tambalan baru

Hubicka memungkinkan vektor 512-bit untuk Zen 4. Hingga saat ini penyetelan kompiler untuk Zen 4 lebih disukai menggunakan instruksi AVX 256-bit daripada instruksi AVX 512-bit di vektorizer otomatis. Namun, pengujian lebih lanjut telah membuktikan bahwa menggunakan vektor 512-bit memang merupakan pendekatan yang paling optimal. Hubicka menjelaskan dengan komit yang membuat perubahan satu baris kode: Aktifkan vektor 512 bit untuk zen4 Sementara register internal 512 dibagi menjadi dua bagian 256 bit vektor 512 bit mengurangi jumlah instruksi untuk dihentikan dan memiliki peluang untuk meningkatkan paralelisme. Ada beberapa tolok ukur TSVC yang meningkat secara signifikan: runtime benchmark 256bit 512bit S2275 48.57 20.67 -58% S311 32.29 16.06 -50% S312 32.30 16.42% SUMR 32.30 16.07 -50% S314.4.42% SMSUMR 32.30 16.07 -50% S314.4.42% S3.4.4.4.4.4.30% S314.42.50% S314. 43.05 21.69 -50% S316 10.80 5.64 -48% S235 61.72 33.91 -45% S161 15.91 9.95 -38% S3251 32.13 20.31 -36% dan tidak ada tolok ukur dengan regresi off-noise. Loop perkalian matriks dasar meningkat sebesar 32%. Diharapkan juga bahwa vektor 512 bit lebih hemat daya (Saya tidak dapat memastikannya). Kelemahannya adalah loop dengan jumlah perjalanan rendah mungkin menjadi lebih lambat saat prolog dan epilog yang tidak divektor lebih sering dipukul. Dengan SPECfp masalah ini terjadi dengan x264 (12% regresi) dan bwaves (6% regresi) dan ini lacak di https://gcc.gnu.org/bugzilla/show_bug.cgi?id=108410 dan akan memerlukan lebih banyak pekerjaan pada vectorizer untuk mendukung epilog bertopeng. Setelah beberapa pengujian tambahan tampaknya menggunakan vektor 512 bit secara default sekarang secara keseluruhan lebih baik pilihan. Sangat menyenangkan melihat penyetelan menit terakhir ini berhasil untuk target Znver4 berlanjut menjelang rilis fitur tahunan GCC 13.1 yang akan datang pada bulan Maret~April. (Memang, idealnya, ini akan melihat pekerjaan ini ditangani pra-peluncuran untuk Zen 4 dan agar kompiler yang dirilis sudah tersedia akan memiliki dukungan yang disetel ini untuk mereka yang ingin mengeksploitasi penanganan “-march=znver4”.) Ini akan menyenangkan untuk melihat bagaimana kinerja kompiler GCC 13.1 dibandingkan dengan kompiler AOCC 4.0 AMD pada prosesor seri Ryzen 7000 dan seri EPYC 9004. Di sisi LLVM/Clang hulu, (sayangnya) tidak ada sesuatu yang baru dalam antrean tinjauan dengan satu-satunya komit Znver4 di sana adalah pengaktifan awal dari bulan Desember yang menyalin penyetelan dari Zen 3 dan membalikkan instruksi baru.

Itulah berita seputar GCC 13 Sekarang Mengaktifkan Vektor 512-bit Untuk AMD Zen 4 Tuning, semoga bermanfaat. Disadur dari Phoronix.com.

Terbaru

  • Daftar Sekarang! Beasiswa S2 di Italia dari IYT Scholarship 2026 Sudah Dibuka
  • Sejarah Hantavirus dan Perkembangannya Sampai ke Indonesia
  • Kementerian Pendidikan: Mapel Bahasa Inggris Wajib di SD Mulai 2027!
  • Ketua Fraksi PKB MPR-RI: Kemenag Respon Cepat Pendidikan Santri Ndolo Kusumo Pati yang Terdampak
  • Viral Video Sejoli Di Balai Kota Panggul Trenggalek, Satpol PP Janji Usut
  • Video Viral Wakil Wali Kota Batam Tegur Keras Pasir Ilegal
  • LPDP Buka Peluang Beasiswa S3 Prancis 2026, Simak Syaratnya!
  • Inilah Panduan Lengkap dan Aturan Main Seleksi Penerimaan Murid Baru (SPMB) SMA dan SMK Negeri Jawa Tengah Tahun 2026
  • Inilah Syarat dan Cara Daftar MOFA Taiwan Fellowship 2027
  • RESMI! Inilah Macam Jalur di SPMB Sekolah Tahun Ajaran 2026
  • Ini Loh Rute Terbaru TransJOGJA Per Mei 2026, Jangan Salah Naik!
  • Inilah Jadwal Operasional MRT Jakarta Per Mei 2026, Berubah Dimana?
  • Inilah Syarat dan Mekanisme Seleksi Siswa Unggul ITB Jalur Talenta (OSN, Seniman, Hafidz, Atlet dll) 2026/2027
  • Inilah Daftar Saham Farmasi di BEI Per Mei 2026, Pilih Mana?
  • Kesehatan Mental Itu Penting: Inilah Isi Chat Terakhir Karyawan Minimarket Sukabumi Bundir
  • Inilah Kampus Swasta Terbaik Jurusan Farmasi di Area Malang Raya
  • Cara Login EMIS 4.0 Kemenag Terbaru 2026 Pakai Akun Lembaga dan PTK Guru Madrasah Aktivasi
  • Survei Parpol Terbaru: Gerindra Unggul, PDIP Ketiga, PKB 5%
  • PKB Resmi Jalin Kerjasama dengan Institut Teknologi & Sains NU Kalimantan
  • Inilah Urutan Terbaru Pangkat TNI Angkatan Darat! (Update 2026)
  • Inilah Panduan Lengkap Operator Sekolah Mengelola SPTJM e-Ijazah dan Menghindari Kesalahan Fatal Data Kelulusan
  • Inilah Syarat dan Penilaian Seleksi Siswa Unggul ITB Jalur UTBK
  • Download Video Viral Guru Bahasa Inggris? Awas Berisi Virus!
  • PKB Minta Kasus C4bul Pendiri Ponpes Pati Tidak Ada Ampunan & Tuntutan Maksimal
  • Inilah Kronologi Video Viral Preman vs Sopir Di Sumedang
  • Ini Alasan UKP Pariwisata Disindir Konten Kreator Drone Gunung Rinjani
  • Inilah Kronologi Viral Video Dugaan Asusila Pegawai Disdik Pasuruan di Mobil Dinas
  • Polisi Polda Sumut Resmi Dipecat: Dari Video Viral Sampai Sidang Etik Ini Kronologinya
  • ASUS ExpertBook Ultra: Produk Flagship yang Cerminkan Kepemimpinan ASUS di Pasar Global
  • Inilah Tahapan dan Syarat Pendaftaran Beasiswa Garuda 2026 Gelombang II (25 Mei – 25 Juni 2026)
  • How to build a high-performance private photo cloud with Immich and TrueNAS SCALE
  • How to Build an Endgame Local AI Agent Setup Using an 8-Node NVIDIA Cluster with 1TB Memory
  • How to Master Windows Event Logs to Level Up Your Cybersecurity Investigations and SOC Career
  • How to Build Ultra-Resilient Databases with Amazon Aurora Global Database and RDS Proxy for Maximum Uptime and Performance
  • How to Build Real-Time Personalization Systems Using AWS Agentic AI to Make Every User Feel Special
  • Testing Baidu Ernie 5.1, ultra-efficient thinking mode to solve your most complex coding and reasoning challenges with ease
  • How to Evaluate AI Logic Performance Using DeepSeek V4 Flash Think and Gemini 3.1 Flash Light in Complex Reasoning Tests
  • How to Build Your Own Content Factory Using the New Google NotebookLM Intelligence Updates
  • How to Use DFlash for Blazing Fast AI Text Generation on Gemma 4 26B
  • How to Optimize Your AI Agent Using Compiled Knowledge Layers to Replace Traditional RAG Systems
  • Apa itu Spear-Phishing via npm? Ini Pengertian dan Cara Kerjanya yang Makin Licin
  • Apa Itu Predator Spyware? Ini Pengertian dan Kontroversi Penghapusan Sanksinya
  • Mengenal Apa itu TONESHELL: Backdoor Berbahaya dari Kelompok Mustang Panda
  • Siapa itu Kelompok Hacker Silver Fox?
  • Apa itu CVE-2025-52691 SmarterMail? Celah Keamanan Paling Berbahaya Tahun 2025

©2026 emka.web.id | Design: Newspaperly WordPress Theme