Performa Intel Advanced Matrix Extensions [AMX] Dengan Xeon Scalable Sapphire Rapids
Salah satu fitur paling menarik dari prosesor "Sapphire Rapids" Xeon Generasi ke-4 Intel yang Dapat Diskalakan adalah pengenalan Advanced Matrix Extensions (AMX). Ekstensi Intel AMX ISA dimaksudkan untuk mempercepat AI dan beban kerja terkait pembelajaran mesin. Dalam artikel ini adalah melihat kinerja AMX pada prosesor Xeon Platinum 8490H on/off untuk kinerja pembelajaran mesin.
Intel mengungkapkan AMX tiga tahun lalu dan sementara peluncuran Sapphire Rapids ditunda beberapa kali, yang telah memungkinkan insinyur Intel waktu tambahan untuk mendapatkan dukungan perangkat lunak kuadrat pergi. Di sisi kompiler, pekerjaan pengaktifan AMX awal ditayangkan perdana di GCC 11 pada tahun 2021 dan telah menjadi bagian dari LLVM 12 sejak rilis akhir tahun 2020. Dukungan GNU Assembler (Gas) untuk AMX juga memulai debutnya pada tahun 2020. Patch kernel Linux seputar penanganan AMX telah di-upstream sejak Linux 5.16. Sejak itu dengan Linux 5.17 adalah dukungan AMX dengan KVM dan dengan Linux 6.0 adalah perbaikan manajemen daya AMX. Dukungan AMX juga telah masuk ke komponen lain seperti QEMU 7.0 sebagai bagian dari tumpukan virtualisasi Linux.
Untuk Sapphire Rapids dengan AMX, akselerator awalnya adalah unit Tile-Matrix Multiply (TUML) untuk tipe data BF16 dan INT8 untuk mempercepat matriks perkalian seperti yang digunakan dalam beban kerja AI/ML. Karena Intel sudah mulai, dukungan AMX-FP16 sedang dalam proses untuk Granite Rapids dengan dukungan tipe input FP16. AMX adalah ekstensi mandiri yang terpisah dari AVX dan keberadaan dukungan dapat diperiksa melalui /proc/cpuinfo dengan flag "amx_bf16", "amx_int8", dan "amx_tile" yang baru. Semua prosesor Xeon Sapphire Rapids saat ini mendukung Advanced Matrix Extensions.
Sama seperti dukungan AVX-512 yang membutuhkan waktu untuk diadopsi secara luas di antara paket perangkat lunak sumber terbuka, adopsi Intel AMX juga akan memakan waktu. Sementara dukungan kompiler telah ada selama 2+ tahun bersama dengan dokumentasi manual referensi pemrograman. Mitra perangkat lunak Intel hanya memiliki server Sapphire Rapids dalam beberapa bulan terakhir dan pengembang perangkat lunak independen tersebut sekarang menunggu ketersediaan perangkat keras atau menemukan prosesor Xeon yang Dapat Diskalakan Generasi ke-4 dari penyedia cloud publik. Plus ada juga Intel DevCloud. dapat memanfaatkan Advanced Matrix Extensions segera dan kemudian mencapai angka tolok ukur yang menarik dengan kinerja mentah serta efisiensi daya.
Itulah berita seputar Performa Intel Advanced Matrix Extensions [AMX] Dengan Xeon Scalable Sapphire Rapids, semoga bermanfaat. Disadur dari Phoronix.com.