Menjelang minggu Supercomputing SC23, versi baru OpenBLAS telah diterbitkan untuk pustaka Basic Linear Algebra Subprograms (BLAS) sumber terbuka terkemuka ini. OpenBLAS 0.3.25 menghadirkan peningkatan baru untuk CPU Intel dan AMD x86_64 serta sejumlah peningkatan umum, dan penyetelan lanjutan untuk arsitektur lain seperti ARM64, POWER, dan LoongArch.
OpenBLAS 0.3.25 menghadirkan sejumlah perbaikan umum pada perpustakaan BLAS ini, perbaikan yang dibangun oleh kompiler Cray CCE, melakukan back-port beberapa perubahan dari rilis perpustakaan referensi LAPACK 3.12 yang akan datang, dan kemudian berbagai perbaikan khusus arsitektur.
Untuk CPU Intel terdapat optimasi AVX-512 yang ditambahkan untuk ?ASUM pada prosesor Sapphire Rapids dan Cooper Lake. Untuk CPU AMD, terdapat perbaikan untuk deteksi otomatis waktu kompilasi prosesor AMD Ryzen Zen 3 dan Zen 4.
Di sisi ARM64 terdapat berbagai perbaikan, sejumlah perbaikan berbeda untuk IBM POWER, dan kemudian LoongArch 64-bit telah menambahkan kernel SGEMV dan DTRSM yang dioptimalkan.
Unduhan dan detail lebih lanjut tentang rilis OpenBLAS 0.3.25 melalui GitHub.
Itulah berita seputar OpenBLAS 0.3.25 Menambahkan Optimasi AVX-512 Baru Untuk Sapphire Rapids & Lainnya, semoga bermanfaat. Disadur dari Phoronix.com.