Intels x86-simd-sort 4.0 Memberikan Peningkatan 2x Untuk Kinerja AVX-512, Menambahkan Kode AVX2

Awal tahun ini Intel menerbitkan x86-simd-sort sebagai perpustakaan penyortiran yang sangat cepat yang awalnya memanfaatkan instruksi AVX-512 untuk penyortiran 10~17x lebih cepat. Numpy adalah salah satu proyek besar pertama yang mengadopsi x86-simd-sort dan OpenJDK baru-baru ini mengadopsinya. Sejak rilis awal, kami telah melihat lebih banyak fitur dan optimalisasi kinerja yang ditambahkan. Hari ini menandai peluncuran x86-simd-sort 4.0 dan memberikan kinerja yang lebih baik sekaligus menambahkan jalur kode AVX2 untuk membantu mereka yang tidak memiliki AVX-512.
Dengan x86-simd-sort 4.0 mereka berhasil mencapai kecepatan 2x untuk menyortir data 32-bit. Lumayan untuk kecepatan pengurutan yang sangat cepat… Sementara itu, data 64-bit akan mengalami peningkatan kecepatan sekitar 1,5x sedangkan data 16-bit akan mengalami peningkatan kecepatan sekitar 1,25x.

Selain membuat x86-simd-sort menjadi lebih cepat, rilis v4.0 terkenal karena kini memperkenalkan jalur kode AVX2 untuk tipe data 32-bit dan 64-bit. Dengan jalur kode AVX2 yang dioptimalkan, Intel mendapati implementasinya 12x lebih cepat untuk data 32-bit dibandingkan std::sort dan sekitar 7x lebih cepat untuk mengurutkan data 64-bit. Hal ini penting karena CPU Intel Core terbaru tidak memiliki AVX-512, jadi sekarang setidaknya mereka juga dapat menggunakan x86-simd-sort dengan AVX2.
Dengan rilis baru ini, x86-simd-sort 4.0 kini juga dapat dibangun sebagai perpustakaan bersama yang juga memiliki dukungan pengiriman run-time untuk secara otomatis memilih versi tercepat di antara AVX-512 / AVX2 / skalar tergantung pada prosesornya.
Unduhan dan detail lebih lanjut tentang rilis x86-simd-sort 4.0 melalui GitHub.

Itulah berita seputar Intels x86-simd-sort 4.0 Memberikan Peningkatan 2x Untuk Kinerja AVX-512, Menambahkan Kode AVX2, semoga bermanfaat. Disadur dari Phoronix.com.