Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

Llamafile 0.8 Dirilis Dengan Dukungan LLaMA3 & Grok, Performa F16 Lebih Cepat

Posted on April 25, 2024

Llamafile telah menjadi proyek yang cukup menarik dari grup Ocho Mozilla di era AI. Llamafile memudahkan menjalankan dan mendistribusikan model bahasa besar (LLM) yang mandiri dalam satu file. Llamafile dibuat dari Llama.cpp dan memudahkan pengiriman seluruh LLM sebagai satu file dengan dukungan eksekusi CPU dan GPU. Llamafile 0.8 kini hadir untuk ikut serta dalam kesenangan LLaMA3 serta memberikan dukungan model lain dan meningkatkan kinerja CPU.
Llamafile 0.8 adalah rilis menarik dengan tambahan dukungan untuk LLaMA3, Grok, dan Mixtral 8x22b.
Model Mixture of Experts (MoE) seperti Mixtral dan Grok kini juga 2~5x lebih cepat untuk dieksekusi pada CPU setelah memfaktorkan ulang kode CPU tinyBLAS. Ada juga performa F16 sekitar 20% lebih cepat di Raspberry Pi 5, performa F16 sekitar 30% lebih cepat di Intel Skylake, dan performa F16 sekitar 60% lebih cepat di Apple M2.

Llamafile 0.8 juga menghadirkan peningkatan deteksi fitur CPU dan peningkatan lainnya:
– Dukungan untuk LLaMA3 sekarang tersedia
– Dukungan untuk Grok telah diperkenalkan
– Dukungan untuk Mixtral 8x22b telah diperkenalkan
– Dukungan untuk model Command-R telah diperkenalkan
– Model MoE (misalnya Mixtral, Grok) kini bekerja 2-5x lebih cepat pada CPU
– F16 sekarang 20% ​​lebih cepat di Raspberry Pi 5 (Eval prompt TinyLLaMA 1.1b ditingkatkan 62 -> 75 tok/detik)
– F16 sekarang 30% lebih cepat di Skylake (eval prompt TinyLLaMA 1.1b ditingkatkan 171 -> 219 tok/detik)
– F16 kini 60% lebih cepat di Apple M2 (Eval prompt Mistral 7b ditingkatkan 79 -> 128 tok/detik)
– Tambahkan kemampuan untuk mengganti template obrolan di web gui saat membuat file llama
– Meningkatkan penurunan harga dan penyorotan sintaksis di server
– Deteksi fitur CPU telah ditingkatkan Unduhan Llamafile 0.8 melalui GitHub. Saya akan segera mengerjakan benchmark Llamafile baru.

Itulah berita seputar Llamafile 0.8 Dirilis Dengan Dukungan LLaMA3 & Grok, Performa F16 Lebih Cepat, semoga bermanfaat. Disadur dari Phoronix.com.

Terbaru

  • Inilah Cara Clear RDP Cache dan Registry MRU Biar Remote Desktop Kalian Kembali Segar
  • Cara Restore File Association .rdp Agar Remote Desktop Bisa Terbuka Otomatis Lagi
  • Apa itu Probabilistic Methods dalam Klasifikasi Data?
  • Apa itu Klasifikasi Data dengan Metode Feature Selection?
  • Inilah Panduan Lengkap Jalur Afirmasi Disabilitas SPMB Kota Malang 2026, Simak Syarat dan Jadwalnya!
  • Inilah Cara Lengkap Daftar UM Undip 2026: Panduan Teknis, Jadwal, dan Syarat Biar Nggak Salah Langkah!
  • Inilah Daftar Kampus Swasta Terbaik di Indonesia 2026 Versi Webometrics dan QS WUR, Nggak Kalah Sama Negeri!
  • Inilah Cara Daftar PPKB UI 2026, Kesempatan Emas Masuk Kampus Jaket Kuning Tanpa Tes!
  • Inilah Tampilan Baru Aplikasi Cek Bansos Kemensos 2026, Cara Cek Status dan Nominal Bantuan yang Cair!
  • Inilah Aturan PIN SPMB Jatim 2026, Bisa Dipakai Berapa Kali Sih?
  • Apa itu Common Techniques in Data Classification?
  • Inilah Cara Mengatasi Error Loading File Default.rdp Saat Menggunakan Remote Desktop
  • Anak Anies, Mutiara Baswedan Sukses Lulus S2 di Harvard University Sambil Momong Anak, Inspiratif Pol!
  • Inilah Kenapa Nama Cut Salwa Viral di TikTok dan X, Bikin Netizen Penasaran Banget!
  • Inilah Panduan Lengkap Fakultas Vokasi UNY Kampus Wates 2026: Jurusan, Biaya Kuliah, dan Bedanya dengan Gunungkidul
  • Inilah Arti FOMO yang Sebenarnya dan Cara Biar Jenengan Nggak Gampang Ikut-ikutan Tren Viral
  • Inilah Perbedaan Red Flag dan Green Flag Serta Cara Mengenalinya dalam Hubungan
  • Inilah Cara Menghitung Nilai Gabungan Rapor dan TKA SPMB 2026 Supaya Peluang Lolos Makin Besar
  • Inilah Sisi Gelap Dunia Kotak-Kotak, Mengenal Creepypasta Minecraft yang Bikin Pemain Merinding Seharian
  • Inilah Caranya Plotting Bidang Tanah Mandiri Lewat Aplikasi Sentuh Tanahku Supaya Data Jenengan Makin Akurat
  • Inilah Debut Yua Mikami di Drama Netflix Sins of Kujo, Perannya Bikin Banyak Orang Kaget!
  • Inilah Alasan Kenapa Video Viral Rok Hijau di Dapur Jadi Trending Topik dan Bikin Geger Netizen
  • Inilah Arti Rizz yang Viral di Media Sosial dan Rahasia Punya Karisma Alami Tanpa Perlu Banyak Gaya
  • Inilah Cara Menghapus Game Steam Sampai Bersih Biar Penyimpanan Lega dan Library Tetap Rapi
  • Inilah Cara Melacak iPhone Hilang Biar Bisa Motret Muka Pencurinya Secara Otomatis
  • Iki Loh Mitos Jam Posting Instagram yang Sering Bikin Bingung
  • Inilah Arti Withdrawn dalam Saham dan Cara Melakukannya Biar Nggak Bingung Pas Trading
  • Inilah Cara Melihat Nilai UTBK SNBT 2026 dan Tutorial Download Sertifikat Resminya
  • Inilah Kenapa Kalian Harus Pilih View TikTok Gratis Tanpa Login Biar Akun Tetap Aman dan Cepat FYP
  • Inilah Bedanya SSD NVMe vs SATA di Laptop Bisnis, Kitorang Kasih Tau Biar Kalian Tra Salah Pilih!
  • How Measure Linux Security Use OpenSCAP Lynis and Systemd
  • SELinux Make Nginx Break and How to Fix It Easy
  • How See Hidden SELinux Errors When Your Server Is Broken
  • How Fix SELinux Port Denied Error With Sealert Easy Guide
  • Read SELinux AVC Denial Log Simple Guide for Noob
  • How to Automate Your Entire SEO Strategy Using a Swarm of 100 Free AI Agents Working in Parallel
  • How to create professional presentations easily using NotebookLM’s AI power for school projects and beyond
  • How to Master SEO Automation with Google Gemini 3.1 Flash-Lite in Google AI Studio
  • How to create viral AI video ads and complete brand assets using the Claude and Higgsfield MCP integration
  • How to Transform Your Mac Into a Supercharged AI Assistant with Perplexity Personal Computer
RSS Error: WP HTTP Error: A valid URL was not provided.

©2026 emka.web.id | Design: Newspaperly WordPress Theme