Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

Llamafile 0.8 Dirilis Dengan Dukungan LLaMA3 & Grok, Performa F16 Lebih Cepat

Posted on April 25, 2024

Llamafile telah menjadi proyek yang cukup menarik dari grup Ocho Mozilla di era AI. Llamafile memudahkan menjalankan dan mendistribusikan model bahasa besar (LLM) yang mandiri dalam satu file. Llamafile dibuat dari Llama.cpp dan memudahkan pengiriman seluruh LLM sebagai satu file dengan dukungan eksekusi CPU dan GPU. Llamafile 0.8 kini hadir untuk ikut serta dalam kesenangan LLaMA3 serta memberikan dukungan model lain dan meningkatkan kinerja CPU.
Llamafile 0.8 adalah rilis menarik dengan tambahan dukungan untuk LLaMA3, Grok, dan Mixtral 8x22b.
Model Mixture of Experts (MoE) seperti Mixtral dan Grok kini juga 2~5x lebih cepat untuk dieksekusi pada CPU setelah memfaktorkan ulang kode CPU tinyBLAS. Ada juga performa F16 sekitar 20% lebih cepat di Raspberry Pi 5, performa F16 sekitar 30% lebih cepat di Intel Skylake, dan performa F16 sekitar 60% lebih cepat di Apple M2.

Llamafile 0.8 juga menghadirkan peningkatan deteksi fitur CPU dan peningkatan lainnya:
– Dukungan untuk LLaMA3 sekarang tersedia
– Dukungan untuk Grok telah diperkenalkan
– Dukungan untuk Mixtral 8x22b telah diperkenalkan
– Dukungan untuk model Command-R telah diperkenalkan
– Model MoE (misalnya Mixtral, Grok) kini bekerja 2-5x lebih cepat pada CPU
– F16 sekarang 20% ​​lebih cepat di Raspberry Pi 5 (Eval prompt TinyLLaMA 1.1b ditingkatkan 62 -> 75 tok/detik)
– F16 sekarang 30% lebih cepat di Skylake (eval prompt TinyLLaMA 1.1b ditingkatkan 171 -> 219 tok/detik)
– F16 kini 60% lebih cepat di Apple M2 (Eval prompt Mistral 7b ditingkatkan 79 -> 128 tok/detik)
– Tambahkan kemampuan untuk mengganti template obrolan di web gui saat membuat file llama
– Meningkatkan penurunan harga dan penyorotan sintaksis di server
– Deteksi fitur CPU telah ditingkatkan Unduhan Llamafile 0.8 melalui GitHub. Saya akan segera mengerjakan benchmark Llamafile baru.

Itulah berita seputar Llamafile 0.8 Dirilis Dengan Dukungan LLaMA3 & Grok, Performa F16 Lebih Cepat, semoga bermanfaat. Disadur dari Phoronix.com.

Terbaru

  • Hasil Benchmark Xiaomi Pad 8 Global Bocor! Siap-siap Masuk Indonesia Nih
  • KAGET! Ressa Rizky Rossano Akui Sudah Nikah & Punya Anak
  • Inilah Kronologi Ledakan Bom Rakitan SMPN 3 Sungai Raya, Kubu Raya Kalbar
  • Cara Mengatasi Error 208 BCA Mobile
  • Hapus Sekarang! Inilah Hornet, App LGBTQ Tembus Indonesia, Hati-hati
  • Berapa Lama Sih Ngecas HP 33 Watt? Ini Dia Penjelasannya!
  • Cara Cek Saldo Hana Bank Lewat SMS
  • Update Sistem Google Februari 2026: Apa yang Baru dan Perlu Kalian Tahu?
  • Membership FF Bulanan & Mingguan: Berapa DM yang Harus Kalian Siapkan?
  • Maksimal Ngecas HP Berapa Kali Sehari? Boleh 2 Kali Nggak, Sih?
  • Cara Mengatasi Error “Try Again, Open in Another App”
  • Sideload Android: Cara Pasang APK Tanpa Google Play Store (Panduan Lengkap 2026)
  • iPhone Jadi Kamera Vintage Modular? Proyek Kickstarter Ini Bikin Kagum!
  • Cara Mengatasi Video Nest Cam Bermasalah dan Video Hilang
  • iTunes Masih Jadi Rajanya Music? Ini Faktanya!
  • Google Home Smart Button Makin Canggih: Kini Otomatisasi Lebih Fleksibel!
  • F1: The Movie Raih Grammy! Tak Terduga, Kalahkan Bintang Country Ternama
  • Blokir Situs Judi Online: Lindungi Diri & Keluarga dari Dampak Negatif
  • Belanda Larang Anak di Bawah 16 Tahun Gunakan Media Sosial: Ini Detailnya!
  • Gemini Live Mendapat Desain Ulang ‘Floating UI’ yang Super Keren!
  • Galaxy S26 Kehilangan Magnet Qi2? Kebocoran Terbaru Bikin Penasaran!
  • DCT Coin: Crypto Legitim atau Penipuan? Bedah Tuntas, Harga & Fakta Penting!
  • Apple Rilis Update Terbaru untuk iOS, macOS, watchOS & Lainnya!
  • Paket Super Seru Telkomsel: Aplikasi Apa Saja yang Bisa Digunakan?
  • Deus Ex: Human Revolution GRATIS di Android! Buruan Download Sebelum Hilang!
  • Apa Bedanya Thigh, Wing, dan Drumstick di McDonald’s? Yuk, Kupas Tuntas!
  • OpenAI Luncurkan Codex App untuk macOS: Kode Jadi Lebih Mudah!
  • Dana Kaget Wealth Plan: Untung atau Mitos? Review Jujur & Cara Daftarnya!
  • Desain Sony WF-1000XM6 Bocor: Desain Baru, Performa Lebih Gahar!
  • Cara Pinjam 5 Juta di Pegadaian: Mudah, Cepat & Aman! (2024)
  • How to Run Qwen (14B) on AMD MI200 with vLLM
  • How to Enable New Run Dialog in Windows 11
  • How to Disable AI Features in Firefox 148
  • Git 2.53: What’s New?
  • Linux From Scratch Ditches Old System V init
  • Cara Membuat Podcast dari PDF dengan NotebookLlama dan Groq
  • Tutorial Membuat Sistem Automatic Content Recognition (ACR) untuk Deteksi Logo
  • Apa itu Google Code Wiki?
  • Cara Membuat Agen AI Otomatis untuk Laporan ESG dengan Python dan LangChain
  • Cara Membuat Pipeline RAG dengan Framework AutoRAG
  • Apa itu Spear-Phishing via npm? Ini Pengertian dan Cara Kerjanya yang Makin Licin
  • Apa Itu Predator Spyware? Ini Pengertian dan Kontroversi Penghapusan Sanksinya
  • Mengenal Apa itu TONESHELL: Backdoor Berbahaya dari Kelompok Mustang Panda
  • Siapa itu Kelompok Hacker Silver Fox?
  • Apa itu CVE-2025-52691 SmarterMail? Celah Keamanan Paling Berbahaya Tahun 2025
Beli Pemotong Rumput dengan Baterai IRONHOOF 588V Mesin Potong Rumput 88V disini https://s.shopee.co.id/70DBGTHtuJ
Beli Morning Star Kursi Gaming/Kantor disini: https://s.shopee.co.id/805iTUOPRV

©2026 emka.web.id | Design: Newspaperly WordPress Theme