Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

Llamafile 0.8 Dirilis Dengan Dukungan LLaMA3 & Grok, Performa F16 Lebih Cepat

Posted on April 25, 2024

Llamafile telah menjadi proyek yang cukup menarik dari grup Ocho Mozilla di era AI. Llamafile memudahkan menjalankan dan mendistribusikan model bahasa besar (LLM) yang mandiri dalam satu file. Llamafile dibuat dari Llama.cpp dan memudahkan pengiriman seluruh LLM sebagai satu file dengan dukungan eksekusi CPU dan GPU. Llamafile 0.8 kini hadir untuk ikut serta dalam kesenangan LLaMA3 serta memberikan dukungan model lain dan meningkatkan kinerja CPU.
Llamafile 0.8 adalah rilis menarik dengan tambahan dukungan untuk LLaMA3, Grok, dan Mixtral 8x22b.
Model Mixture of Experts (MoE) seperti Mixtral dan Grok kini juga 2~5x lebih cepat untuk dieksekusi pada CPU setelah memfaktorkan ulang kode CPU tinyBLAS. Ada juga performa F16 sekitar 20% lebih cepat di Raspberry Pi 5, performa F16 sekitar 30% lebih cepat di Intel Skylake, dan performa F16 sekitar 60% lebih cepat di Apple M2.

Llamafile 0.8 juga menghadirkan peningkatan deteksi fitur CPU dan peningkatan lainnya:
– Dukungan untuk LLaMA3 sekarang tersedia
– Dukungan untuk Grok telah diperkenalkan
– Dukungan untuk Mixtral 8x22b telah diperkenalkan
– Dukungan untuk model Command-R telah diperkenalkan
– Model MoE (misalnya Mixtral, Grok) kini bekerja 2-5x lebih cepat pada CPU
– F16 sekarang 20% ​​lebih cepat di Raspberry Pi 5 (Eval prompt TinyLLaMA 1.1b ditingkatkan 62 -> 75 tok/detik)
– F16 sekarang 30% lebih cepat di Skylake (eval prompt TinyLLaMA 1.1b ditingkatkan 171 -> 219 tok/detik)
– F16 kini 60% lebih cepat di Apple M2 (Eval prompt Mistral 7b ditingkatkan 79 -> 128 tok/detik)
– Tambahkan kemampuan untuk mengganti template obrolan di web gui saat membuat file llama
– Meningkatkan penurunan harga dan penyorotan sintaksis di server
– Deteksi fitur CPU telah ditingkatkan Unduhan Llamafile 0.8 melalui GitHub. Saya akan segera mengerjakan benchmark Llamafile baru.

Itulah berita seputar Llamafile 0.8 Dirilis Dengan Dukungan LLaMA3 & Grok, Performa F16 Lebih Cepat, semoga bermanfaat. Disadur dari Phoronix.com.

Terbaru

  • Belum Tahu? Inilah Cara Upload Reels Instagram Sampai 20 Menit, Konten Jadi Lebih Puas!
  • Apa itu Negara Somaliland? Apa Hubungannya dengan Israel?
  • Apa itu Game TheoTown? Game Simulasi Jadi Diktator
  • Inilah Rekomendasi 4 HP Honor Terbaik – Prosesor Snapdragon Tahun 2026
  • Lagi Nyari HP Gaming Murah? Inilah 4 HP Asus RAM 8 GB yang Recomended
  • Ini Trik Main Game Merge Cats Road Trip Sampai Tarik Saldo ke DANA
  • Mau Jadi Digital Writer Pro? Ini Caranya Buat Portofolio Pakai Blog!
  • Ini Cara Login Banyak Akun FB & IG di Satu HP Tanpa Diblokir!
  • Inilah Cara Mengatasi Verval Siswa Silang Merah di RDM versi Hosting
  • HP Tertinggal? Inilah Caranya Login PDUM Langsung dari Laptop, Lebih Praktis!
  • Inilah Cara Tarik Dana dari APK Drama Rush
  • Inilah Cara Mudah Tarik Uang Kertas Biru di Merge Cats ke DANA dan OVO Tanpa Ribet!
  • Apakah Aplikasi Pinjaman KlikKami Penipu? Ada DC Penagih?
  • Kenapa Tentara Romawi Hanya Pakai Armor Kaki Saja?
  • Inilah Alasan Kenapa Beli Follower IG itu TIDAK AMAN!
  • EPIK! Kisah Mesin Bor Tercanggih Takluk di Proyek Terowongan Zojila Himalaya
  • Bingung Cari Lokasi Seseorang? Cek Cara Melacak Pemilik Nomor HP Tanpa Bayar Ini, Dijamin Akurat!
  • Apa itu Logis? Kenapa Logika Bisa Berbeda-beda?
  • Ini Alasan Kenapa Fitur Bing AI Sedang Trending dan Dicari Banyak Orang
  • Sejarah Kerajaan Champa: Bangsa Yang Hilang Tanpa Perang Besar, Kok Bisa?
  • Gini Caranya Dapat Weekly Diamond Pass Gratis di Event M7 Pesta, Ternyata Nggak Pake Modal!
  • Inilah Trik Rahasia Panen Token dan Skin Gratis di Event Pesta Cuan M7 Mobile Legends!
  • Apakah Apk Pinjaman Cepat Galaxy Pinjol Penipu?
  • Cara Tarik Saldo APK Game Clear Blast
  • Apakah APK Game Clear Blast Penipu? Ini Reviewnya
  • Inilah Perbedaan SEO dan GEO + Tips Konten Disukai Google dan AI!
  • Inilah Cara Download Video TikTok 2026 Tanpa Watermark
  • Belum Tahu? Ini Trik Nonton Doods Pro Bebas Iklan dan Cara Downloadnya
  • Misteri DNA Spanyol Terungkap: Jauh Lebih Tua dari Romawi dan Moor!
  • Kenapa Belut Listrik itu Sangat Mematikan
  • Tailwind’s Revenue Down 80%: Is AI Killing Open Source?
  • Building Open Cloud with Apache CloudStack
  • TOP 1% AI Coding: 5 Practical Techniques to Code Like a Pro
  • Why Your Self-Hosted n8n Instance Might Be a Ticking Time Bomb
  • CES 2026: Real Botics Wants to Be Your Best Friend, but at $95k, Are They Worth the Hype?
  • Inilah Cara Belajar Cepat Model Context Protocol (MCP) Lewat 7 Proyek Open Source Terbaik
  • Inilah Cara Menguasai Tracing dan Evaluasi Aplikasi LLM Menggunakan LangSmith
  • Begini Cara Menggabungkan LLM, RAG, dan AI Agent untuk Membuat Sistem Cerdas
  • Cara Buat Sistem Moderasi Konten Cerdas dengan GPT-OSS-Safeguard
  • Inilah Cara Membuat Aplikasi Web Full-Stack Tanpa Coding dengan Manus 1.5
  • Apa itu CVE-2025-14847? Ini Penjelasan Lengkap MongoBleed
  • Ini Kronologi & Resiko Kebocoran Data WIRED
  • Apa itu Grubhub Crypto Scam? Ini Pengertian dan Kronologi Penipuan yang Catut Nama Grubhub
  • Apa Itu CVE-2025-59374? Mengenal Celah Keamanan ASUS Live Update yang Viral Lagi
  • Apa itu RansomHouse Mario? Ini Pengertian dan Mengenal Versi Baru ‘Mario’ yang Makin Bahaya
Beli Morning Star Kursi Gaming/Kantor disini: https://s.shopee.co.id/805iTUOPRV
Beli Pemotong Rumput dengan Baterai IRONHOOF 588V Mesin Potong Rumput 88V disini https://s.shopee.co.id/70DBGTHtuJ

©2026 emka.web.id | Design: Newspaperly WordPress Theme