Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

Peneliti Apple mengungkapkan terobosan AI baru untuk melatih LLM pada gambar dan teks

Posted on March 20, 2024

Hey Siri command HomePod
Dalam makalah baru yang diterbitkan bulan ini, peneliti Apple mengungkapkan bahwa mereka telah mengembangkan metode baru untuk melatih model bahasa besar menggunakan informasi teks dan visual. Menurut peneliti Apple, ini merupakan cara untuk mendapatkan hasil yang canggih.

Seperti yang pertama kali ditemukan oleh VentureBeat, ide penelitian ini adalah untuk menunjukkan “betapa hati-hati menggabungkan berbagai jenis data pelatihan dan arsitektur model dapat menghasilkan kinerja tercanggih pada berbagai tolok ukur AI.”

Makalah ini diterbitkan minggu lalu dan diberi judul “MM1: Metode, Analisis & Wawasan dari Pra-pelatihan LLM Multimodal.” Peneliti Apple menjelaskan dalam abstrak makalah:

Dalam karya ini, kami membahas pembuatan Model Bahasa Besar Multimodal (MLLM) yang berkinerja baik. Secara khusus, kami mempelajari pentingnya berbagai komponen arsitektur dan pilihan data. Melalui ablasi yang cermat dan komprehensif pada encoder gambar, konektor bahasa visi, dan berbagai pilihan data pra-pelatihan, kami mengidentifikasi beberapa pembelajaran desain yang penting.

Misalnya, kami mendemonstrasikan bahwa untuk pra-pelatihan multimodal skala besar yang menggunakan perpaduan yang cermat antara teks gambar, teks gambar yang disisipkan, dan data hanya teks sangat penting untuk mencapai state-of-the-art (SOTA) sedikit -menembak hasil di berbagai tolok ukur, dibandingkan dengan hasil pra-pelatihan lain yang dipublikasikan.

MM1 dideskripsikan sebagai “keluarga model multimodal” yang canggih dan memiliki “sifat menarik seperti pembelajaran dalam konteks yang ditingkatkan, dan penalaran multi-gambar, memungkinkan rangkaian pemikiran beberapa gambar dorongan.”

Kemampuan pembelajaran dalam konteks model MM1 sangat mengesankan:

MM1 dapat melakukan prediksi dalam konteks berkat pra-pelatihan multimodal berskala besar. Hal ini memungkinkan MM1 untuk (a) menghitung objek dan mengikuti pemformatan khusus, (b) merujuk ke bagian gambar dan melakukan OCR, (c) menunjukkan akal sehat dan pengetahuan kata tentang objek sehari-hari, dan (d) melakukan fungsi matematika dasar. Gambar berasal dari set validasi COCO 2014.

Para peneliti menyimpulkan bahwa rangkaian model ini “menghasilkan kinerja kompetitif pada berbagai tolok ukur, sekaligus memungkinkan penalaran multi-gambar dan dorongan beberapa gambar.”

Baca selengkapnya:

Pekerjaan Apple AI berlanjut: Mengedit foto menggunakan perintah teksApple Keyframer menghasilkan animasi AI dari gambar diam dan teks promptFitur AI baru iOS 18: Semua yang kami ketahui sejauh ini
Itulah konten tentang Peneliti Apple mengungkapkan terobosan AI baru untuk melatih LLM pada gambar dan teks, semoga bermanfaat.

Terbaru

  • Inilah Huawei Pura 90 Pro, HP Flagship dengan Desain Kamera Segitiga Unik dan Performa Kirin yang Makin Gahar
  • Inilah 5 Rekomendasi Kipas Tangan Portable Cas Tahan Lama Biar Kalian Tetap Adem Saat Cuaca Panas Ekstrem
  • Inilah MacBook Neo, Laptop Termurah Apple yang Ternyata Punya Performa Gaming Gila!
  • Inilah Daftar Tablet SIM Card 5G dengan Keyboard Terbaik 2026 untuk Kerja Remote
  • Inilah Daftar Game Penghasil Pulsa 2026, Cara Cerdas Dapat Kuota Gratis Tanpa Keluar Duit Sepeserpun!
  • Inilah Caranya Klaim Bonus Kuota Lokal Smartfren 2026, Jangan Sampai Bonus Kalian Hangus Sia-sia!
  • Inilah Cara Mengatasi Rockstar Games Launcher Not Responding dan Macet Saat Connecting
  • Inilah Cara Cek HP Masih Kredit atau Sudah Lunas Biar Kalian Nggak Ketipu Pas Beli Bekas
  • Inilah Cara Pakai Astute FF Beta Apk 2026, Rahasia Unlock Server 2.0 Tanpa Verifikasi!
  • Inilah Ketentuan Foto UM-PTKIN 2026 yang Benar Biar Nggak Gagal Verifikasi Administrasi
  • Inilah Cara Persiapan E IJAZAH 2026 yang Benar Buat Operator Sekolah Agar Data Siswa Aman dan Valid
  • Inilah Cara Cek Status PKH April 2026 Secara Akurat, Dana Bansos Sudah Masuk Rekening Belum Ya?
  • Inilah Spesifikasi Vivo Y31d Pro, HP Murah dengan Baterai 7.000 mAh dan Bodi Tahan Banting Ekstrem
  • Inilah 5 Rekomendasi HP Samsung dengan Fitur NFC Terbaik yang Bikin Hidup Makin Praktis dan Satset
  • Inilah Deretan HP Vivo dengan Kamera Stabilizer Terbaik 2026, Cocok Banget Buat Konten Kreator Modal Minim!
  • Cara Mendapatkan Lead dan Rekomendasi SEO dari ChatGPT dan Claude (Update Tahun 2026)
  • Inilah Rekomendasi HP Infinix Kamera Bagus dan RAM Besar Paling Juara Buat Konten dan Gaming!
  • Inilah Trik Supaya Koneksi Indosat Makin Kencang, Tutorial Setting APN Terbaru 2026!
  • Inilah 7 HP Xiaomi NFC Termurah 2025, Dompet Aman Aktivitas Tetap Lancar!
  • Inilah 5 Rekomendasi HP Samsung dengan Fitur NFC Termurah dan Terbaik untuk Kebutuhan Harian Kalian
  • Inilah Rekomendasi HP Vivo Harga 2 Jutaan dengan Fitur Stabilizer Kamera Terbaik untuk Konten Kreator
  • Inilah 5 HP Infinix Kamera Bagus dan RAM Besar, Bikin Konten Jadi Makin Estetik!
  • Inilah Alasan Kenapa Lenovo Yoga Tab Bakal Jadi Tablet AI Paling Gahar di Tahun 2026
  • Inilah Bocoran Tecno Pova 8 dan Spark 50 Pro, HP dengan Baterai Monster Sampai 7.750mAh!
  • Inilah Alasan Kenapa Poco X8 Pro Series Ludes Terjual 30 Ribu Unit dalam Sehari, Performanya Benar-Benar Naik Kelas!
  • Inilah Rekomendasi HP Samsung dengan Kamera Terbaik 2025, Hasil Foto Dijamin Kayak Profesional!
  • Inilah Kemudahan Belanja Elektronik Lewat Kolaborasi Strategis Indodana Finance dan Sharp Indonesia
  • Inilah Rekomendasi Smartwatch Mirip Apple Watch Termurah 2026 yang Bikin Gaya Makin Maksimal
  • Inilah Cara Cek Lokasi UTBK 2026 Agar Tidak Salah Alamat dan Terlambat
  • Inilah Realme Narzo 100 Lite 5G, Smartphone Baterai 7000mAh yang Siap Meluncur dengan Spesifikasi Gahar dan Layar Super Smooth
  • Is it Time to Replace Nano? Discover Fresh, the Terminal Text Editor You Actually Want to Use
  • How to Design a Services Like Google Ads
  • How to Fix 0x800ccc0b Outlook Error: Step-by-Step Guide for Beginners
  • How to Fix NVIDIA App Error on Windows 11: Simple Guide
  • How to Fix Excel Formula Errors: Quick Fixes for #NAME
  • A Complete Tutorial on How to Self-Host Convex on a VPS for Real-Time App Sync
  • Complete tutorial on creating high-quality realistic AI videos with ultra-realistic skin and cinematic camera movements
  • Complete Tutorial: Exploring Hermes Agent v0.8.0 Features for Better AI Workflows
  • How to Master PixelSmile: A Complete Tutorial for Fine-Grained Facial Expression Editing in ComfyUI
  • How to Create Ultra-Realistic Talking AI Characters with LTX and ComfyUI: A Complete Workflow Tutorial
  • Apa itu Spear-Phishing via npm? Ini Pengertian dan Cara Kerjanya yang Makin Licin
  • Apa Itu Predator Spyware? Ini Pengertian dan Kontroversi Penghapusan Sanksinya
  • Mengenal Apa itu TONESHELL: Backdoor Berbahaya dari Kelompok Mustang Panda
  • Siapa itu Kelompok Hacker Silver Fox?
  • Apa itu CVE-2025-52691 SmarterMail? Celah Keamanan Paling Berbahaya Tahun 2025

©2026 emka.web.id | Design: Newspaperly WordPress Theme