Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

Peneliti Apple mengungkapkan terobosan AI baru untuk melatih LLM pada gambar dan teks

Posted on March 20, 2024

Hey Siri command HomePod
Dalam makalah baru yang diterbitkan bulan ini, peneliti Apple mengungkapkan bahwa mereka telah mengembangkan metode baru untuk melatih model bahasa besar menggunakan informasi teks dan visual. Menurut peneliti Apple, ini merupakan cara untuk mendapatkan hasil yang canggih.

Seperti yang pertama kali ditemukan oleh VentureBeat, ide penelitian ini adalah untuk menunjukkan “betapa hati-hati menggabungkan berbagai jenis data pelatihan dan arsitektur model dapat menghasilkan kinerja tercanggih pada berbagai tolok ukur AI.”

Makalah ini diterbitkan minggu lalu dan diberi judul “MM1: Metode, Analisis & Wawasan dari Pra-pelatihan LLM Multimodal.” Peneliti Apple menjelaskan dalam abstrak makalah:

Dalam karya ini, kami membahas pembuatan Model Bahasa Besar Multimodal (MLLM) yang berkinerja baik. Secara khusus, kami mempelajari pentingnya berbagai komponen arsitektur dan pilihan data. Melalui ablasi yang cermat dan komprehensif pada encoder gambar, konektor bahasa visi, dan berbagai pilihan data pra-pelatihan, kami mengidentifikasi beberapa pembelajaran desain yang penting.

Misalnya, kami mendemonstrasikan bahwa untuk pra-pelatihan multimodal skala besar yang menggunakan perpaduan yang cermat antara teks gambar, teks gambar yang disisipkan, dan data hanya teks sangat penting untuk mencapai state-of-the-art (SOTA) sedikit -menembak hasil di berbagai tolok ukur, dibandingkan dengan hasil pra-pelatihan lain yang dipublikasikan.

MM1 dideskripsikan sebagai “keluarga model multimodal” yang canggih dan memiliki “sifat menarik seperti pembelajaran dalam konteks yang ditingkatkan, dan penalaran multi-gambar, memungkinkan rangkaian pemikiran beberapa gambar dorongan.”

Kemampuan pembelajaran dalam konteks model MM1 sangat mengesankan:

MM1 dapat melakukan prediksi dalam konteks berkat pra-pelatihan multimodal berskala besar. Hal ini memungkinkan MM1 untuk (a) menghitung objek dan mengikuti pemformatan khusus, (b) merujuk ke bagian gambar dan melakukan OCR, (c) menunjukkan akal sehat dan pengetahuan kata tentang objek sehari-hari, dan (d) melakukan fungsi matematika dasar. Gambar berasal dari set validasi COCO 2014.

Para peneliti menyimpulkan bahwa rangkaian model ini “menghasilkan kinerja kompetitif pada berbagai tolok ukur, sekaligus memungkinkan penalaran multi-gambar dan dorongan beberapa gambar.”

Baca selengkapnya:

Pekerjaan Apple AI berlanjut: Mengedit foto menggunakan perintah teksApple Keyframer menghasilkan animasi AI dari gambar diam dan teks promptFitur AI baru iOS 18: Semua yang kami ketahui sejauh ini
Itulah konten tentang Peneliti Apple mengungkapkan terobosan AI baru untuk melatih LLM pada gambar dan teks, semoga bermanfaat.

Terbaru

  • Inilah Cara Menonaktifkan Antivirus Pihak Ketiga di Windows 11 dengan Aman
  • Inilah Cara Mengatur Raspberry Pi 5 dengan Ubuntu Server untuk Python dan Desktop GUI Tanpa Ribet
  • Inilah Alasan Kenapa Galaxy Z Fold 8 Ultra Bisa Jadi Produk yang Mengecewakan
  • Inilah Alasan Intel Merilis Raptor Lake Next di Socket LGA 1700, Masih Setia dengan DDR4!
  • Gini Caranya Menghilangkan Recycle Bin dari Desktop Windows 11 Supaya Lebih Bersih!
  • Inilah Huawei AirEngine 8771-X1T, Solusi Wi-Fi 7 Super Cepat untuk Bisnis Masa Kini
  • Inilah Cara Mengatasi Error Koneksi VMware Horizon Akibat Intersepsi SSL Proxy
  • Inilah Cara Mengatasi Connection Server Authentication Failed di VMware Horizon Client
  • Cara Laptop Nggak Lemot Pas Colok SD Card, Gampang Banget!
  • Inilah Caranya Mengatasi SD Card Reader yang Tidak Terbaca di Laptop
  • Inilah Cara Ampuh Atasi Perangkat USB yang Sering Terputus di Windows 10 dan 11
  • Cara Atasi USB Error dengan Update USB Root Hub dan Chipset Driver
  • Inilah Cara Mengatasi Unknown USB Device Descriptor Request Failed yang Paling Ampuh
  • Inilah 20 Kampus Swasta Terbaik di Bandung Versi EduRank 2026 untuk Referensi Kuliah Kalian
  • Inilah Syarat dan Cara Daftar Sekolah Kedinasan STPN 2026, Kuota Terbatas!
  • Inilah Cara Daftar PPKB UI 2026 Lengkap dengan Rincian Uang Pangkal Semua Jurusan S1
  • Inilah Aturan Resmi MPLS 2026 dari Kemendikdasmen, Guru dan Sekolah Wajib Catat Pedoman Lengkap Ini!
  • Inilah Cara Daftar Beasiswa S1/D4 Guru Kemendikdasmen 2026, Masa Pendaftaran Diperpanjang!
  • Inilah Cara Mengatasi Unknown USB Device (Device Descriptor Request Failed) dan Penjelasan Lengkapnya
  • Inilah Cara Membuat File Koneksi RDP Secara Manual Biar Akses Remote Kalian Nggak Error Lagi
  • Inilah Cara Clear RDP Cache dan Registry MRU Biar Remote Desktop Kalian Kembali Segar
  • Cara Restore File Association .rdp Agar Remote Desktop Bisa Terbuka Otomatis Lagi
  • Apa itu Probabilistic Methods dalam Klasifikasi Data?
  • Apa itu Klasifikasi Data dengan Metode Feature Selection?
  • Inilah Panduan Lengkap Jalur Afirmasi Disabilitas SPMB Kota Malang 2026, Simak Syarat dan Jadwalnya!
  • Inilah Cara Lengkap Daftar UM Undip 2026: Panduan Teknis, Jadwal, dan Syarat Biar Nggak Salah Langkah!
  • Inilah Daftar Kampus Swasta Terbaik di Indonesia 2026 Versi Webometrics dan QS WUR, Nggak Kalah Sama Negeri!
  • Inilah Cara Daftar PPKB UI 2026, Kesempatan Emas Masuk Kampus Jaket Kuning Tanpa Tes!
  • Inilah Tampilan Baru Aplikasi Cek Bansos Kemensos 2026, Cara Cek Status dan Nominal Bantuan yang Cair!
  • Inilah Aturan PIN SPMB Jatim 2026, Bisa Dipakai Berapa Kali Sih?
  • How to Hardening Mount Option in Linux Server
  • How to Secure Linux Server with AIDE
  • Auditd Custom Rules & Tips
  • Securing SSH Server with fail2ban
  • Fedora Linux Firewalld Drop Zone and Rich Rules
  • How to Automate Your Entire SEO Strategy Using a Swarm of 100 Free AI Agents Working in Parallel
  • How to create professional presentations easily using NotebookLM’s AI power for school projects and beyond
  • How to Master SEO Automation with Google Gemini 3.1 Flash-Lite in Google AI Studio
  • How to create viral AI video ads and complete brand assets using the Claude and Higgsfield MCP integration
  • How to Transform Your Mac Into a Supercharged AI Assistant with Perplexity Personal Computer
  • Inilah Update Pasar Saham AS 31 Mei 2026: Menakar Peluang S&P 500 dan Nasib Sektor Teknologi Saat Inflasi Belum Jinak
  • Sinyal Update Kondisi Pasar IHSG 31 Mei 2026: Strategi Cerdas Menghadapi Gejolak IHSG dan Rupiah di Awal Juni
  • Inilah Alasan Ilmiah Kenapa Kita Menguap, Ternyata Bukan Cuma Kurang Oksigen!
  • Inilah Alasan China Larang PR Berlebihan dan Ujian Berat, Ternyata Demi Kesehatan Mental Siswa!
  • Inilah Cara Cek Peluang Lolos SNBT Unair 2026 dan Daftar Lengkap Daya Tampungnya

©2026 emka.web.id | Design: Newspaperly WordPress Theme