Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

Peneliti Apple mengungkapkan terobosan AI baru untuk melatih LLM pada gambar dan teks

Posted on March 20, 2024

Hey Siri command HomePod
Dalam makalah baru yang diterbitkan bulan ini, peneliti Apple mengungkapkan bahwa mereka telah mengembangkan metode baru untuk melatih model bahasa besar menggunakan informasi teks dan visual. Menurut peneliti Apple, ini merupakan cara untuk mendapatkan hasil yang canggih.

Seperti yang pertama kali ditemukan oleh VentureBeat, ide penelitian ini adalah untuk menunjukkan “betapa hati-hati menggabungkan berbagai jenis data pelatihan dan arsitektur model dapat menghasilkan kinerja tercanggih pada berbagai tolok ukur AI.”

Makalah ini diterbitkan minggu lalu dan diberi judul “MM1: Metode, Analisis & Wawasan dari Pra-pelatihan LLM Multimodal.” Peneliti Apple menjelaskan dalam abstrak makalah:

Dalam karya ini, kami membahas pembuatan Model Bahasa Besar Multimodal (MLLM) yang berkinerja baik. Secara khusus, kami mempelajari pentingnya berbagai komponen arsitektur dan pilihan data. Melalui ablasi yang cermat dan komprehensif pada encoder gambar, konektor bahasa visi, dan berbagai pilihan data pra-pelatihan, kami mengidentifikasi beberapa pembelajaran desain yang penting.

Misalnya, kami mendemonstrasikan bahwa untuk pra-pelatihan multimodal skala besar yang menggunakan perpaduan yang cermat antara teks gambar, teks gambar yang disisipkan, dan data hanya teks sangat penting untuk mencapai state-of-the-art (SOTA) sedikit -menembak hasil di berbagai tolok ukur, dibandingkan dengan hasil pra-pelatihan lain yang dipublikasikan.

MM1 dideskripsikan sebagai “keluarga model multimodal” yang canggih dan memiliki “sifat menarik seperti pembelajaran dalam konteks yang ditingkatkan, dan penalaran multi-gambar, memungkinkan rangkaian pemikiran beberapa gambar dorongan.”

Kemampuan pembelajaran dalam konteks model MM1 sangat mengesankan:

MM1 dapat melakukan prediksi dalam konteks berkat pra-pelatihan multimodal berskala besar. Hal ini memungkinkan MM1 untuk (a) menghitung objek dan mengikuti pemformatan khusus, (b) merujuk ke bagian gambar dan melakukan OCR, (c) menunjukkan akal sehat dan pengetahuan kata tentang objek sehari-hari, dan (d) melakukan fungsi matematika dasar. Gambar berasal dari set validasi COCO 2014.

Para peneliti menyimpulkan bahwa rangkaian model ini “menghasilkan kinerja kompetitif pada berbagai tolok ukur, sekaligus memungkinkan penalaran multi-gambar dan dorongan beberapa gambar.”

Baca selengkapnya:

Pekerjaan Apple AI berlanjut: Mengedit foto menggunakan perintah teksApple Keyframer menghasilkan animasi AI dari gambar diam dan teks promptFitur AI baru iOS 18: Semua yang kami ketahui sejauh ini
Itulah konten tentang Peneliti Apple mengungkapkan terobosan AI baru untuk melatih LLM pada gambar dan teks, semoga bermanfaat.

Terbaru

  • Apa itu Pin di iMessage?
  • SKTP Nggak Muncul di Info GTK padahal Sudah Terbit? Ini Trik Rahasia Biar Data Langsung Update!
  • Ini Trik Nuyul Cari Cuan di Game Puzzle Farm 2026 Biar Koin Melimpah Tanpa Undang Teman
  • Inilah Ukuran Kertas Thermal 58mm ISO Di Word, Berapa dan Panduan Lengkap Memilihnya
  • Bukan Cuma Zakat! Ternyata Sumbangan Jenis Ini Bisa Ngurangin Pajak Kalian! Simak Penjelasannya
  • Inilah Caranya Mengajar Bahasa Indonesia di Amerika Serikat Lewat Beasiswa Fulbright FLTA 2026
  • Inilah 6 Rekomendasi HP yang Awet dan Tahan Lama Biar Kalian Nggak Gonta-ganti Terus!
  • Apa itu Proses BOP dan Psikotes BRI Life?
  • Ini Cara Input Tugas Tambahan Guru di EMIS GTK IMP 2026 Biar Jam Mengajar Aman!
  • APK Juice Pack Frenzy Penipuan? Benarkah Membayar atau Cuma Tipuan Iklan? Ini Faktanya!
  • Apakah Apk ReelAct Penipu? Mau Tarik 100 Dolar dari Reel Act? Cek Dulu Faktanya Biar Nggak Rugi Waktu!
  • Inilah Rekomendasi Game Turn Base Android dan PC Terbaik Buat Kalian yang Suka Strategi!
  • Inilah Cara Membuat Sertifikat di Canva dan Ukuran Standar yang Wajib Kalian Tahu
  • Inilah Aturan Zakat yang Bisa Jadi Pengurang Pajak Bruto Kalian, Sudah Tahu Belum?
  • Inilah Data Pendaftar KIP Kuliah 2026 Jalur SNBP dan Bocoran Kriteria yang Lolos!
  • Inilah Game Silent Hill: Townfall, Teror Psikologis Baru yang Bakal Bikin Kalian Gemetar di Tahun 2026!
  • Inilah Trailer Mortal Kombat 2, Johnny Cage Resmi Gabung dan Siap Hadapi Shao Kahn!
  • Inilah Spesifikasi Lengkap Samsung Galaxy S26 yang Baru Meluncur, Ternyata Harganya Naik Segini!
  • Inilah Cara Mematikan MSA Xiaomi Supaya HP Nggak Lemot dan Bebas Iklan, Ternyata Langkahnya Simpel Banget!
  • Inilah Kronologi Mobil Calya Plat D yang Viral Lawan Arus di Jakpus, Ternyata Bawa Banyak Plat Palsu!
  • Inilah Axioo Hype AI 5, Laptop AI Canggih yang Nggak Bikin Kantong Bolong!
  • Ini Loh Kejahatan Modus Phishing Google Tasks Terbaru yang Bisa Nguras Data Perusahaan Kalian
  • Inilah Poco X7 5G dan M7 Pro 5G, HP Gaming Performa Ekstrem yang Ngebikin Mabar Kalian Jadi Anti Lag!
  • Inilah Cara Mengubah Lahan Kosong Jadi Uang Lewat Strategi Land Banking
  • Ini Trik Supaya Gajian YouTube Shorts Tembus Puluhan Juta dari Penonton Bule!
  • Jangan Sampai Keliru! Begini Cara Cek Total Jam Linear dan Non Linear di EMIS GTK IMP 2026
  • Cuma Nonton Drama Pendek Bisa Cair Uang Tunai? Bongkar Habis Kebenaran Aplikasi FunFlick di Sini!
  • Apa itu Resetter Epson L3210?
  • Ini Loh Ukuran A4, F4, A3, B5, A5 di Canva Biar Hasil Cetakan Kalian Nggak Terpotong!
  • Inilah Cara Transfer Pulsa Telkomsel Paling Update 2026, Lengkap dengan Biaya dan Syarat Terbarunya!
  • Typhoon Weather App Gets Qt6 Upgrade: What’s New?
  • Showtime Video Player Coming to As Default on Ubuntu 26.04 Soon
  • What is Wireshark 4.6.4 and Why is the USB HID Fix Critical?
  • What’s New in Tails 7.5? Understanding the Latest Privacy-Focused Linux Update
  • Linux Kernel LTS Support Gets Major Update for Long-Term Users
  • Prompt AI Menyusun Script Pola Suara Karakter agar Brand Jadi Ikonik
  • Prompt AI untuk Merancang Karakter Brand yang Ikonik
  • Prompt AI Audit Konten Sesuai Karakter Brand
  • Prompt AI Merubah Postingan LinkedIn Jadi Ladang Diskusi dengan ChatGPT
  • Prompt AI: Paksa Algoritma LinkedIn Promosikan Konten Kalian
  • Apa itu Spear-Phishing via npm? Ini Pengertian dan Cara Kerjanya yang Makin Licin
  • Apa Itu Predator Spyware? Ini Pengertian dan Kontroversi Penghapusan Sanksinya
  • Mengenal Apa itu TONESHELL: Backdoor Berbahaya dari Kelompok Mustang Panda
  • Siapa itu Kelompok Hacker Silver Fox?
  • Apa itu CVE-2025-52691 SmarterMail? Celah Keamanan Paling Berbahaya Tahun 2025
Beli Pemotong Rumput dengan Baterai IRONHOOF 588V Mesin Potong Rumput 88V disini https://s.shopee.co.id/70DBGTHtuJ
Beli Morning Star Kursi Gaming/Kantor disini: https://s.shopee.co.id/805iTUOPRV

©2026 emka.web.id | Design: Newspaperly WordPress Theme