Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

Microsoft VASA-1 AI dapat membuat satu gambar bernyanyi atau berbicara

Posted on April 20, 2024

AI dan modelnya berkembang pesat. Dari menghasilkan gambar, video, dan audio hingga membuat klip audio dan video dari satu gambar, telah terjadi peningkatan yang luar biasa. Microsoft Research mengumumkan telah memperkenalkan VASA-1 , model AI yang dapat membuat gambar bernyanyi atau berbicara. Itu membuat gambar menjadi klip video dengan audio dan ekspresi wajah yang sesuai dengan audio.

Microsoft VASA-1 AI dapat membuat satu gambar bernyanyi atau berbicara

VASA adalah model AI baru dari Microsoft yang dapat menghasilkan wajah berbicara yang sangat realistis dari satu gambar. Anda hanya perlu memasukkan gambar dan satu klip audio untuk mendapatkan klip video yang realistis. Model VASA tidak hanya menyinkronkan audio secara bibir tetapi juga menghasilkan nuansa wajah dan momen alami kepala agar sesuai dengan audio dan menciptakan dampak yang realistis.

Microsoft baru saja menjatuhkan VASA-1.

AI ini dapat membuat satu gambar bernyanyi dan berbicara dari referensi audio secara ekspresif. Mirip dengan EMO dari Alibaba

10 contoh liar:

1. Mona Lisa rap Paparazzi pic.twitter.com/LSGF3mMVnD

— Min Choi (@minchoi) 18 April 2024

ncCP Model VASA dapat memberikan kualitas tinggi keluaran video dan secara signifikan mengungguli model lain yang mampu menghasilkan video. Itu juga dapat menghasilkan video online 512×512 hingga 40 FPS dengan latensi yang sangat dapat diabaikan. Model ini bisa sangat membantu untuk menciptakan avatar yang hidup dan meniru perilaku percakapan manusia.

Dengan VASA, pengguna dapat mengontrol pembuatan video dengan memasukkan kondisi tatapan mata, jarak kepala, dan perubahan emosi lainnya. Model tersebut dapat menangani foto artistik seperti Mona Lisa, audio nyanyian, dan pidato non-Inggris untuk menghasilkan video yang sangat realistis.

Microsoft dalam makalah penelitiannya menambahkan bahwa penelitian ini difokuskan pada menghasilkan keterampilan afektif visual untuk avatar AI virtual yang ditujukan untuk kasus penggunaan positif. Konten apa pun yang dibuat dengan modus yang dimaksudkan untuk menyesatkan atau menipu adalah melanggar kebijakan mereka. Microsoft telah mengakui bahwa seperti model lainnya, model ini juga dapat digunakan untuk menyamar sebagai manusia. Mereka yakin bahwa ada kesenjangan antara apa yang dapat dicapai saat ini dan video asli yang asli.

Tidak ada rencana dari Microsoft untuk merilis demo online, API, detail implementasi tambahan, atau penawaran terkait lainnya kepada publik sampai mereka yakin bahwa alat tersebut akan digunakan secara bertanggung jawab dan mengikuti peraturan yang tepat.

Itulah konten tentang Microsoft VASA-1 AI dapat membuat satu gambar bernyanyi atau berbicara, semoga bermanfaat.

Terbaru

  • Apa Itu Kompensasi Sistem Trail Mobile Legends? Ini Penjelasan dan Cara Klaim Hadiahnya
  • Pixel 2 Tersandung Pembaruan Desember 2025: Fitur Baru dan Perbaikan Penting
  • Ini Cara Reset Desil di Aplikasi Cek Bansos Biar Valid (Update Januari 2026)
  • Apa Itu EZNET Wireless dan Fiber Optic? Ini Perbedaan dan Pengertian Lengkapnya
  • Pengertian Rework Magic Wheel dan Rank Mythic Eternal: Apa itu Perubahan Sistem Baru Mobile Legends?
  • Apa Itu Diamond Combo? Pengertian Game Puzzle Viral yang Katanya Bisa Hasilkan Cuan
  • Apa Itu Showbox? Pengertian, Fungsi, dan Cara Menggunakannya di Android
  • Cara Mengatasi Fitur Monet Facebook Pro Tiba-tiba Hilang
  • Google Bikin Kejutan! Pixel 10 Diskon Gila-gilaan di YouTube Premium
  • Apa Itu Google CC? Ini Pengertian Agen Produktivitas AI Eksperimental Terbaru
  • Apa Itu Ultras Seblak di eSport? Pengertian dan Fenomena Baru Suporter eSport
  • Android 16: Animasi Folder Baru yang Mengubah Cara Kita Berinteraksi!
  • Android 16: Notifikasi Lokasi ‘Blue Dot’ – Fitur Baru yang Perlu Kalian Ketahui!
  • Apa Itu Risiko Auto Click di Event Spongebob Mobile Legends? Ini Penjelasannya
  • Apa Itu Fitur Eksperimental Windows? Ini Pengertian dan Cara Menonaktifkannya
  • Apa Itu Android 16 Beta 1? Ini Pengertian dan Fitur Terbarunya
  • Belum Tahu? Ini Trik Supaya Bisa Dapat Skin Patrick Mobile Legends dengan Harga Murah
  • Pixel Desember 2025: Update Besar Siap Meluncur, Apa yang Baru?
  • Apa Itu HYFE XL Prioritas? Ini Pengertian, FUP, dan Realita Kecepatannya
  • Pengertian Render dan Convert: Apa Bedanya dalam Video Editing?
  • Cara Mengatasi Aplikasi Office yang Terus Muncul dan Menerapkan Perubahan Pengaturan Privasi
  • Pixel Launcher Mendapatkan Sentuhan Google Search Baru!
  • Penyebab Aplikasi Wondr BNI Tidak Bisa Dibuka
  • Kode 0425 Daerah Mana? Ini Pengertian dan Fakta Sebenarnya
  • Apa Itu SSS CapCut? Pengertian Downloader Video Tanpa Watermark yang Wajib Kalian Tahu
  • Apa Itu Paket GamesMAX Telkomsel? Ini Pengertian dan Fungsinya Bagi Gamers
  • Apa Itu Menu Plus di Google Search? Ini Pengertian dan Fungsinya
  • Apa Itu Lepas Kolpri? Ini Pengertian dan Fenomenanya di Dunia Gaming
  • Pixel Buds Pro Dapat Update Software dengan Dukungan ANC Adaptif dan Peningkatan Audio
  • Mous Pixel Watch 4 Akan Hadir dengan Charger Baru dan Fitur-Fitur Terbaru
  • Apa Itu AI Kill Switch di Firefox? Ini Pengertian dan Detail Fitur Terbarunya
  • Apa Itu Platform Modular Intel Alder Lake N (N100)? Ini Pengertian dan Spesifikasinya
  • Apa Itu Armbian Imager? Pengertian Utilitas Flashing Resmi untuk Perangkat ARM Kalian
  • Apa Itu OpenShot 3.4? Pengertian dan Fitur LUT Terbaru untuk Grading Warna
  • Flatpak 1.16.2: Sandbox Baru untuk GPU Intel Xe dan VA-API
  • Loading Model AI Lama? Coba Fitur Cached Models RunPod Ini, Hemat Waktu & Biaya!
  • Replicate Diakuisisi Cloudflare? Tenang, Ini Justru Kabar Baik Buat Developer AI
  • Apa Itu Nemotron-3 Nano? Pengertian Model Bahasa Ringkas dan Hasil Uji Cobanya
  • Prompt AI Dapur Aestetik
  • Prompt AI Suami Istri Bawa Terong
  • Apa Itu “I Am Not a Robot – reCAPTCHA Verification ID: 2165”? Ini Pengertian dan Bahayanya
  • Apa Itu Serangan Clop Ransomware pada CentreStack? Ini Pengertian dan Dampaknya
  • Apa Itu E-Note? Pengertian Platform Kripto yang Baru Saja Disita FBI
  • Pengertian CVE-2025-37164: Celah Keamanan Fatal di HPE OneView Adalah?
  • Apa Itu APT137? Pengertian Kelompok Peretas Tiongkok yang Mengincar Windows
Beli Pemotong Rumput dengan Baterai IRONHOOF 588V Mesin Potong Rumput 88V disini https://s.shopee.co.id/70DBGTHtuJ
Beli Morning Star Kursi Gaming/Kantor disini: https://s.shopee.co.id/805iTUOPRV

©2025 emka.web.id | Design: Newspaperly WordPress Theme