Seharusnya jelas bagi siapa pun yang mengikuti berita AI generatif bahwa teknologi baru dengan cepat tersebar di mana-mana. Tahun lalu, generator gambar AI menggemparkan dunia, dan menjelang akhir tahun 2022, ChatGPT menangkap imajinasi publik. Sekarang, beberapa minggu memasuki tahun 2023, AI text-to-video hampir tiba.
Minggu ini AI startup Runway mengumumkan Gen-2, sistem AI multi-modal yang dapat menghasilkan video dengan klip dari video lain, gambar, atau bahkan hanya teks . Itu benar, tidak lama lagi, pengguna akan dapat mengetik apa pun yang mereka inginkan ke prompt dan mendapatkan video yang diproduksi sepenuhnya dari apa yang mereka impikan dalam imajinasi mereka. NbspHasilkan video hanya dengan kata-kata. Jika Anda dapat mengatakannya, sekarang Anda dapat melihatnya.
Memperkenalkan, Teks ke Video. Dengan Gen-2
Namun, seperti semua teknologi baru, ini belum cukup siap untuk prime time. Menurut Kyle Bar dari Gizmodo, sementara AI video baru Runway belum tersedia untuk umum, sudah ada layanan teks-ke-video lain di luar sana: ModelScope, yang dirilis beberapa hari yang lalu. Situs webnya sebagian besar berbahasa Cina, dengan beberapa judul bahasa Inggris. Namun sampel pada video yang dibuat oleh AI di situs cukup mengesankan, meskipun mentah.
Beberapa sampel di situs ModelScope termasuk "jerapah di bawah microwave", "gambar goldendoodle yang bermain di taman di tepi danau", “Seekor beruang panda mengendarai mobil”, “boneka beruang berlarian di New York City”, dan banyak lagi. Setiap klip video hanya berdurasi beberapa detik tetapi dengan jelas menunjukkan kekuatan teknologi baru. Perlu dicatat bahwa setiap video sampel berisi tanda air Shutterstock, kemungkinan besar karena perusahaan menggunakan gambar stok untuk melatih AI-nya. Namun, ModelScope tidak sepenuhnya ramah pengguna. Selain situs yang sebagian besar berbahasa Cina, tampaknya pengguna harus melakukan sedikit riset (atau berpengalaman dalam seluk beluk AI generatif) untuk membuatnya berfungsi. Ini tidak seperti ChatGPT atau Bing Baru dulu. Tetapi keberadaan teknologi ini di internet berarti bahwa teks-ke-video datang lebih cepat dari yang kita kira. Nbsp
Sumber: Gizmodo
Disadur dari HowToGeek.com.