Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

Apa Itu OpenAI Sora dan Akankah Ini Mengubah Video Selamanya?

Posted on February 24, 2024

OpenAI Sora membuat klip video yang sangat realistis dari perintah teks, menampilkan kemajuan besar dalam teknologi AI. Kemampuan Sora untuk mensimulasikan fisika dalam video secara akurat adalah fitur yang menonjol, namun masih memiliki beberapa masalah dengan interaksi dan pembuatan objek. Ketersediaan Sora untuk publik masih belum pasti, karena saat ini sedang diuji keamanan dan kualitasnya sebelum tanggal rilis pasti ditetapkan. Kecepatan pengembangan AI sedang menuju titik di luar pemahaman manusia, dan sistem teks-ke-video Sora OpenAI hanyalah teknologi AI terbaru yang mengejutkan dunia dengan menyadari bahwa segala sesuatunya terjadi lebih cepat dari perkiraan siapa pun.

Apa itu OpenAI Sora?

Seperti alat AI generatif lainnya seperti DALL-E dan MidJourney, Sora mengambil perintah teks dari Anda dan mengubahnya menjadi media visual. Namun, tidak seperti generator gambar AI yang disebutkan di atas, Sora membuat klip video lengkap dengan gerakan, sudut kamera berbeda, arah, dan segala hal lain yang Anda harapkan dari video produksi tradisional.

Melihat contoh di situs web Sora, hasilnya sering kali tidak dapat dibedakan dari video asli yang diproduksi secara profesional. Semuanya, mulai dari rekaman drone kelas atas hingga produksi film bernilai jutaan dolar. Lengkap dengan aktor yang dihasilkan AI, efek khusus, karya.

Sora tentu saja bukan teknologi pertama yang melakukan hal ini. Hingga saat ini, pemimpin yang paling menonjol di bidang ini adalah RunwayML, yang menawarkan layanannya kepada publik dengan biaya tertentu. Namun, bahkan dalam kondisi terbaik sekalipun, video Runway lebih mirip dengan gambar diam MidJourney generasi awal. Tidak ada stabilitas pada gambar, fisika tidak masuk akal, dan saat saya menulis ini, durasi klip terpanjang adalah 16 detik.

Sebaliknya, output terbaik yang Sora tunjukkan sangat stabil, dengan fisika yang terlihat tepat (setidaknya bagi otak kita), dan klip bisa berdurasi hingga satu menit. Klipnya sama sekali tidak bersuara, tetapi sudah ada sistem AI lain yang dapat menghasilkan musik, efek suara, dan ucapan. Jadi saya yakin alat-alat itu dapat diintegrasikan ke dalam alur kerja Sora, atau paling buruk, pekerjaan sulih suara dan foley tradisional.

Tidak dapat dilebih-lebihkan betapa besarnya lompatan yang diwakili Sora dari rekaman video AI yang mengerikan hanya setahun sebelum demo Sora. Seperti AI Will Smith yang cukup mengganggu saat memakan spageti. Saya pikir ini adalah kejutan yang lebih besar bagi sistem dibandingkan ketika generator gambar AI berubah dari lelucon menjadi memberikan ketakutan eksistensial bagi seniman visual.

Sora kemungkinan akan berdampak pada seluruh industri video, mulai dari pembuat rekaman yang dilakukan oleh satu orang hingga ke tingkat proyek anggaran besar Disney dan Marvel. Tidak ada yang tidak tersentuh oleh hal ini. Saya rasa hal ini terutama benar karena Sora tidak harus membuat sesuatu secara utuh, namun dapat mengerjakan materi yang sudah ada, seperti menganimasikan gambar diam yang Anda berikan. Ini mungkin merupakan awal sebenarnya dari industri film sintetik.

Bagaimana Cara Kerja Sora?

Kita akan membahas sedikit tentang Sora sejauh yang kita bisa, tapi tidak mungkin untuk membahasnya secara detail. Pertama, karena OpenAI ironisnya tidak terbuka tentang cara kerja teknologinya. Itu semua adalah hak milik dan saus rahasia yang membedakan Sora dari pesaingnya tidak kita ketahui secara rinci. Kedua, saya bukan ilmuwan komputer, Anda mungkin bukan ilmuwan komputer, jadi kita hanya bisa memahami cara kerja teknologi ini secara umum.

Kabar baiknya adalah ada penjelasan Sora (berbayar) yang sangat bagus oleh Mike Young di Medium, berdasarkan laporan teknis dari OpenAI yang dia uraikan untuk kita pahami sebagai manusia biasa. Meskipun kedua dokumen tersebut layak dibaca, kami dapat mengekstrak fakta terpentingnya di sini.

Sora dibangun berdasarkan pembelajaran yang telah dipelajari perusahaan seperti OpenAI saat membuat teknologi seperti ChatGPT atau DALL-E. Sora berinovasi dalam cara melatihnya pada video sampel dengan memecah video tersebut menjadi “tambalan” yang analog dengan “token” yang digunakan oleh model pelatihan ChatGPT. Karena semua token ini berukuran sama, hal-hal seperti panjang klip, rasio aspek, dan ukuran resolusi tidak menjadi masalah bagi Sora.

Sora menggunakan pendekatan transformator luas yang sama yang mendukung GPT bersama dengan metode difusi yang digunakan generator gambar AI. Selama pelatihan, ia melihat token patch yang tersebar sebagian dan berisik dari sebuah video dan mencoba memprediksi seperti apa tampilan token yang bersih dan bebas noise. Dengan membandingkan hal tersebut dengan kebenaran dasar, model mempelajari “bahasa” video. Itulah sebabnya contoh dari situs Sora terlihat sangat otentik.

Terlepas dari kemampuannya yang luar biasa ini, Sora juga memiliki teks yang sangat detail yang disertakan untuk bingkai video yang dilatihnya, yang merupakan sebagian besar alasannya ia dapat memodifikasi video yang dihasilkannya berdasarkan perintah teks.

Kemampuan Sora untuk secara akurat mensimulasikan fisika dalam video tampaknya merupakan fitur yang muncul, yang dihasilkan hanya dari pelatihan jutaan video yang berisi gerakan berdasarkan fisika dunia nyata. Sora memiliki ketetapan objek yang sangat baik, bahkan ketika objek meninggalkan bingkai atau terhalang oleh sesuatu yang lain di dalam bingkai, objek tersebut tetap ada dan kembali tanpa gangguan.

Itulah konten tentang Apa Itu OpenAI Sora dan Akankah Ini Mengubah Video Selamanya?, semoga bermanfaat.

Terbaru

  • Belum Tahu? Ini Trik Nonton Doods Pro Bebas Iklan dan Cara Downloadnya
  • Misteri DNA Spanyol Terungkap: Jauh Lebih Tua dari Romawi dan Moor!
  • Kenapa Belut Listrik itu Sangat Mematikan
  • Apa itu Tesso Nilo dan Kronologi Konflik Taman Nasional
  • Inilah 4 Keunikan Sulawesi Tengah: Kota Emas Gaib, Situs Purba dll
  • Kepulauan Heard dan McDonald: Pulau Paling Terpencil Milik Australia
  • Ghost Farm Janjikan Rp 3 Juta Cuma-Cuma, Beneran Membayar atau Scam? Ini Buktinya!
  • Apakah UIPinjam Pinjol Penipu? Cek Reviewnya Dulu Disini
  • Pengajuan Samir Sering Ditolak? Ternyata Ini Penyebab Tersembunyi dan Trik Supaya Langsung ACC
  • Lagi Viral! Ini Cara WD Fortes Cue ke DANA, Benaran Membayar atau Cuma Angin Lalu?
  • Bingung Pilih Paket? Inilah Perbedaan Telkomsel Data dan Telkomsel Data Flash yang Wajib Kalian Tahu!
  • Ini Alasan Pohon adalah Mahluk Hidup Terbesar di Dunia
  • Sempat Panas! Kronologi Perseteruan Cak Ji vs Madas di Surabaya, Gini Endingnya
  • Gila! Norwegia Bikin Terowongan Melayang di Bawah Laut
  • Cuma Terpisah 20 Mil, Kenapa Hewan di Bali dan Lombok Beda Total? Ternyata Ini Alasannya
  • Heboh Video Umari Viral 7 Menit 11 Detik dari Pakistan, Isinya Beneran Ada atau Cuma Jebakan Link? Cek Faktanya!
  • Tertipu Online atau HP Hilang? Ini Cara Melacak Nomor HP yang Nggak Tipu-Tipu!
  • Apakah Aplikasi Labora Bisa Hasilkan Uang Jutaan atau Cuma Tipu-Tipu?
  • Apakah APK Cashcash Pro Penipu? Cek Reviewnya Dulu
  • Google Kliks Communicator: Pengalaman Awal yang Mengejutkan – Apa yang Kami Rasakan?
  • Belum Tahu? Ini Ukuran Banner YouTube yang Pas Biar Channel Kalian Makin Kece!
  • Inilah Rencana Gila China Balap AS ke Bulan Sebelum 2030
  • Inilah Spesifikasi Resmi Macbook Pro M5 yang Masuk Indonesia
  • Nonton Drama Bisa Dapat Cuan? Simak Cara Main Yudia APK Biar Nggak Salah Langkah!
  • Cuma Nonton Drama Pendek Bisa Cair Saldo DANA? Cobain Aplikasi Melolo, Begini Caranya!
  • Nonton Drama Bisa Dapat Cuan? Jangan Senang Dulu, Simak Fakta Mengejutkan Aplikasi Cash Drama Ini!
  • Ini Video Asli Bocil Block Blast 1 VS 3 di TikTok, Awas Jangan Asal Klik Link Sembarangan!
  • Instapop Terbukti Membayar atau Cuma Tipuan? Cek Faktanya Sebelum Kalian Buang Waktu Main Game!
  • Geger Video Botol Coca Cola 24 Detik di TikTok, Jangan Asal Klik! Ini Fakta Sebenarnya
  • Apa itu Video Botol Makarizo Viral? Ini Faktanya
  • Apa itu Cosmic Desktop: Pengertian dan Cara Pasangnya di Ubuntu 26.04?
  • Apa Itu Auvidea X242? Pengertian Carrier Board Jetson T5000 dengan Dual 10Gbe
  • Elementary OS 8.1 Resmi Rilis: Kini Pakai Wayland Secara Standar!
  • Apa Itu Raspberry Pi Imager? Pengertian dan Pembaruan Versi 2.0.3 yang Wajib Kalian Tahu
  • Performa Maksimal! Ini Cara Manual Update Ubuntu ke Linux Kernel 6.18 LTS
  • Inilah Cara Melatih AI Agent Agar Bisa Belajar Sendiri Menggunakan Microsoft Agent Lightning
  • Tutorial Optimasi LangGraph dengan Node-Level Caching untuk Performa Lebih Cepat
  • Tutorial Membuat Game Dengan LangChain
  • X Terancam Sanksi Eropa Gara-Gara AI Grok Bikin Deepfake Anak Kecil
  • Nano Banana 2 Flash Itu Apa Sih? Ini Penjelasan Lengkapnya
  • Inilah Risiko Fatal yang Mengintai Kreator OnlyFans, Dari Doxxing sampai Penipuan!
  • Apa itu Kerentanan FortiCloud SSO? Ini Pengertian dan Bahayanya
  • Apa itu Covenant Health Data Breach? Ini Pengertian dan Kronologi Lengkapnya
  • Apa Itu Integrasi Criminal IP dan Cortex XSOAR? Ini Definisinya
  • Gawat! VVS Stealer Cuma Seharga Makan Siang Tapi Bisa Habisi Akun Discord Kalian
Beli Morning Star Kursi Gaming/Kantor disini: https://s.shopee.co.id/805iTUOPRV
Beli Pemotong Rumput dengan Baterai IRONHOOF 588V Mesin Potong Rumput 88V disini https://s.shopee.co.id/70DBGTHtuJ

©2026 emka.web.id | Design: Newspaperly WordPress Theme