
Pengumuman AI dari CEO Meta Mark Zuckerberg telah menimbulkan kekhawatiran besar, setelah dia mengatakan bahwa perusahaan tersebut memiliki lebih banyak data pengguna daripada yang digunakan untuk melatih ChatGPT – dan akan segera menggunakannya untuk melatih sistem AI miliknya sendiri.
Rencana perusahaan untuk menggunakan postingan dan komentar Facebook dan Instagram untuk melatih chatbot pesaing menimbulkan kekhawatiran tentang privasi dan toksisitas …
Zuckerberg mengumumkan rencana perusahaan tersebut setelah merilis laporan pendapatan terbaru perusahaan, seperti yang dilaporkan Bloomberg.
Bagi banyak orang, Facebook adalah internet, dan jumlah penggunanya masih terus bertambah, menurut hasil keuangan terbaru Meta Platforms Inc. Namun Mark Zuckerberg tidak hanya merayakan pertumbuhan yang berkelanjutan tersebut. Dia ingin memanfaatkannya dengan menggunakan data dari Facebook dan Instagram untuk menciptakan kecerdasan buatan yang kuat dan bertujuan umum […]
[Zuckerberg berkata] “Bagian penting berikutnya dari pedoman kami adalah belajar dari data unik dan putaran umpan balik di kami produk… Di Facebook dan Instagram, terdapat ratusan miliar gambar yang dibagikan secara publik dan puluhan miliar video publik, yang kami perkirakan lebih besar daripada kumpulan data Common Crawl dan orang-orang juga membagikan postingan teks publik dalam jumlah besar dalam komentar di seluruh layanan kami .”
Common Crawl mengacu pada arsip besar berisi 250 miliar halaman web, mewakili sebagian besar teks yang digunakan untuk melatih ChatGPT. Dengan menggunakan kumpulan data yang lebih besar, Meta dapat membangun chatbot yang lebih cerdas.
Seperti yang dicatat oleh Bloomberg, bukan hanya banyaknya data yang mungkin memberi Meta keuntungan – tetapi fakta bahwa sebagian besar data bersifat interaktif.
Tumpukan data yang dia simpan sangat berharga karena sebagian besar berasal dari rangkaian komentar. Teks apa pun yang mewakili dialog manusia sangat penting untuk melatih apa yang disebut agen percakapan, itulah sebabnya OpenAI banyak memanfaatkan forum internet Reddit Inc. untuk membangun chatbot populernya sendiri.
Namun karya tersebut juga menunjuk pada dua bendera merah besar di sini. Pertama, Meta akan secara efektif melatih AI-nya pada postingan yang mungkin bersifat pribadi, dan percakapan antar teman di komentar Facebook. Hal ini menimbulkan kekhawatiran privasi yang besar.
Kedua, siapa pun yang pernah membaca bagian komentar di mana pun di Internet tahu bahwa persentase konten beracun tinggi. Meskipun para pengguna yang bijaksana memperdebatkan masalah ini, tidak sedikit pula yang memberikan komentar yang melontarkan serangan pribadi dan hinaan kasar – dan sebagian besar dari tindakan tersebut bersifat rasis dan seksis.
Itu adalah sesuatu yang harus difilter oleh sistem pelatihan chatbot mana pun – dan Apple mungkin lebih berhati-hati dibandingkan siapa pun dalam pekerjaan pengembangan chatbotnya, sehingga berkontribusi pada peluncuran kembali Siri yang sangat terlambat – tetapi situasi di sini mungkin sangat buruk.
Beberapa konten di Facebook yang ditandai sebagai beracun tidak lagi ditinjau oleh manusia dan ditinggalkan di situs. Lebih buruk lagi: Ketika Zuckerberg mengatakan bahwa data Meta lebih besar daripada data Common Crawl, dia kemungkinan besar memasukkan arsip bersejarah perusahaan yang berisi semua konten politik hiperbolik dan berita palsu yang ada di situs tersebut sebelum Zuckerberg bersusah payah membersihkannya.
Dan ini adalah perusahaan yang, bahkan beberapa hari yang lalu, mengatakan bahwa video palsu Presiden Biden harus dibiarkan tetap ada di platform karena diedit oleh manusia dan bukan oleh sistem AI, jadi standarnya tidak’ bahkan saat ini tidak terlalu tinggi.
Foto oleh Mariia Shalabaieva di Unsplash
Itulah konten tentang Pengumuman AI Zuckerberg menimbulkan tanda bahaya privasi dan toksisitas, semoga bermanfaat.