Deteksi konten
AI tidak selalu akurat! Alat pendeteksi Anda terkadang menandai konten yang ditulis manusia sebagai konten buatan AI. Inilah sebabnya hal ini terjadi dan apa yang dapat Anda lakukan untuk mengatasinya.
Bagaimana Cara Kerja Detektor AI?
Sebelum kita memahami mengapa detektor AI gagal, mari kita buat beberapa dasar. Deteksi konten AI adalah tentang menemukan pola.
Mengapa? Karena ketika manusia menulis, mereka memadukan pemikiran acak menjadi kalimat yang bermakna. Tidak ada pola yang pasti. Beberapa kalimat mungkin terlalu panjang untuk dibaca, dan beberapa lagi mungkin pendek.
Ini adalah kebalikan dari cara AI berpikir dan menulis. Ada sedikit keacakan, dan teksnya sangat terstruktur. Mungkin juga ada pengulangan ide atau kata-kata. Dan pilihan kata-katanya sendiri mungkin terlalu robot untuk dibaca. Pendeteksi konten AI mempertimbangkan semua ini. Mereka mencari pola seperti itu untuk membedakan antara konten yang ditulis manusia dan konten yang dibuat oleh AI.
Untuk melakukan ini, empat konsep ikut berperan.
Mereka Menerapkan Pengklasifikasi
Pengklasifikasi adalah algoritme yang mengkategorikan teks ke dalam kelas berbeda berdasarkan faktor seperti penggunaan, tata bahasa, gaya, dan nada.
Misalnya, teks dengan nada lembut, tata bahasa yang buruk, dan gaya penulisan yang berulang-ulang lebih cenderung dikategorikan sebagai buatan AI.
Mereka Menggunakan Penyematan
Dalam deteksi konten AI, Penyematan adalah representasi numerik dari kata-kata dan hubungannya dengan setiap kata lainnya. Mereka dinyatakan sebagai vektor dalam ruang dimensi tinggi, masing-masing dengan kode unik.
Kode-kode ini membantu komputer memahami bagaimana setiap kata berhubungan satu sama lain dan konteks penggunaannya. Model pembelajaran mesin yang mendasarinya terus dilatih untuk menentukan kode mana yang umum untuk teks yang dihasilkan AI dan mana yang tidak.
Mereka Melihat Kebingungan
Kebingungan adalah karakteristik teks yang menentukan tingkat keacakan dalam sebuah tulisan. Manusia menulis dengan tingkat kebingungan yang sangat tinggi. AI tidak.
Misalnya, pikirkan kemungkinan akhir dari kalimat ini: “Saya pergi menonton Oppenheimer kemarin, dan saat itu _____.”
Jika Anda menjawab sesuatu yang diharapkan seperti “spektakuler”, “luar biasa”, “luar biasa”, “mengesankan ,” atau “menawan”, maaf, tapi Anda mungkin robot. Namun, Anda memiliki selera film yang bagus! Selain bercanda, manusia lebih cenderung menyelesaikan kalimat dengan sesuatu yang lebih bersifat percakapan atau berdasarkan pengalaman pribadi. Sesuatu seperti “benar-benar gila” atau “tidak seperti yang saya harapkan”. Bagaimanapun, manusia bisa mengharapkan sesuatu dari sebuah film. AI jelas tidak bisa. Jika memang mengklaim demikian, model bahasa yang mendasarinya mungkin berhalusinasi (membuat klaim saat itu juga tanpa bukti faktual) atau tidak memiliki pagar pelindung (penataan keluaran dan kontrol kualitas).
Mereka Memeriksa Burstiness
Kita telah membicarakan tentang bagaimana manusia menulis secara tidak terduga. Dan bagaimana beberapa kalimat bisa panjang dan ada pula yang pendek. Burstiness adalah karakteristik teks lain yang mendefinisikan ini. Teks yang ditulis AI biasanya terdiri dari kalimat-kalimat yang panjang dan strukturnya serupa (low burstiness). Berikut ini contoh beberapa teks yang dihasilkan oleh ChatGPT. Perhatikan struktur monoton dan panjang yang sebanding dari kedua kalimat:
“Teks burstiness, juga dikenal sebagai kata burstiness atau istilah burstiness, adalah sebuah konsep dalam pemrosesan bahasa alami dan analisis teks yang mengacu pada distribusi kata atau istilah yang tidak seragam dalam sebuah kalimat. teks atau dokumen tertentu. Dengan kata lain, ini menggambarkan fenomena di mana kata atau istilah tertentu muncul lebih sering dalam konteks atau dokumen tertentu daripada yang diharapkan berdasarkan distribusi acak atau seragam.”
Teks manusia adalah kebalikannya (seperti artikel ini) . Ini memiliki perpaduan yang sehat antara kalimat panjang dan pendek dengan kreativitas yang cukup untuk memecahkan pola. Dan menghindari struktur kusam (kerusakan tinggi). Detektor
AI menggunakan kombinasi empat konsep ini untuk mengenali konten yang ditulis AI. Jadi, ilmunya ada di sana. Tapi apakah kedengarannya? Apakah Deteksi AI Akurat?
Sedihnya, deteksi AI tidak 100% akurat. Lagipula belum. Ini hanyalah permainan probabilitas.
Dan itulah mengapa menjalankan konten apa pun melalui detektor AI akan mengembalikan tingkat kepercayaan, bukan tingkat akurasi. Misalnya, jika detektor AI Anda memberi skor 70%, itu berarti 70% yakin bahwa konten tersebut dibuat oleh AI, dan 30% yakin bahwa konten tersebut ditulis oleh manusia.
Sekarang, bayangkan ini. Saya tunjukkan sepuluh coklat dan beri tahu Anda tujuh coklat gelap dan tiga coklat putih. Sekarang saya meminta Anda untuk memilih satu secara acak dan memberi tahu saya rasa yang Anda dapatkan tanpa membuka bungkusnya. Bisakah kamu menjawab ini? Tentu saja tidak! Premisnya sendiri membuat Anda siap menghadapi kegagalan. Dan itulah yang terjadi pada detektor AI. Dengan hanya tingkat keyakinan dan probabilitas yang dapat diandalkan, cepat atau lambat mereka pasti akan salah.
Mengapa Pendeteksi Konten AI Gagal?
Ada banyak alasan mengapa pendeteksian konten AI menjadi semakin sulit. Pembuat konten AI melampaui mereka: Model seperti ChatGPT 4 (dan bahkan versi gratisnya) menjadi sangat pandai dalam menulis konten mirip manusia. Mereka hanya menggunakan pengklasifikasi, penyematan, kebingungan, dan ledakan yang tepat. Mereka telah menganalisis sejumlah besar konten buatan manusia untuk menemukan titik terbaik antara penggunaan tata bahasa yang tepat dan pilihan kosa kata. Alat pendeteksi AI Anda tidak cukup bagus: Sama seperti generator AI, detektor AI pun perlu dilatih pada data dalam jumlah besar. Jika tidak, mereka tidak dapat mengklasifikasikan konten buatan manusia dan AI secara akurat. Bias sering kali menyusup ke dalam data pelatihan: Ketika AI membuat keputusan yang salah secara sistematis untuk kasus penggunaan tertentu, hal ini dikenal sebagai bias. Dan ini adalah masalah yang serius. Mereka ada karena semua data pelatihan berasal dari manusia. Manusia mempunyai bias, meskipun mereka tidak menyadarinya. Strategi pembuatan konten AI yang baru memperburuk keadaan: penulis dan blogger profesional AI terus-menerus mengembangkan strategi baru untuk mengelabui pendeteksi AI. Misalnya, mereka telah menemukan petunjuk khusus untuk membuat ChatGPT menulis konten yang kemungkinan besar tidak terdeteksi. Bahkan sekarang ada plugin khusus untuk memanusiakan teks ChatGPT! Apa yang Dapat Anda Lakukan?
Taruhan terbaik Anda adalah mempelajari cara mengenali konten AI sendiri.
Apakah mudah? Tidak terlalu. Namun hal ini tentu saja mungkin terjadi. Dengan beberapa latihan, Anda dapat melatih mata Anda untuk mencari hal-hal berikut:
Kata dan frasa yang berulang, terutama berfokus pada kemungkinan kata kunci target. Bahkan strukturnya mungkin tampak terlalu seragam. Misalnya, “Aku suka kucing karena kucingnya lucu. Kucing punya bulu yang lembut dan dengkuran yang hangat. Aku tidak bisa membayangkan hidupku tanpa kucing.” Nada generik dan robotik dengan kreativitas nol hingga minimal. Misalnya, “Selamat datang di situs web kami. Kami menawarkan berbagai macam produk dan layanan. Kami melayani kebutuhan pelanggan kami. Tim kami bekerja keras untuk memberikan kualitas dan kepuasan terbaik kepada klien kami.” Kedalaman ide-ide kunci di tingkat permukaan tanpa wawasan nyata atau pembelajaran praktis berdasarkan pengalaman kehidupan nyata. Misalnya saja, “Kamu harus selalu bersikap positif dan pantang menyerah. Sikap positif membawa kesuksesan dan kebahagiaan dalam hidup. Ini adalah kebiasaan yang baik.” Kesalahan faktual dan informasi yang ketinggalan jaman. Pembuat konten AI diketahui kadang-kadang “berhalusinasi” dan langsung mengarang sesuatu tanpa dasar yang nyata. Misalnya, “Menurut penelitian terbaru pada tahun 2002, bumi itu datar dan matahari berputar mengelilinginya.” Inkonsistensi dan kesalahan logis yang memalukan untuk dibaca. Misalnya, “John sedang makan siang di malam hari ketika surat pagi datang.” Perasaan umum tentang konten yang tidak bernyawa.
Masa depan generator AI Vs. Detektor AI benar-benar tidak dapat diprediksi. Tidak ada yang tahu siapa yang pada akhirnya akan memenangkan perlombaan. Untuk saat ini, yang terbaik adalah mengambil jalur manual dan berusaha mengembangkan keterampilan intuitif ini.