ChatGPT sejauh ini dikenal sebagai bot ajaib yang dapat membantu Anda mendapatkan jawaban atas pertanyaan berbasis teks. Meskipun sering kali melakukan kesalahan, hal ini juga dapat membantu dalam beberapa kasus. Namun sebagian besar, Anda hanya dapat berinteraksi dengannya melalui teks. Anda mengetikkan pertanyaan, dan itu akan menjelaskan jawabannya. Kini, OpenAI mengumumkan beberapa cara berbeda agar Anda dapat berinteraksi dengannya.
OpenAI menambahkan beberapa fitur suara dan gambar baru ke ChatGPT, menawarkan Anda cara yang lebih intuitif untuk berinteraksi dengan AI. Fitur-fitur ini tidak hanya memungkinkan Anda berkomunikasi dengan ChatGPT dalam lebih banyak cara, namun juga memungkinkan Anda mengintegrasikannya ke lebih banyak bagian kehidupan sehari-hari Anda.
Pertama, Anda kini dapat terlibat dalam percakapan suara dengan ChatGPT, memungkinkan diskusi bolak-balik di berbagai topik. Kemampuan suara tersedia di iOS dan Android melalui pengaturan keikutsertaan, dengan lima opsi suara berbeda yang dibuat oleh aktor suara berbeda. Whisper, sistem pengenalan suara sumber terbuka OpenAI, mentranskripsikan kata-kata yang diucapkan menjadi teks untuk komunikasi yang lancar.
Bagaimana dengan gambar? Anda juga dapat mendiskusikan gambar dengan ChatGPT, sehingga memungkinkan untuk memecahkan masalah, merencanakan makanan, atau menganalisis grafik data yang kompleks dengan menampilkan satu atau beberapa gambar. Fitur pemahaman gambar memanfaatkan model multimodal GPT-3.5 dan GPT-4, memungkinkan penalaran dengan berbagai macam gambar, termasuk foto, tangkapan layar, dan dokumen yang berisi teks dan gambar. Pada dasarnya, cukup lemparkan gambar ke ChatGPT, dan itu akan melakukan yang terbaik untuk memahaminya dan membantu Anda menjawab pertanyaan Anda — seperti fitur yang sedang diuji di Bing Chat. Hal ini mungkin tidak akan sempurna, dan terutama pada awalnya, namun perlahan-lahan akan menjadi lebih baik.
Perusahaan juga benar-benar memperjelas bahwa mereka menerapkan ini dengan cara yang bertanggung jawab untuk memastikan keselamatan dan memitigasi potensi risiko. Obrolan suara, misalnya, dikembangkan bekerja sama dengan pengisi suara untuk mencegah penyalahgunaan, dan OpenAI bekerja sama dengan mitra seperti Spotify untuk aplikasi seperti Terjemahan Suara dalam podcasting. Dan dalam hal model deteksi gambar, OpenAI telah menguji modelnya dengan tim merah dan penguji alfa untuk memastikan penggunaan yang bertanggung jawab. Perusahaan ini juga bekerja sama dengan organisasi seperti Be My Eyes untuk memahami keterbatasan dan manfaat kemampuan penglihatan, khususnya bagi tunanetra.
OpenAI meluncurkan kemampuan ini secara bertahap kepada pengguna Plus dan Enterprise sebelum memperluas akses ke grup lain. Pengembang perangkat lunak yang membuat aplikasi mereka sendiri yang didukung GPT juga akan dapat menggunakan fitur-fitur ini pada suatu saat.
Sumber: OpenAI