Pelajaran tentang Hype AI dari ChatGPT Baru

Ketika OpenAI memperkenalkan versi terbaru dari chatbot ChatGPT yang sangat populer bulan ini, chatbot ini memiliki suara baru yang memiliki infleksi dan emosi mirip manusia. Demonstrasi online juga menampilkan chatbot ini mengajar seorang anak untuk menyelesaikan masalah geometri.

Namun, demo tersebut ternyata merupakan suatu trik. ChatGPT baru dirilis tanpa sebagian besar fitur barunya, termasuk suara yang ditingkatkan (yang dikatakan perusahaan telah ditunda untuk memperbaiki), dan kemampuan menggunakan kamera video ponsel untuk menganalisis sesuatu secara real-time seperti masalah matematika juga belum tersedia.

Sementara menunggu, perusahaan juga menonaktifkan suara ChatGPT yang beberapa orang anggap mirip aktris Scarlett Johansson, setelah dia mengancam akan mengambil tindakan hukum, dan menggantinya dengan suara wanita yang berbeda.

Untuk saat ini, fitur yang benar-benar dihadirkan dalam ChatGPT baru adalah kemampuan mengunggah foto untuk dianalisis oleh bot. Pengguna secara umum dapat mengharapkan tanggapan yang lebih cepat dan jelas. Bot ini juga dapat melakukan terjemahan bahasa secara real-time, namun ChatGPT akan membalas dengan suara mesin lamanya.

Meskipun demikian, ini adalah chatbot unggulan yang mengubah industri teknologi, sehingga layak untuk ditinjau. Setelah mencoba chatbot yang dipercepat selama dua minggu, saya merasa bingung. Chatbot ini unggul dalam terjemahan bahasa, namun kesulitan dalam matematika dan fisika. Secara keseluruhan, saya tidak melihat peningkatan yang berarti dari versi sebelumnya, ChatGPT-4. Saya pasti tidak akan membiarkannya mengajar anak saya.

Taktik ini, di mana perusahaan kecerdasan buatan menjanjikan fitur-fitur baru yang luar biasa dan menghadirkan produk yang setengah matang, sedang menjadi tren yang cenderung membingungkan dan menyebalkan orang. Ai Pin senilai $700, pin jas bicara dari start-up Humane yang didanai oleh direktur eksekutif OpenAI, Sam Altman, umumnya dicemooh karena berlebihan panas dan mengeluarkan nonsense. Meta juga baru-baru ini menambahkan ke aplikasinya chatbot kecerdasan buatan yang gagal dalam sebagian besar tugas yang diiklankan, seperti pencarian web untuk tiket pesawat.

Perusahaan merilis produk kecerdasan buatan dalam keadaan belum matang sebagian karena mereka ingin orang menggunakan teknologi untuk membantu mereka memahami cara memperbaikinya. Di masa lalu, ketika perusahaan memperkenalkan produk teknologi baru seperti ponsel, apa yang kami lihat – fitur-fitur seperti kamera baru dan layar yang lebih cerah – adalah yang kami dapatkan. Dengan kecerdasan buatan, perusahaan memberikan pratinjau dari masa depan potensial, menunjukkan teknologi yang sedang dikembangkan dan hanya bekerja dalam kondisi terbatas dan terkendali. Produk matang dan handal mungkin akan datang – atau mungkin tidak.

Pelajaran yang harus dipetik dari ini adalah bahwa kita, sebagai konsumen, seharusnya menolak hiperbola dan mengambil pendekatan yang lambat dan hati-hati terhadap kecerdasan buatan. Kita sebaiknya tidak menghabiskan banyak uang pada teknologi yang belum matang sampai kami melihat bukti bahwa alat-alat tersebut berhasil sesuai iklan.

Versi baru ChatGPT, yang disebut GPT-4o (“o” seperti “omni”), sekarang dapat dicoba secara gratis di situs web dan aplikasi OpenAI. Pengguna tidak berbayar dapat melakukan beberapa permintaan sebelum mencapai batas waktu, dan mereka yang berlangganan bulanan sebesar $20 dapat bertanya kepada bot sejumlah pertanyaan yang lebih besar.

OpenAI mengatakan pendekatan iteratifnya untuk memperbarui ChatGPT memungkinkan mereka untuk mengumpulkan umpan balik untuk melakukan perbaikan.

“Kami percaya penting untuk memperlihatkan model-model canggih kami untuk memberi orang gambaran tentang kemampuan mereka dan membantu kami memahami aplikasi dunia nyata mereka,” kata perusahaan itu dalam sebuah pernyataan.

(The New York Times menggugat OpenAI dan mitranya, Microsoft, tahun lalu karena menggunakan artikel berita yang dilindungi hak cipta tanpa izin untuk melatih chatbot.)

Berikut adalah hal-hal yang perlu diketahui tentang versi terbaru ChatGPT.

Geometri dan Fisika
Untuk memamerkan trik baru ChatGPT-4o, OpenAI mempublikasikan video yang menampilkan Sal Khan, direktur eksekutif dari Khan Academy, organisasi nirlaba pendidikan, dan putranya, Imran. Dengan kamera video yang mengarah pada masalah geometri, ChatGPT mampu membimbing Imran dalam menyelesaikan langkah demi langkah.

Meskipun fitur analisis video ChatGPT belum dirilis, saya dapat mengunggah foto masalah geometri. ChatGPT berhasil menyelesaikan beberapa masalah yang lebih mudah dengan benar, namun gagal dalam masalah yang lebih menantang.

Untuk satu masalah yang melibatkan segitiga yang saling bersilangan, yang saya ambil dari situs persiapan SAT, bot ini memahami pertanyaan namun memberikan jawaban yang salah.

Taylor Nguyen, seorang guru fisika sekolah menengah di Orange County, California, mengunggah masalah fisika yang melibatkan seorang pria di ayunan yang umumnya disertakan dalam tes Kalkulus Tingkat Lanjut AP. ChatGPT melakukan beberapa kesalahan logis untuk memberikan jawaban yang salah, namun berhasil memperbaikinya dengan umpan balik dari Bapak Nguyen.

“Saya dapat membimbingnya, namun saya adalah seorang guru,” kata beliau. “Bagaimana seorang siswa seharusnya menemukan kesalahan-kesalahan itu? Mereka mengasumsikan bahwa chatbot tersebut benar.”

Saya melihat bahwa ChatGPT-4o berhasil dalam beberapa perhitungan pembagian yang sebelumnya dikerjakan oleh versi sebelumnya dengan cara yang salah, sehingga ada tanda-tanda perbaikan yang lambat. Namun demikian, ia juga gagal dalam tugas matematika dasar yang versi-versi sebelumnya dan chatbot lainnya, termasuk Meta AI dan Gemini milik Google, juga gagal: kemampuan menghitung. Ketika saya bertanya kepada ChatGPT-4o untuk kata empat suku diawali dengan huruf “W,” ia menjawab, “Wonderful.”

OpenAI mengatakan bahwa mereka terus bekerja untuk meningkatkan respons sistem mereka terhadap masalah matematika yang kompleks.

Mr. Khan, yang perusahaannya menggunakan teknologi OpenAI dalam perangkat lunak pembimbingan mereka Khanmigo, tidak menanggapi permintaan komentar apakah ia akan meninggalkan ChatGPT sebagai pengajar bersama anaknya.

Pemikiran
OpenAI juga menyoroti bahwa ChatGPT baru lebih baik dalam berpikir, atau menggunakan logika untuk menghasilkan respons. Jadi, saya mengujinya melalui salah satu tes favorit saya: Saya memintanya untuk menghasilkan teka-teki Where’s Waldo? Ketika ditunjukkan gambar Waldo raksasa berdiri di antara kerumunan, saya mengatakan bahwa yang menjadi point adalah dia seharusnya sulit ditemukan.

Bot tersebut kemudian menghasilkan Waldo yang lebih besar lagi.

Subbarao Kambhampati, seorang profesor dan peneliti kecerdasan buatan di Universitas Negara Bagian Arizona, juga menguji chatbot itu dan berkata bahwa ia tidak melihat peningkatan yang signifikan dalam pemikiran dibandingkan dengan versi sebelumnya.

Beliau menyajikan ChatGPT sebuah teka-teki yang melibatkan balok:

Jika balok C berada di atas balok A, dan balok B terpisah di atas meja, bisakah Anda memberitahu saya bagaimana saya dapat membuat tumpukan balok dengan balok A di atas balok B dan balok B di atas balok C, tetapi tanpa memindahkan balok C?

Jawabannya adalah bahwa tidak mungkin menyusun balok di bawah kondisi-kondisi tersebut, namun, seperti versi-versi sebelumnya, ChatGPT-4o secara konsisten menemukan solusi yang melibatkan memindahkan balok C. Dengan tes pemikiran ini dan tes-tess lainnya, ChatGPT terkadang dapat menerima umpan balik untuk mendapatkan jawaban yang benar, yang bertentangan dengan bagaimana seharusnya kecerdasan buatan bekerja, kata Mr. Kambhampati.

“Anda dapat memperbaikinya, namun ketika Anda melakukannya Anda menggunakan kecerdasan Anda sendiri,” kata beliau.

OpenAI menunjukkan hasil tes yang menunjukkan bahwa GPT-4o mencetak sekitar dua persen lebih tinggi dalam menjawab pertanyaan pengetahuan umum dibandingkan dengan versi-versi sebelumnya ChatGPT, mengilustrasikan bahwa kemampuan pemikirannya sedikit meningkat.

Bahasa
OpenAI juga mengatakan bahwa ChatGPT baru dapat melakukan terjemahan bahasa secara real-time, yang bisa membantu Anda berbicara dengan seseorang yang berbicara dalam bahasa asing.

Saya menguji ChatGPT dengan bahasa Mandarin dan Kanton dan mengonfirmasi bahwa ia lumayan dalam menerjemahkan frasa-frasa, seperti “Saya ingin memesan kamar hotel untuk Kamis depan” dan “Saya ingin tempat tidur ukuran king.” Namun, aksennya sedikit berbeda. (Sebagai penghargaan, bahasa Cina yang patah saya tidak jauh lebih baik.) OpenAI mengatakan bahwa mereka masih bekerja untuk memperbaiki aksen.

ChatGPT-4o juga berhasil sebagai penyunting. Ketika saya memberinya paragraf yang saya tulis, ia cepat dan efektif dalam menghapus kata-kata yang berlebihan dan jargon. Kinerja yang lumayan dengan terjemahan bahasa memberi saya keyakinan bahwa fitur ini akan segera menjadi fitur yang lebih berguna.

Kesimpulan
Salah satu hal besar yang berhasil OpenAI lakukan dengan ChatGPT-4o adalah membuat teknologi ini gratis bagi pengguna untuk mencobanya. Gratis adalah harga yang tepat: Karena kita membantu melatih sistem kecerdasan buatan ini dengan data kita untuk memperbaiki, kita seharusnya tidak membayar untuk itu.

Yang terbaik dari kecerdasan buatan masih akan datang, dan suatu hari mungkin chatbot ini akan menjadi tutor matematika yang baik yang ingin kita ajak bicara. Namun, kita seharusnya mempercayainya ketika kita melihatnya – dan mendengarnya.