Dalam Studi Baru, GPT-4 Lebih Unggul Dibandingkan Dokter Dalam Pemikiran Klinis, Namun Lebih Sering Salah
Dalam sebuah studi terbaru, para ilmuwan di Beth Israel Deaconess Medical Center (BIDMC) membandingkan kemampuan penalaran klinis dari model bahasa besar dengan rekan dokter manusia. Para peneliti menggunakan skor revised-IDEA (r-IDEA), yang merupakan alat yang umum digunakan untuk menilai penalaran klinis. Studi tersebut melibatkan memberikan chatbot yang didukung oleh GPT-4, 21 dokter spesialis, dan 18 … Baca Selengkapnya