- Published on
Studi: ChatGPT Ungguli Dokter dalam Empati dan Praktikalitas
Pendahuluan
Sejak kemunculan ChatGPT, kemampuannya dalam bidang medis telah menarik perhatian luas. Misalnya, dalam ujian medis nasional di Jerman, ChatGPT memperoleh skor rata-rata 74,6%, melampaui kinerja mahasiswa kedokteran manusia. Ia juga berhasil menjawab 88,1% dari 630 pertanyaan dengan benar. Dalam aplikasi medis praktis, ChatGPT memberikan respons yang cukup akurat terhadap 284 pertanyaan medis yang mencakup 17 spesialisasi, dan terus meningkatkan kinerjanya melalui pembelajaran penguatan. Dalam bidang kedokteran olahraga ortopedi, tingkat akurasi jawabannya terhadap pertanyaan sampel juga mencapai 65%.
Latar Belakang dan Metodologi Penelitian
Untuk lebih mengeksplorasi potensi aplikasi ChatGPT dalam bidang medis, para peneliti di Klinik BG Ludwigshafen, Jerman, melakukan studi perbandingan. Mereka memilih 100 pertanyaan terkait kesehatan dari lima spesialisasi medis utama: bedah trauma, bedah umum, THT, pediatri, dan penyakit dalam. Kemudian, mereka membandingkan jawaban ChatGPT dengan jawaban dari para ahli berpengalaman (EP). Hasil penelitian menunjukkan bahwa ChatGPT lebih unggul daripada para ahli dalam hal empati dan kepraktisan.
Untuk mengevaluasi persepsi pasien terhadap asisten AI secara komprehensif, para peneliti mengadopsi metode multi-tahap:
- Pengumpulan Pertanyaan: 100 pertanyaan terkait kesehatan publik dikumpulkan dari platform daring yang berorientasi pada pasien, mencakup lima spesialisasi medis yang disebutkan di atas, dengan 20 pertanyaan dari setiap spesialisasi.
- Pembuatan Jawaban: ChatGPT-4.0 digunakan untuk menghasilkan jawaban atas 100 pertanyaan ini, dan dibandingkan dengan jawaban ahli dari platform yang sama.
- Anonimisasi: Semua pertanyaan dan jawaban dianonimkan dan dikemas menjadi 10 set data, masing-masing berisi 10 pertanyaan.
- Evaluasi: Set data ini didistribusikan kepada pasien dan dokter untuk dievaluasi. Pasien terutama berfokus pada empati dan kepraktisan jawaban, sementara dokter, selain mengevaluasi empati dan kepraktisan, juga mengevaluasi keakuratan dan potensi bahaya jawaban.
Untuk memastikan objektivitas evaluasi, semua peserta tidak mengetahui apakah jawaban diberikan oleh ChatGPT atau oleh seorang ahli selama proses evaluasi. Selain itu, tim peneliti juga mengumpulkan informasi dasar pasien seperti usia dan jenis kelamin, serta pengalaman kerja dokter, untuk menganalisis lebih lanjut pengaruh faktor-faktor ini terhadap hasil evaluasi.
Analisis Hasil Evaluasi: Penilaian Pasien
Pasien memberikan evaluasi yang sangat positif terhadap jawaban ChatGPT.
- Empati: ChatGPT memperoleh skor rata-rata 4,2 (standard error 0,15), sedangkan ahli memperoleh skor rata-rata 3,8 (standard error 0,18).
- Kepraktisan: ChatGPT memperoleh skor rata-rata 4,1, sedangkan ahli memperoleh skor rata-rata 3,7.
Hasil ini menunjukkan bahwa pasien umumnya menganggap jawaban ChatGPT lebih empatik dan praktis daripada jawaban para ahli. Analisis lebih lanjut menunjukkan bahwa usia dan jenis kelamin pasien tidak berpengaruh signifikan terhadap hasil evaluasi, tetapi tingkat pendidikan dan status sosial ekonomi pasien mungkin memengaruhi tingkat penerimaan mereka terhadap ChatGPT. Sayangnya, data mengenai aspek ini tidak dikumpulkan dalam penelitian ini, sehingga analisis rinci tidak dapat dilakukan.
Analisis Hasil Evaluasi: Penilaian Dokter
Dokter juga memberikan evaluasi positif terhadap jawaban ChatGPT.
- Empati: ChatGPT memperoleh skor rata-rata 4,3, sedangkan ahli memperoleh skor rata-rata 3,9.
- Kepraktisan: ChatGPT memperoleh skor rata-rata 4,2 (standard error 0,15), sedangkan ahli memperoleh skor rata-rata 3,8 (standard error 0,17).
- Keakuratan: ChatGPT memperoleh skor rata-rata 4,5 (standard error 0,13), sedangkan ahli memperoleh skor rata-rata 4,1 (standard error 0,15).
- Potensi Bahaya: ChatGPT memperoleh skor rata-rata potensi bahaya 1,2 (standard error 0,08), sedangkan ahli memperoleh skor rata-rata potensi bahaya 1,5 (standard error 0,10).
Data ini menunjukkan bahwa ChatGPT tidak hanya unggul dalam hal empati, kepraktisan, dan keakuratan, tetapi juga lebih unggul daripada para ahli dalam hal potensi bahaya.
Implikasi dan Diskusi
Studi ini memberikan bukti kuat tentang kemampuan ChatGPT dalam memberikan respons medis yang tidak hanya akurat tetapi juga empatik dan praktis. Temuan ini memiliki implikasi yang signifikan bagi masa depan layanan kesehatan, di mana asisten AI seperti ChatGPT dapat berperan penting dalam memberikan dukungan kepada pasien dan tenaga medis.
Potensi Penggunaan ChatGPT dalam Layanan Kesehatan
- Peningkatan Akses Informasi: ChatGPT dapat memberikan akses yang mudah dan cepat ke informasi medis yang akurat bagi pasien di mana saja dan kapan saja.
- Dukungan untuk Dokter: ChatGPT dapat membantu dokter dalam memberikan respons yang cepat dan tepat terhadap pertanyaan pasien, memungkinkan mereka untuk fokus pada tugas-tugas yang lebih kompleks.
- Peningkatan Empati: Kemampuan ChatGPT untuk memberikan respons yang empatik dapat meningkatkan pengalaman pasien dan membangun kepercayaan yang lebih kuat antara pasien dan penyedia layanan kesehatan.
- Pengurangan Biaya: Penggunaan asisten AI dapat membantu mengurangi biaya layanan kesehatan dengan mengotomatiskan beberapa tugas rutin.
Tantangan dan Pertimbangan
- Privasi dan Keamanan Data: Penting untuk memastikan privasi dan keamanan data pasien saat menggunakan asisten AI.
- Keterbatasan AI: Meskipun AI telah menunjukkan kemajuan yang signifikan, penting untuk menyadari keterbatasannya dan menggunakan AI sebagai alat bantu, bukan pengganti tenaga medis manusia.
- Regulasi dan Etika: Perlu ada regulasi dan panduan etika yang jelas mengenai penggunaan AI dalam layanan kesehatan.
- Pendidikan dan Pelatihan: Perlu ada upaya pendidikan dan pelatihan yang memadai bagi tenaga medis dan pasien tentang cara menggunakan asisten AI secara efektif dan aman.
Penelitian Lebih Lanjut
Penelitian lebih lanjut diperlukan untuk mengeksplorasi lebih dalam potensi dan tantangan penggunaan AI dalam layanan kesehatan. Beberapa area penelitian yang menarik meliputi:
- Pengembangan Model AI yang Lebih Canggih: Upaya untuk terus mengembangkan model AI yang lebih canggih dan akurat dalam memberikan respons medis.
- Evaluasi Dampak Jangka Panjang: Evaluasi dampak jangka panjang penggunaan asisten AI terhadap kualitas layanan kesehatan dan kepuasan pasien.
- Penelitian Multidisiplin: Penelitian yang melibatkan para ahli dari berbagai bidang, seperti ilmu komputer, kedokteran, psikologi, dan etika.
- Perbandingan dengan Model AI Lain: Penelitian yang membandingkan kinerja ChatGPT dengan model AI lain dalam bidang medis.
Penelitian ini adalah langkah penting dalam memahami potensi transformatif AI dalam layanan kesehatan. Dengan pendekatan yang hati-hati dan bertanggung jawab, kita dapat memanfaatkan kekuatan AI untuk meningkatkan kualitas hidup manusia.