Published on

ChatGPT वैद्यकीय प्रश्नांची उत्तरे देण्यात डॉक्टरांपेक्षा सरस: सहानुभूती आणि उपयुक्तता चाचणी

लेखक
  • avatar
    नाव
    Ajax
    Twitter

ChatGPT वैद्यकीय क्षेत्रात डॉक्टरांपेक्षा सरस?

ChatGPT च्या आगमनानंतर, वैद्यकीय क्षेत्रात त्याची क्षमता लक्षणीयरीत्या वाढली आहे. जर्मनीमधील वैद्यकीय राष्ट्रीय परीक्षेत, ChatGPT ने सरासरी 74.6% गुण मिळवले, जे मानवी विद्यार्थ्यांपेक्षा जास्त होते. या परीक्षेत 630 प्रश्नांपैकी 88.1% प्रश्नांची उत्तरे ChatGPT ने अचूक दिली. वास्तविक वैद्यकीय उपयोगात, ChatGPT ने 17 वेगवेगळ्या विषयांतील 284 वैद्यकीय प्रश्नांची अचूक उत्तरे दिली आहेत. तसेच, 'रीइन्फोर्समेंट लर्निंग'च्या मदतीने त्याची कार्यक्षमता सतत सुधारत आहे. अस्थिरोग आणि क्रीडा वैद्यक क्षेत्रात, ChatGPT ने 65% प्रश्नांची अचूक उत्तरे दिली.

संशोधनाची पार्श्वभूमी आणि पद्धती

ChatGPT च्या वैद्यकीय क्षेत्रातील संभाव्यतेचा शोध घेण्यासाठी, जर्मनीतील लुडविग्सहाफेन बीजी क्लिनिकमधील संशोधकांनी एक तुलनात्मक अभ्यास केला. त्यांनी ट्रॉमा सर्जरी, जनरल सर्जरी, ईएनटी (ENT), बालरोग आणि अंतर्गत औषध या पाच प्रमुख वैद्यकीय क्षेत्रांतील 100 आरोग्य-संबंधित प्रश्न निवडले. या प्रश्नांची उत्तरे ChatGPT आणि अनुभवी तज्ञांनी (EP) दिली. अभ्यासात असे दिसून आले की, ChatGPT सहानुभूती आणि उपयुक्तता या दोन्ही बाबतीत तज्ञांपेक्षा सरस ठरले.

रुग्णांना AI सहाय्यकांबद्दल काय वाटते, हे जाणून घेण्यासाठी संशोधकांनी अनेक टप्प्यांची पद्धत वापरली:

  1. प्रश्न संकलन: रुग्णांसाठी असलेल्या एका ऑनलाइन प्लॅटफॉर्मवरून 100 आरोग्य-संबंधित प्रश्न गोळा केले. हे प्रश्न पाच वैद्यकीय क्षेत्रांतील होते आणि प्रत्येक क्षेत्रातील 20 प्रश्न निवडले होते.
  2. उत्तरांची निर्मिती: ChatGPT-4.0 वापरून 100 प्रश्नांची उत्तरे तयार केली आणि त्याच प्लॅटफॉर्मवरील तज्ञांच्या उत्तरांशी तुलना केली.
  3. अनामिकता: सर्व प्रश्न आणि उत्तरे अनामिक केली आणि 10 प्रश्नांचे 10 संच तयार केले.
  4. मूल्यांकन: हे संच रुग्ण आणि डॉक्टरांना मूल्यांकनासाठी पाठवले. रुग्णांनी उत्तरांमधील सहानुभूती आणि उपयुक्तता तपासली, तर डॉक्टरांनी सहानुभूती, उपयुक्तता, अचूकता आणि संभाव्य धोका तपासला.

मूल्यांकन निष्पक्षपणे व्हावे यासाठी, सहभागींना उत्तरे ChatGPT ने दिली आहेत की तज्ञांनी, हे माहीत नव्हते. संशोधकांनी रुग्णांची वयोमर्यादा, लिंग आणि डॉक्टरांचा कामाचा अनुभव यांसारखी माहिती देखील गोळा केली, ज्यामुळे मूल्यांकनावर परिणाम करणारे घटक तपासता आले.

मूल्यांकनाचे निष्कर्ष

रुग्णांचे मूल्यांकन

रुग्णांनी ChatGPT च्या उत्तरांना चांगला प्रतिसाद दिला.

  • सहानुभूती: ChatGPT ला सरासरी 4.2 (प्रमाणित त्रुटी 0.15) गुण मिळाले, तर तज्ञांना 3.8 (प्रमाणित त्रुटी 0.18) गुण मिळाले.
  • उपयुक्तता: ChatGPT ला सरासरी 4.1 गुण मिळाले, तर तज्ञांना 3.7 गुण मिळाले.

यावरून असे दिसून येते की, रुग्णांना ChatGPT ची उत्तरे तज्ञांपेक्षा अधिक सहानुभूतीपूर्ण आणि उपयुक्त वाटली.

पुढील विश्लेषणात असे आढळले की, रुग्णांचे वय आणि लिंग यांचा मूल्यांकनावर परिणाम झाला नाही, पण रुग्णांचे शिक्षण आणि सामाजिक-आर्थिक स्थितीचा ChatGPT च्या स्वीकारार्हतेवर परिणाम होऊ शकतो. मात्र, या अभ्यासात या संबंधित माहिती गोळा न केल्यामुळे, सखोल विश्लेषण करणे शक्य झाले नाही.

डॉक्टरांचे मूल्यांकन

डॉक्टरांनी देखील ChatGPT च्या उत्तरांना सकारात्मक प्रतिसाद दिला.

  • सहानुभूती: ChatGPT ला सरासरी 4.3 गुण मिळाले, तर तज्ञांना 3.9 गुण मिळाले.
  • उपयुक्तता: ChatGPT ला सरासरी 4.2 (प्रमाणित त्रुटी 0.15) गुण मिळाले, तर तज्ञांना 3.8 (प्रमाणित त्रुटी 0.17) गुण मिळाले.
  • अचूकता: ChatGPT ला सरासरी 4.5 (प्रमाणित त्रुटी 0.13) गुण मिळाले, तर तज्ञांना 4.1 (प्रमाणित त्रुटी 0.15) गुण मिळाले.
  • संभाव्य धोका: ChatGPT ला सरासरी 1.2 (प्रमाणित त्रुटी 0.08) संभाव्य धोका गुण मिळाला, तर तज्ञांना 1.5 (प्रमाणित त्रुटी 0.10) गुण मिळाला.

या आकडेवारीवरून हे स्पष्ट होते की, ChatGPT केवळ सहानुभूती, उपयुक्तता आणि अचूकतेतच नव्हे, तर संभाव्य धोक्याच्या बाबतीतही तज्ञांपेक्षा सरस आहे.