تتفوق أنظمة دعم القرار التشخيصي التقليدية على الذكاء الاصطناعي التوليدي في تشخيص الأمراض

قارن الباحثون أداة الذكاء الاصطناعي الخاصة بأنظمة دعم القرار التشخيصي طويلة الأمد، DXplain، مع نماذج اللغات الكبيرة الحديثة مثل ChatGPT وGemini، ووجدوا أن أداء DXplain كان أفضل قليلاً. ويقولون إن النتائج التي توصلوا إليها تشير إلى أن الجمع بين DXplain وLLMs يمكن أن يعزز التشخيص السريري ويحسن كلتا التقنيتين.

يستخدم المتخصصون الطبيون الذكاء الاصطناعي (AI) لتبسيط التشخيص لعقود من الزمن، باستخدام ما يسمى أنظمة دعم القرار التشخيصي (DDSSs). قام علماء الكمبيوتر في مستشفى ماساتشوستس العام (MGH)، وهو عضو مؤسس في نظام الرعاية الصحية Mass General Brigham، بتطوير DDSS الخاص بمستشفى ماساتشوستس العام والذي يسمى DXplain في عام 1984، والذي يعتمد على الآلاف من ملفات تعريف الأمراض والنتائج السريرية ونقاط البيانات لإنشاء وتصنيف التشخيصات المحتملة لاستخدامها من قبل الأطباء. مع تعميم وزيادة إمكانية الوصول إلى الذكاء الاصطناعي التوليدي ونماذج اللغة الكبيرة (LLMs) في الطب، سعى الباحثون في مختبر علوم الكمبيوتر (LCS) التابع لـ MGH إلى مقارنة القدرات التشخيصية لـ DXplain، التي تطورت على مدى العقود الأربعة الماضية، مع LLMs الشائعة. يقارن بحثهم الجديد بين ChatGPT وGemini وDXplain في تشخيص حالات المرضى، ويكشف عن أن أداء DXplain كان أفضل إلى حد ما، لكن أداء LLMs كان جيدًا أيضًا. يتصور الباحثون أن دمج DXplain مع LLM هو الطريقة المثلى للمضي قدمًا، لأنه من شأنه تحسين كلا النظامين وتعزيز فعاليتهما السريرية. يتم نشر النتائج في JAMA Network Open. "وسط كل الاهتمام بنماذج اللغات الكبيرة، من السهل أن ننسى أن أنظمة الذكاء الاصطناعي الأولى المستخدمة بنجاح في الطب كانت أنظمة متخصصة مثل DXplain". قال المؤلف المشارك إدوارد هوفر، دكتوراه في الطب، من LCS في MGH. "يمكن لهذه الأنظمة تعزيز وتوسيع نطاق تشخيص الأطباء، وتذكر المعلومات التي قد ينساها الأطباء في خضم هذه اللحظة، ولا تتحيز بسبب العيوب الشائعة في المنطق البشري. والآن، نعتقد أن الجمع بين القدرات التفسيرية القوية لأنظمة التشخيص الحالية والقدرات اللغوية لنماذج اللغة الكبيرة سيتيح دعمًا آليًا أفضل لقرارات التشخيص ونتائج المرضى. قال المؤلف المقابل ميتشل فيلدمان، دكتوراه في الطب، وهو أيضًا من LCS التابع لـ MGH. اختبر الباحثون القدرات التشخيصية لـ DXplain وChatGPT وGemini باستخدام 36 حالة مريض تشمل الفئات العرقية والإثنية والعمرية والجنسانية. وفي كل حالة، أتيحت للأنظمة الفرصة لاقتراح تشخيصات محتملة للحالة باستخدام بيانات المختبر وبدونها. باستخدام بيانات المختبر، أدرجت الأنظمة الثلاثة التشخيص الصحيح في معظم الأوقات: 72% لـ DXplain، و64% لـ ChatGPT، و58% لـ Gemini. بدون بيانات المختبر، أدرج DXplain التشخيص الصحيح بنسبة 56% من الحالات، متفوقًا على ChatGPT (42%) وGemini (39%)، على الرغم من أن النتائج لم تكن ذات دلالة إحصائية. لاحظ الباحثون أن اختباري DDSS وLLMs اكتشفا أمراضًا معينة لم يلحظها الآخرون، مما يشير إلى أنه قد يكون هناك أمل في الجمع بين النهجين. يكشف العمل الأولي المبني على هذه النتائج أنه يمكن استخدام LLMs لسحب النتائج السريرية من النص السردي، والتي يمكن بعد ذلك توصيلها بمقاييس DDSS - مما يؤدي بدوره إلى تحسين كلا النظامين واستنتاجاتهما التشخيصية بشكل تآزري. المواد المقدمة من قبل قداس الجنرال بريجهام. ملحوظة: يمكن تحرير المحتوى حسب الأسلوب والطول.

This article was originally published by ScienceDaily. For more details, images, and references:

Read Full Original Article ↗