Исследователи сравнили свой давний инструмент искусственного интеллекта для систем поддержки диагностических решений DXplain с современными моделями больших языков, такими как ChatGPT и Gemini, и обнаружили, что DXplain работает немного лучше. Они говорят, что их результаты показывают, что объединение DXplain с LLM может улучшить клиническую диагностику и улучшить обе технологии.
Медицинские работники десятилетиями использовали искусственный интеллект (ИИ) для оптимизации диагностики, используя так называемые системы поддержки принятия диагностических решений (DDSS). Ученые-компьютерщики из Массачусетской больницы общего профиля (MGH), одного из основателей системы здравоохранения Mass General Brigham, впервые разработали собственную DDSS MGH под названием DXplain в 1984 году, которая опирается на тысячи профилей заболеваний, клинических данных и точек данных для генерации и ранжирования потенциальных диагнозов для использования врачами. С популяризацией и повышением доступности генеративного искусственного интеллекта и больших языковых моделей (LLM) в медицине исследователи из Лаборатории компьютерных наук (LCS) MGH попытались сравнить диагностические возможности DXplain, который развивался за последние четыре десятилетия, с популярными LLM.
Их новое исследование сравнивает ChatGPT, Gemini и DXplain при диагностике случаев пациентов и показывает, что DXplain работает несколько лучше, но и LLM также работают хорошо. Исследователи рассматривают объединение DXplain с LLM как оптимальный путь вперед, поскольку это улучшит обе системы и повысит их клиническую эффективность. Результаты опубликованы в JAMA Network Open.
«На фоне всего интереса к большим языковым моделям легко забыть, что первыми системами искусственного интеллекта, успешно использовавшимися в медицине, были экспертные системы, такие как DXplain», — сказал он. сказал соавтор Эдвард Хоффер, доктор медицинских наук, из LCS в MGH.
«Эти системы могут улучшить и расширить диагнозы врачей, напоминая информацию, которую врачи могут забыть в самый разгар, и которая не искажается обычными недостатками человеческого мышления. И теперь мы считаем, что объединение мощных объяснительных возможностей существующих диагностических систем с лингвистическими возможностями больших языковых моделей позволит улучшить автоматизированную поддержку диагностических решений и улучшить результаты лечения пациентов», — сказал он. сказал автор-корреспондент Митчелл Фельдман, доктор медицинских наук, также из LCS MGH.
Исследователи проверили диагностические возможности DXplain, ChatGPT и Gemini, используя 36 случаев пациентов, охватывающих расовые, этнические, возрастные и гендерные категории. Для каждого случая системы имели возможность предложить потенциальный диагноз как с использованием лабораторных данных, так и без них. Судя по лабораторным данным, все три системы в большинстве случаев указывали правильный диагноз: 72% для DXplain, 64% для ChatGPT и 58% для Gemini. Без лабораторных данных DXplain указывал правильный диагноз в 56% случаев, опережая ChatGPT (42%) и Gemini (39%), хотя результаты не были статистически значимыми.
Исследователи заметили, что DDSS и LLM выявили определенные заболевания, которые пропустили другие, что позволяет предположить, что объединение подходов может быть многообещающим. Предварительная работа, основанная на этих выводах, показывает, что LLM можно использовать для извлечения клинических результатов из повествовательного текста, который затем можно будет подключить к DDSS, что, в свою очередь, синергетически улучшит обе системы и их диагностические заключения.
Материалы предоставлены Генералом Массачусетса Бригамом. Примечание. Содержимое можно редактировать по стилю и длине.