Google DeepMind и Google Research представили исследование о развитии медицинского ИИ-агента AMIE, рассчитанного не только на постановку диагноза, но и на сопровождение пациента в ходе лечения. Работа опубликована в Nature и посвящена тому, как разговорные ИИ-системы могут помогать врачу в управлении заболеванием: оценивать динамику состояния, подбирать обследования, учитывать ответ на терапию и работать с лекарственными назначениями.
AMIE расшифровывается как Articulate Medical Intelligence Explorer. Ранее этот проект уже изучали как систему для диагностического диалога, но новая работа делает акцент на более сложной задаче — ведении пациента на протяжении нескольких визитов. Это принципиально отличается от одноразовой консультации, потому что врачу нужно учитывать историю болезни, изменения симптомов, результаты лечения, новые анализы, риски препаратов и актуальные клинические рекомендации.
Авторы исследования создали ИИ-систему на основе большой языковой модели и агентного подхода. Такой агент не просто отвечает на отдельный вопрос, а выстраивает рассуждение вокруг клинической ситуации, обращается к внешним знаниям, сопоставляет данные пациента с рекомендациями и формирует план дальнейших действий. В качестве основы использовались возможности Gemini с длинным контекстом, что позволило системе работать с большим объемом медицинской информации.
Важной частью AMIE стала привязка к авторитетным клиническим источникам. Система использовала извлечение информации из контекста и структурированное рассуждение, чтобы согласовывать ответы с актуальными медицинскими рекомендациями и лекарственными справочниками. Это важно, потому что в медицине недостаточно просто дать правдоподобный ответ: рекомендации должны быть основаны на проверенных источниках, соответствовать клинической практике и учитывать безопасность пациента.
Для проверки возможностей AMIE исследователи провели рандомизированное слепое виртуальное испытание в формате Objective Structured Clinical Examination. OSCE — это объективный структурированный клинический экзамен, который часто используют для оценки навыков врачей в смоделированных клинических ситуациях. В исследовании AMIE сравнивали с 21 врачом первичного звена на 100 сценариях с несколькими визитами пациента.
Сценарии были построены так, чтобы отражать британские клинические рекомендации NICE Guidance и материалы BMJ Best Practice. NICE — это Национальный институт здравоохранения и совершенствования медицинской помощи Великобритании, который выпускает рекомендации для врачей. BMJ Best Practice — клинический справочный ресурс, который помогает принимать решения на основе доказательной медицины.
По оценке специалистов, AMIE оказалась не хуже врачей первичного звена в рассуждениях, связанных с ведением пациента. Более того, система получила более высокие оценки по точности назначений лечения и обследований, а также по соответствию клиническим рекомендациям. Это не означает, что ИИ готов заменить врача, но показывает, что при правильной настройке такие системы могут быть сильны в структурированном медицинском рассуждении.
Отдельно авторы проверили лекарственное мышление системы с помощью бенчмарка RxQA. Этот тест был создан на основе двух национальных лекарственных справочников — американского и британского — и проверен сертифицированными фармацевтами. AMIE и врачи получали возможность пользоваться внешней информацией о лекарствах, но на более сложных вопросах ИИ-система показала лучший результат.
Лекарственные назначения — одна из самых чувствительных частей медицинского ИИ. Ошибка в дозировке, противопоказаниях, взаимодействии препаратов или выборе лекарства может привести к серьезным последствиям. Поэтому способность системы работать с формулярами, проверять информацию и объяснять назначение особенно важна, если разговорный ИИ когда-либо будет применяться в реальной клинической практике.
При этом авторы прямо подчеркивают, что до реального внедрения таких систем нужны дополнительные исследования. Виртуальный экзамен и смоделированные сценарии позволяют сравнить качество рассуждения, но они не заменяют клинические испытания с реальными пациентами. В настоящей медицине есть больше неопределенности, неполных данных, эмоциональных факторов, сложных сопутствующих заболеваний и организационных ограничений.
Главный смысл работы заключается не в том, что ИИ уже можно допустить к самостоятельному лечению людей, а в том, что разговорные медицинские агенты быстро переходят от диагностики к более сложному управлению заболеванием. Если такие системы будут безопасно встроены в практику, они смогут помогать врачам проверять назначения, не упускать рекомендации, готовить планы наблюдения и объяснять пациентам логику лечения.
Исследование Google DeepMind показывает, что медицинский ИИ становится все ближе к роли интеллектуального помощника в клинике. Но чем выше его возможности, тем важнее становятся проверка, ответственность, прозрачность и контроль со стороны врачей. Ведение пациента — это не только правильный ответ в тесте, а долгий процесс принятия решений, где ИИ может быть полезным инструментом, но не должен становиться единственным источником медицинского решения.