«ИИ – не доктор Хаус»

Искусственный интеллект перестает быть чем-то сверхъестественным и всё активнее используется человеком для решения практических задач. Вместе с тем его внедрение ограничено из-за большого числа вопросов, связанных с безопасностью. В интервью университетской газете Alma mater сотрудник лаборатории лазерного молекулярного имиджинга и машинного обучения Томского госуниверситета Денис Вражнов рассказал, как исследователи учат искусственный интеллект диагностировать заболевания и почему приходится контролировать фантазии ИИ.

DSC_2056.jpg
Ученый лаборатории лазерного молекулярного имиджинга и машинного обучения ТГУ Денис Вражнов

ИИ «РОДИЛСЯ» С БОЛЬШИМИ ДАННЫМИ

– Денис, давайте начнем с определения, что такое искусственный интеллект? 

– Самое забавное, что, несмотря на достаточно высокую популярность этого направления, до сих пор четкого определения нет. Существует множество трактовок, например, примерно с пятидесятых годов прошлого века возникло определение искусственного интеллекта как способности машины думать, обучаться и принимать решения. 

Если брать биомедицину, то у нас искусственный интеллект – это описание данных, но не в виде математических формул, а в виде набора чисел, соответствующего изучаемому образцу, и правила сопоставления таких наборов. То есть мы разрабатываем прикладные, а не теоретические решения. 

– Расскажите, пожалуйста, каковы мировые тренды использования ИИ в медицине и как вы используете этот инструмент в своих разработках? 

– Чтобы оценить тренды, придется вспомнить, что послужило толчком к развитию ИИ после 2010 года. Это было наличие большого количества размеченных экспертами данных (вы же помните вездесущие «каптчи», определяющие, человек вы или робот? Так вот – это один из способов разметки данных для верификации того, что есть на картинке) и доступные вычислительные мощности. Как только появились данные в большом количестве, начали появляться большие модели ИИ, позволявшие распознавать картинки, речь человека и рукописный текст. На сегодняшний день есть размеченные данные, есть способы адаптировать существующие модели к новым данным, есть довольно мощные доступные вычислители. 

Есть возможность даже дома тренировать небольшие модели. Но что касается медицинских данных, здесь, конечно, большая проблема, в том числе для России, потому что медицинские данные попадают под множество ограничений и так просто воспользоваться ими нельзя. Есть попытки обезличить данные, работать только с изображениями, без привязки к людям, но это все делается разрозненно. К сожалению, в стране нет единой большой системы, которая позволила бы анализировать медицинские данные. 

Существует несколько различных медицинских информационных систем, которые как раз агрегируют данные, и эти системы зачастую несовместимы между собой. Большой шаг в этом направлении сделан в Москве, где удалось свести множество поликлиник в одну систему, и там количество обрабатываемой информации существенно отличается от того, что доступно нам. Вот поэтому те же СКОЛКОВО или Сеченовский институт находятся в заранее выгодном положении, поскольку имеют доступ к этим данным. 

34534635.jpg
Денис Вражнов с коллегами

Создание такой, пусть и локальной, но большой базы – это первый шаг, который позволяет создать хорошую модель. Плюс в том, что она может учитывать специфические особенности пациента. Например, как показала мировая практика, модель может адекватно работать на одной расе, к примеру, европеоидной, и не работать на негроидной или монголоидной.

Наша страна особенная в этом плане. Люди, живущие в разных регионах России, имеют характерные особенности в плане патологий. К примеру, для жителей Томской области одним из наиболее частых заболеваний является описторхоз. Исторически так сложилось. Рыба всегда была на столе у сибиряков, а в Обь-Иртышском бассейне зараженность метацеркарием некоторых видов рыбы достигает почти 100 процентов, отсюда и высокая заболеваемость среди населения. А на Дальнем Востоке совсем другие виды паразитов представляют основную угрозу. 

Другой пример – это малые коренные народы Севера. Известно, что у них организм более восприимчив к алкоголю. Помимо этого, у таких народов есть специфические заболевания, обусловленные генетикой. В идеале модель должна учитывать все эти тонкости. Когда в одном месте происходит накопление характерных для этой области медицинских данных, это тоже служит толчком для появления хорошей модели ИИ. 

– Но как построить модель, чтобы она была максимально объективной? Ведь в данном случае речь идет о диагностике, от которой зависит жизнь человека. 

– Прежде всего нужно сказать, что любой результат, выданный ИИ, в обязательном порядке будет проверен врачом. То есть искусственный интеллект не ставит диагноз сам, он лишь является вспомогательным инструментом для клиницистов. Что касается точности модели – это как раз то, над чем работает весь мир. Есть огромное количество нюансов, которые мы не видим, но которые на самом деле присутствуют, и в этом проблема первоначальных попыток построить искусственный интеллект. 

Когда ученые пытались на основе имеющихся знаний построить описание, как связаны те или иные данные о человеке и его состояние во время болезни, оказалось, что такие модели предсказывают что угодно, но не то, что мы хотим. Несмотря на то, что медицина развивается уже несколько тысяч лет, очень многие процессы, происходящие в человеческом организме, не нашли своего объяснения. Поэтому построенные модели ИИ поначалу были крайне неточными. Тогда был выбран другой путь. 

Если невозможно знать все, то нужно набрать большое количество людей с одной патологией и сравнивать их с новыми пациентами. В таком случае очень велик шанс, что мы встретим человека, у которого будут очень похожие проявления этой болезни. Тогда мы сможем ее диагностировать. Этот подход показал свою эффективность. Поэтому он сейчас и лежит в основе машинного обучения в биомедицине. Чем больше данных мы предоставляем модели во время обучения, тем больше ее «диагностический опыт» и вероятность того, что она выявит патологию, которая есть на самом деле, а не ту, которую она нафантазировала. 

– Такое тоже может быть? 

– Может, и в случае с ИИ, тем же ChatGPT, это не такая уж редкость. Есть даже такой термин – галлюцинирующий ИИ. К примеру, мой коллега использовал ChatGPT: ради любопытства он проверял его возможности и по какой-то теме в области физики попросил ссылки на литературу. ИИ сгенерировал текст, в котором были ссылки, как положено, с DOI и с названиями журналов. Но при проверке выяснилось, что в реальности таких работ не было.

– Получается, ИИ дезинформирует? 

– Он не может делать это специально. Все зависит от того, как вы его используете. Он как молоток, который не забивает гвозди сам по себе. 

DSC_6965.jpg
Коллектив лаборатории лазерного молекулярного имиджинга ТГУ

ИИ «СИЛЕН» В СЛОЖНЫХ СЛУЧАЯХ

– Денис, вновь возникает вопрос о безопасности использования этого инструмента. Причем, в контексте медицинского применения он особенно актуален. 

– Безусловно. Чтобы внедрять решения, которые выдал ИИ, нужно сначала понять, как он к тому или иному выводу пришел. Это называется объясненный ИИ – одно из тех направлений, которым занимаемся мы и другие разработчики искусственного интеллекта. То есть мы должны выяснить, почему ИИ определил, что именно вот эти показатели важны, и ориентировался именно на них. 

– Но ведь такая проверка требует большого количества времени? 

– Все верно, но других вариантов нет, поэтому нам приходится тратить огромное количество времени, чтобы эти модели верифицировать. Это одна из главных причин, почему нет массового внедрения искусственного интеллекта в медицине. Есть прототипы, размещенные на разных сайтах, которые по описанию симптомов якобы могут поставить диагноз. Эти модели привлекают внимание обывателя, но мы пробовали их потестировать – это не более чем игрушка. Ответ, который вы получите: сделайте рентген или МРТ, сдайте анализы и обратитесь к врачу. Но этот сценарий вам доступен и без ИИ. То есть сделать какие-то гениальные выводы, как делал доктор Хаус в фильмах, искусственный интеллект не может. 

– В таком случае, что он может и в чем его польза? Почему разработчики бьются над созданием моделей ИИ, если они не способны реально помочь в диагностике заболеваний? 

– Они способны, но не совсем так, как многие себе это представляют. Вот представьте, врач сидит на приеме, он, как минимум, знает 50 процентов своих пациентов на участке, а чаще и больше, – тех, которые, что называется, постоянные клиенты. В большинстве своем они приходят с вполне распространенными заболеваниями: гипертония, грипп и другие сезонные инфекции, патологии ЖКТ и так далее. Но это то, с чем врач, скорее всего, уже имел дело в своей практике. Если же к нему приходит пациент с какой-то особенной болячкой, то врачу не хватит 15 минут, отведенных на прием. Ему нужно найти научные статьи с описанием похожих симптомов, обсудить клиническую картину с коллегами, чтобы понять, как дообследовать человека. 

По этой причине сложные случаи служат основанием для проведения консилиумов. В случае с такими непростыми пациентами ИИ может оказать врачу неоценимую помощь. Он, конечно, не доктор Хаус с огромным опытом и нестандартным мышлением, но может, например, найти в мировой научной литературе соответствующие статьи и быстро проанализировать их. То, на что у человека уйдут недели и месяцы, у искусственного интеллекта займет часы. Это реальная помощь и ответ на вопрос – зачем и как использовать ИИ. Как вспомогательная система он просто незаменим.

Для справки: Лаборатория лазерного молекулярного имиджинга и машинного обучения создана при поддержке мегагранта правительства РФ. Задача лаборатории – разработка новых неинвазивных методов диагностики социально значимых заболеваний. В качестве инструмента для исследования биологических тканей, жидкостей и выдыхаемого воздуха ученые ТГУ используют оптические технологии, что позволяет сократить время обследования с нескольких дней до нескольких часов или минут. Коллектив под руководством академика РАН Юрия Михайлова занимается работами в рамках проекта при финансовой поддержке министерства науки и высшего образования РФ.