Применение нейронных сетей в медицине

Translation will be available soon.
Статья в журнале
Об авторах:


Аннотация:
Данная статья посвящена нейронным сетям, применению нейронных сетей в медицине, а также преимуществам программной диагностики болезней.

Ключевые слова:

нейронные сети, программная диагностика болезней
Цитировать публикацию:
Применение нейронных сетей в медицине – С. 264-271.

Primenenie neyronnyh setey v meditsine. , 264-271. (in Russian)

Приглашаем к сотрудничеству авторов научных статей

Публикация научных статей по экономике в журналах РИНЦ, ВАК (высокий импакт-фактор). Срок публикации - от 1 месяца.

creativeconomy.ru Москва + 7 495 648 6241




Одним из направлений исследований в области искусственного интеллекта, основанным на попытках воспроизвести нервную систему человека, является нейронная сеть. А именно: способность нервной системы обучаться и исправлять ошибки, что должно позволить смоделировать, хотя и достаточно грубо, работу человеческого мозга.

Основу каждой нейронной сети составляют относительно простые, в большинстве случаев – однотипные, элементы, имитирующие работу нейронов мозга. Каждый нейрон характеризуется своим текущим состоянием по аналогии с нервными клетками головного мозга, которые могут быть возбуждены или заторможены. Он обладает группой синапсов – однонаправленных входных связей, соединенных с выходами других нейронов, а также имеет аксон – выходную связь данного нейрона, с которой сигнал поступает на синапсы следующих нейронов. Общий вид нейрона приведен на рис. 1. Каждый синапс характеризуется величиной синаптической связи или ее весом wi, который по физическому смыслу эквивалентен электрической проводимости.

Рис. 1. Общий вид нейрона

Текущее состояние нейрона определяется, как взвешенная сумма его входов:

(1)

Выход нейрона есть функция его состояния:

y = f(s) (2)

Рис. 2. а) функция единичного скач­ка; б) линейный порог (гис­те­ре­зис); в) сигмоид – гипербо­ли­ческий тангенс; г) сигмоид – фор­мула (3)

Нелинейная функция f называется активационной и может иметь различный вид, как показано на рис. 2. Одной из наиболее распространеных является нелинейная функция с насыщением, так называемая логистическая функция или сигмоид (т.е. функция S-образного вида):

(3)

При уменьшении a сигмоид становится более пологим, в пределе при a=0 вырождаясь в горизонтальную линию на уровне 0.5, при увеличении a сигмоид приближается по внешнему виду к функции единичного скачка с порогом T в точке x=0. Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0,1]. Одно из ценных свойств сигмоидной функции – простое выражение для ее производной, применение которого будет рассмотрено в дальнейшем.

(4)

Также для всех нейронных сетей характерен принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения определенным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно.

В качестве примера простейшей нейронной сети рассмотрим трехней­ронный персептрон (рис. 3), то есть такую сеть, нейроны которой имеют активационную функцию в виде единичного скачка.

Рис. 3. Трехнейронный персептрон

На n входов поступают некие сигналы, проходящие по синапсам на 3 нейрона, образующие единственный слой этой НС и выдающие три выходных сигнала:

, j=1...3 (5)

Очевидно, что все весовые коэффициенты синапсов одного слоя нейронов можно свести в матрицу W, в которой каждый элемент wij задает величину i-ой синаптической связи j-ого нейрона. Таким образом, процесс, происходящий в нейронной сети, может быть записан в матричной форме:

Y=F(XW), (6)

где X и Y – соответственно входной и выходной сигнальные векторы, F(V) – активационная функция, применяемая поэлементно к компонентам вектора V.

Теоретически число слоев и число нейронов в каждом слое может быть произвольным, однако фактически оно ограничено ресурсами компьютера или специализированной микросхемы, на которых обычно реализуется нейронная сеть. Чем сложнее нейронная сеть, тем масштабнее задачи, подвластные ей. Выбор структуры нейронной сети осуществляется в соответствии с особенностями и сложностью задачи. Существует множество областей применения нейронных сетей. Это автоматизация процессов распознавания образов, адаптивное управление, аппроксимация функционалов, прогнозирование, создание экспертных систем, организация ассоциативной памяти и многие другие приложения. С помощью нейронных сетей можно, например, предсказывать показатели биржевого рынка, выполнять распознавание оптических или звуковых сигналов, создавать самообучающиеся системы, способные управлять автомашиной при парковке или синтезировать речь по тексту.

Одна из наиболее интересных областей применения нейронных сетей, на мой взгляд, медицина. Приведу ряд примеров.

Диагностика инфаркта миокарда.

Предположим, скорая помощь доставляет больного в приемный покой с острой болью в груди, где дежурный врач должен поставить диагноз и определить, действительно ли это инфаркт миокарда. Опыт показывает, что доля пациентов, перенесших инфаркт среди поступивших с аналогичными симптомами, невелика. Точных методов диагностики, тем не менее, до сих пор нет. Электрокардиограмма иногда не содержит явных признаков недуга. А сколько всего параметров состояния больного могут так или иначе помочь поставить в данном случае правильный диагноз? Более сорока. Может ли врач в приемном покое быстро проанализировать все эти показатели вместе с взаимосвязями, чтобы принять решение о направлении больного в кардиологическое отделение? В какой-то мере эту задачу помогают решать нейросетевые технологии.

По статистике врач правильно диагностирует инфаркт миокарда у 88% больных и ошибочно ставит этот диагноз в 29% случаев. Ложных тревог очень много. История применения различных методов обработки данных для повышения качества диагностики насчитывает десятилетия, однако лучший из них помог сократить число случаев гипердиагностики лишь на 3%.

В 1990 году Вильям Бакст из Калифорнийского университета в Сан-Диего использовал нейронную сеть – многослойный персептрон – для распознавания инфаркта миокарда у пациентов, поступающих в приемный покой с острой болью в груди. Его целью было создание инструмента, способного помочь врачам, которые не в силах справиться с потоком данных, характеризующих состояние поступившего больного. Другой целью может быть совершенствование диагностики. Свою задачу исследователь усложнил, поскольку анализировал данные только тех пациентов, кого уже направили в кардиологическое отделение. Бакст использовал лишь 20 параметров, среди которых были возраст, пол, локализация боли, реакция на нитроглицерин, тошнота и рвота, потение, обмороки, частота дыхания, учащенность сердцебиения, предыдущие инфаркты, диабет, гипертония, вздутие шейной вены, ряд особенностей ЭКГ и наличие значительных ишемических изменений.

Сеть продемонстрировала точность 92% при обнаружении инфаркта миокарда и дала только 4% случаев сигналов ложной тревоги, ошибочно подтверждая направление пациентов без инфаркта в кардиологическое отделение. Итак, налицо факт успешного применения искусственных нейронных сетей в диагностике заболевания.

Кардиодиагностика.

Примером программы диагностики служит пакет кардиодиагностики, разработанный фирмой RES Informatica совместно с Центром кардиологических исследований в Милане. Программа позволяет осуществлять неинвазивную кардиодиагностику на основе распознавания спектров тахограмм. Тахограмма представляет собой гистограмму интервалов между последовательными сердцебиениями, и ее спектр отражает баланс активностей симпатической и парасимпатической нервной системы человека, специфично изменяющейся при различных заболеваниях.

Так или иначе, уже сейчас можно констатировать, что нейронные сети превращаются в инструмент кардиодиагностики – в Англии, например, они используются в четырех госпиталях для предупреждения инфаркта миокарда.

Медицинский прогноз нахождения пациента в реанимации.

Известно, что длинные очереди в кардиохирургические отделения (от недель до месяцев) вызваны нехваткой реанимационных палат. Увеличить их число не удается из-за высокой стоимости реанимационной помощи.

Выход только в более эффективном использовании имеющихся средств. Предположим, что состояние прооперированных в некоторый день больных настолько тяжелое, что им необходимо их длительное пребывание в реанимационной палате (более двух суток). Все это время хирурги будут простаивать, поскольку вновь прооперированных больных некуда класть. Тяжелых больных разумнее оперировать перед выходными или праздниками – операционные все равно закрыты в эти дни, хирурги будут отдыхать, а больные восстанавливаться в реанимации. А вот в начале рабочей недели лучше прооперировать тех пациентов, которым нужно будет находиться в реанимационной палате только один-два дня. Тогда койки в реанимации будут освобождаться быстрее и принимать новых, прооперированных во вторник и среду больных.

Вопрос в том, как угадать, кому придется надолго задержаться в блоке интенсивной терапии после операции, а кому – нет. Джек Ту и Майкл Гуэрир из госпиталя Святого Михаила университета в Торонто использовали нейронные сети для такого предсказания. В качестве исходных данных они взяли только те сведения о пациенте, которые известны в предоперационный период.

Ту и Гуэрир обучили двухслойный персептрон разделять больных на три группы риска, учитывая их возраст, пол, функциональное состояние левого желудочка, степень сложности предстоящей операции и наличие сопутствующих заболеваний. Из тех пациентов, которых сеть отнесла к группе малого риска задержки в реанимации, только 16,3% действительно провели в ней более двух дней. В то же время свыше 60% из тех, кого сеть отнесла в группу повышенного риска, оправдали неблагоприятный прогноз.

Диагностика рака молочной железы.

Обнаружение опухоли осуществляется в ходе первичного рентгенографического анализа молочной железы (маммографии) и последующего анализа кусочка ткани новообразования (биопсии). Несмотря на существование общих правил дифференцирования доброкачественных и злокачественных новообразований, по данным маммографии, только от 10 до 20% результатов последующей хирургической биопсии действительно подтверждают наличие рака молочной железы. Опять мы имеем дело со случаем крайне низкой специфичности метода.

Исследователи из университета Дьюка обучили нейронную сеть распознавать маммограммы злокачественной ткани на основе восьми особенностей, с которыми обычно имеют дело радиологи. Оказалось, что сеть способна решать поставленную задачу с чувствительностью около 100% и специфичностью 59% (сравните с 10-20% у радиологов). Сколько женщин с доброкачественными опухолями можно не подвергать стрессу, связанному с проведением биопсии, если использовать эту нейронную сеть! В клинике Майо (Миннесота) нейросеть анализировала результаты ультразвукового исследования молочной железы и обеспечила специфичность 40%, в то время как для тех же женщин специфичность заключения радиологов оказалась нулевой. Не правда ли, успех использования нейросетевых технологий выглядит совсем не случайным?

После лечения рака молочной железы возможны рецидивы возникновения опухоли. Нейросети уже помогают эффективно их предсказывать. Подобные исследования проводятся на медицинском факультете Техасского университета. Обученные сети показали свои способности выявлять и учитывать очень сложные связи прогностических переменных, в частности, их тройные связи для улучшения предсказательной способности.

Выбор метода лечения рака кожи

В Троицком институте инновационных и термоядерных исследований (ТРИНИТИ) в рамках реализуемого Министерством науки проекта создания нейросетевых консультационных систем была разработана нейросетевая программа, которая выбирает метод лечения базальноклеточного рака кожи (базалиомы) на основе долгосрочного прогноза развития рецидива. Число заболеваний базалиомой - онкологическим недугом белокожих людей с тонкой кожей - составляет треть всех онкологических заболеваний.

Рассмотрим, как строятся и обучаются сети для медицинской диагностики.

Проведем наблюдение за тем, как врач ставит диагноз болезни пациента. Прежде всего он выясняет и записывает имя, возраст, пол, место работы, затем, как правило, измеряет давление, проводит внешний осмотр, выслушивает жалобы больного, знакомится с историей его болезни, результатами анализов, изучает электрокардиограмму. В результате у врача накапливается от 20 до 100 и более параметров, характеризующих пациента и его состояние здоровья. Это и есть исходные параметры, обработав которые с помощью своих медицинских знаний и опыта, врач делает заключение о заболевании пациента – ставит диагноз его болезни.

Задавшись целью построить нейросетевую математическую модель врача-диагноста, прежде всего необходимо определиться с входным вектором X и выходным вектором D, задав их размерности, и условиться о содержимом каждого компонента. В векторе X логично предусмотреть параметры, которые врач выясняет у больного. Например, в качестве компоненты можно задать дату рождения, в качестве – закодировать пол (например, нулем или единицей), в качестве – вес больного, – артериальное давление, – температуру тела и т.д. Нелишне учесть также цвет глаз, цвет волос, знак зодиака и другие данные, определяющие особенности организма и, следовательно, влияющие на вероятность возникновения тех или иных заболеваний. В выходном векторе D следует закодировать все возможные диагнозы болезней, которые способен обнаружить врач.

Естественно, что размерность вектора D можно существенно снизить, если моделировать врача, специализирующегося в узкой области медицины. Так, если мы выбрали врача-кардиолога, то в векторе D следует кодировать только кардиологические заболевания. Например, можно принять, если у больного был инфаркт, и, если нет. Аналогично с помощью можно закодировать наличие или отсутствие порока сердца, – ишемической болезни сердца и т.д.

Таким образом, выходной вектор персептрона D будет состоять из множества нулей и одной или нескольких единиц (если болезней несколько). Однако диагнозы болезней лучше кодировать по пяти-, десяти- или стобальной шкале. Тогда на этапе подготовки обучающего множества примеров с помощью баллов можно будет учитывать степень уверенности врача в правильности его диагноза или степень развитости заболевания, а на этапе эксплуатации – вероятность правильного ответа персептрона. Например, если врач подозревает, что у больного инфаркт миокарда, знает, что у больного нет порока сердца и уверен, что больной страдает ишемической болезнью сердца, то он может указать: d1 = 20%, d2 = 0%, d3 = 100%.

Далее следует подготовить множество обучающих примеров. Качество нейросетевой диагностической системы напрямую зависит от квалификации практикующего врача, на примерах работы которого она обучилась. Дело в том, что нейронная сеть наследует от врача не только его знания, но и пробелы в его медицинском образовании. Понятно, что она будет допускать те же самые врачебные ошибки, которые допускает врач. Поэтому для обеспечения высокого качества диагностики нейронную сеть следует обучать на примерах работы высококвалифицированного врача или даже на результатах работы врачебного консилиума. А если к работе по обучению нейронной сети привлечь еще и патологоанатома, исключающего ошибки врачебной диагностики, то будут все основания надеяться, что обученная таким способом нейронная сеть по качеству выставляемых диагнозов превзойдет обычных врачей. В этом случае нейронная сеть может обнаружить и заложить в модель такие закономерности человеческого организма, которые современной медицине вообще неизвестны.

Итак, в результате совместной работы коллектива специалистов-медиков и программистов будет накоп­лено множество обучающих примеров, состоящее из множества пар векторов. Теперь задача состоит в том, чтобы спроектировать персептрон и путем обучения передать ему знания и опыт, содержащийся во множестве обучающих примеров. В качестве метода обучения персептрона можно использовать, например, алгоритм обратного распространения ошибки.

В результате персептрон должен научиться отображать любой вектор обучающего множества на вектор, совпадающий (либо почти совпадающий) с вектором. Кроме того, при появлении нового пациента, характеризующегося новым входным вектором, персептрон должен вычислить для него новый вектор, содержащий правильный диагноз, поставленный персептроном уже без помощи врача-эксперта. Другими словами, персептрон должен уметь обобщать переданный ему опыт на новые, не встречавшиеся ранее примеры предметной облас­ти – ставить диагнозы болезней новым, не встречавшимся ранее пациентам.

В заключение отметим преимущества программной диагностики болезней.

Во-первых, качество работы экспертной системы всегда стабильно и не зависит от настроения и состояния здоровья. Во-вторых, и это главное, нейронная сеть способна извлекать и применять знания, которые современной медицине неизвестны. Поэтому есть все основания ожидать, что благодаря применению методов искусственного интеллекта в будущем несовершенство современной медицины будет в значительной степени ликвидировано.



Издание научных монографий от 15 т.р.!

Издайте свою монографию в хорошем качестве всего за 15 т.р.!
В базовую стоимость входит корректура текста, ISBN, DOI, УДК, ББК, обязательные экземпляры, загрузка в РИНЦ, 10 авторских экземпляров с доставкой по России.

creativeconomy.ru Москва + 7 495 648 6241



Источники:
1. Бабич Н., Батыков И. Ординальное шкалирование. URL: http://christsocio.info/content/view/983/68/1/1/ (дата обращения 26.05.2012).
2. Методы многокритериальной оптимизации//Многокритериальный выбор на конечном множестве альтернатив: Научная школа в рамках научного направления «Системный анализ и управление» URL: http://mcd.it-pgups.ru/refer04.html (дата обращения 26.05.2012).
3. Осташко В.Я. Основы многокритериального подхода к обоснованию эффективных вложений в недвижимость//Международный оценочный консорциум. Портал по оценочной деятельности. URL: http:// www.ValNet.ru /m7-211.phtml.htm (дата обращения 26.05.2012).