Просвиркина Е.В., Сахарчук А.Ю., Попов Д.М., Руднев С.Д.
Кемеровский
государственный медицинский университет,
г. Кемерово,
Россия
ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ДИАГНОСТИКИ СЕРДЕЧНО-СОСУДИСТЫХ ЗАБОЛЕВАНИЙ
Заболевания
сердечно-сосудистой системы являются одной из основных причин смертности во
всем мире. В их профилактике ключевую роль играет ранняя диагностика, при этом
дефицит опытных врачей и экономически эффективных устройств делают
кардиологическое обследование пациентов затрудненным в сельской местности,
малонаселенных, отдаленных и труднодоступных районах. В качестве системы
поддержки принятия решения предложенная модель, в которой применено машинное
обучение, может служить возможным решением для быстрой удаленной диагностики
сердечно-сосудистых заболеваний.
Цель
работы
– исследование возможности использования нейронных сетей глубокого обучения для
диагностики заболеваний сердечно-сосудистой системы с удаленным подключением к
глобальной сети Интернет.
Материал
и методы исследования. В работе использован метод сравнительного анализа
устройств для проведения электронной аускультации и соответствующего
программного обеспечения. Для получения прогнозирующей модели использовалось
трансферное обучение, предоставляемое веб-сервисом «Teachable Machine». Для
разработки веб-приложения использовался язык программирования JavaScript,
библиотеки машинного обучения TensorFlow.js и распознавания речи «Speech
Command Recognizer».
Результаты. Предложенная
модель проверена на тестовых наборах данных в режиме удаленной диагностики в
глобальной сети Интернет. Выполнена проверка в режиме реального времени при
подключении электронного стетоскопа к аудиовходу персонального компьютера.
Испытание модели на тестовом наборе аудиоданных показало возможность
диагностировать сердечные аномалии с точностью более 90%.
Заключение. Разработанный
программно-аппаратный комплекс является системой поддержки принятия врачебных
решений, и может рассматриваться как дополнительная возможность
квалифицированной медицинской помощи в отдаленных и труднодоступных местностях,
а также для обучения и помощи молодым специалистам.
Ключевые слова: сердечно-сосудистые заболевания; диагностика; электронный стетоскоп; машинное обучение; обученная модель
Prosvirkina E.V., Sakharchuk A.Yu., Popov D.M., Rudnev S.D.
Kemerovo State Medical University, Kemerovo, Russia
THE USE INTEGRATION OF MACHINE LEARNING FOR CARDIOVASCULAR DISEASE DIAGNOSIS
The aim of the research – the possibility of
using deep learning neural networks for diagnosing cardiovascular diseases with
remote access to the global Internet investigated.
Materials and methods. The method of comparative analysis of devices for
conducting electronic auscultation and the corresponding software was used.
Transfer learning provided by the Teachable Machine web service to obtain a
predictive model used. The JavaScript programming language, the TensorFlow.js
machine learning library, and the Speech Command Recognizer to develop the web
application were used.
Results. The proposed
model on test datasets in the remote diagnostics mode on the global Internet
was developed and tested. In real time with connecting the electronic
stethoscope to the audio input of a personal computer was performed. The proposed
model on the datatset of audio showed the possibility of diagnosing cardiac
abnormalities with an accuracy of more than 90% were tested.
Key words: cardiovascular diseases; electronic stethoscope; machine learning; model
Заболевания
сердечно-сосудистой системы являются одной из основных причин смертности во
всем мире. По данным ВОЗ, более 30% смертей происходит в результате
сердечно-сосудистых заболеваний [1]. В их профилактике ключевую роль играет
ранняя диагностика, при этом дефицит опытных врачей и экономически эффективных
устройств делают кардиологическое обследование пациентов затрудненным в
сельской местности, малонаселенных, отдаленных и труднодоступных районах.
Условия для решения этой проблемы создаются развитием цифровых технологий, в
число которых входят широкое покрытие территории страны сотовой связью,
развитие облачных сервисов и технологий искусственного интеллекта.
Несмотря
на то, что существует значительный практический опыт по удаленной диагностике с
применением электронных стетоскопов и других аналогичных приборов [2],
выполненный литературный поиск показал, что до настоящего времени недостаточно изучена
возможность повышения качества диагностики за счет использования искусственного
интеллекта (нейросетей) (модели обладают низкой точностью, неэффективны) [3, 4].
В настоящей работе проведено исследование возможности применения нейронных
сетей глубокого обучения для диагностики сердечно-сосудистых заболевание (ССЗ),
а также возможностей Интернет и облачных сервисов в процессе диагностики. Это
позволит применять в процессе диагностики более дешевые и доступные устройства,
повысить эффективность диагностики специалистов с недостаточным опытом, создать
новые возможности для обучения врачей.
Цель
работы
– исследовать возможность применения машинного обучения для быстрой диагностики
ССЗ.
В
исследовании можно выделить следующие задачи:
1) проведение сравнительного анализа устройств и
программного обеспечения для электронной аускультации с возможностью записи
файлов с аудиоданными; 2) создание наборов
данных для обучения и тестирования модели машинного обучения; 3) исследование полученной модели машинного обучения; 4) разработка тестового веб-приложения для удаленной
диагностики в среде глобальной сети Интернет.
МАТЕРИАЛ И МЕТОДЫ ИССЛЕДОВАНИЯ
Первым
этапом разработки программно-аппаратного комплекса являлась подготовка данных
для машинного обучения.
На
основании классификации Министерства здравоохранения Российской Федерации были
выбраны следующие ССЗ, для диагностики которых может быть применена
аускультация:
1 аортальный стеноз;
2 аортальная недостаточность;
3 митральный стеноз;
4 митральная недостаточность;
5 трикуспидальная недостаточность;
6 трикуспидальный стеноз;
7 фибрилляция предсердий;
8 трепетание предсердий;
9 желудочковая тахикардия;
10 наджелудочковая тахикардия.
Всего
база данных таким образом должна включать 11 групп файлов, соответствующих
пациентам без диагностированных ССЗ и пациентам с установленным диагнозом из
вышеприведенного списка. Распределение файлов с аудиоданными по дополнительным
признакам, таким как пол, возраст, и т.д., не производится, поскольку
характерные признаки, соответствующие определенному заболеванию, не имеют
половозрастных и других особенностей, кроме того, файлы формируются
обезличенно.
Для подготовки набора данных использовались
три различных электронных стетоскопа.
1 цифровой
стетоскоп Littmann Core Digital;
2 цифровой
стетоскоп Lung Pass;
3 электронный
стетоскоп Phonendo.
Сравнительный анализ цифровых стетоскопов
показал, что цифровой стетоскоп Littmann Core Digital представляет собой
стетоскоп Littmann Cardiology IV с предварительно собранной цифровой
насадкой CORE Littmann. Для работы со стетоскопом предварительно был проведен
поиск и установлено на смартфон (под управлением ОС Android) приложение Eko
App, которое обеспечивает хранение и аннотирование 15-, 30-, 60- или
120-секундных записей. Программный комплекс Eko Analysis Software, частью
которого является приложение, имеет проприетарную систему поддержки принятия
врачебных решений, доступ к которой возможен только для пользователей цифрового
стетоскопа Littmann Core digital в США, вне США доступна только базовая
функциональность. В рамках доступной на территории Российской Федерации
функциональности записанная аудиограмма хранится на серверах компании, и
доступна на сайте компании Eko Health при регистрации. В своем личном кабинете
пользователь может загрузить записанные файлы в формате mp3.
Цифровой стетоскоп Lung Pass обеспечивает
снятие аудиограммы и позволяет выявлять признаки пневмонии и хронической
обструктивной болезни легких. Для работы со стетоскопом на смартфон было
установлено приложение Lung Pass. Данное приложение создает аудиограмму, снятую
в 11 точках аускультации, и позволяет переслать ее любому потенциальному
получателю.
Электронный стетоскоп Phonendo предназначен
для аускультации и усиления исключительно слабых звуков тела, исходящих из
сердца и легких, что обеспечивает аускультацию без нарушения целостности
средств индивидуальной защиты. Для работы необходимо сопряжение с
устройством-партнером по протоколу беспроводной связи Bluetooth после установки
приложения Phonendo.
С учетом результатов проведенного анализа,
было принято решение о добавлении в функционал приложения, входящего в
разрабатываемый программный комплекс, возможности подсказок по правильному
расположению стетоскопа для проводящего самообследование пациента [5].
Таким образом, в рамках проводимого
исследования принята следующая методика снятия и записи аудиофайлов:
обследование должно проводиться специалистом, имеющим медицинское образование,
и необходимую квалификацию для проведения диагностических процедур, в пяти
вышеуказанных точках аускультации в заданной последовательности; полученные
файлы должны при необходимости редактироваться в звуковом редакторе для
удаления посторонних шумов и нормализации громкости записанного сигнала, и
затем храниться в базе данных – наборе данных для машинного обучения.
Модель
машинного обучения.
Разработка моделей глубокого обучения является ресурсоемким процессом,
требующим значительных наборов данных и вычислительных мощностей. Поэтому для
получения модели машинного обучения использовался веб-инструмент «Teachable
Machine by Google Creative Lab» (ТМ). Сервис ТМ использует предварительно
обученные модели. Такой подход обеспечивает универсальность и эффективность.
Используя эти уже существующие модели, разработчики могут получить доступ к
результату накопленных знаний, извлеченных из огромных наборов данных и
бесчисленных итераций обучения. Данный подход известен как трансферное
обучение, позволяет быстро адаптировать эти модели к конкретным вариантам
использования, значительно сократить время разработки и требования к ресурсам.
Сервис ТМ использует библиотеку машинного обучения TensorFlow.js, позволяющую
разрабатывать сложные нейронные сети для специализированных задач «с нуля».
Для
звуковых моделей в ТМ используется нейронная сеть «Speech Command Recognizer» (SCR) – распознаватель речевых команд. Это модуль
JavaScript, который позволяет распознавать голосовые команды, состоящие из
простых отдельных английских слов из небольшого словарного запаса. Словарный
запас по умолчанию включает в себя следующие слова: десять цифр от «нуля» до
«девяти», «вверх», «вниз», «влево», «вправо», «иди», «стоп», «да», «нет», а
также дополнительные категории «неизвестное слово» и «фоновый шум».
Распознаватель речевых команд использует для цифровой обработки звука API
WebAudio – интерфейс программирования веб-браузера. Обучение модели и вывод
осуществляется полностью в веб-браузере за счет использования TensorFlow.js.
РЕЗУЛЬТАТЫ
Поскольку
для обучения модели в ТМ требуются более 10 файлов аудиоданных,
исследование модели выполнено по четырем классам заболеваний.
На
сайте ТМ была создана модель для распознавания аудиоданных. В качестве фонового
шума были загружены 20 файлов аудиоданных пациентов без диагностированных
ССЗ. Затем созданы 4 класса аудиоданных, куда были загружены 28 файлов
аудиоданных пациентов с установленным диагнозом аортальный стеноз, 52 – с
аортальной недостаточностью, 55 – с митральным стенозом и 31 – с митральной
недостаточностью. Формат файлов аудиограмм: mp3 (частота дискретизации 44100 Гц,
стерео, битрейт 256 Кбит/c). Количество файлов для обучения модели – 186.
На следующем этапе было проведено обучение
модели и проведена проверка с помощью файлов, не входящих в обучающий набор.
Для оценки качества модели машинного обучения использовалась метрика качества accuracy – доля правильных ответов [4]:
,
где:
TP (true positive) – число истинноположительных,
верно отнесенных к классу i примеров;
TN (true negative) – число истинноотрицательных,
верно не отнесенных к классу i примеров, отнесенных к некоторому другому
классу j ≠ i;
FP (false positive) – число ложноположительных,
ошибочно отнесенных к классу i примеров;
FN (false negative) – число ложноотрицательных
примеров, ошибочно отнесенных к некоторому другому классу j ≠ i, в то время как истинный класс примеров – i.
При проверке на тестовом наборе accuracy принимала значение в диапазоне
0,95…0,99. Таким образом, проверка результатов обработки на файлах, не входящих
в базу данных, показала, что модель успешно распознает типичные ССЗ.
Таким
образом, проверка результатов обработки на аудиоданных, не входящих в базу
данных, показала, что модель успешно распознает типичные ССЗ.
Программно-аппаратный комплекс
Для
разработки программной части комплекса обученная модель была выгружена с сайта
ТМ в виде файлов metadata.json, model.json, weights.bin:
- metadata.json – метаданные, JSON-файл,
указывающий версии используемых библиотек, метаданные о пользователе и имени
модели, а также список имен меток и размер изображений (спектрограмм),
используемых для обучения модели;
- model.json – модель, JSON-файл,
определяющий топологию модели;
- weights.bin – весовые коэффициенты,
BIN-файл, определяющий веса обученной модели.
Исходными
данными для прогноза модели является матрица, в которой каждый столбец является
спектром короткого участка исходного аудиосигнала. Матрица является результатом
последовательного применения преобразования Фурье к коротким участкам
аудиосигнала. В библиотеке TensorFlow.js для получения матрицы используется
кратковременное преобразование Фурье (short-time Fourier transform, STFT) [6].
В программном коде приложения необходимо выполнить последовательное
преобразование Фурье и передать результаты объекту SCR.
SCR может работать в двух режимах распознавания:
1) Распознавание потокового вещания в режиме
онлайн, во время которого библиотека автоматически открывает канал аудиовхода с
помощью API-интерфейсов веб-браузера (запрашивая разрешение у пользователя) и
выполняет распознавание аудиовхода в режиме реального времени;
2) Распознавание оффлайн, при котором
необходимо подготовить и передать SCR предварительно
созданный массив данных из файла аудиоданных.
Программно-аппаратный комплекс создавался с поддержкой этих двух режимов. Проверка первого и второго режимов распознавания на тестовом наборе аудиоданных показала результаты, аналогичные полученным на сайте ТМ. Разработка веб-приложения осуществлялась в конструкторе сайтов «Tilda Publishing». Основной программный код был размещен в блоке Т-123 (HTML-код). Для получения данных спектрограммы из файлов аудиоданных использовался инструментарий API WebAudio веб-браузера. Модель после распознавания возвращает результаты последовательного преобразования Фурье, которые используются для вывода в браузер спектрограммы. Для отображения спектрограммы в режиме реального времени использовался модуль JavaScript графического представления спектрограмм доктора А.Р. Коллинза. На рисунке 1 показана спектрограмма, полученная по данным обработки файла «Аортальная недостаточность.mp3».
Рисунок. Спектрограмма
аудиосигнала файла «Аортальная недостаточность.mp3»
Figure. Spectrogram of the audiosignal “Aortic insufficiency.mp3”
ЗАКЛЮЧЕНИЕ
Проведенное
исследование показало эффективность использования нейросети и целесообразность
разработки программно-аппаратного комплекса с использованием библиотеки SCR. Библиотека может быть использована в режиме «online»
в веб-браузере для работы с аудиовходом или в режиме «offline» для работы с
файлами. Таким образом, предоставляется программный интерфейс Tensorflow.js и
все возможности экосистемы JavaScript. Библиотека Tensorflow.js имеет несколько
преимуществ, таких как размер модели машинного обучения, скорость, но наиболее
важное преимущество для программно-аппаратного комплекса – это
конфиденциальность. Tensorflow.js предоставляет возможность обучать и
классифицировать данные на клиентской машине, не отправляя данные на сторонний
сервер.
Оценка
модели на тестовом наборе аудиоданных показала возможность диагностировать
сердечные аномалии с точностью более 90%.
Разработанный
программно-аппаратный комплекс предоставляет возможность для помощи врачу в
установлении диагноза, обеспечение возможности квалифицированной медицинской
помощи в отдаленных и труднодоступных местностях, обучение и помощь молодым
специалистам.
Информация о финансировании и конфликте интересов
Исследование не имело спонсорской поддержки.
Авторы декларируют отсутствие явных и потенциальных
конфликтов интересов, связанных с публикацией настоящей статьи.
ЛИТЕРАТУРА / REFERENCES:
1. Sadr H,
Salari A, Ashoobi MT, Nazari M. Cardiovascular disease diagnosis: a holistic
approach using the integration of machine learning and deep learning models. Eur J Med Res. 2024; 29(1): 455. doi: 10.1186/s40001-024-02044-7
2. Garanin
AA, Aydumova OY, Rubanenko AO, Bibikova EG. Digital stethoscope: a new era of
auscultation. Digital Diagnostics.
2024; 5(4): 808-818. Russian (Гаранин А.А., Айдумова О.Ю., Рубаненко А.О., Бибикова Е.Г. Цифровой стетоскоп – новая эра аускультации //Digital Diagnostics. 2024. Т. 5, № 4. C. 808-818.) doi: 10.17816/DD632499
3. Huang J,
Cai Y, Wu X, Huang X, Liu J, Hu D. Prediction of mortality events of patients
with acute heart failure in intensive care unit based on deep neural network. Comput Methods Programs Biomed. 2024; 256:
108403. doi: 10.1016/j.cmpb.2024.108403
4. Mohamed
N, Lafi Almutairi R, Abdelrahim S, Alharbi R, Alhomayani FM, Alsulami A,
Alkhalaf S. Deep convolutional fuzzy neural networks with stork optimization on
chronic cardiovascular disease monitoring for pervasive healthcare services. Sci Rep. 2025; 15(1): 19008. doi:
10.1038/s41598-025-02924-w
5. Prosvirkina
EV, Sakharchuk AYu. The the use of artificial intelligence in the processing of
audiograms were researched. Strategic
Directions for the Development of Science, Medicine, Digital and Educational
Technologies: Collection of Scientific Articles. Kemerovo, 2024. P. 197-200. Russian (Просвиркина
Е.В., Сахарчук А.Ю. Исследование работы искусственного интеллекта при обработке
аудиограмм //Стратегические векторы развития науки, медицины, цифровых и образовательных
технологий: Сборник научных статей. Кемерово, 2024. С. 197-200)
6. Sakhibgareeva
MV, Zaozersky AYu. Developing an artificial intelligence-based system for
medical prediction. Bulletin of Russian State Medical University. 2017; 6: 42-46. Russian (Сахибгареева М.В., Заозерский А.Ю.
Разработка системы прогнозирования диагнозов заболеваний на основе
искусственного интеллекта //Вестник РГМУ. 2017. № 6. C.
42-46)
Корреспонденцию адресовать:
ПРОСВИРКИНА Елена Владимировна
650029, г. Кемерово, ул. Ворошилова, д. 22а, ФГБОУ ВО КемГМУ Минздрава России
E-mail: prosvirkina.ev@kemsma.ru
Сведения об авторах:
ПРОСВИРКИНА Елена Владимировна
канд. хим. наук, доцент,
зав. кафедрой медицинской, биологической физики и высшей математики, ФГБОУ ВО
КемГМУ Минздрава России, г. Кемерово, Россия
E-mail: prosvirkina.ev@kemsma.ru
САХАРЧУК Алексей Юрьевич
клинический ординатор, ФГБОУ
ВО КемГМУ Минздрава России, г. Кемерово, Россия
E-mail: alex90s03kemerovo@mail.ru
ПОПОВ Дмитрий Михайлович
канд. техн. наук, доцент
кафедры медицинской, биологической физики и высшей математики, ФГБОУ ВО КемГМУ
Минздрава России, г. Кемерово, Россия
E-mail: scxf1999@gmail.com
РУДНЕВ Сергей Дмитриевич
доктор техн. наук, профессор,
профессор кафедры медицинской, биологической физики и высшей математики, ФГБОУ
ВО КемГМУ Минздрава России, г. Кемерово, Россия
E-mail: sdrudnev@yandex.ru
Information about authors:
PROSVIRKINA Elena Vladimirovna
candidate of chemical
sciences, docent, head of the department of medical and biological physics and
higher mathematics, Kemerovo State Medical University, Kemerovo, Russia
E-mail: prosvirkina.ev@kemsma.ru
SAKHARCHUK Aleksey
Yuryevich
clinical resident, Kemerovo State Medical University, Kemerovo,
Russia
E-mail: alex90s03kemerovo@mail.ru
POPOV Dmitry
Mikhailovich
candidate of technical sciences department of medical and
biological physics and higher mathematics, docent, Kemerovo State Medical
University, Kemerovo, Russia
E-mail: scxf1999@gmail.com
RUDNEV Sergey
Dmitrievich
doctor of technical sciences, professor, professor of the
department of medical and biological physics and higher mathematics, Kemerovo
State Medical University, Kemerovo, Russia
E-mail: sdrudnev@yandex.ru
Ссылки
- На текущий момент ссылки отсутствуют.


