АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ В ОЦЕНКЕ ГЕНЕТИЧЕСКОЙ ПРЕДРАСПОЛОЖЕННОСТИ К РАКУ ЛEГКИХ У РАБОТНИКОВ УГОЛЬНЫХ ШАХТ


Колесникова Т.Г., Черноусов М.Е., Минина В.И., Вылегжанина А.В., Минин А.В., Баканова М.Л.

Аннотация


Цель исследования – в работе представлены результаты исследования, направленного на определение генетической предрасположенности к раку легких у работников угольных предприятий Кемеровской области.
Материалы и методы. Были использованы данные, собранные во время медицинских профосмотров. Данные обрабатывались с использованием алгоритмов машинного обучения.
Результаты. Рассмотрены различные методы моделирования, включая деревья решений, случайный лес, логистическую регрессию и другие. Особое внимание уделено оценке точности предсказания риска развития рака легких и определению значимых признаков, таких как курение и определенные генетические варианты.
Заключение. Полученные результаты свидетельствуют о высокой эффективности алгоритмов случайного леса и логистической регрессии, а также о возможности применения методов машинного обучения для анализа сложных биомедицинских данных.


Ключевые слова


рак легких; генетическая предрасположенность; векторизация текста; алгоритмы машинного обучения; дерево решений; случайный лес; логистическая регрессия; метод опорных векторов; метод k ближайших соседей

Полный текст:

Full Text PDF Full Text HTML

Литература


World Health Organization (WHO): Lung cancer URL: https://www.who.int/ru/news-room/fact-sheets/detail/lung-cancer (дата обращения: 26.01.2025)

Zabolevaemost onkologiei i smertnost ot nee s 1997 goda» //MNIOI im. P.A. Gertsena; obrabotka: «Esli byt tochnym», 2024. Russian (Заболеваемость онкологией и смертность от нее с 1997 года» //МНИОИ им. П.А. Герцена; обработка: «Если быть точным», 2024.) URL: https://tochno.st/datasets/cancer_incidence (дата обращения: 16.02.2025)

Geneticheskii pasport – osnova individualnoi i prediktivnoi meditsiny /Pod red. V.S. Baranova. SPb: OOO «Izdatelstvo N-L», 2009. 528 s. Russian (Генетический паспорт – основа индивидуальной и предиктивной медицины /Под ред. В.С. Баранова. СПб: ООО «Издательство Н-Л», 2009. 528 с.)

Akinin AA. Primenenie bol'shih yazykovyh modelej dlya diagnostiki. Scientific and Technical Volga region Bulletin. 2024; 11: 138-140. Russian (Акинин А.А. Применение больших языковых моделей для диагностики //Научно-технический вестник Поволжья. 2024. № 11. С. 138-140)

Yang R, Tan TF, Lu W, Thirunavukarasu AJ, Ting DSW, Liu N. Large language models in health care: Development, applications, and challenges. Health Care Sci. 2023; 2(4): 255-263. doi: 10.1002/hcs2.61

Primenenie bolshikh iazykovykh modelei v meditsine [Elektronnyi resurs] Webiomed. Russian (Применение больших языковых моделей в медицине [Электронный ресурс] Webiomed.) URL: https://webiomed.ru/blog/primenenie-bolshikh-iazykovykh-modelei-v-meditsine (дата обращения: 25.01.2025)

Vasyaeva DO, Belyakova AS. Review of clustering algorithms for the purpose of processing medical data. Algorithms, methods and systems for data processing. 2017; 2(36): 17-22. Russian (Васяева Д.О., Белякова А.С. Обзор алгоритмов кластеризации с целью обработки медицинских данных //Алгоритмы, методы и системы обработки данных. 2017. Т. 2, № 36. С. 17-22)

Kasyuk ST, Didenko GA, Stepanova OA. Cluster analysis of medical research data using the R language. Modern science: current problems of theory and practice. Series: Natural and Technical Sciences. 2021; 04/2: 23-32. Russian (Касюк С.Т., Диденко Г.А., Степанова О.А. Кластерный анализ данных медицинских исследований с использованием языка R //Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. 2021. Т. 04/2. С. 23-32.) doi: 10.37882/2223-2966.2021.04-2.11

Bogatyr IN. Clustering algorithms in the analysis of medical data. Scientific and technical bulletin of the Volga region. 2023; 12: 586-588. Russian (Богатырь И.Н. Алгоритмы кластеризации в анализе медицинских данных //Научно-технический вестник Поволжья. 2023. № 12. С. 586-588)

Zimina EYu. Application of clustering methods in the development of a system for automated analysis of cardiac information. New information technologies and systems (NITIS-2021): Collection of scientific articles based on the materials of the XVIII International Scientific and Technical Conference, Penza, November 24-26, 2021. Penza, 2021. P. 63-66. Russian (Зимина Е.Ю. Применение методов кластеризации при разработке системы автоматизированного анализа кардиологической информации //Новые информационные технологии и системы (НИТиС-2021): Сб. науч. статей по матер. XVIII Междунар. науч.-техн. конф., Пенза, 24-26 ноября 2021 года. Пенза, 2021. С. 63-66)

Serobabov AS, Denisova LA, Serobabova AL. Development of a system to support medical decision-making when prescribing treatment to a patient. News of Tula State University. Technical Sciences. 2023; 9: 321-325. Russian (Серобабов А.С., Денисова Л.А., Серобабова А.Л. Разработка системы поддержки принятия врачебных решений при назначении лечения пациенту //Известия Тульского государственного университета. Технические науки. 2023. № 9. С. 321-325.) doi: 10.24412/2071-6168-2023-9-321-322

Al-Funjan A, Meziane F, Aspin R. Describing Pulmonary Nodules Using 3D Clustering. Advanced Engineering Research (Rostov-on-Don). 2022; 22(3): 261-271. Russian (Аль-Фунжан А, Мезиан Ф, Аспин Р. Описание легочных узелков с помощью трехмерной кластеризации //Передовые инженерные исследования (Ростов-на-Дону). 2022. Т. 22, № 3. С. 261-271.) doi: 10.23947/2687-1653-2022-22-3-261-271

Kotov SA, Starkov SO. Determination of the results of computed tomography studies of the chest organs with signs of COVID-19 using computer vision methods. The future of nuclear energy – AtomFuture 2021: Abstracts of the XVII International Scientific and Practical Conference, Obninsk, November 22-23, 2021. Obninsk, 2021. P. 180-182. Russian (Котов С.А., Старков С.О. Определение результатов исследований компьютерной томографии органов грудной клетки с признаками COVID-19 с помощью методов компьютерного зрения //Будущее атомной энергетики – AtomFuture 2021: Тезисы докладов XVII Междунар. науч.-практ. конф., Обнинск, 22-23 ноября 2021 года. Обнинск, 2021. С. 180-182)

Limanova NI, Morozov DA. Review of computer vision models for determining the presence of COVID-19 disease. Eurasian Scientific Association. 2021; 4-1(74): 57-59. Russian (Лиманова Н.И., Морозов Д.А. Обзор моделей компьютерного зрения для определения наличия заболевания COVID-19 //Евразийское Научное Объединение. 2021. Т. 4-1, № 74. С. 57-59)

Vinokurov MA, Mironov KO, Domonova EA, Romanyuk TN, Popova AA, Akimkin VG. Comparison of machine learning methods for predicting cervical cancer risk based on genetic susceptibility. Epidemiology and infectious diseases. Current issues. 2024; 14(1): 77-82. Russian (Винокуров М.А., Миронов К.О., Домонова Э.А., Романюк Т.Н., Попова А.А., Акимкин В.Г. Сравнение методов машинного обучения для прогнозирования риска развития рака шейки матки на основе генетической предрасположенности //Эпидемиология и инфекционные болезни. Актуальные вопросы. 2024. Т. 14, № 1. С. 77-82.) doi: 10.18565/epidem.2024.14.1.77-82

Minin AV, Katanakhova MV. Analysis of whole-exome sequencing data in Kuzbass patients with lung cancer: search for rare pathogenic variants. Interdisciplinary approaches in biology, medicine and earth sciences: theoretical and applied aspects: Proceedings of the symposium of the XIX (LI) International scientific conference of students, graduate students and young scientists, Kemerovo, April 23, 2024. Kemerovo, 2024. P. 116-119. Russian (Минин А.В., Катанахова М.В. Анализ данных полноэкзомного секвенирования у жителей Кузбасса больных раком легкого: поиск редких патогенных вариантов //Междисциплинарные подходы в биологии, медицине и науках о земле: теоретические и прикладные аспекты: Матер. симп. XIX (LI) Междунар. науч. конф. студентов, аспирантов и молодых ученых, Кемерово, 23 апреля 2024 года. Кемерово, 2024. С. 116-119)

Minin AV, Rekunov DS. Lung cancer in miners: genetic factors. Development – 2021: Scientific electronic publication. Kemerovo: FRC CCC SB RAS, 2021. P. 219-227. Russian (Минин А.В., Рекунов Д.С. Рак легкого у шахтеров: генетические факторы //Развитие – 2021: Научное электронное издание. Кемерово: ФИЦ УУХ СО РАН, 2021. С. 219-227.) doi: 10.53650/9785902305620_219

Timofeeva AA, Minin AV, Bakanova ML, Zakharova YaA, Torgunakova AV, Prosekov AYu, et al. Polymorphism of genes encoding DNA repair enzymes in coal mine workers with lung cancer. Journal of the Siberian Federal University. Series: Biology. 2024; 17(1): 33-44. Russian (Тимофеева А.А., Минин А.В., Баканова М Л., Захарова Я.А., Торгунакова А.В., Просеков А.Ю., и др.. Полиморфизм генов ферментов репарации ДНК у работников угольных шахт больных раком легкого //Журнал Сибирского федерального университета. Серия: Биология. 2024. Т. 17, № 1. С. 33-44)

Kulincha PV. Ispol'zovanie sluchajnogo lesa dlya klassifikacii dannyh. Molodoj uchenyj. 2024; 24(523): 88-91. Russian (Кулинча П.В. Использование случайного леса для классификации данных //Молодой ученый. 2024. № 24(523). С. 88-91)


Ссылки

  • На текущий момент ссылки отсутствуют.