Preview

Вестник Российской академии медицинских наук

Расширенный поиск

ПРИМЕНЕНИЕ СИНТЕТИЧЕСКИХ ОБРАЗОВ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ НА ПРИМЕРЕ ДИАГНОСТИКИ РАКА ЛЕГКОГО

https://doi.org/10.15690/vramn946

Полный текст:

Аннотация

Обоснование. С математической точки зрения задачи медицинской диагностики представляют собой задачи классификации данных. При этом важно понимать, насколько существенные искажения могут внести в результат классификации погрешности сбора первичной диагностической информации, в частности результатов биохимических тестов.

Цель исследования ― установление зависимости результата классификации от вариативности первичной диагностической информации на примере модельного классификатора.

Методы. В исследовании случай-контроль приняли участие пациенты, которые были разделены на 2 группы ― основную (с диагнозом рака легкого, n=200) и контрольную (условно здоровые, n=500). Всем участникам было проведено биохимическое исследование слюны, а также последующая гистологическая верификация диагноза. Биохимический состав слюны определен спектрофотометрически. На основе полученных данных построен модельный классификатор для диагностики рака легкого (случайный лес). В каждый параметр, лежащий в основе классификатора, вносили отклонения в заданном диапазоне (±1–5%, ±5–10%, ±10–15%), создавая синтетические образы. Затем методом кросс-валидации проведена оценка результатов классификации.

Результаты. Определены базовые диагностические характеристики модельного классификатора (чувствительность ― 72,5%; специфичность ― 86,0%). При увеличении отклонений синтетических образов от базового значения диагностические характеристики при общей классификации ухудшаются. Однако результат уверенной классификации, напротив, дает более высокие значения (чувствительность ― 81,8%, специфичность ― 93,1%). В случае уверенной классификации близкие образы, которые по результатам классификации попадают в разные классы, удаляются, тогда как в случае общей ― учитываются. Разница между методами классификации связана с наличием образов, на которых классификатор дает результат принадлежности к классу в диапазоне 0,45–0,55. Поэтому необходимо введение третьего класса в классификатор, так называемой серой зоны (0,4–0,6), т.к. вероятность постановки ошибочного диагноза в данной области существенно повышается.

Заключение. Полученные результаты позволяют сделать вывод, что измерительная погрешность в диапазоне (±1–15%) не оказывает существенного влияния на качество классификации.

Об авторах

Иван Анатольевич Гундырев
ООО Три-Софт
Россия

Кандидат физико-математических наук, аналитик.

644099, Омск, ул. Гагарина, д. 14, оф. 702.

SPIN-код: 3338-4901


Людмила Владимировна Бельская
Омский государственный технический университет; ООО ХимСервис
Россия

Кандидат химических наук, директор по науке ООО «ХимСервис», доцент кафедры химической технологии и биотехнологии ОГТУ.

644050, Омск, Проспект Мира, д. 11.

SPIN-код: 4189-7899



Виктор Константинович Косенок
ООО ХимСервис; Омский государственный медицинский университет
Россия

Доктор медицинских наук, профессор, академик РАМТН, заведующий кафедрой онкологии с курсом лучевой терапии ОГМУ.

644013, Омск, ул. Завертяева, д. 9, корп. 1, тел.: +7 (3812) 60-17-46.

SPIN-код: 4578-1551



Елена Александровна Сарф
ООО ХимСервис
Россия

Заведующая лабораторией.

644070, Омск, ул. А. Нейбута, д. 91а.

SPIN-код: 9161-0264



Список литературы

1. Карякина О.Е., Добродеева Л.К., Мартынова Н.А., и др. Применение математических моделей в клинической практике // Экология человека. ― 2012. ― №7 ― С. 55–64.

2. Халафян А.А. Современные статистические методы медицинских исследований. ― М.: Изд-во ЛКИ; 2008. ― 320 с.

3. Омирова Н.И., Палей М.Н., Евсюкова Е.В., Тишков А.В. Композиция деревьев решений для распознавания степени тяжести хронической обструктивной болезни легких // Информационно-управляющие системы. ― 2014. ― №5 ― С. 115–118.

4. Liang L, Cai F, Cherkassky V. Predictive learning with structured (grouped) data. Neural Netw. 2009;22(5-6):766–773. doi: 10.1016/j.neunet.2009.06.030.

5. Самаха Б.А., Шевякин В.Н., Разумова К.В., Кореневская С.Н. Использование интерактивных методов классификации для решения задач медицинского прогнозирования // Фундаментальные исследования. ― 2014. ― №1 ― С. 33–37.

6. Смагин С.В. Комплекс программ для индуктивного формирования баз медицинских знаний // Программные продукты и системы. ― 2014. ― №4 ― С. 108–113. [Smagin SV. Kompleks programm dlya induktivnogo formirovaniya baz meditsinskikh znanii. Programmnye produkty i sistemy. 2014;(4):108–113. (In Russ).]

7. Sotiras A, Gaonkar B, Eavani H, et al. Machine learning as a means toward precision diagnostics and prognostics. In: Wu G, Shen D, Sabuncu M, editors. Machine learning and medical imaging. The Elsevier and MICCAI Society Book Series. Elsevier; 2016. pp. 299–334. doi: 10.1016/b978-0-12-804076-8.00010-4.

8. Chen H, Tan C, Lin Z, Wu T. The diagnostics of diabetes mellitus based on ensemble modeling and hair/urine element level analysis. Comput Biol Med. 2014;50:70–75. doi: 10.1016/j.compbiomed.2014.04.012.

9. Mohebian MR, Marateb HR, Mansourian M, et al. A Hybrid Computer-aided-diagnosis System for Prediction of Breast Cancer Recurrence (HPBCR) using optimized ensemble learning. Comput Struct Biotechnol J. 2017;15:75–85. doi: 10.1016/j.csbj.2016.11.004.

10. Ле Н.В., Камаев В.А., Панченко Д.П., Трушкина О.А. Обзор подходов к проектированию медицинской системы дифференциальной диагностики // Известия Волгоградского государственного технического университета. ― 2014. ― Т.20. ― №6 ― С. 50–58.

11. Гундырев И.А., Бельская Л.В. Использование синтетических образов для задачи медицинской диагностики рака легкого. В кн.: Материалы X международной научной конференции / Под общей ред. В.П. Колосова. ― Самара; 2016. ― С. 8–11.

12. Wu Yo, Wu Yi, Wang J, et al. An optimal tumor marker group-coupled artificial neural network for diagnosis of lung cancer. Expert Syst Appl. 2011;38(9):11329–11334. doi: 10.1016/j.eswa.2011.02.183.

13. Хайленко В.А., Давыдов М.И., Новиков А.М., Сперанский Д.Л. Клиническое значение определения сиаловых кислот у больных раком легкого // Вестник онкологического научного центра Российской академии медицинских наук. ― 1991. ― Т.2. ― №1 ― С. 25–27.

14. Lemjabbar-Alaoui H, McKinney A, Yang Y-W, et al. Glycosylation alterations in lung and brain cancer. Adv Cancer Res. 2015;126:305–344. doi: 10.1016/bs.acr.2014.11.007.

15. Shamberger RJ. Serum sialic acid in normals and in cancer patients. J Clin Chem Clin Biochem. 1984;22(10):647–651.

16. Tran TT, Nguyen TMP, Nguyen BN, Phan VC. Changes of Serum Glycoproteins in Lung Cancer Patients. J Proteomics Bioinform. 2008;1(1):11–16. doi: 10.4172/jpb.1000004.

17. Сперанский В.В., Алехин Е.К., Петрова И.В., Алехин В.Е. О роли гистамина и антигистаминных препаратов в онкогенезе // Медицинский вестник Башкортостана. ― 2010. ― Т.5. ― №4 ― С. 151–156.

18. Флеминг М.В., Климов В.В., Чердынцева Н.В. О взаимовлиянии аллергических реакций и злокачественных процессов (современное состояние проблемы) // Сибирский онкологический журнал. ― 2005. ― №1 ― С. 96–101.

19. Keskinege A, Elgun S, Yilmaz E. Possible implications of arginase and diamine oxidase in prostatic carcinoma. Cancer Detect Prev. 2001;25(1):76–79.

20. Манина И.В., Перетолчина Н.М., Сапрыкина Н.С., и др. Перспективы применения антагониста Н2-гистаминовых рецепторов (циметидина) в качестве адъюванта биотерапии меланомы // Иммунопатология, аллергология, инфектология. ― 2010. ― №4 ― С. 42–51.

21. Lattermann R, Geisser W, Georgieff M, et al. Integrated analysis of glucose, lipid, and urea metabolism in patients with bladder cancer. Impact of tumor stage. Nutrition. 2003;19(7–8):589–592. doi: 10.1016/S0899-9007(03)00055-8.

22. Liu J, Duan Y. Saliva: a potential media for disease diagnostics and monitoring. Oral Oncol. 2012;48(7):569–577. doi: 10.1016/j.oraloncology.2012.01.021.

23. Malathi M, Shrinivas BR. Relevance of serum alkaline phosphatase as a diagnostic aid in lung pathology. Indian J Physiol Pharmacol. 2001;45(1):119–121.

24. Soini Y, Kaarteenaho-Wiik R, Paakko P, Kinnula V. Expression of antioxidant enzymes in bronchial metaplastic and dysplastic epithelium. Lung Cancer. 2003;39(1):15–22. doi: 10.1016/S0169-5002(02)00392-6.

25. Dayem AA, Choi HY, Kim JH, Cho SG. Role of oxidative stress in stem, cancers and cancer stem cells. Cancers (Basel). 2010;2(2):859–884. doi: 10.3390/cancers2020859.

26. Панкова О.В., Перельмутер В.М., Савенкова О.В. Характеристика экспрессии маркеров пролиферации и регуляции апоптоза в зависимости от характера дисрегенераторных изменений в эпителии бронхов при плоскоклеточном раке легкого // Сибирский онкологический журнал. ― 2010. ― №5 ― С. 36–41.

27. Клиническая биохимия. Сборник инструкций. ― Новосибирск; 2011. ― 132 с. [Klinicheskaya biokhimiya. Sbornik instruktsii. Novosibirsk; 2011. 132 p. (In Russ).]

28. Королюк М.А., Иванова Л.И., Майорова И.Г., Токарев В.Е. Метод определения активности каталазы // Лабораторное дело. ― 1988. ― №1 ― С. 16–19.

29. Островский О.В., Храмов В.А., Попова Т.А. Биохимия полости рта. ― Волгоград: Изд-во ВолГМУ; 2010. ― 184 с.

30. Храмов В.А., Пригода Е.В. Уровень аминоазота и имидазольных соединений в ротовой жидкости человека // Стоматология. ― 2002. ― Т.81. ― №6 ― С. 10–11.

31. Романенко Е.Г., Руденко А.И. Методика определения сиаловой кислоты в слюне // Свiт медицини та бiологii. ― 2013. ― Т.9. ― №1 ― С. 139–142.

32. Гаврилов В.Б., Бидула М.М., Фурманчук Д.А., и др. Оценка интоксикации организма по нарушению баланса между накоплением и связыванием токсинов в плазме // Клиническая лабораторная диагностика. ― 1999. ― №2 ― С. 13–17.

33. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. ― М.: ДМК Пресс; 2015. ― 399 с.

34. Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R [интернет]. 2014. Доступно по: http://r-analytics.blogspot.com. Ссылка активна на 12.03.2018.

35. Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R [интернет]. 2017. Доступно по: https://github.com/ranalytics/data-mining. Ссылка активна на 12.03.2018.

36. Джеймс Г., Уиттон Д., Хасти Т., Тибширани Р. Введение в статистическое обучение с примерами на языке R. Пер. с англ. С.Э. Мастицкого. ― М.: ДМК Пресс; 2016. ― 460 с.

37. Ле Н.В. Интеллектуальная медицинская система дифференциальной диагностики на основе экспертных систем // Вестник Саратовского государственного технического университета. ― 2014. ― Т.2. ― №1 ― С. 167–179.

38. Поворознюк А.И. Система поддержки принятия решения в медицине на основе синтеза структурированных моделей объектов диагностики // Научные ведомости Белгородского государственного университета. ― 2009. ― Т.12. ― №15–1 ― С. 170–176.

39. Давыдов М.И., Заридзе Д.Г. Скрининг злокачественных опухолей // Вестник российского онкологического научного центра им. Н.Н. Блохина Российской академии медицинских наук. ― 2014. ― Т.25. ― №3–4 ― С. 5–16.

40. Сергеева Н.С., Маршутина Н.В., Солохина М.П., и др. Современные представления о серологических опухолеассоциированных маркерах и их месте в онкологии // Успехи молекулярной онкологии. ― 2014. ― №1 ― С. 69–84.

41. Федеральные клинические рекомендации по диагностике и лечению больных раком легкого. Доступно по: http://www.volgmed.ru/uploads/files/2014-11/34115-federalnye_klinicheskie_rekomendacii_po_diagnostike_i_lecheniyu_bolnyh_rakom_legkogo_2013_http_oncology-association_ru.pdf. Ссылка активна на 12.03.2018.


Для цитирования:


Гундырев И.А., Бельская Л.В., Косенок В.К., Сарф Е.А. ПРИМЕНЕНИЕ СИНТЕТИЧЕСКИХ ОБРАЗОВ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ НА ПРИМЕРЕ ДИАГНОСТИКИ РАКА ЛЕГКОГО. Вестник Российской академии медицинских наук. 2018;73(2):96-104. https://doi.org/10.15690/vramn946

For citation:


Gundyrev I.A., Bel'skaya L.V., Kosenok V.K., Sarf E.A. THE USE OF SYNTHETIC IMAGES FOR SOLVING THE CLASSIFICATION PROBLEM BY THE EXAMPLE OF LUNG CANCER DIAGNOSIS. Annals of the Russian academy of medical sciences. 2018;73(2):96-104. (In Russ.) https://doi.org/10.15690/vramn946

Просмотров: 173


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 0869-6047 (Print)
ISSN 2414-3545 (Online)