THE USE OF SYNTHETIC IMAGES FOR SOLVING THE CLASSIFICATION PROBLEM BY THE EXAMPLE OF LUNG CANCER DIAGNOSIS

Cover Page

Abstract


Background: From a mathematical point of view, the problems of medical diagnostics are the tasks of data classification. It is important to understand how significant distortions can contribute to the result of classification errors in the collection of primary diagnostic information, in particular, the results of biochemical tests.

Aims: Determination of the dependence of the prediction result on the variability of the primary diagnostic information on the example of the model classifier.

Materials and methods: The case-control study enrolled patients who were divided into 2 groups: the main (diagnosed with lung cancer, n=200) and the control group (conditionally healthy, n=500). Questioning and biochemical saliva study was performed in all participants. Patients of the main group and the comparison group were hospitalized for surgical treatment, after which carried out the histological verification of the diagnosis. The biochemical composition of saliva is determined spectrophotometrically. Based on the data obtained, a model classifier for the diagnosis of lung cancer (a random forest) has been constructed. In each parameter underlying the classifier, deviations were made in the specified range (±1–5%, ±5–10%, ±10–15%), creating synthetic images. Then, the results of the classification were evaluated by the cross-validation method.

Results: The basic diagnostic characteristics of the model classifier are determined (sensitivity ― 72.5%, specificity ― 86.0%). As the deviations of synthetic images from the baseline increase, diagnostic characteristics deteriorate with the general classification. However, the result of a confident classification, on the contrary, gives higher values (sensitivity ― 81.8%, specificity ― 93.1%). In case of a confident classification, similar images that fall into different classes according to the classification results are deleted, whereas in the case of a general classification, they are taken into account. The difference between methods of classification is associated with the presence of images on which the classifier gives the result of belonging to the class in the range of 0.45–0.55. Therefore, it is necessary to introduce a third class into the classifier, the so-called gray zone (0.4–0.6), since the probability of making an erroneous diagnosis in this area is significantly increased.

Conclusions: The obtained results allow to conclude that the measurement error in the range (±1–15%) does not significantly affect the quality of the classification.


I. A. Gundyrev

Tri-Soft

Email: ivangundyrev@yandex.ru
ORCID iD: 0000-0002-9845-0039

Russian Federation

Omsk

L. V. Bel'skaya

Omsk State Technical University; Omsk State Medical University

Author for correspondence.
Email: ludab2005@mail.ru
ORCID iD: 0000-0002-6147-4854

Russian Federation

Кандидат химических наук, директор по науке ООО «ХимСервис», доцент кафедры химической технологии и биотехнологии ОГТУ.

644050, Омск, Проспект Мира, д. 11.

SPIN-код: 4189-7899

V. K. Kosenok

Omsk State Medical University; ChemService

Email: victorkosenok@gmail.com
ORCID iD: 0000-0002-2072-2460

Russian Federation

Moscow

E. A. Sarf

Omsk State Medical University

Email: nemcha@mail.ru
ORCID iD: 0000-0003-4918-6937

Russian Federation

Заведующая лабораторией.

644070, Омск, ул. А. Нейбута, д. 91а.

SPIN-код: 9161-0264

  1. Карякина О.Е., Добродеева Л.К., Мартынова Н.А., и др. Применение математических моделей в клинической практике // Экология человека. ― 2012. ― №7 ― С. 55–64.
  2. Халафян А.А. Современные статистические методы медицинских исследований. ― М.: Изд-во ЛКИ; 2008. ― 320 с.
  3. Омирова Н.И., Палей М.Н., Евсюкова Е.В., Тишков А.В. Композиция деревьев решений для распознавания степени тяжести хронической обструктивной болезни легких // Информационно-управляющие системы. ― 2014. ― №5 ― С. 115–118.
  4. Liang L, Cai F, Cherkassky V. Predictive learning with structured (grouped) data. Neural Netw. 2009;22(5-6):766–773. doi: 10.1016/j.neunet.2009.06.030.
  5. Самаха Б.А., Шевякин В.Н., Разумова К.В., Кореневская С.Н. Использование интерактивных методов классификации для решения задач медицинского прогнозирования // Фундаментальные исследования. ― 2014. ― №1 ― С. 33–37.
  6. Смагин С.В. Комплекс программ для индуктивного формирования баз медицинских знаний // Программные продукты и системы. ― 2014. ― №4 ― С. 108–113. [Smagin SV. Kompleks programm dlya induktivnogo formirovaniya baz meditsinskikh znanii. Programmnye produkty i sistemy. 2014;(4):108–113. (In Russ).]
  7. Sotiras A, Gaonkar B, Eavani H, et al. Machine learning as a means toward precision diagnostics and prognostics. In: Wu G, Shen D, Sabuncu M, editors. Machine learning and medical imaging. The Elsevier and MICCAI Society Book Series. Elsevier; 2016. pp. 299–334. doi: 10.1016/b978-0-12-804076-8.00010-4.
  8. Chen H, Tan C, Lin Z, Wu T. The diagnostics of diabetes mellitus based on ensemble modeling and hair/urine element level analysis. Comput Biol Med. 2014;50:70–75. doi: 10.1016/j.compbiomed.2014.04.012.
  9. Mohebian MR, Marateb HR, Mansourian M, et al. A Hybrid Computer-aided-diagnosis System for Prediction of Breast Cancer Recurrence (HPBCR) using optimized ensemble learning. Comput Struct Biotechnol J. 2017;15:75–85. doi: 10.1016/j.csbj.2016.11.004.
  10. Ле Н.В., Камаев В.А., Панченко Д.П., Трушкина О.А. Обзор подходов к проектированию медицинской системы дифференциальной диагностики // Известия Волгоградского государственного технического университета. ― 2014. ― Т.20. ― №6 ― С. 50–58.
  11. Гундырев И.А., Бельская Л.В. Использование синтетических образов для задачи медицинской диагностики рака легкого. В кн.: Материалы X международной научной конференции / Под общей ред. В.П. Колосова. ― Самара; 2016. ― С. 8–11.
  12. Wu Yo, Wu Yi, Wang J, et al. An optimal tumor marker group-coupled artificial neural network for diagnosis of lung cancer. Expert Syst Appl. 2011;38(9):11329–11334. doi: 10.1016/j.eswa.2011.02.183.
  13. Хайленко В.А., Давыдов М.И., Новиков А.М., Сперанский Д.Л. Клиническое значение определения сиаловых кислот у больных раком легкого // Вестник онкологического научного центра Российской академии медицинских наук. ― 1991. ― Т.2. ― №1 ― С. 25–27.
  14. Lemjabbar-Alaoui H, McKinney A, Yang Y-W, et al. Glycosylation alterations in lung and brain cancer. Adv Cancer Res. 2015;126:305–344. doi: 10.1016/bs.acr.2014.11.007.
  15. Shamberger RJ. Serum sialic acid in normals and in cancer patients. J Clin Chem Clin Biochem. 1984;22(10):647–651.
  16. Tran TT, Nguyen TMP, Nguyen BN, Phan VC. Changes of Serum Glycoproteins in Lung Cancer Patients. J Proteomics Bioinform. 2008;1(1):11–16. doi: 10.4172/jpb.1000004.
  17. Сперанский В.В., Алехин Е.К., Петрова И.В., Алехин В.Е. О роли гистамина и антигистаминных препаратов в онкогенезе // Медицинский вестник Башкортостана. ― 2010. ― Т.5. ― №4 ― С. 151–156.
  18. Флеминг М.В., Климов В.В., Чердынцева Н.В. О взаимовлиянии аллергических реакций и злокачественных процессов (современное состояние проблемы) // Сибирский онкологический журнал. ― 2005. ― №1 ― С. 96–101.
  19. Keskinege A, Elgun S, Yilmaz E. Possible implications of arginase and diamine oxidase in prostatic carcinoma. Cancer Detect Prev. 2001;25(1):76–79.
  20. Манина И.В., Перетолчина Н.М., Сапрыкина Н.С., и др. Перспективы применения антагониста Н2-гистаминовых рецепторов (циметидина) в качестве адъюванта биотерапии меланомы // Иммунопатология, аллергология, инфектология. ― 2010. ― №4 ― С. 42–51.
  21. Lattermann R, Geisser W, Georgieff M, et al. Integrated analysis of glucose, lipid, and urea metabolism in patients with bladder cancer. Impact of tumor stage. Nutrition. 2003;19(7–8):589–592. doi: 10.1016/S0899-9007(03)00055-8.
  22. Liu J, Duan Y. Saliva: a potential media for disease diagnostics and monitoring. Oral Oncol. 2012;48(7):569–577. doi: 10.1016/j.oraloncology.2012.01.021.
  23. Malathi M, Shrinivas BR. Relevance of serum alkaline phosphatase as a diagnostic aid in lung pathology. Indian J Physiol Pharmacol. 2001;45(1):119–121.
  24. Soini Y, Kaarteenaho-Wiik R, Paakko P, Kinnula V. Expression of antioxidant enzymes in bronchial metaplastic and dysplastic epithelium. Lung Cancer. 2003;39(1):15–22. doi: 10.1016/S0169-5002(02)00392-6.
  25. Dayem AA, Choi HY, Kim JH, Cho SG. Role of oxidative stress in stem, cancers and cancer stem cells. Cancers (Basel). 2010;2(2):859–884. doi: 10.3390/cancers2020859.
  26. Панкова О.В., Перельмутер В.М., Савенкова О.В. Характеристика экспрессии маркеров пролиферации и регуляции апоптоза в зависимости от характера дисрегенераторных изменений в эпителии бронхов при плоскоклеточном раке легкого // Сибирский онкологический журнал. ― 2010. ― №5 ― С. 36–41.
  27. Клиническая биохимия. Сборник инструкций. ― Новосибирск; 2011. ― 132 с. [Klinicheskaya biokhimiya. Sbornik instruktsii. Novosibirsk; 2011. 132 p. (In Russ).]
  28. Королюк М.А., Иванова Л.И., Майорова И.Г., Токарев В.Е. Метод определения активности каталазы // Лабораторное дело. ― 1988. ― №1 ― С. 16–19.
  29. Островский О.В., Храмов В.А., Попова Т.А. Биохимия полости рта. ― Волгоград: Изд-во ВолГМУ; 2010. ― 184 с.
  30. Храмов В.А., Пригода Е.В. Уровень аминоазота и имидазольных соединений в ротовой жидкости человека // Стоматология. ― 2002. ― Т.81. ― №6 ― С. 10–11.
  31. Романенко Е.Г., Руденко А.И. Методика определения сиаловой кислоты в слюне // Свiт медицини та бiологii. ― 2013. ― Т.9. ― №1 ― С. 139–142.
  32. Гаврилов В.Б., Бидула М.М., Фурманчук Д.А., и др. Оценка интоксикации организма по нарушению баланса между накоплением и связыванием токсинов в плазме // Клиническая лабораторная диагностика. ― 1999. ― №2 ― С. 13–17.
  33. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. ― М.: ДМК Пресс; 2015. ― 399 с.
  34. Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R [интернет]. 2014. Доступно по: http://r-analytics.blogspot.com. Ссылка активна на 12.03.2018.
  35. Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R [интернет]. 2017. Доступно по: https://github.com/ranalytics/data-mining. Ссылка активна на 12.03.2018.
  36. Джеймс Г., Уиттон Д., Хасти Т., Тибширани Р. Введение в статистическое обучение с примерами на языке R. Пер. с англ. С.Э. Мастицкого. ― М.: ДМК Пресс; 2016. ― 460 с.
  37. Ле Н.В. Интеллектуальная медицинская система дифференциальной диагностики на основе экспертных систем // Вестник Саратовского государственного технического университета. ― 2014. ― Т.2. ― №1 ― С. 167–179.
  38. Поворознюк А.И. Система поддержки принятия решения в медицине на основе синтеза структурированных моделей объектов диагностики // Научные ведомости Белгородского государственного университета. ― 2009. ― Т.12. ― №15–1 ― С. 170–176.
  39. Давыдов М.И., Заридзе Д.Г. Скрининг злокачественных опухолей // Вестник российского онкологического научного центра им. Н.Н. Блохина Российской академии медицинских наук. ― 2014. ― Т.25. ― №3–4 ― С. 5–16.
  40. Сергеева Н.С., Маршутина Н.В., Солохина М.П., и др. Современные представления о серологических опухолеассоциированных маркерах и их месте в онкологии // Успехи молекулярной онкологии. ― 2014. ― №1 ― С. 69–84.
  41. Федеральные клинические рекомендации по диагностике и лечению больных раком легкого. Доступно по: http://www.volgmed.ru/uploads/files/2014-11/34115-federalnye_klinicheskie_rekomendacii_po_diagnostike_i_lecheniyu_bolnyh_rakom_legkogo_2013_http_oncology-association_ru.pdf. Ссылка активна на 12.03.2018.

Views

Abstract - 20

PDF (Russian) - 13

Cited-By


PlumX



Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies