ПРИМЕНЕНИЕ СИНТЕТИЧЕСКИХ ОБРАЗОВ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ НА ПРИМЕРЕ ДИАГНОСТИКИ РАКА ЛЕГКОГО

Обложка

Аннотация


Обоснование. С математической точки зрения задачи медицинской диагностики представляют собой задачи классификации данных. При этом важно понимать, насколько существенные искажения могут внести в результат классификации погрешности сбора первичной диагностической информации, в частности результатов биохимических тестов.

Цель исследования ― установление зависимости результата классификации от вариативности первичной диагностической информации на примере модельного классификатора.

Методы. В исследовании случай-контроль приняли участие пациенты, которые были разделены на 2 группы ― основную (с диагнозом рака легкого, n=200) и контрольную (условно здоровые, n=500). Всем участникам было проведено биохимическое исследование слюны, а также последующая гистологическая верификация диагноза. Биохимический состав слюны определен спектрофотометрически. На основе полученных данных построен модельный классификатор для диагностики рака легкого (случайный лес). В каждый параметр, лежащий в основе классификатора, вносили отклонения в заданном диапазоне (±1–5%, ±5–10%, ±10–15%), создавая синтетические образы. Затем методом кросс-валидации проведена оценка результатов классификации.

Результаты. Определены базовые диагностические характеристики модельного классификатора (чувствительность ― 72,5%; специфичность ― 86,0%). При увеличении отклонений синтетических образов от базового значения диагностические характеристики при общей классификации ухудшаются. Однако результат уверенной классификации, напротив, дает более высокие значения (чувствительность ― 81,8%, специфичность ― 93,1%). В случае уверенной классификации близкие образы, которые по результатам классификации попадают в разные классы, удаляются, тогда как в случае общей ― учитываются. Разница между методами классификации связана с наличием образов, на которых классификатор дает результат принадлежности к классу в диапазоне 0,45–0,55. Поэтому необходимо введение третьего класса в классификатор, так называемой серой зоны (0,4–0,6), т.к. вероятность постановки ошибочного диагноза в данной области существенно повышается.

Заключение. Полученные результаты позволяют сделать вывод, что измерительная погрешность в диапазоне (±1–15%) не оказывает существенного влияния на качество классификации.

Об авторах

Иван Анатольевич Гундырев

ООО Три-Софт

Email: ivangundyrev@yandex.ru
ORCID iD: 0000-0002-9845-0039

Россия

Кандидат физико-математических наук, аналитик.

644099, Омск, ул. Гагарина, д. 14, оф. 702.

SPIN-код: 3338-4901

Людмила Владимировна Бельская

Омский государственный технический университет; ООО ХимСервис

Автор, ответственный за переписку.
Email: ludab2005@mail.ru
ORCID iD: 0000-0002-6147-4854

Россия

Кандидат химических наук, директор по науке ООО «ХимСервис», доцент кафедры химической технологии и биотехнологии ОГТУ.

644050, Омск, Проспект Мира, д. 11.

SPIN-код: 4189-7899

Виктор Константинович Косенок

ООО ХимСервис; Омский государственный медицинский университет

Email: victorkosenok@gmail.com
ORCID iD: 0000-0002-2072-2460

Россия

Доктор медицинских наук, профессор, академик РАМТН, заведующий кафедрой онкологии с курсом лучевой терапии ОГМУ.

644013, Омск, ул. Завертяева, д. 9, корп. 1, тел.: +7 (3812) 60-17-46.

SPIN-код: 4578-1551

Елена Александровна Сарф

ООО ХимСервис

Email: nemcha@mail.ru
ORCID iD: 0000-0003-4918-6937

Россия

Заведующая лабораторией.

644070, Омск, ул. А. Нейбута, д. 91а.

SPIN-код: 9161-0264

Список литературы

  1. Карякина О.Е., Добродеева Л.К., Мартынова Н.А., и др. Применение математических моделей в клинической практике // Экология человека. ― 2012. ― №7 ― С. 55–64.
  2. Халафян А.А. Современные статистические методы медицинских исследований. ― М.: Изд-во ЛКИ; 2008. ― 320 с.
  3. Омирова Н.И., Палей М.Н., Евсюкова Е.В., Тишков А.В. Композиция деревьев решений для распознавания степени тяжести хронической обструктивной болезни легких // Информационно-управляющие системы. ― 2014. ― №5 ― С. 115–118.
  4. Liang L, Cai F, Cherkassky V. Predictive learning with structured (grouped) data. Neural Netw. 2009;22(5-6):766–773. doi: 10.1016/j.neunet.2009.06.030.
  5. Самаха Б.А., Шевякин В.Н., Разумова К.В., Кореневская С.Н. Использование интерактивных методов классификации для решения задач медицинского прогнозирования // Фундаментальные исследования. ― 2014. ― №1 ― С. 33–37.
  6. Смагин С.В. Комплекс программ для индуктивного формирования баз медицинских знаний // Программные продукты и системы. ― 2014. ― №4 ― С. 108–113. [Smagin SV. Kompleks programm dlya induktivnogo formirovaniya baz meditsinskikh znanii. Programmnye produkty i sistemy. 2014;(4):108–113. (In Russ).]
  7. Sotiras A, Gaonkar B, Eavani H, et al. Machine learning as a means toward precision diagnostics and prognostics. In: Wu G, Shen D, Sabuncu M, editors. Machine learning and medical imaging. The Elsevier and MICCAI Society Book Series. Elsevier; 2016. pp. 299–334. doi: 10.1016/b978-0-12-804076-8.00010-4.
  8. Chen H, Tan C, Lin Z, Wu T. The diagnostics of diabetes mellitus based on ensemble modeling and hair/urine element level analysis. Comput Biol Med. 2014;50:70–75. doi: 10.1016/j.compbiomed.2014.04.012.
  9. Mohebian MR, Marateb HR, Mansourian M, et al. A Hybrid Computer-aided-diagnosis System for Prediction of Breast Cancer Recurrence (HPBCR) using optimized ensemble learning. Comput Struct Biotechnol J. 2017;15:75–85. doi: 10.1016/j.csbj.2016.11.004.
  10. Ле Н.В., Камаев В.А., Панченко Д.П., Трушкина О.А. Обзор подходов к проектированию медицинской системы дифференциальной диагностики // Известия Волгоградского государственного технического университета. ― 2014. ― Т.20. ― №6 ― С. 50–58.
  11. Гундырев И.А., Бельская Л.В. Использование синтетических образов для задачи медицинской диагностики рака легкого. В кн.: Материалы X международной научной конференции / Под общей ред. В.П. Колосова. ― Самара; 2016. ― С. 8–11.
  12. Wu Yo, Wu Yi, Wang J, et al. An optimal tumor marker group-coupled artificial neural network for diagnosis of lung cancer. Expert Syst Appl. 2011;38(9):11329–11334. doi: 10.1016/j.eswa.2011.02.183.
  13. Хайленко В.А., Давыдов М.И., Новиков А.М., Сперанский Д.Л. Клиническое значение определения сиаловых кислот у больных раком легкого // Вестник онкологического научного центра Российской академии медицинских наук. ― 1991. ― Т.2. ― №1 ― С. 25–27.
  14. Lemjabbar-Alaoui H, McKinney A, Yang Y-W, et al. Glycosylation alterations in lung and brain cancer. Adv Cancer Res. 2015;126:305–344. doi: 10.1016/bs.acr.2014.11.007.
  15. Shamberger RJ. Serum sialic acid in normals and in cancer patients. J Clin Chem Clin Biochem. 1984;22(10):647–651.
  16. Tran TT, Nguyen TMP, Nguyen BN, Phan VC. Changes of Serum Glycoproteins in Lung Cancer Patients. J Proteomics Bioinform. 2008;1(1):11–16. doi: 10.4172/jpb.1000004.
  17. Сперанский В.В., Алехин Е.К., Петрова И.В., Алехин В.Е. О роли гистамина и антигистаминных препаратов в онкогенезе // Медицинский вестник Башкортостана. ― 2010. ― Т.5. ― №4 ― С. 151–156.
  18. Флеминг М.В., Климов В.В., Чердынцева Н.В. О взаимовлиянии аллергических реакций и злокачественных процессов (современное состояние проблемы) // Сибирский онкологический журнал. ― 2005. ― №1 ― С. 96–101.
  19. Keskinege A, Elgun S, Yilmaz E. Possible implications of arginase and diamine oxidase in prostatic carcinoma. Cancer Detect Prev. 2001;25(1):76–79.
  20. Манина И.В., Перетолчина Н.М., Сапрыкина Н.С., и др. Перспективы применения антагониста Н2-гистаминовых рецепторов (циметидина) в качестве адъюванта биотерапии меланомы // Иммунопатология, аллергология, инфектология. ― 2010. ― №4 ― С. 42–51.
  21. Lattermann R, Geisser W, Georgieff M, et al. Integrated analysis of glucose, lipid, and urea metabolism in patients with bladder cancer. Impact of tumor stage. Nutrition. 2003;19(7–8):589–592. doi: 10.1016/S0899-9007(03)00055-8.
  22. Liu J, Duan Y. Saliva: a potential media for disease diagnostics and monitoring. Oral Oncol. 2012;48(7):569–577. doi: 10.1016/j.oraloncology.2012.01.021.
  23. Malathi M, Shrinivas BR. Relevance of serum alkaline phosphatase as a diagnostic aid in lung pathology. Indian J Physiol Pharmacol. 2001;45(1):119–121.
  24. Soini Y, Kaarteenaho-Wiik R, Paakko P, Kinnula V. Expression of antioxidant enzymes in bronchial metaplastic and dysplastic epithelium. Lung Cancer. 2003;39(1):15–22. doi: 10.1016/S0169-5002(02)00392-6.
  25. Dayem AA, Choi HY, Kim JH, Cho SG. Role of oxidative stress in stem, cancers and cancer stem cells. Cancers (Basel). 2010;2(2):859–884. doi: 10.3390/cancers2020859.
  26. Панкова О.В., Перельмутер В.М., Савенкова О.В. Характеристика экспрессии маркеров пролиферации и регуляции апоптоза в зависимости от характера дисрегенераторных изменений в эпителии бронхов при плоскоклеточном раке легкого // Сибирский онкологический журнал. ― 2010. ― №5 ― С. 36–41.
  27. Клиническая биохимия. Сборник инструкций. ― Новосибирск; 2011. ― 132 с. [Klinicheskaya biokhimiya. Sbornik instruktsii. Novosibirsk; 2011. 132 p. (In Russ).]
  28. Королюк М.А., Иванова Л.И., Майорова И.Г., Токарев В.Е. Метод определения активности каталазы // Лабораторное дело. ― 1988. ― №1 ― С. 16–19.
  29. Островский О.В., Храмов В.А., Попова Т.А. Биохимия полости рта. ― Волгоград: Изд-во ВолГМУ; 2010. ― 184 с.
  30. Храмов В.А., Пригода Е.В. Уровень аминоазота и имидазольных соединений в ротовой жидкости человека // Стоматология. ― 2002. ― Т.81. ― №6 ― С. 10–11.
  31. Романенко Е.Г., Руденко А.И. Методика определения сиаловой кислоты в слюне // Свiт медицини та бiологii. ― 2013. ― Т.9. ― №1 ― С. 139–142.
  32. Гаврилов В.Б., Бидула М.М., Фурманчук Д.А., и др. Оценка интоксикации организма по нарушению баланса между накоплением и связыванием токсинов в плазме // Клиническая лабораторная диагностика. ― 1999. ― №2 ― С. 13–17.
  33. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. ― М.: ДМК Пресс; 2015. ― 399 с.
  34. Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R [интернет]. 2014. Доступно по: http://r-analytics.blogspot.com. Ссылка активна на 12.03.2018.
  35. Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R [интернет]. 2017. Доступно по: https://github.com/ranalytics/data-mining. Ссылка активна на 12.03.2018.
  36. Джеймс Г., Уиттон Д., Хасти Т., Тибширани Р. Введение в статистическое обучение с примерами на языке R. Пер. с англ. С.Э. Мастицкого. ― М.: ДМК Пресс; 2016. ― 460 с.
  37. Ле Н.В. Интеллектуальная медицинская система дифференциальной диагностики на основе экспертных систем // Вестник Саратовского государственного технического университета. ― 2014. ― Т.2. ― №1 ― С. 167–179.
  38. Поворознюк А.И. Система поддержки принятия решения в медицине на основе синтеза структурированных моделей объектов диагностики // Научные ведомости Белгородского государственного университета. ― 2009. ― Т.12. ― №15–1 ― С. 170–176.
  39. Давыдов М.И., Заридзе Д.Г. Скрининг злокачественных опухолей // Вестник российского онкологического научного центра им. Н.Н. Блохина Российской академии медицинских наук. ― 2014. ― Т.25. ― №3–4 ― С. 5–16.
  40. Сергеева Н.С., Маршутина Н.В., Солохина М.П., и др. Современные представления о серологических опухолеассоциированных маркерах и их месте в онкологии // Успехи молекулярной онкологии. ― 2014. ― №1 ― С. 69–84.
  41. Федеральные клинические рекомендации по диагностике и лечению больных раком легкого. Доступно по: http://www.volgmed.ru/uploads/files/2014-11/34115-federalnye_klinicheskie_rekomendacii_po_diagnostike_i_lecheniyu_bolnyh_rakom_legkogo_2013_http_oncology-association_ru.pdf. Ссылка активна на 12.03.2018.

Статистика

Просмотры

Аннотация - 446

PDF (Russian) - 161

Cited-By


Метрики статей

Загрузка метрик ...

PlumX

Dimensions



Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах