Создание базы медицинских знаний на основе национального метатезауруса для унификации разработки систем поддержки принятия клинических решений

Обложка


Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Доступ платный или только для подписчиков

Аннотация

Обоснование. Стремительный рост объемов медицинских данных, широкие возможности информационных технологий, перевод медицинского документооборота в электронный формат порождают спрос на внедрение инструментов информационно-справочной помощи и систем поддержки принятия клинических решений (СППКР). Работа над СППКР в настоящее время объединяет экспертную деятельность врачей, специалистов в области информационных технологий, математической статистики, машинного обучения, инженеров по знаниям. Большинство разработок, предполагающих формирование баз знаний, создается изолированно, без использования универсальных подходов, позволяющих объединять различные решения. В основе любой базы медицинских знаний (БМЗ) лежит тезаурус, представляющий собой систематизированный словарь терминов, который позволяет стандартизировать терминологию и таким образом ускорить поиск и обмен информацией. Он включает в себя термины-концепты и связи между ними, а также синонимы и различные атрибуты.

Цель исследования — cоздание национального медицинского метатезауруса, построенного по онтологическому принципу, и разработка на его основе БМЗ.

Методы. Международный систематизированный словарь медицинских терминов UMLS (Unified Medical Language System); клинические рекомендации по 22 группам нозологий; справочники федерального портала нормативно-справочной информации Минздрава России; электронные медицинские карты – 330 тыс. (dataset MIMIC-IV); абстракты публикаций PubMed – 28 млн. Использовались семантические анализаторы SemRep (Semantic Repository) и MetaMap; методы оценки лексической схожести, связности, контекстной сочетаемости сущностей в подграфе, математической статистики.

Результаты. Создана первая версия унифицированной национальной медицинской номенклатуры (УНМН). Показано, что онтологические модели являются эффективным способом представления структурированной информации. Созданы компоненты информационно-поисковых систем. Разработаны аналитические инструменты для работы с метатезаурусом.

Заключение. На основе УНМН и созданных инструментов возможны автоматизированное формирование образа заболевания (базы знаний) и одноплатформенная разработка СППКР.

Полный текст

Доступ закрыт

Об авторах

Татьяна В. Зарубина

Институт цифровой трансформации медицины Российского национального исследовательского медицинского университет имени Н.И. Пирогова

Автор, ответственный за переписку.
Email: t_zarubina@mail.ru
ORCID iD: 0000-0002-4403-8049
SPIN-код: 4354-3290

д.м.н., профессор, член-корреспондент РАН

Россия, Москва

Светлана Е. Раузина

Институт цифровой трансформации медицины Российского национального исследовательского медицинского университет имени Н.И. Пирогова

Email: rauzina@mail.ru
ORCID iD: 0000-0002-9535-2847
SPIN-код: 1164-3516

к.м.н., доцент 

Россия, Москва

Павел А. Астанин

Институт цифровой трансформации медицины Российского национального исследовательского медицинского университет имени Н.И. Пирогова

Email: med_cyber@mail.ru
ORCID iD: 0000-0002-1854-8686
SPIN-код: 2658-1189

аспирант

Россия, Москва

Юлия И. Королева

Институт цифровой трансформации медицины Российского национального исследовательского медицинского университет имени Н.И. Пирогова

Email: koroleva_iui@rsmu.ru
ORCID iD: 0000-0003-3560-312X
SPIN-код: 4950-1854

к.м.н., доцент

Россия, Москва

Лев В. Ронжин

Институт цифровой трансформации медицины Российского национального исследовательского медицинского университет имени Н.И. Пирогова

Email: izopropylbenzol@gmail.com
ORCID iD: 0000-0002-4653-1611
SPIN-код: 5502-6792

аналитик

Россия, Москва

Александр А. Борисов

Институт цифровой трансформации медицины Российского национального исследовательского медицинского университет имени Н.И. Пирогова

Email: aleksandrborisov10650@gmail.com
ORCID iD: 0000-0003-4036-5883
SPIN-код: 4294-4736

аналитик

Россия, Москва

Мария А. Афанасьева

Институт цифровой трансформации медицины Российского национального исследовательского медицинского университет имени Н.И. Пирогова

Email: usovanastasija@gmail.com
ORCID iD: 0009-0002-2680-6291
Россия, Москва

Анастасия В. Усова

Институт цифровой трансформации медицины Российского национального исследовательского медицинского университет имени Н.И. Пирогова

Email: usovanastasija@gmail.com
ORCID iD: 0009-0001-0625-1105
SPIN-код: 9109-8782
Россия, Москва

Список литературы

  1. Указ Президента Российской Федерации от 10 октября 2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации». [Decree of the President of the Russian Federation No. 490 of 10 October 2019 “O razvitii iskusstvennogo intellekta v Rossijskoj Federacii”. (In Russ.)] Available from: http://www.kremlin.ru/acts/bank/44731 (accessed: 02.10.2023).
  2. Гусев А.В., Владзимирский А.В., Шарова Д.Е., и др. Развитие исследований и разработок в сфере технологий искусственного интеллекта для здравоохранения в Российской Федерации: итоги 2021 года // Digital Diagnostics. — 2022. — Т. 3. — № 3. — С. 178–194. [Gusev AV, Vladzymyrskyy AV, Sharova DE, et al. Evolution of research and development in the field of artificial intelligence technologies for healthcare in the Russian Federation: results of 2021. Digital Diagnostics. 2022;3(3):178–194. (In Russ.)] doi: https://doi.org/10.17816/DD107367
  3. Искусственный интеллект поможет московским терапевтам в постановке диагнозов // Коммерсантъ. 08.09.2023. [Iskusstvennyj intellekt pomozhet moskovskim terapevtam v postanovke diagnozov. Kommersant. 08.09.2023. (In Russ.)] Available from: https://www.kommersant.ru/doc/6199795 (accessed: 02.10.2023).
  4. Гусев А.В., Астапенко Е.М., Иванов И.В., и др. Принципы формирования доверия к системам искусственного интеллекта для здравоохранения // Вестник Росздравнадзора. — 2022. — № 2. — С. 25–33. [Gusev AV, Astapenko EM, Ivanov IV, et al. Principles for building confidence in artificial intelligence systems for healthcare. Vestnik Roszdravnadzora. 2022;2:25–33. (In Russ.)]
  5. Поповьян Р.А., Будкова Н.Н., Раковский А.А., и др. Составление тезауруса — важный шаг по настройке работы информационной системы в любой области медицины // Врач и информационные технологии. — 2005. — № 4. — С. 57–61. [Popovyan RA, Budkova NN, Rakovskij AA, et al. Sostavlenie tezaurusa-vazhnyj shag po nastrojke raboty informacionnoj sistemy v lyuboj oblasti mediciny. Vrach i informacionnye tekhnologii. 2005;4:57–61. (In Russ.)]
  6. Морозов С.П., Владзимирский А.В., Шулькин И.М., и др. Исследование целесообразности применения технологий искусственного интеллекта в лучевой диагностике // Врач и информационные технологии. — 2022. — № 1. — С. 12–29. [Morozov SP, Vladzymyrskyy AV, Shulkin IM, et al. Feasibility of using artificial intelligence in radiation diagnostics. Medical doctor and information technology. 2022;1:12–29. (In Russ.)] doi: https://doi.org/10.25881/18110193_2022_1_12
  7. Нейросеть поможет врачам одновременно определять до 10 патологий на КТ-снимках // mos.ru. Новости. 27.07.2023. [Nejroset` pomozhet vracham odnovremenno opredelyat` do 10 patologij na KT-snimkakh. mos.ru. News. 27.07.2023. (In Russ.)] Available from: https://www.mos.ru/news/item/125792073/ (accessed: 02.10.2023).
  8. Компьютерное зрение поможет врачам в 29 направлениях лучевых исследований // mos.ru. News. 19.03.2022. [Komp`yuternoe zrenie pomozhet vracham v 29 napravleniyakh luchevy`kh issledovanij. mos.ru. News. 19.03.2022. (In Russ.)] Available from: https://www.mos.ru/news/item/103860073/?utm_source=search&utm_term=serp (accessed: 02.10.2023).
  9. Jing X. The Unified Medical Language System at 30 Years and How It Is Used and Published: Systematic Review and Content Analysis. JMIR Med Inform. 2021;9(8):e20675. doi: https://doi.org/10.2196/20675
  10. National Library of Medicine, USA, Unified Medical Language System (UMLS). Available from: https://www.nlm.nih.gov/research/umls/knowledge_sources/metathesaurus/index.html (accessed: 02.10.2023).
  11. Румянцев П.О., Бледжянц Г.А., Туманов Н.А., и др. UMKB-технология для создания «интеллектуальных» систем в области медицины // Здравоохранение. — 2015. — № 11. — С. 82–89. [Rumyanczev PO, Bledzhyancz GA, Tumanov NA, et al. UMKB-tekhnologiya dlya sozdaniya “intellektualnykh” sistem v oblasti medicziny. Zdravookhranenie. 2015;11:82–89. (In Russ.)]
  12. Maslova AY, Mishvelov AE, Dudusheva MJ, et al. Using a Decision Tree with a Feedback Function to Select Therapeutic Tactics for Viral Infection of the Respiratory Tract in the Medical Expert System. International Transaction Journal of Engineering, Management, & Applied Sciences & Technologies. 2022;13(8):1–10. doi: https://doi.org/10.14456/ITJEMAST.2022.157
  13. Грибова В.В., Окунь Д.Б. Онтологии для формирования баз знаний и реализации лечебных мероприятий в медицинских интеллектуальных системах // Информатика и системы управления. — 2018. — Т. 57. — № 3. — С. 71–80. [Gribova VV, Okun DB. Ontologies for the formation of knowledge bases about disease treatment in medical intelligent systems. Informatika i sistemy upravleniya. 2018;57(3):71–89. (In Russ.)] doi: https://doi.org/10.22250/isu.2018.57.71-80
  14. Переволоцкий В.С., Грибова В.В. Подход к автоматическому формированию баз знаний на основе онтологий // Научный аспект. — 2023. — Т. 2. — № 2. — С. 213–221. [Perevolockij VS, Gribova VV. Podhod k avtomaticheskomu formirovaniyu baz znanij na osnove ontologij. Nauchnyj aspekt. 2023;2(2):213–221. (In Russ.)]
  15. Москаленко Ф.М., Окунь Д.Б., Петряева М.В. База терминов для интеллектуальных медицинских сервисов // Системный анализ в медицине (САМ 2016): материалы X Международной научной конференции, 22–23 сентября 2016 г. — Благовещенск, 2016. — C. 155–158. [Moskalenko PM, Okun DB, Petryaeva MV. Terminology base for intelligent medical services. Sistemnyj analiz v medicine (SAM 2016): Materialy X mezhdunarodnoj nauchnoj konferencii; 2016 Sep. 22–23; Blagoveshchensk; 2016. P. 155–158. (In Russ.)]
  16. Мусаев А.А., Григорьев Д.А. Обзор современных технологий извлечения знаний из текстовых сообщений // Компьютерные исследования и моделирование. — 2021. — Т. 13. — № 6. — С. 1291–1315. [Musaev AA, Grigoriev DA. Extracting knowledge from text messages: overview and state-of-the-art. Computer Research and Modeling. 2021;13(6):1291–1315. (In Russ.)] doi: https://doi.org/10.20537/2076-7633-2021-13-6-1291-1315
  17. Катенко Ю.В. Применение методов машинного обучения для анализа текстовой информации // Охрана, безопасность, связь. — 2019. — № 4-3. — С. 90–94. [Katenko YuV. Application of machine learning methods for text information analysis. Ohrana, bezopasnost’, svyaz’. 2019;(4 Pt 3):90–94. (In Russ.)]
  18. Донитова В.В., Киреев Д.А., Титова Е.В., и др. Методы обработки естественного языка для извлечения факторов риска инсульта из медицинских текстов // Труды Института системного анализа Российской академии наук. — 2021. — Т. 71. — № 4. — С. 93–101. [Donitova VV, Kireev DA, Titova EV, et al. Natural language processing models for extraction of stroke risk factors from electronic health records. Proceeding of the Institute for Systems Analysis of the Russian Academy of Science. 2021;71(4):93–101. (In Russ.)] doi: https://doi.org/10.14357/20790279210410
  19. Тучкова П.А. Аннотирование документов и применение речевых технологий для решения задач обработки естественного языка в медицине // Наукосфера. — 2021. — № 9 (2). — С. 69–73. [Tuchkova PA. Text annotation and using speech technologies for solving natural language processing tasks in medicine. Naukosfera. 2021;(9Pt2):69–73. (In Russ.)] doi: https://doi.org/10.5281/zenodo.5531131
  20. Chute CG. Clinical classification and terminology: some history and current observations. J Am Med Inform Assoc. 2000;7(3):298–303. doi: https://doi.org/10.1136/jamia.2000.0070298
  21. Слепов А.Э. Модуль построения семантических запросов к онтологическим базам знаний // Наука настоящего и будущего. — 2022. — Т. 2. — С. 188–191. [Slepov AE. Module for constructing semantic queries to ontological knowledge bases. Nauka nastoyashhego i budushhego. 2022;2:188–191. (In Russ.)]
  22. Кукарцев В.В., Колмакова З.А., Мельникова О.Л. Системный анализ возможностей по извлечению именованных сущностей с применением технологии Text Mining // Перспективы науки. — 2019. — Т. 120. — № 9. — С. 18–20. [Kukarcev VV, Kolmakova ZA, Melnikova OL. System Analysis of Possibilities to Retrieve Essentials Using Text Mining Technology. Science Prospects. 2019;120(9):18–20. (In Russ.)]
  23. Орлова Д.Е., Падалко А.В. Использование аппарата семантических сетей для интеллектуальной поддержки принятия решений // Вестник Воронежского института высоких технологий. — 2021. — Т. 36. — № 1. — С. 61–65. [Orlova DE, Padalko AV. Using the semantic network apparatus for intelligent decision support. Bulletin Voronezh institute of high technologies. 2021;36(1):61–65. (In Russ.)]
  24. Кайда А.Ю., Савельев А.О. Применение графовой визуализации данных в системах поддержки принятия решений для решения задач автоматизации проведения исследований // Электронные средства и системы управления: материалы докладов международной научно-практической конференции. — 2020. — № 1-2. — С. 137–139. [Kajda AYu, Savelev AO. Primenenie grafovoj vizualizacii dannyh v sistemah podderzhki prinyatiya reshenij dlya resheniya zadach avtomatizacii provedeniya issledovanij. Elektronnye sredstva i sistemy upravleniya. Materialy dokladov mezhdunarodnoj nauchno-prakticheskoj konferencii. 2020;(1 Pt 2):137–139. (In Russ.)]
  25. Szárnyas G, Kővári Z, Salánki A, et al. Towards the characterization of realistic models: evaluation of multidisciplinary graph metrics. Proceedings of the ACM/IEEE 19th International Conference on Model Driven Engineering Languages and Systems (MODELS‘16); 2016 Oct 2. New York, NY; 2016. P. 87–94. doi: https://doi.org/10.1145/2976767.2976786
  26. Varghese J, Sünninghausen SS, Dugas M. Standardized Cardiovascular Quality Assurance Forms with Multilingual Support, UMLS Coding and Medical Concept Analyses. Stud Health Technol Inform. 2015;216:837–841.
  27. Мосалов О.П. Векторные представления ребер графа онтологии как инструмент для анализа и генерации новых данных // Информационно-технологический вестник. — 2021. — Т. 27. — № 1. — С. 93–101. [Mosalov OP. Edge embedding of ontology graphs as a tool for analysis and generation of new data. Informacionno-Tekhnologicheskij Vestnik. 2021;27(1):93–101. (In Russ.)]
  28. Семантическая платформа DataMonitor. [Semanticheskaya platforma DataMonitor. (In Russ.)] Available from: http://avicomp.ru/services/datamonitor (accessed: 02.10.2023).
  29. Портал нормативно справочной информации Министерства здравоохранения Российской Федерации. [Portal normativno spravochnoj informacii Ministerstva zdravoohraneniya Rossijskoj Federacii. (In Russ.)] Available from: https://nsi.rosminzdrav.ru (accessed: 02.10.2023).
  30. Kilicoglu H, Rosemblat G, Fiszman M, et al. Broad-coverage biomedical relation extraction with SemRep. BMC Bioinformatics. 2020;21(1):188. doi: https://doi.org/10.1186/s12859-020-3517-7
  31. Lang F, Mork JG, Demner-Fushman D, et al. Increasing UMLS Coverage and Reducing Ambiguity via Automated Creation of Synonymous Terms: First Steps toward Filling UMLS Synonymy Gaps. American Medical Informatics Association Annual Symposium; 2018. P. 1–26.
  32. Johnson AEW, Bulgarelli L, Shen L, et al. MIMIC-IV, a freely accessible electronic health record dataset. Sci Data. 2023;10(1):1. doi: https://doi.org/10.1038/s41597-022-01899-x
  33. Daniel G, Sunyé G, Cabot J. UMLtoGraphDB: Mapping Conceptual Schemas to Graph Databases. Lecture Notes in Computer Science. 2016;9974:430–444. doi: https://doi.org/10.1007/978-3-319-46397-1_33
  34. Масликова У.В., Супильников А.А. Технологии разработки программы содействия принятию решения в диагностике заболеваний системы крови с использованием сверточных искусственных нейронных сетей // Вестник медицинского института «Реавиз»: реабилитация, врач и здоровье. — 2020. — Т. 47. — № 5. — С. 138–150. [Maslikova UV, Supilnikov AA. Technologies for developing decision support systems for the diagnosis of blood disorders using convolutional neural networks. Bulletin of Medical University Reaviz. 2020;47(5):138–150. (In Russ.)] doi: https://doi.org/10.20340/vmi-rvz.2020.5.16
  35. Berger B, Waterman MS, Yu YW. Levenshtein Distance, Sequence Comparison and Biological Database Search. IEEE Trans Inf Theory. 2021;67(6):3287–3294. doi: https://doi.org/10.1109/ tit.2020.2996543
  36. Черкашин А.М. Применение метода расстояния Левенштейна библиотеки Fuzzywuzzy языка Python для исправления данных // Постулат. — 2021. — Т. 66. — № 4. — С. 11. [Cherkashin AM. Applying the Levenshtein distance method of the Python Fuzzywuzzy library to correct data. Postulat. 2021;66(4):11. (In Russ.)]
  37. Рубрикатор клинических рекомендаций Министерства здравоохранения Российской Федерации. [Rubrikator klinicheskih rekomendacij Ministerstva zdravoohraneniya Rossijskoj Federacii. (In Russ.)] Available from: https://cr.minzdrav.gov.ru/ (accessed: 02.10.2023).
  38. Астанин П.А. Применение автоматизированного анализа семантической сети UMLS для решения задачи поиска релевантных знаний о ревматических заболеваниях // Математическое моделирование систем и процессов: сборник материалов Международной научно-практической конференции. — Псков, 2022. — С. 6–12. [Astanin PA. Primenenie avtomatizirovannogo analiza semanticheskoj seti UMLS dlya resheniya zadachi poiska relevantnyh znanij o revmaticheskih zabolevaniyah. Matematicheskoe modelirovanie sistem i processov: Sbornik materialov Mezhdunarodnoj nauchno-prakticheskoj konferencii. Pskov; 2022. P. 6–12. (In Russ.)] doi: https://doi.org/10.37490/978-5-00200-102-6-6-12
  39. Ширинян М.В., Шустова С.В. Трудности медицинского перевода и способы их преодоления при обучении студентов неязыковых вузов // Язык и культура. — 2018. — № 43. — С. 295–316. [Shirinyan MV, Shustova SV. Trudnosti medicinskogo perevoda i sposoby ih preodoleniya pri obuchenii studentov neyazykovyh vuzov. Yazyk i kul’tura. 2018;43:295–316. (In Russ.)] doi: https://doi.org/10.17223/19996195/43/18
  40. Астанин П.А., Ронжин Л.В., Королева Ю.И. Модуль поиска кратчайшего пути между концептами семантической сети UMLS. Свидетельство о регистрации программы для ЭВМ № 2022684714. 16.12.2022. [Astanin PA, Ronzhin LV, Koroleva YuI. Modul’ poiska kratchajshego puti mezhdu konceptami semanticheskoj seti UMLS. Certificate of computer program registration RUS No. 2022684714. 16.12.2022. (In Russ.)] Available from: https://www.elibrary.ru/download/elibrary_49979662_35579965.PDF (accessed: 02.10.2023).
  41. Близнякова Е.А., Куликов А.А., Куликов А.В. Сравнительный анализ методов поиска кратчайшего пути в графе // Архитектура, строительство, транспорт. — 2022. — № 1. — С. 80–87. [Bliznyakova EA, Kulikov AA, Kulikov AV. Comparative analysis of methods for finding the shortest distance in a graph. Architecture, construction, transport. 2022;1:80–87. (In Russ.)] doi: https://doi.org/10.31660/2782-232X-2022-1-80-87
  42. Астанин П.А., Ронжин Л.В., Раузина С.Е. Модуль поиска релевантного окружения концептов семантической сети UMLS. Свидетельство о регистрации программы для ЭВМ № 2022684715. 16.12.2022. [Astanin PA, Ronzhin LV, Rauzina SE. Modul’ poiska relevantnogo okruzheniya konceptov semanticheskoj seti UMLS. Certificate of computer program registration RUS No. 2022684715. 16.12.2022. (In Russ.)] Available from: https://www.elibrary.ru/download/elibrary_49979663_14353005.PDF (accessed: 02.10.2023).
  43. Астанин П.А., Раузина С.Е., Зарубина Т.В. Автоматизированная система извлечения клинически релевантных терминов UMLS из текстов англоязычных статей на примере аксиального спондилоартрита // Электронный научный журнал «Социальные аспекты здоровья населения». — 2023. — Т. 69. — № 3. — С. 14. [Astanin PA, Rauzina SE, Zarubina TV. Automated system for recognizing clinically relevant UMLS terms in texts of the englishlanguage articles exemplified by axial spondyloarthritis. Social’nye aspekty zdorov’ya naseleniya [serial online]. 2023;69(3):14. (In Russ.)] doi: 10.21045/2071-5021-2023-69-3-14. Available from: http://vestnik.mednet.ru/content/view/1491/30/lang.ru (accessed: 02.10.2023).
  44. Astanin PA, Rauzina SE, Zarubina TV. Digital Tools in UMLS Metathesaurus Knowledge Processing. Studies in Health Technology and Informatics; 2023 Jun 29; Athens, Greece; 2023;305:186–189. doi: https://doi.org/10.3233/SHTI230458

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Организация тематических групп терминов в UMLS

Скачать (202KB)
3. Рис. 2. Примеры симметричной (А), обратной (Б) и однородной (В) связей

Скачать (117KB)
4. Рис. 3. Фрагмент графического представления симптоматического «образа» язвенной болезни и хронического панкреатита

Скачать (434KB)
5. Рис. 4. Закономерности при анализе графа в отношении инструментальной диагностики заболеваний (T060 «Диагностические процедуры»)

Скачать (85KB)
6. Рис. 5. Закономерности при анализе графа в отношении лабораторной диагностики заболеваний

Скачать (126KB)
7. Рис. 6. Варианты графовых путей с включением корневого, концевого и промежуточных концептов UMLS

Скачать (127KB)
8. Рис. 7. Графовые контуры в окружении корневого концепта

Скачать (129KB)
9. Рис. 8. Схема оценки углового расстояния между концептами

Скачать (70KB)
10. Рис. 9. Фрагмент веб-интерфейса рабочего варианта прототипа информационно-поисковой системы

Скачать (177KB)

© Издательство "Педиатръ", 2024



Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах