Creation of a Medical Knowledge Base for Unify the Development of Clinical Decision Support Systems Based on the National Metathesaurus

Cover Page


Cite item

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription or Fee Access

Abstract

Background: The rapid growth in the volume of medical data, the extensive possibilities of information technology, the transfer of medical document flow to electronic format generates a high demand for the introduction of information and reference assistance tools and clinical decision support systems (CDSS). Work on the creation of CDSS currently combines the expert activities of doctors with the work of information technology specialists, mathematical statisticians, data scientists, knowledge engineers. Most of the developments involving the formation of knowledge bases are created in isolation, without the use of universal approaches that allow combining various solutions. At the heart of any medical knowledge base (MKB) there is a thesaurus, which is a systematized dictionary of terms that helps to standardize terminology, which makes it possible to speed up the search and exchange of information. It includes concept terms and relationships between them, as well as synonyms and various attributes. Aims creation of a national medical metathesaurus, built on the ontological principle and the development of MKB based on it. Methods. International systematized dictionary of medical terms UMLS (Unified Medical Language System); clinical recommendations for 22 groups of nosologies; reference books of the federal portal of normative reference information of the Ministry of Health of the Russian Federation; electronic medical records – 330 thousand (dataset MIMIC-IV); abstracts of PubMed publications-28 million. Semantic analyzers SemRep (Semantic Repository) and MetaMap were used; methods for evaluating lexical similarity, connectivity, contextual combinability of entities in a subgraph, and mathematical statistics.

Results. The first version of the Unified National Medical Nomenclature (UNMN) has been created. It is proved that ontological models are an effective way of presenting structured information. Components of information search engines have been created. Analytical tools for working with metathesaurus have been developed.

Conclusions. On the basis of the UNMN and the created tools, it is possible to automate the formation of a clinical picture of the disease (knowledge base) and single-platform development of the CDSS.

Full Text

Restricted Access

About the authors

Tat’yana V. Zarubina

Healthcare Digital Transformation Institute of the Pirogov Russian National Research Medical University (Pirogov Medical University)

Author for correspondence.
Email: t_zarubina@mail.ru
ORCID iD: 0000-0002-4403-8049
SPIN-code: 4354-3290

MD, PhD, Professor, Corresponding Member of the RAS

Russian Federation, Moscow

Svetlana E. Rauzina

Healthcare Digital Transformation Institute of the Pirogov Russian National Research Medical University (Pirogov Medical University)

Email: rauzina@mail.ru
ORCID iD: 0000-0002-9535-2847
SPIN-code: 1164-3516

MD, PhD, Associate Professor

Russian Federation, Moscow

Pavel A. Astanin

Healthcare Digital Transformation Institute of the Pirogov Russian National Research Medical University (Pirogov Medical University)

Email: med_cyber@mail.ru
ORCID iD: 0000-0002-1854-8686
SPIN-code: 2658-1189

PhD Student

Russian Federation, Moscow

Julia I. Koroleva

Healthcare Digital Transformation Institute of the Pirogov Russian National Research Medical University (Pirogov Medical University)

Email: koroleva_iui@rsmu.ru
ORCID iD: 0000-0003-3560-312X
SPIN-code: 4950-1854

MD, PhD, Associate Professor

Russian Federation, Moscow

Lev V. Ronzhin

Healthcare Digital Transformation Institute of the Pirogov Russian National Research Medical University (Pirogov Medical University)

Email: izopropylbenzol@gmail.com
ORCID iD: 0000-0002-4653-1611
SPIN-code: 5502-6792

Analyst

Russian Federation, Moscow

Alexsandr A. Borisov

Healthcare Digital Transformation Institute of the Pirogov Russian National Research Medical University (Pirogov Medical University)

Email: aleksandrborisov10650@gmail.com
ORCID iD: 0000-0003-4036-5883
SPIN-code: 4294-4736

Analyst

Russian Federation, Moscow

Maria A. Afanasyeva

Healthcare Digital Transformation Institute of the Pirogov Russian National Research Medical University (Pirogov Medical University)

Email: usovanastasija@gmail.com
ORCID iD: 0009-0002-2680-6291
Russian Federation, Moscow

Anastasia V. Usova

Healthcare Digital Transformation Institute of the Pirogov Russian National Research Medical University (Pirogov Medical University)

Email: usovanastasija@gmail.com
ORCID iD: 0009-0001-0625-1105
SPIN-code: 9109-8782
Russian Federation, Moscow

References

  1. Указ Президента Российской Федерации от 10 октября 2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации». [Decree of the President of the Russian Federation No. 490 of 10 October 2019 “O razvitii iskusstvennogo intellekta v Rossijskoj Federacii”. (In Russ.)] Available from: http://www.kremlin.ru/acts/bank/44731 (accessed: 02.10.2023).
  2. Гусев А.В., Владзимирский А.В., Шарова Д.Е., и др. Развитие исследований и разработок в сфере технологий искусственного интеллекта для здравоохранения в Российской Федерации: итоги 2021 года // Digital Diagnostics. — 2022. — Т. 3. — № 3. — С. 178–194. [Gusev AV, Vladzymyrskyy AV, Sharova DE, et al. Evolution of research and development in the field of artificial intelligence technologies for healthcare in the Russian Federation: results of 2021. Digital Diagnostics. 2022;3(3):178–194. (In Russ.)] doi: https://doi.org/10.17816/DD107367
  3. Искусственный интеллект поможет московским терапевтам в постановке диагнозов // Коммерсантъ. 08.09.2023. [Iskusstvennyj intellekt pomozhet moskovskim terapevtam v postanovke diagnozov. Kommersant. 08.09.2023. (In Russ.)] Available from: https://www.kommersant.ru/doc/6199795 (accessed: 02.10.2023).
  4. Гусев А.В., Астапенко Е.М., Иванов И.В., и др. Принципы формирования доверия к системам искусственного интеллекта для здравоохранения // Вестник Росздравнадзора. — 2022. — № 2. — С. 25–33. [Gusev AV, Astapenko EM, Ivanov IV, et al. Principles for building confidence in artificial intelligence systems for healthcare. Vestnik Roszdravnadzora. 2022;2:25–33. (In Russ.)]
  5. Поповьян Р.А., Будкова Н.Н., Раковский А.А., и др. Составление тезауруса — важный шаг по настройке работы информационной системы в любой области медицины // Врач и информационные технологии. — 2005. — № 4. — С. 57–61. [Popovyan RA, Budkova NN, Rakovskij AA, et al. Sostavlenie tezaurusa-vazhnyj shag po nastrojke raboty informacionnoj sistemy v lyuboj oblasti mediciny. Vrach i informacionnye tekhnologii. 2005;4:57–61. (In Russ.)]
  6. Морозов С.П., Владзимирский А.В., Шулькин И.М., и др. Исследование целесообразности применения технологий искусственного интеллекта в лучевой диагностике // Врач и информационные технологии. — 2022. — № 1. — С. 12–29. [Morozov SP, Vladzymyrskyy AV, Shulkin IM, et al. Feasibility of using artificial intelligence in radiation diagnostics. Medical doctor and information technology. 2022;1:12–29. (In Russ.)] doi: https://doi.org/10.25881/18110193_2022_1_12
  7. Нейросеть поможет врачам одновременно определять до 10 патологий на КТ-снимках // mos.ru. Новости. 27.07.2023. [Nejroset` pomozhet vracham odnovremenno opredelyat` do 10 patologij na KT-snimkakh. mos.ru. News. 27.07.2023. (In Russ.)] Available from: https://www.mos.ru/news/item/125792073/ (accessed: 02.10.2023).
  8. Компьютерное зрение поможет врачам в 29 направлениях лучевых исследований // mos.ru. News. 19.03.2022. [Komp`yuternoe zrenie pomozhet vracham v 29 napravleniyakh luchevy`kh issledovanij. mos.ru. News. 19.03.2022. (In Russ.)] Available from: https://www.mos.ru/news/item/103860073/?utm_source=search&utm_term=serp (accessed: 02.10.2023).
  9. Jing X. The Unified Medical Language System at 30 Years and How It Is Used and Published: Systematic Review and Content Analysis. JMIR Med Inform. 2021;9(8):e20675. doi: https://doi.org/10.2196/20675
  10. National Library of Medicine, USA, Unified Medical Language System (UMLS). Available from: https://www.nlm.nih.gov/research/umls/knowledge_sources/metathesaurus/index.html (accessed: 02.10.2023).
  11. Румянцев П.О., Бледжянц Г.А., Туманов Н.А., и др. UMKB-технология для создания «интеллектуальных» систем в области медицины // Здравоохранение. — 2015. — № 11. — С. 82–89. [Rumyanczev PO, Bledzhyancz GA, Tumanov NA, et al. UMKB-tekhnologiya dlya sozdaniya “intellektualnykh” sistem v oblasti medicziny. Zdravookhranenie. 2015;11:82–89. (In Russ.)]
  12. Maslova AY, Mishvelov AE, Dudusheva MJ, et al. Using a Decision Tree with a Feedback Function to Select Therapeutic Tactics for Viral Infection of the Respiratory Tract in the Medical Expert System. International Transaction Journal of Engineering, Management, & Applied Sciences & Technologies. 2022;13(8):1–10. doi: https://doi.org/10.14456/ITJEMAST.2022.157
  13. Грибова В.В., Окунь Д.Б. Онтологии для формирования баз знаний и реализации лечебных мероприятий в медицинских интеллектуальных системах // Информатика и системы управления. — 2018. — Т. 57. — № 3. — С. 71–80. [Gribova VV, Okun DB. Ontologies for the formation of knowledge bases about disease treatment in medical intelligent systems. Informatika i sistemy upravleniya. 2018;57(3):71–89. (In Russ.)] doi: https://doi.org/10.22250/isu.2018.57.71-80
  14. Переволоцкий В.С., Грибова В.В. Подход к автоматическому формированию баз знаний на основе онтологий // Научный аспект. — 2023. — Т. 2. — № 2. — С. 213–221. [Perevolockij VS, Gribova VV. Podhod k avtomaticheskomu formirovaniyu baz znanij na osnove ontologij. Nauchnyj aspekt. 2023;2(2):213–221. (In Russ.)]
  15. Москаленко Ф.М., Окунь Д.Б., Петряева М.В. База терминов для интеллектуальных медицинских сервисов // Системный анализ в медицине (САМ 2016): материалы X Международной научной конференции, 22–23 сентября 2016 г. — Благовещенск, 2016. — C. 155–158. [Moskalenko PM, Okun DB, Petryaeva MV. Terminology base for intelligent medical services. Sistemnyj analiz v medicine (SAM 2016): Materialy X mezhdunarodnoj nauchnoj konferencii; 2016 Sep. 22–23; Blagoveshchensk; 2016. P. 155–158. (In Russ.)]
  16. Мусаев А.А., Григорьев Д.А. Обзор современных технологий извлечения знаний из текстовых сообщений // Компьютерные исследования и моделирование. — 2021. — Т. 13. — № 6. — С. 1291–1315. [Musaev AA, Grigoriev DA. Extracting knowledge from text messages: overview and state-of-the-art. Computer Research and Modeling. 2021;13(6):1291–1315. (In Russ.)] doi: https://doi.org/10.20537/2076-7633-2021-13-6-1291-1315
  17. Катенко Ю.В. Применение методов машинного обучения для анализа текстовой информации // Охрана, безопасность, связь. — 2019. — № 4-3. — С. 90–94. [Katenko YuV. Application of machine learning methods for text information analysis. Ohrana, bezopasnost’, svyaz’. 2019;(4 Pt 3):90–94. (In Russ.)]
  18. Донитова В.В., Киреев Д.А., Титова Е.В., и др. Методы обработки естественного языка для извлечения факторов риска инсульта из медицинских текстов // Труды Института системного анализа Российской академии наук. — 2021. — Т. 71. — № 4. — С. 93–101. [Donitova VV, Kireev DA, Titova EV, et al. Natural language processing models for extraction of stroke risk factors from electronic health records. Proceeding of the Institute for Systems Analysis of the Russian Academy of Science. 2021;71(4):93–101. (In Russ.)] doi: https://doi.org/10.14357/20790279210410
  19. Тучкова П.А. Аннотирование документов и применение речевых технологий для решения задач обработки естественного языка в медицине // Наукосфера. — 2021. — № 9 (2). — С. 69–73. [Tuchkova PA. Text annotation and using speech technologies for solving natural language processing tasks in medicine. Naukosfera. 2021;(9Pt2):69–73. (In Russ.)] doi: https://doi.org/10.5281/zenodo.5531131
  20. Chute CG. Clinical classification and terminology: some history and current observations. J Am Med Inform Assoc. 2000;7(3):298–303. doi: https://doi.org/10.1136/jamia.2000.0070298
  21. Слепов А.Э. Модуль построения семантических запросов к онтологическим базам знаний // Наука настоящего и будущего. — 2022. — Т. 2. — С. 188–191. [Slepov AE. Module for constructing semantic queries to ontological knowledge bases. Nauka nastoyashhego i budushhego. 2022;2:188–191. (In Russ.)]
  22. Кукарцев В.В., Колмакова З.А., Мельникова О.Л. Системный анализ возможностей по извлечению именованных сущностей с применением технологии Text Mining // Перспективы науки. — 2019. — Т. 120. — № 9. — С. 18–20. [Kukarcev VV, Kolmakova ZA, Melnikova OL. System Analysis of Possibilities to Retrieve Essentials Using Text Mining Technology. Science Prospects. 2019;120(9):18–20. (In Russ.)]
  23. Орлова Д.Е., Падалко А.В. Использование аппарата семантических сетей для интеллектуальной поддержки принятия решений // Вестник Воронежского института высоких технологий. — 2021. — Т. 36. — № 1. — С. 61–65. [Orlova DE, Padalko AV. Using the semantic network apparatus for intelligent decision support. Bulletin Voronezh institute of high technologies. 2021;36(1):61–65. (In Russ.)]
  24. Кайда А.Ю., Савельев А.О. Применение графовой визуализации данных в системах поддержки принятия решений для решения задач автоматизации проведения исследований // Электронные средства и системы управления: материалы докладов международной научно-практической конференции. — 2020. — № 1-2. — С. 137–139. [Kajda AYu, Savelev AO. Primenenie grafovoj vizualizacii dannyh v sistemah podderzhki prinyatiya reshenij dlya resheniya zadach avtomatizacii provedeniya issledovanij. Elektronnye sredstva i sistemy upravleniya. Materialy dokladov mezhdunarodnoj nauchno-prakticheskoj konferencii. 2020;(1 Pt 2):137–139. (In Russ.)]
  25. Szárnyas G, Kővári Z, Salánki A, et al. Towards the characterization of realistic models: evaluation of multidisciplinary graph metrics. Proceedings of the ACM/IEEE 19th International Conference on Model Driven Engineering Languages and Systems (MODELS‘16); 2016 Oct 2. New York, NY; 2016. P. 87–94. doi: https://doi.org/10.1145/2976767.2976786
  26. Varghese J, Sünninghausen SS, Dugas M. Standardized Cardiovascular Quality Assurance Forms with Multilingual Support, UMLS Coding and Medical Concept Analyses. Stud Health Technol Inform. 2015;216:837–841.
  27. Мосалов О.П. Векторные представления ребер графа онтологии как инструмент для анализа и генерации новых данных // Информационно-технологический вестник. — 2021. — Т. 27. — № 1. — С. 93–101. [Mosalov OP. Edge embedding of ontology graphs as a tool for analysis and generation of new data. Informacionno-Tekhnologicheskij Vestnik. 2021;27(1):93–101. (In Russ.)]
  28. Семантическая платформа DataMonitor. [Semanticheskaya platforma DataMonitor. (In Russ.)] Available from: http://avicomp.ru/services/datamonitor (accessed: 02.10.2023).
  29. Портал нормативно справочной информации Министерства здравоохранения Российской Федерации. [Portal normativno spravochnoj informacii Ministerstva zdravoohraneniya Rossijskoj Federacii. (In Russ.)] Available from: https://nsi.rosminzdrav.ru (accessed: 02.10.2023).
  30. Kilicoglu H, Rosemblat G, Fiszman M, et al. Broad-coverage biomedical relation extraction with SemRep. BMC Bioinformatics. 2020;21(1):188. doi: https://doi.org/10.1186/s12859-020-3517-7
  31. Lang F, Mork JG, Demner-Fushman D, et al. Increasing UMLS Coverage and Reducing Ambiguity via Automated Creation of Synonymous Terms: First Steps toward Filling UMLS Synonymy Gaps. American Medical Informatics Association Annual Symposium; 2018. P. 1–26.
  32. Johnson AEW, Bulgarelli L, Shen L, et al. MIMIC-IV, a freely accessible electronic health record dataset. Sci Data. 2023;10(1):1. doi: https://doi.org/10.1038/s41597-022-01899-x
  33. Daniel G, Sunyé G, Cabot J. UMLtoGraphDB: Mapping Conceptual Schemas to Graph Databases. Lecture Notes in Computer Science. 2016;9974:430–444. doi: https://doi.org/10.1007/978-3-319-46397-1_33
  34. Масликова У.В., Супильников А.А. Технологии разработки программы содействия принятию решения в диагностике заболеваний системы крови с использованием сверточных искусственных нейронных сетей // Вестник медицинского института «Реавиз»: реабилитация, врач и здоровье. — 2020. — Т. 47. — № 5. — С. 138–150. [Maslikova UV, Supilnikov AA. Technologies for developing decision support systems for the diagnosis of blood disorders using convolutional neural networks. Bulletin of Medical University Reaviz. 2020;47(5):138–150. (In Russ.)] doi: https://doi.org/10.20340/vmi-rvz.2020.5.16
  35. Berger B, Waterman MS, Yu YW. Levenshtein Distance, Sequence Comparison and Biological Database Search. IEEE Trans Inf Theory. 2021;67(6):3287–3294. doi: https://doi.org/10.1109/ tit.2020.2996543
  36. Черкашин А.М. Применение метода расстояния Левенштейна библиотеки Fuzzywuzzy языка Python для исправления данных // Постулат. — 2021. — Т. 66. — № 4. — С. 11. [Cherkashin AM. Applying the Levenshtein distance method of the Python Fuzzywuzzy library to correct data. Postulat. 2021;66(4):11. (In Russ.)]
  37. Рубрикатор клинических рекомендаций Министерства здравоохранения Российской Федерации. [Rubrikator klinicheskih rekomendacij Ministerstva zdravoohraneniya Rossijskoj Federacii. (In Russ.)] Available from: https://cr.minzdrav.gov.ru/ (accessed: 02.10.2023).
  38. Астанин П.А. Применение автоматизированного анализа семантической сети UMLS для решения задачи поиска релевантных знаний о ревматических заболеваниях // Математическое моделирование систем и процессов: сборник материалов Международной научно-практической конференции. — Псков, 2022. — С. 6–12. [Astanin PA. Primenenie avtomatizirovannogo analiza semanticheskoj seti UMLS dlya resheniya zadachi poiska relevantnyh znanij o revmaticheskih zabolevaniyah. Matematicheskoe modelirovanie sistem i processov: Sbornik materialov Mezhdunarodnoj nauchno-prakticheskoj konferencii. Pskov; 2022. P. 6–12. (In Russ.)] doi: https://doi.org/10.37490/978-5-00200-102-6-6-12
  39. Ширинян М.В., Шустова С.В. Трудности медицинского перевода и способы их преодоления при обучении студентов неязыковых вузов // Язык и культура. — 2018. — № 43. — С. 295–316. [Shirinyan MV, Shustova SV. Trudnosti medicinskogo perevoda i sposoby ih preodoleniya pri obuchenii studentov neyazykovyh vuzov. Yazyk i kul’tura. 2018;43:295–316. (In Russ.)] doi: https://doi.org/10.17223/19996195/43/18
  40. Астанин П.А., Ронжин Л.В., Королева Ю.И. Модуль поиска кратчайшего пути между концептами семантической сети UMLS. Свидетельство о регистрации программы для ЭВМ № 2022684714. 16.12.2022. [Astanin PA, Ronzhin LV, Koroleva YuI. Modul’ poiska kratchajshego puti mezhdu konceptami semanticheskoj seti UMLS. Certificate of computer program registration RUS No. 2022684714. 16.12.2022. (In Russ.)] Available from: https://www.elibrary.ru/download/elibrary_49979662_35579965.PDF (accessed: 02.10.2023).
  41. Близнякова Е.А., Куликов А.А., Куликов А.В. Сравнительный анализ методов поиска кратчайшего пути в графе // Архитектура, строительство, транспорт. — 2022. — № 1. — С. 80–87. [Bliznyakova EA, Kulikov AA, Kulikov AV. Comparative analysis of methods for finding the shortest distance in a graph. Architecture, construction, transport. 2022;1:80–87. (In Russ.)] doi: https://doi.org/10.31660/2782-232X-2022-1-80-87
  42. Астанин П.А., Ронжин Л.В., Раузина С.Е. Модуль поиска релевантного окружения концептов семантической сети UMLS. Свидетельство о регистрации программы для ЭВМ № 2022684715. 16.12.2022. [Astanin PA, Ronzhin LV, Rauzina SE. Modul’ poiska relevantnogo okruzheniya konceptov semanticheskoj seti UMLS. Certificate of computer program registration RUS No. 2022684715. 16.12.2022. (In Russ.)] Available from: https://www.elibrary.ru/download/elibrary_49979663_14353005.PDF (accessed: 02.10.2023).
  43. Астанин П.А., Раузина С.Е., Зарубина Т.В. Автоматизированная система извлечения клинически релевантных терминов UMLS из текстов англоязычных статей на примере аксиального спондилоартрита // Электронный научный журнал «Социальные аспекты здоровья населения». — 2023. — Т. 69. — № 3. — С. 14. [Astanin PA, Rauzina SE, Zarubina TV. Automated system for recognizing clinically relevant UMLS terms in texts of the englishlanguage articles exemplified by axial spondyloarthritis. Social’nye aspekty zdorov’ya naseleniya [serial online]. 2023;69(3):14. (In Russ.)] doi: 10.21045/2071-5021-2023-69-3-14. Available from: http://vestnik.mednet.ru/content/view/1491/30/lang.ru (accessed: 02.10.2023).
  44. Astanin PA, Rauzina SE, Zarubina TV. Digital Tools in UMLS Metathesaurus Knowledge Processing. Studies in Health Technology and Informatics; 2023 Jun 29; Athens, Greece; 2023;305:186–189. doi: https://doi.org/10.3233/SHTI230458

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. Organization of thematic groups of terms in UMLS

Download (202KB)
3. Fig. 2. Examples of symmetrical (A), inverse (B) and homogeneous (C) connections

Download (117KB)
4. Fig. 3. Fragment of a graphical representation of the symptomatic “image” of peptic ulcer and chronic pancreatitis

Download (434KB)
5. Fig. 4. Patterns in graph analysis in relation to instrumental diagnostics of diseases (T060 “Diagnostic procedures”)

Download (85KB)
6. Fig. 5. Patterns in graph analysis in relation to laboratory diagnostics of diseases

Download (126KB)
7. Fig. 6. Variants of graph paths with the inclusion of root, end and intermediate UMLS concepts

Download (127KB)
8. Fig. 7. Graph contours surrounding the root concept

Download (129KB)
9. Fig. 8. Scheme for estimating the angular distance between concepts

Download (70KB)
10. Fig. 9. Fragment of the web interface of the working version of the prototype of the information retrieval system

Download (177KB)

Copyright (c) 2024 "Paediatrician" Publishers LLC



This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies