Обзор методов связывания текстовых записей |
Некоторое время назад я стал участником проекта по разработке программного продукта, предназначенного для анализа поступающих из медицинских организаций записей о пациентах и данных об их состоянии здоровья с целью формирования единой медицинской карты. Долгое время команда не могла выработать подход к объединению данных пациентов. Отправной точкой послужило изучение исходных кодов решения Open EMPI (Open Enterprise Master Patient Index), которые подтолкнули нас к алгоритмам анализа похожести строк. С этого момента началось более глубокое изучение материалов, позволившее создать сначала макет, а потом и рабочее решение.
До сих пор, на разного рода презентациях приходится слышать много вопросов о логике работы подобных продуктов, из чего я делаю вывод, что обзор методов связывания текстовых записей будет интересен широкому кругу читателей.
Материал представляет собой перевод статьи wikipedia «Record linkage» с авторскими правками и дополнениями.
Читать дальше ->https://habr.com/post/417465/?utm_source=habrahabr&utm_medium=rss&utm_campaign=417465
Комментировать | « Пред. запись — К дневнику — След. запись » | Страницы: [1] [Новые] |