Нейросеть обучили распознавать жалобы на лекарства в соцсетях
Группа российских исследователей обучила нейронную сеть анализировать мнения пользователей соцсетей об эффектах лекарств. Основной целью ученых было преодолеть терминологический разрыв между пациентами и профессионалами в области здравоохранения. На примерах базы данных на английском языке нейронную сеть обучили превращать текст обычных людей в формальный медицинский язык. Результаты опубликованы в Journal of Biomedical Informatic. Работа поддержана грантом Российского научного фонда.
Социальные сети — практически неисчерпаемый источник мнений по широкому кругу вопросов. Люди пишут о своей работе, отношениях и в том числе жалуются на проблемы со здоровьем. По сути, социальные сети предоставляют огромные наборы данных мнений вместе с демографической информацией и другими данными о пользователе.
Хотя ученые часто используют интеллектуальный анализ текстов (text mining) в социальных сетях для перепрофилирования лекарств и генерации гипотез, мало кто сопоставлял пользовательские фразы с профессиональными терминами. Задача сопоставления упомянутого пользователем заболевания с конкретным медицинским термином называется нормализацией медицинских концептов. Сложность в том, что профессиональная медицинская лексика редко совпадает с повседневной, которую используют люди в общении. Чтобы решить эту проблему, российские исследователи использовали последовательное обучение рекуррентных нейронных сетей и семантическое представление однословных и многословных выражений.
«Важность работы определяется постоянно растущей потребностью в анализе текстовых данных. Мы живем в условиях информационного взрыва, когда количество информации удваивается каждые несколько лет, и человек или даже коллектив людей уже не способен обработать все доступные данные, — говорит соавтор работы Елена Тутубалина из Казанского федерального университета. — В нашем проекте используются методы анализа текстов и машинное обучение для извлечения полезной информации из доступных данных, как, например, в этом случае, где мы извлекали упоминания о побочных лекарственных реакциях из сообщений, которые люди пишут в социальных сетях».
По мнению авторов работы, непрерывное развитие и улучшение точности интеллектуального анализа текстов сообщений пациентов в социальных сетях окажет значительное влияние на изучение влияния лекарств на организм, повторное назначение лекарств и понимание лекарственных эффектов в контексте других факторов, таких как одновременный прием разных препаратов, диета и образ жизни.
В исследовании принимали участие ученые Казанского федерального университета, НИЦ «Курчатовский институт», Первого МГМУ имени И.М. Сеченова, Санкт-Петербургского отделения Математического института имени В.А. Стеклова РАН (ПОМИ РАН) и Московского физико-технического института (МФТИ).
Понравился материал? Добавьте Indicator.Ru в «Мои источники» Яндекс.Новостей и читайте нас чаще.
Пресс-релизы о научных исследованиях, информацию о последних вышедших научных статьях и анонсы конференций, а также данные о выигранных грантах и премиях присылайте на адрес science@indicator.ru.