ИИ за последние 5 лет стал на 9% точнее выявлять рак кожи

Пузырьковая диаграмма средней точности различных алгоритмов нейронной сети, обученных на бинарных дерматологических базах данных за последние пять лет

Исследователи проанализировали научные статьи о диагностике рака кожи с помощью технологии искусственного интеллекта и выяснили, что чаще всего для этой цели используются сверточные нейросети, основанные на глубоком обучении. При этом самый точный результат (93% точности) дают системы, основанные на машинном обучении, что делает их наиболее предпочтительным методом диагностики. Кроме того, за последние 5 лет точность таких алгоритмов повысилась более чем на 9%. Результаты исследования, поддержанного грантом Президентской программы Российского научного фонда (РНФ), опубликованы в журнале Computers in Biology and Medicine.

Рак кожи — один из самых распространенных типов рака, поскольку он составляет более 40% от всех выявленных онкологических заболеваний. Рак кожи тяжело диагностировать на начальных стадиях, потому что злокачественные формы пигментации можно спутать с доброкачественными, которые есть у всех людей — например, родинками. При этом ранняя диагностика крайне важна, поскольку в этом случае выживаемость пациентов составляет около 99%. Если же выявить заболевание на более поздних стадиях, когда злокачественный характер пигментации становится очевиден (появляется зуд, язвы или корочки, неоднородный темный цвет), выживаемость снижается до 27%.

В основном рак кожи диагностируют с помощью дерматоскопа — прибора, который позволяет подсветить потенциальное новообразование и рассмотреть его с десятикратным увеличением. Точность такого анализа составляет 65–75%. Для помощи врачам в ранней диагностике иногда применяются системы искусственного интеллекта: они сравнивают родинку, которую «видят» у пациента, с набором из десятков тысяч фотографий пигментных пятен из медицинских баз. Чаще всего для диагностики рака кожи используются сверточные нейросети, хотя они не всегда демонстрируют высокую точность. Отчасти проблема точности связана с тем, что не во всех базах данных изображения уже отмечены как злокачественные или доброкачественные, из-за чего данных для обучения алгоритма может быть недостаточно. Кроме того, фотографии не стандартизированы, что также уменьшает достоверность диагностики с помощью искусственного интеллекта.

Ученые из Северо-Кавказского Федерального университета (Ставрополь) проанализировали более 10 000 научных статей, выпущенных с 2019 по 2023 год, и выбрали 171 статью, в которой была четко прописана методология диагностики рака по фотографиям пигментных пятен. Далее авторы сгруппировали статьи по тому, какой алгоритм искусственного интеллекта использовался. Они выделили пять групп: алгоритмы машинного обучения, сверточные нейросети, ансамбли нейронных сетей, мультимодальные нейросети и продвинутые интеллектуальные методы. Алгоритмы машинного обучения основаны на том, что программа «тренируется» распознавать опухоли на наборе снимков, где каждая фотография подписана человеком как изображающая злокачественное или доброкачественное новообразование, а затем ищет закономерности на новых фотографиях новообразований. Сверточные нейросети распознают изображения, разбивая их на слои, в которых можно затем менять контрастность, яркость, цветовую гамму без потери качества изображения. Ансамбли нейронных сетей — это сочетание нескольких моделей, которые обучаются отдельно разным операциям, а затем объединяются. Мультимодальные нейросети одновременно работают с разными типами данных (текст, цифры, фотографии), а продвинутые интеллектуальные методы основаны на других принципах обучения, например, преобразовании изображений в векторы.

Оказалось, что лишь в 7% работ ученые использовали мультиклассовые базы данных, в которые входили не только фотографии пигментных пятен, но и результаты биопсии (например, анализ крови на онкомаркеры, на общий белок, изучение формы клеток во взятом у пациента образце кожи). Авторы заключили, что для повышения точности диагностики база данных должна включать, помимо этих признаков, информацию о пациенте — его возраст, пол, тип кожи и анатомическое расположение родинки. Эти данные есть не всегда, поскольку, хотя имеются рекомендации по сбору биомаркеров рака, единых стандартов наборов данных пока не существует.

В 39% исследований алгоритм сравнивал фотографию с базой данных, в которой содержалось менее 1000 изображений, что в 10 раз меньше, чем нужно для качественной выборки. Поэтому даже если точность диагностики рака у алгоритма в самом исследовании высокая, на практике, когда через алгоритм будут проходить данные сотен пациентов, возможно, точность будет ниже. Ученые также установили, что чаще всего для диагностики рака кожи — в 39% случаев — используются сверточные нейронные сети, тогда как анализ показал, что самая высокая точность — на 3% выше, чем у сверточных нейросетей — достигается алгоритмами с машинным обучением.

Авторы выяснили, что за последние пять лет средняя точность распознавания рака кожи у моделей, основанных на машинном обучении, увеличилась на 9,2%, достигнув 93%, а ансамблевых — только на 3%. При этом точность мультимодальных нейронных сетей упала на 9,7%, а сверточных нейросетей — на 1%. Также исследователи определили, что для работы алгоритмы искусственного интеллекта чаще всего (37% из всех исследований на основе мультиклассовых баз) пользуются базой изображений HAM10000, в которой содержится 10 000 фотографий семи типов новообразований кожи у людей разных национальностей. Использование этой базы данных повышает среднюю точность диагностики с использованием искусственного интеллекта: так, за последние пять лет ее качество возросло на 6,9% до 92,3% в среднем для разных алгоритмов.

«Результаты, которые мы получили, показывают огромный потенциал автоматизированной ранней диагностики рака кожи на основе искусственного интеллекта. Однако подобные системы все еще несут в себе этическую и юридическую двусмысленность, а также проблему отсутствия большого количества стандартизированных клинических баз данных. Поэтому иногда модель диагностирует предвзято, опираясь на диагноз, преобладающий в используемой базе данных. В результате обобщить критерии диагностики с помощью искусственного интеллекта пока нельзя. В дальнейшем нужны исследования, которые помогут понять, как внедрить алгоритмы искусственного интеллекта для вспомогательной медицинской диагностики, в частности, для того, чтобы точнее выявлять рак кожи на ранних стадиях», — рассказывает руководитель проекта, поддержанного грантом РНФ, Павел Ляхов, кандидат физико-математических наук, заведующий кафедрой математического моделирования Северо-Кавказского федерального университета.

Автор: Indicator.Ru