11.10.2025
Дамир Сухов, Партнер, руководитель направления «Здравоохранение и фармацевтика», Kept:
Дамир Сухов, Партнер, руководитель направления «Здравоохранение и фармацевтика», Kept:
«Мы проводили исследование рынка медицинских данных в России. Делали это при поддержке наших партнеров - Ассоциации «Инфарма», IPM, Ассоциации «Альянс в сфере искусственного интеллекта» и АНО «Цифровая экономика». Мы посмотрели на рынок медицинских данных и поняли, что есть отдельные публикации, но [нет] всеобъемлющего подхода, что такое есть рынок [медданных], какой он в количественном выражении, какие у него тренды и игроки»
«Рынок накапливает большие объёмы медицинских данных. Если посмотреть на его выражение, то мы видим, что в 2021 году объём электронных медицинских данных (единиц, которые есть в ЕГИСЗ) - это было 76 млн. Сейчас, в 2024 году, это уже 1,7 млрд, это официальные данные Минздрава. В 2027 году прогнозируется его увеличение практически на 50%. Есть отдельный массив данных страховых компаний, данных, которые можно снимать с электронных цифровых устройств. Мы все понимаем важность медицинских данных – это большой потенциал, который может работать на цели пациентов, государства, фармацевтической индустрии. Это помогает улучшать эффективность врачей, разрабатывать новые методы лечения, оптимизировать бюджеты на медицинскую помощь»
«Какая основная сложность? В настоящее время отсутствует единый механизм доступа к этим данным. В таких условиях, если есть потребность, компании инициируют такие проекты, обмениваются данными. Благодаря таким инициативам и стал формироваться этот рынок»
«В денежном эквиваленте рынок медицинских данных, по нашим оценкам, составляет от 2 до 4 млрд рублей на сегодняшний момент. Его темп роста исторически, на протяжении последних трех лет, составляет порядка 10%. <...> Темп роста небольшой, но он небольшой ровно потому, что есть определенные ограничения и барьеры, которые не дают возможность рынку полноценно заработать. Если рынок полноценно заработает, это будет в разы больше»
«Кто эти основные игроки рынка? Это государство, как оператор большого массива данных, которые есть в ЕГИСЗ, фармацевтические компании, которые регулярно приобретают данные, - они нужны им для анализа эффективности лекарственных препаратов и планирования разработок, это разработчики решений искусственного интеллекта - им нужна эта информация для обучения этого ИИ и для совершенствования его алгоритмов, это производители медицинских изделий и оборудования, частные разработчики информационных систем» .
«Какие барьеры? В первую очередь, это правовые ограничения, которые есть в настоящий момент и отсутствие критериев отнесения информации к сведениям о состоянии здоровья. Есть врачебная тайна, есть персональные данные. Со всеми этими вопросами необходимо разобраться. Есть определенные инициативы, например, по внедрению экспериментального правового режима, в рамках которого можно передавать в течение трех лет обезличенные данные»
«Также неоднородное качество медицинской информации, недостаточный уровень ее полноты. Сейчас многие медицинские учреждения заполняют фрагментарно эти данные. У нас есть не всё: не того качества, неполная информация. А это очень важно, чтобы медицинские данные стали полезными, чтобы их могли использовать»
«Недостаток мощностей для хранения данных. <...> Это большие массивы данных. А если говорим о радиологии, то здесь в несколько раз возрастают требования к мощности и хранению. Здесь нужно думать, как решать вопрос: возможно, строительство ЦОДов, увеличение мощностей»
«Не все осознали, что данные – это будущее, они нужны. На фоне динамичных темпов цифровизации расширяется перечень инициатив, по которому информация становится более доступной. Если она становится более доступной, мы приходим к формированию централизованной платформы доступа к медицинским данным, которая позволит как повысить удовлетворенность медицинскими услугами, и внедрить новые технологии, и государству решить определенные задачи»
«Потенциально это действительно большой сегмент – при снятии барьеров он может кратно вырасти, в долгосрочной перспективе оказать большой экономической эффект для страны – пока нет такой оценки, насколько может [вырасти] экономия государственного бюджета. <...> В ЕС есть подобная централизованная система, к ней подключены 180 организаций, порядка 30 стран. За 10 лет экономия порядка 11 млрд евро – принесла экономического эффекта. В России большой рынок, у нас тоже большое будущее в этом плане существует»
Александр Храмов, Главный научный сотрудник ФГАУ «ЦИТ», профессор, член-корреспондент РАН:
«Есть несколько основных источников данных, которые активно анализируются и собираются. В первую очередь, это электронные медицинские карты - бесценный источник информации о пациенте. Эти данные важны в контексте того, что современные большие языковые модели хорошо умеют работать с такими типами данных. До недавнего времени такие данные были не упорядочены и полны пустот. К ним испытывали большой скептицизм, в плане того, что из них можно извлечь какую-то полезную информацию <...> На современном этапе с развитием больших языковых моделей такие проблемы исчезают, и электронные медицинские карты все чаще являются тем источником информации, с которого черпают сведения разработчики сети, врачи»
«Второй момент – геномные данные. В настоящий момент все больше и больше происходит секвенирование. И зарубежом есть огромные базы данных. И в России тоже есть игроки, которые обладают большими датасетами, связанными с анализом генетических профилей пациента. Эти данные тоже являются бесценными для здравоохранения»
«Еще один тренд - данные с носимых устройств. Это связано с тем, что появилась возможность сделать клинику без границ. <...> Это мощный вызов к задачам, связанных с телемедициной, непрерывным контролем пациента. Это источники данных. На самом деле в медицине часто хочется хранить сырые данные, не обработанные, потому что очень много гипотез и подходов, где одни и те же данные могут рассматриваться по-разному. Выводы из этих данных могут быть не связаны с какой-то конкретной нозологией. Поэтому хранение в «озёрах данных» — это тренд именно в работе с медицинскими данными. Это, например, отличает их от индустрии, где в промышленности мы обычно понимаем, какие данные надо хранить – это автоматически обеспечивает нам меньшие объёмы хранения и передачи данных. Если мы имеем какую-то нозологию и понимаем, что нам не надо хранить все объемы данных, а достаточно получить какую-то более-менее структурированную сущность, то в этом случае мы можем перейти к более компактному и удобному для дальнейшего анализа хранению данных.
Всё это в современном мире делается на основе облачных платформ, где существует возможность масштабировать решения, при определенной гибкости обрабатывать в реальном времени, особенно если это данные с носимых устройств. Такие подходы позволяют развивать продвинутые методы, например, федеративного обучения, не забирая данные из конкретных клиник, когда имеется сервер федеративного обучения. <...> Это увеличивает безопасность данных, уходят некоторые вопросы, связанные с персональными данными. Это перспективные подходы в развитии данных медицины»
«В настоящее время мы имеем возможность использовать классические подходы машинного обучения для задач предиктивной медицины – предсказания успеха каких-либо вмешательств, качества реабилитации, выявления пациентов группы риска. Второй важный момент – сегментация пациентов, в том числе на основе электронных медицинских карт, где можно выявлять более перспективные стратегии лечения пациентов»
«Large Language Models (Большие языковые модели) завоевывают рынок ИИ, поэтому обработка естественного языка - тоже тренд в аналитике ИИ в медицине. <…> Возможности здесь огромные: это работа с неструктурированной информацией, которая позволяет вытащить те недоработки, которые сделаны врачом. Можно выявить общие тенденции и автоматизировать процессы клиники, снять количество рутины с плеч заведующего отделением, главной медсестры за счет заказов лекарств, расходников. Это то, с чем ЛЛМ модели справляются»
«Как это можно применить к фармацевтической промышленности? Есть два аспекта. Первый – связан с R&D. Мы можем сделать разработки новых лекарств и выявление новых биомаркеров. Это анализ геномных данных для поиска новых мишеней для лекарств. <...> Второй момент: с использованием ИИ и больших данных мы можем эффективно планировать дизайн клинических исследований»
Илья Кананыкин, Директор, Ассоциация больших данных:
«Проблема большого количества отраслей в том, что те, у кого становится все больше данных, — с ними сложнее конкурировать. И стартап не может без данных, в том числе в медицине, это не исключение. Он не может конкурировать с каким-нибудь гигантом, которому эти данные доступны. Поэтому вся история, связанная с движением в сторону обмена, взаимодействия и доступной аналитикой данных, – это безусловно единственный правильный путь. Важно, что мы идем в этом направлении»
Вадим Кукава, Исполнительный директор, ИНФАРМА:
«Мы последние полгода или даже больше ведем диалог с Минздравом России с тем, чтобы мы, как фармпроизводители Российской Федерации, могли получить доступ к единому цифровому контуруи получать оттуда эти данные. И вот здесь, все понимают, что это благо для всех: для пациентов, производителей, государства. Но пока технически мы не можем добиться, чтобы нам этот доступ был предоставлен»
Александр Мартыненко, Директор по индустриальным вопросам и лекарственной доступности, Ассоциация международных фармацевтических производителей:
«Важно выработать единые требования и отраслевые стандарты для формирования датасетов. Это унификация форматов данных из разных источников. То, чего сейчас нет во многих медицинских массивах.
Это отработка работы дата-посредников для аккумуляции обезличенных данных. Введение понятия анонимизации и псевдонимизации. Потребуется возможность обработки обезличенных медицинских данных без согласия субъекта, персональных данных. Без этого дальше система не двинется. Но, как минимум, это нужно для анализа данных реальной клинической практики, для обучения искусственной интеллектуальной системы.
Риски и обезличивание датасетов, система разработки таких рисков, их оценки и обязанности оператора осуществлять такую оценку — это тоженеобходимый элемент. И уже после этого можно двигаться дальше: определить модель хранения. Будет эта модель централизованной или децентрализованной?»
«Широкое внедрение ИИ в медицине неизбежно, но оно не должно стать полной заменой думающему, знающему врачу. И систему медицинского образования далее нужно выстраивать с учетом этого факта»
*Пресс-релиз носит справочно-информационный характер


