Средняя стоимость разработки одного лекарства сейчас составляет $2,6 млрд, подсчитали в Ассоциации фармацевтических исследований и производителей Америки (PhRMA). Платить приходится более чем дорого, однако чуть ли не половина всех средств, которые тратят компании на R&D, приходится на препараты, которые никогда не выйдут на рынок. На помощь игрокам рынка — фармацевтическим компаниям и фондам — приходят инновационные технологии, позволяющие снизить инвестиционные риски. Сделать это можно, автоматизировав анализ больших объемов данных, имеющих непосредственное отношение к фарминдустрии — патентов, описания клинических исследований, научных материалов и докладов, данных о разрабатываемых препаратах и даже пресс-релизов и постеров с конференций.
Квалифицировать цель
Именно такой сервис предлагает фармацевтической индустрии российский стартап Semantic Hub, работающий на рынке с 2015 г. Сегодня с помощью сервиса можно не только оценить перспективность фармацевтической разработки, тем самым снизив инвестиционные риски, но и подобрать «кандидатов» для вложений. При этом оценка разработок потребует в разы меньше времени, а главное, до 30% может снизиться вероятность ошибочного решения из-за простого пропуска важной информации.
«Речь идет о работе с текстом, с пониманием его смысла, когда из больших массивов неструктурированных текстов извлекаются самые разные сведения, и они превращаются в базу знаний», — говорит генеральный директор Semantic Hub Ирина Ефименко.
Компания предлагает рынку сразу два интеллектуальных продукта. Один из них ближе скорее к маркетинговым задачам, которые в рамках традиционного подхода решают медицинские директора. Речь идет о выявлении и анализе проблем и потребностей пациентов или врачей — к примеру, с помощью сервиса можно определить барьеры и драйверы в назначении препаратов, понять, почему придерживается пациент назначенной терапии или, наоборот, отказывается от нее. В данных целях проводится анализ пользовательского контента (форумов, соцсетей и т.д. ).
Другой продукт от Semantic Hub имеет прямое отношение к сфере R&D — речь идет о поиске перспективных фармацевтических разработок (это может быть инновационная молекула или уже известный рынку продукт, но с новыми свойствами). Задача может формулироваться и иначе — сервис также позволяет квалифицировать уже намеченные заказчиком потенциальные инвестиционные цели.
«Например, компания может рассматривать определенную разработку, думать, не вложиться ли в нее», — говорит Ирина Ефименко.
Именно в фармотрасли такое происходит крайне часто — на ранних стадиях разработки ведут обычно технологические стартапы или университетские лаборатории, однако процесс клинических испытаний оказывается под силу только крупным игрокам (прежде всего из-за их крайне высокой стоимости последних).
Безусловно, речь идет об анализе тех данных, которые уже существуют. Однако в известной степени компания моделирует и деятельность технологических скаутов, которые есть у всех крупных фармкомпаний, в том числе они ездят по конференциям и пытаются обнаружить потенциально прорывные, интересные разработки.
«Мы делаем примерно то же самое, только мониторя WEB», — говорит Ирина Ефименко.
Работа с поддержкой
«То, что мы делаем, это система поддержки принятия решений, — поясняет Ирина Ефименко. — Мы снимаем с эксперта рутинную работу, позволяем сосредоточиться на более интеллектуальных составляющих. Конечно, люди жили и без нас, как без любой другой автоматизации, однако именно в фармотрасли стоит задача анализа больших объемов информации, при этом крайне велика цена ошибки, поэтому именно здесь автоматизация очень полезна».
Фактически речь идет об оценке потенциала медпрепаратов и поиске перспективных разработок с помощью технологии искусственного интеллекта и анализа больших данных. Одним из компонентов системы является поисковый робот, или краулер, который подключается к авторитетным базам данных, патентов, статей, результатов клинических исследований для сбора информации. Может он подключаться и к медицинским порталам и форумам — все зависит от поставленной задачи. Несмотря на то, что сбор идет максимально широко, работа занимает считанные часы. После того как массив собранной информации очищается от «шелухи» (например, удаляются баннеры и ссылки), его анализирует лингвистический процессор.
«Это наш главный актив, ядро технологии: система, которая умеет понимать смысл текста», — говорит Ирина Ефименко.
Механизм работы чем-то напоминает ассоциативное мышление человека — например, если вы увидели в тексте незнакомое слово, начинающееся с большой буквы, а за ним будет следовать слово «Inc.» (incorporated), скорее всего, вы поймете, что речь идет о названии компании, сработает определенный паттерн. Примерно так же работает лингвистический процессор Semantic Hub. Например, из научной статьи о новом соединении система извлечет название молекулы, против чего она направлена (скажем, ревматоидного артрита), на каких моделях была протестирована и т.д. Для каждой предметной области («онкология» или «антибиотики») могут быть сотни типов объектов, фактов, характеристик, которые будут извлечены.
Поскольку информация из разных источников может быть противоречива, сервис также позволяет сделать оценку веса источника, «взвесить» информацию с точки зрения важности.
Заказ из-за границы
Вместе с Ириной Ефименко в число основателей проекта входят президент Национальной Ассоциации участников рынка робототехники Виталий Недельский (занимает должность директора по развитию Semantic Hub), а также директор по науке Владимир Хорошевский, известный ученый в области искусственного интеллекта. В числе инвесторов проекта Semantic Hub — Фонд развития интернет-инициатив (стартап прошел здесь акселерационную программу), предприниматели Валентин Дороничев (соучредитель сети «Инвитро» и инвестфонда Medme) и Владимир Преображенский (соинвестор стартапа «Мультикубик» и бывший главный финансовый директор «Вимм-Билль-Данна» и СУЭК). Минувшим летом все они совместно инвестировали в проект 24 млн рублей. До этого ФРИИ вкладывал в стартап 2,1 млн рублей в обмен на 7%-ую долю в компании.
Сегодня у Semantic Hub есть заказы в том числе от участников российского фармрынка. Правда, последних больше интересует маркетинговый продукт, а вот R&D-направление больше востребовано у клиентов из-за рубежа.
«В России фарминдустрия, к сожалению, не так хорошо развита, особенно, что касается R&D, но у нас уже намечаются первые контракты на мировом рынке», — уточняет Ирина Ефименко.
Средний чек для проекта в области R&D составляет около 100 тысяч евро (в случае с проектом в области маркетинга — несколько меньше). Стратегическим партнером Semantic Hub является фармацевтический гигант Bayer, с которым у стартапа есть несколько проектов, также он прошел внутреннюю акселерацию компании. Решения проекта уже оценили участники Global Pharma R&D Informatics Congress, который прошел в конце прошлого года в Португалии.
Компания планирует более активно развиваться на мировом рынке, включая азиатский. Сейчас платформа работает с английским и русским языками, также проект экспериментирует с китайским (саму платформу можно настраивать на разные языки).
Правильный курс
Сначала в Semantic Hub были проекты из самых разных отраслей, в том числе заказы приходили из нефтегазового бизнеса и горнодобывающих компаний. Первые проекты в области фарминдустрии появились уже в 2016 г.: так, совместно с сервисом Здоровье Mail.ru команда проанализировала сообщения пациентов и врачей. Окончательно выбрали отрасль уже в 2017-ом и, похоже, взяли правильный курс.
«Фармкомпании начинают использовать технологии искусственного интеллекта для разных стадий создания новых лекарственных препаратов — от создания молекул до клинических исследований. Главное преимущество их использования — снижение затрат на разработку», — говорит генеральный директор ООО «Интерлоджик» Сергей Сорокин.
«В индустрии накоплен огромный объем данных, и аналитика и предиктивное моделирование на основе данных могут быть полезны всем участникам рынка», — объясняет старший консультант практики IT и телекоммуникаций Odgers Berndston Ирина Милехина.
Пришло время их «умного» использования, уточняет она, в том числе для улучшения и ускорения разработки лекарств, для оптимизации и удешевления производственных процессов.
«Речь идет о миллиардах долларов для корпораций, которые они могут сэкономить или дополнительно заработать, и о миллиардах людей, которые могут получить точную своевременную медицинскую помощь», — считает Ирина Милехина.
«Данные в фарминдустрии и раньше нужно было правильно обрабатывать и интерпретировать, но с каждым годом развитие технологий позволяет работать с большими объемами данных продуктивней», — уточняет архитектор бизнес-решений КРОК Алексей Сидорин.
По его мнению, основными сценариями работы с большими данными в данной сфере станут сбор и анализ результатов клинических испытаний (pharma datalake), омиксные технологии, аналитические системы, объединяющие публикации и научные исследования по фарминдустрии, а также интеллектуальная оптимизация цепочек поставок и производства.
«На данный момент все эти сценарии находятся на начальной стадии развития, но имеют большой потенциал», — утоняет Алексей Сидорин.
Также он считает, что в перспективе использование больших данных в сфере фарминдустрии (и в исследованиях медпрепаратов в частности) станет обязательным на законодательном уровне. Очевидно, что технологические требования к фармацевтическим компаниям будут в результате только расти. Последние уже сегодня создают технологические подразделения, фокусирующиеся на разработке продуктов для внутреннего использования, в компаниях появляются и новые должности — бизнес-партнеры по большим данным. Подобный тренд инновационным стартапам, очевидно, только на руку.
Автор: Ольга Блинова