Недавно интернет всколыхнула новость, что в китайской школе искусственный интеллект с помощью видеокамер следит за вовлеченностью учащихся. В конце урока преподаватель получает полную статистику и ранжирование школьников. Эксперимент вызвал много технологических и этических вопросов. Между тем в России их уже успешно решили. Профессор, руководитель департамента анализа данных, принятия решений и финансовых технологий Финансового университета, д.э.н. Владимир Соловьев рассказал, зачем и как следить за учащимися и каких результатов можно добиться от вовлеченных студентов.
— Владимир, в России действительно научились следить за студентами?
— Китайские разработчики вслед за нами такую систему сделали. У них пока только в одном классе видеораспознавание вовлеченности развернуто. У нас уже целый корпус подключен, на очереди — другие.
— Чего с помощью этого хотите добиться?
— Важно узнать, что происходит в аудиториях, насколько вообще нужны лекции, семинары, интересно ли студентам… Сейчас вы можете зайти в YouTube и посмотреть лекцию великого человека на любом языке. В интернете есть информация, как правило, более актуальная, чем в голове у преподавателя. Зачем студенту ходить на занятия? Дискуссии об этом ведутся достаточно давно. И, конечно, учебным заведениям не хочется терять монополию на знания.
Поэтому с 1980-х годов исследователи в области образования озабочены тем, как измерять вовлеченность студентов, как управлять ею. Много было методов — от психологических тестирований до исследований с помощью нейрофизиологических датчиков.
— Потом появилось компьютерное зрение…
— Проект начался с моего скепсиса: я был уверен, что Интернет вещей может быть полезен, например, на промышленном предприятии, где датчики, подключенные к резервуарам, будут подавать сигнал о необходимости их очистки. А нам в университете эта технология зачем? Автоматически включать свет в аудиториях, когда стемнеет? И так несложно нажать кнопку.
Но поскольку мы ориентированы, прежде всего, не на образовательный процесс, а на создание различных решений для реального сектора, мы хотели отработать компетенцию, чтобы прийти на какой-то химический комбинат, сказать, что мы в Интернете вещей разбираемся и вам поможем. Начали мы с того, что поставили датчики света, датчики движения. Год назад в одной из аудиторий мы повесили видеокамеру, которая постоянно фиксировала лица. Эти изображения сравнивались с кампусной базой данных. Сначала мы думали, что с ее помощью можно контролировать посещаемость, но это было скучно. Сценарий применения нашелся более интересный. Мы натренировали модель машинного обучения, показывая ей фото студентов, когда они вовлечены и когда нет, и система стала автоматически измерять уровень вовлеченности. В итоге мы поставили видеокамеры более чем в 50 аудиториях, и теперь знаем, где проходят самые интересные занятия.
Наша система умеет больше, чем китайские и американские системы, измеряющие индивидуальную вовлеченность конкретного студента. Уникальность нашей системы в том, что вся информация собирается на дэшборды, и можно посмотреть динамику средней вовлеченности во всем университете, сравнить между собой факультеты или курсы. Если вдруг цвет на интерактивной панели сменился с зеленого на красный, мы можем посмотреть глубже и увидеть, что, по-видимому, какая-то проблема произошла в одной из групп на третьем курсе. Остается эту проблему выявить и решить. Нет цели уволить каких-то преподавателей или отчислить студентов, система нужна для другого — оперативного выявления изменений качества занятий.
Мы выделили разработку системы в стартап. Пока еще мы систему подстраиваем, постоянно доучиваем, но за год мы уже набрали достаточный набор данных, чтобы хорошо определять настрой любых людей.
— Кто мог бы стать потребителем?
— Мы собираемся продавать решение в другие учебные заведения. Кроме того, инструмент идеален для любой клиентской аналитики. Например, менеджер автосервиса с клиентом разговаривает или операционист в отделении банка с бабушкой, система оценит изображения и подаст сигнал, если эмоции клиента изменились.
— Разве здесь нет этической проблемы?
— Этическая проблема, естественно, существует. У нас студенты подписывают согласие на сбор данных. Вначале, естественно, были и студенты, обещавшие перейти в другие вузы, где за ними не следят. Но никто не ушел. Видимо, все-таки понятно, что использование таких систем улучшает образовательный процесс и в конечном счете улучшает результат этого процесса — человеческий капитал выпускников.
— Вы сказали, что выделили это решение в стартап. То есть обучение в университете — это побочный продукт производственной деятельности?
— Скорее, обучение совмещено с проектной деятельностью. Мы стараемся зарабатывать созданием и реализацией интеллектуальных систем и сервисов, активно вовлекая в разработку студентов. Здесь у университета появляется возможность конкурировать с системными интеграторами, которые набирают команды под проекты, а по окончании либо платят им за простой, либо увольняют. А у нас, если студенты в проекте, они получают зарплату. Если проекта нет, то они просто учатся. Основной костяк — это первый курс магистратуры и второй-третий курс бакалавриата.
— Что интересного для рынка уже смогли придумать студенты?
— Например, в интересах «Альфа-Капитала» мы сделали робота, который определяет моменты начала и конца рыночных трендов. Управляющие компании заинтересованы в инструменте, который определяет, когда соответствующий актив нужно купить и когда его нужно продать. Человеку-трейдеру достаточно неплохо удается определить момент начала. Он, может, опоздает на день-два, что не сильно страшно, потому что тренд, как правило, достаточно длинный. А вот определить момент конца человеку сложно, потому что все люди делятся на два типа: осторожных (которые закрывают позиции слишком рано) и склонных к риску (которые опаздывают и продают актив, когда верхняя точка уже пройдена и началось падение цен). Наш алгоритм лишен нервов и поэтому справляется гораздо лучше. На европейских бумагах наша модель стабильно демонстрирует 30-процентный доход.
— На какие индикаторы робот обращает внимание?
— Он основывается на данных о прошлых торгах — ценах открытия и закрытия, минимальной и максимальной цене и объемах торгов за каждый день. На этих временных рядах эксперты — реальные трейдеры — разметили моменты начала и конца прошлых трендов. Натренированный на размеченных данных алгоритм машинного обучения каждый день для произвольно выбранного инструмента говорит, останется ли рыночная фаза такой же, как была вчера, или сменится.
— Можно ли эту модель использовать для рынка криптовалют, или данных пока мало?
— Данных по биткоину вполне достаточно. Проблема в том, что профессиональные трейдеры криптовалютой пока мало интересуются, а у любителей нет денег на то, чтобы нашу модель купить. Но вполне возможно, что она будет работать.
У нас про биткоин есть совершенно другая идея, над которой мы сейчас работаем — строим имитационную модель. Создается «аквариум», в него запускаются «рыбки», пишутся правила, по которым они живут, и дальше можно смотреть, как будет вести себя рынок, если на нем будет столько-то маркетмейкеров, столько-то ценных бумаг. Такие модели для традиционных рынков, для рынков акций прежде всего, давно и успешно применяются профессиональными инвесторами. Мы делаем «аквариум» для рынка криптовалют. Но в отличие от рынка акций, в мире криптовалют отсутствует человеческий фактор: все правила поведения агентов жестко зафиксированы в протоколе. Пока эта модель у нас еще в разработке, но мы ожидаем, что с ее помощью можно будет очень точно моделировать поведение криптовалютных рынков.
— Если все будут применять похожие модели, то волатильность возрастет?
— Нет, волатильность не увеличится, уменьшится доход. Сверхдоход, который обладатель эффективной модели прежде получал один, с распространением этого инструмента будет делится на двоих, на троих… В итоге рынок подстроится.
— То есть нужна будет новая модель?
— Да, нельзя быть хитрым один раз, надо все время быть хитрым. Это означает, что у нас будут заказы и дальше.
— В каких еще проектах принимали участие ваши студенты?
— Мы со студентами разработали интересную технологию визуализации геопространственных данных на тепловых картах. Одно из приложений: интерактивная карта спроса на антигистаминные препараты, заменяющая не всегда понятный экселевский файл, — на интерактивной карте Москвы в режиме реального времени показаны очаги аллергии, то есть спроса на соответствующие препараты. На такой карте четко видно, в какие аптеки нужно подвести много «ящиков со снарядами», а в каких аптеках препарат не пользуется спросом.
Для этой же технологии мы придумали еще один сценарий. Для одной из страховых компаний мы проводили анализ факторов, влияющих на количество дорожно-транспортных происшествий. Попутно разработали инструментарий визуализации того, что происходит на дорогах города, и выяснили очень интересные факты. Оказывается, в Москве есть целые районы, где много автомобилей, случаются аварии, но при этом очень мало ДТП, связанных с наездами на человека.
Это говорит о том, что там правильнее организовано дорожное движение: есть подземные переходы, нет возможности выбежать на проезжую часть и так далее. Этот инструмент и данные пригодились бы не только страховым компаниям, но и всем, кто отвечает за дорожное движение в городе.
Еще одно наше решение для транспорта — система, которая, используя открытые картографические данные, измеряет скорость транспортных потоков в любой точке с точностью плюс-минус 5 км/ч. Себестоимость его — 2-3 месяца труда нескольких студентов под руководством преподавателя. А сейчас для таких же целей «Росавтодор» закупает датчики стоимостью около 400 тысяч рублей за штуку. И таких датчиков на все российские дороги требуется очень много!
Недавно ребята начали работу над фильтром групповых сообщений в мессенджерах. С идеей выступил один преподаватель, у которого есть маленькие дети — воспитанники детского сада. Отец состоит в родительских чатах, в которые часто приходят групповые сообщения, ему совершенно неинтересные, но бывают и такие сообщения, которые касаются его детей. Вместе со студентами они сделали фильтр, через который проходит только действительно важная информация. Думаю, что продукт будет востребован!
Беседовала Анна Орешкина
О том, что можно узнать о пользователе социальной сети по его профилю — читайте в интервью основателя компании SocialDataHub Артура Хачуяна, в прошлом – сотрудника агентства Тины Канделаки «Апостол», а сегодня – одного из ведущих игроков российского рынка BigData-аналитики.