ENG

Перейти в Дзен
Технологии

МФТИ открыл библиотеку для чат-ботов

Лаборатория глубинного обучения нейросетей МФТИ получила 505 млн руб. в рамках госпрограммы «Национальная технологическая инициатива» на проект развития системы с искусственным интеллектом, способной общаться с людьми на естественном языке. Проект, развиваемый на принципах open source, называется iPavlov и представляет собой открытую библиотеку, позволяющую разработчикам диалоговых систем делать их более умными. Сегодня к софинансированию iPavlov присоединился также Сбербанк, у которого на него свои планы. О ходе реализации проекта iPavlov «Инвест-Форсайту» рассказала заместитель руководителя Neural Networks and Deep Learning lab at MIPT (Лаборатории глубинного обучения нейросетей МФТИ) Ольга Кайрова.

Чего хочет Сбербанк

Соглашение о развитии проекта iPavlov Сбербанк и МФТИ подписали в 2017 году. Оно предполагает, что на базе iPavlov к 2020 году будет создана платформа DeepReply — искусственный интеллект, который будет общаться с клиентами Сбербанка, помогая им решить возникшие вопросы за счёт анализа данных банка. На первый взгляд, заменить живого сотрудника банка искусственным интеллектом сравнительно легко: работники банка и так говорят по шаблону. Общение банка с клиентами уже в высокой степени автоматизировано. Напрашивается следующий шаг — заменить человека роботом. Человеку должны остаться только сложные случаи, когда машина не может понять, что посетителю нужно. Хотя создатели iPavlov мечтают создать чат-бота, который сможет отвечать в том числе на нестандартные вопросы.

Кстати, недавно Сбербанк объявил о создании робота-аватара Ники, способной отвечать на вопросы и даже проявлять эмоции, но пока это только прототип, и он как раз использует для диалога библиотеку iPavlov. Для Сбербанка МФТИ разрабатывает целое семейство прототипов общающихся роботов — как для внутренних, так и для внешних коммуникаций. Перспективы искусственного интеллекта в банковском деле можно увидеть в сбербанковской презентации: якобы уже через пять лет робот сможет общаться с клиентом в его автомобиле, объяснять, почему не стоит покупать проехавший мимо автомобиль, одновременно напоминая о распродажах любимого вина, необходимости сдать анализы и приглашая зайти в офис по поводу будущей пенсии.

 Чат-бот, говорящий по-русски

Сейчас на рынке доминируют чат-боты, работающие внутри мессенджеров, которые отвечают на вопросы по заранее подготовленным вариантам (скриптам). Такой бот не может вступить с пользователем в свободный диалог. iPavlov работает над библиотекой, используя которую, можно создавать боты, понимающие естественный язык. Если сейчас человек задает Google вопрос, например когда наступит апокалипсис, то получает в ответ только набор ссылок. Бот будущего должен будет уметь сам пройти по этим ссылкам, извлечь из той же Википедии нужную информацию и дать человеку четкий ответ. Бот, работающий в пиццерии и разработанный на основе алгоритмов, собранных в библиотеке iPavlov, должен понять заказ, определить тип пиццы, спросить о времени и адресе доставки. Кроме того, бот должен понять заказ, даже если он написан с опечатками, ошибками или сокращениями. А потом он должен оформить заказ, обратившись к внутренним базам данных пиццерии.

Данные для обучения ИИ, или готовые дата-сеты, обычно берутся из открытых источников, но, к сожалению, в достаточном количестве те имеются только для английского языка. Поэтому Лаборатории глубинного обучения нейросетей МФТИ приходится создавать дата-сеты на русском языке самим. Это большая, кропотливая работа, сырьем для которой являются тексты, в которых еще не выделены важнейшие параметры: намерения говорящего, сущности, страны, имена и т.д. Эти «сырые» тексты требуется разметить, например при помощи таких программ, как яндексовская «Толока» или Amazon Mechanical Turk.

«На сегодня такой библиотеки, как iPavlov, на русском языке нет, она лучшая по распознаванию имен, намерений пользователя, генерации ответов», — говорит Ольга Кайрова.

После того как данные размечены, они «скармливаются» искусственному интеллекту, чтобы он учился диалогу с человеком.

Кто пользуется iPavlov?

Сегодня чат-ботами пользуются многие крупные компании. Существует конструктор ботов Aimylogic, позволяющий разрабатывать боты на основе ограниченного набора данных, — использовать Aimylogic может даже непрофессиональный программист. iPavlov предназначен для создания более сложных ботов на основе нейросетей, работать с ним может только профессионал. Для пиццерии с небольшим меню подойдет Aimylogic, но для анализа, например, продуктов Apple нужен iPavlov.

Сегодня библиотеку iPavlov использует компания Data Monsters, разрабатывающая бот, способный отвечать на вопросы по поиску оборудования для нефтяных компаний, «заглядывая» при этом во внутренние базы производителей. Кроме того, Data Monsters, используя iPavlov, улучшает бот для поддержки пользователей смартфонов и прочих гаджетов. Сегодня крупнейшие производители смартфонов часто не справляются с потоком запросов на техподдержку — им остро нужна «диалоговая машина».

«Такой бот очень сложен, и задача понимания запроса, поиска решения во внутренних базах и предыдущих решений до сих пор не решена. На этом рынке большое количество наименований, спецификаций и пр. Бот должен распознать модель, понять проблему и принять решение — это пока сложная задача», — говорит Ольга Кайрова.

Для каждой отрасли должен создаваться свой бот. Лаборатория МФТИ стремится снизить порог входа для тех, кто собирается разрабатывать чат-боты, обеспечивая их заготовками компонентов диалоговых систем. При этом эти заготовки аккумулируются из всех возможных мировых источников, а коды библиотеки iPavlov находятся в открытом доступе на Githab.

Автор: Наталья Кузнецова

Следите за нашими новостями в удобном формате
Перейти в Дзен

Предыдущая статьяСледующая статья