ENG

Перейти в Дзен
Стартапы

Как заработать на расшифровке аудиофайлов

Фаундер компании Виктор Осетров и кофаундер Алия Мусина

До сих пор в интернете появляются объявления с просьбой расшифровать аудио- или видеозапись. Компания RealSpeaker переводит аудио- и видеофайлы в буквенный текст, ставка — 7 рублей за минуту работы. «Инвест-Форсайт» узнал детали проекта у ее основателя Виктора Осетрова и протестировал программу.

Как это работает

Вы заходите на сайт RealSpeaker, загружаете аудио- или видеофайл, выбираете язык, система считывает длину файла, выставляет вам счет, вы оплачиваете его онлайн, затем начинается расшифровка — перевод звуков в буквенный текст — вашего текста. Часовое аудио- или видеоинтервью машина превращает в машинописный текст примерно за 20 минут. Пока этот текст без пунктуации, его нужно редактировать и корректировать: в нем могут встречаться слова, которых в аудиофайле нет. Но даже такой текст способен существенно сэкономить время. Пунктуация — следующий этап работы RealSpeaker.

RealSpeaker’ом пользуются колл-центры, телеком-компании, журналисты, блогеры, студенты, писатели, преподаватели — все, кому необходимо перевести голосовой текст в буквенный. Есть заказы на транскрибирование судебных заседаний, совещаний муниципалитетов (например, в Тольятти и ряде сибирских городов), которые обязаны публиковать текстовые отчеты со своих заседаний. Есть компании, которые хотели бы использовать API RealSpeaker, чтобы интегрировать тот в собственные коммерческие продукты. Стоимость — 7 рублей за минуту для россиян и 8-12 центов для зарубежной аудитории. С февраля программа продается разово, но в ближайшие недели начнет предлагаться по подписке.

RealSpeaker умеет распознавать 16 языков (помимо русского и украинского, это испанский, английский в двух вариантах — британском и американском, французский, немецкий, португальский, китайский, корейский, арабский (египетский) и др.). Базу словарного запаса русского языка RealSpeaker накопила сама, распознавая и расшифровывая речь заказчиков. Базы данных других языков закупаются у компаний, специализирующихся на распознавании речи.

Из Йошкар-Олы в Голуэй

Виктор Осетров закончил университет в Йошкар-Оле, а в 2012 году основал компанию RealSpeaker в России и США, став резидентом казанского IT-парка. Первым инвестором стартапа выступила супруга министра связи РФ, бизнес-ангел Светлана Никифорова. Ее «Стартобаза» получила 10% в американской RealSpeaker USA Inc. Еще 10% компании были у граждан США Павла Погодина и Натальи Бугорской, остальные инвесторы не раскрывались. В 2014 году Осетров переехал в Чили, чтобы запустить версию RealSpeaker для латиноамериканской аудитории. С этого момента он работает за границей: жил в Испании, США, Южной Корее, а сейчас работает на две страны — Ирландию (Голуэй) и Францию (Брест, Бретань).

До 2013 года RealSpeaker существовала за счет внешних инвестиций и спонсоров. В частности, крупными спонсорами стартапа были Российская академия наук, «Фонд Сколково», Агентство инновационного развития республики Татарстан, корпорация Microsoft, управляющая компания «Стартобаза», фонд Бортника и другие. На этом этапе привлекалась аудитория, запускалась стабильная версия программы. Но с 2013 года компания не зависела от внешнего финансирования и существовала только за счет средств, получаемых с продаж. К 2016 году у компании было более 3500 платных клиентов (при стоимости лицензии от $5 до $69).

От софта к web’у

В 2016 году RealSpeaker пришлось отказаться от продаж софта и перейти к web-версии. RealSpeaker продавал программы, которые анализировали движение губ и частоту голоса, чтобы считывать речь в режиме реального времени, а потом превращать ее в текст. Но в 2016 году компания, которая предоставляла библиотеку видеообработки лица, была куплена компанией Intel, после чего сменила профиль деятельности. Кроме того, появился Windows 10 с голосовым помощником Сortana, который стал несовместим с программой RealSpeaker. Amazon выпустил помощника Alexa, которая распознает человеческую речь, Apple — Siri. Все эти голосовые помощники, работающие в режиме реального времени, были бесплатны; RealSpeaker стало сложно продавать свою программу. Тогда в компании решили транскрибировать в тексты готовые медиафайлы, а не заниматься распознаванием текстов в режиме реального времени.

«80% аудиофайлов невидимы для поисковых машин, потому что не переведены в текст. Это обычно нужно делать срочно, и пользователь готов за это платить, — объясняет Виктор Осетров. — В России такое, как правило, делается вручную, потому что у нас дешевая рабочая сила».

Новый продукт RealSpeaker начала продавать с России, поскольку предыдущий в стране уже был известен. 60% пользователей — русскоязычная аудитория, 10% — Украина. На сегодня в России у RealSpeaker, как считают в компании, нет прямых конкурентов. Для нового продукта была специально создана компания в Ирландии с тем же названием — RealSpeaker, ее акционеры — госструктура Ирландии и частные инвесторы из Испании и Ирландии, а также Виктор Осетров и его команда. Названия акционеров и доли не раскрываются. Светлана Никифорова свою долю в RealSpeaker продала.

Без рекламной кампании в обычный день на сайт RealSpeaker поступает 50 файлов на расшифровку, в выходные — 30. Длина файлов — от нескольких минут до трех часов. RealSpeaker готовится к запуску официальной версии своего продукта, чтобы продавать его бизнес-аудитории. Пока все заказы поступают от физических лиц. До конца года компания хочет увеличить оборот до 1 млн евро, но прибыль будет небольшой, поскольку многое тратится на аренду серверов для хранения файлов.

Автор: Наталья Кузнецова

Следите за нашими новостями в удобном формате
Перейти в Дзен

Предыдущая статьяСледующая статья