Популярность аудиоконтента в виде аудиокниг, голосовых твитов и других форм продолжает расти. Пользователям зачастую удобнее воспринимать звук, а не текст или видео. Однако звуковое сопровождение содержимого интернет-изданий до сих пор встречалось крайне редко. Перевод текста в качественный звук был слишком долгим и сложным. Основатели сервиса Retell рассказали, как стало возможным автоматизировать процесс.

Мировой тренд подтолкнул к созданию нового сервиса
Давно доказано, что изображение, которое сопровождается звуком, лучше запоминается. Помимо этого, есть категория людей, воспринимающих информацию исключительно на слух. Их называют аудиалами. Поэтому звук для интернет-изданий является способом поиска новой аудитории и расширения возможностей.
«Особенно четко прослеживается тренд на подкасты, который актуализировался на фоне роста популярности подкастов и доли процента посетителей мобильного трафика, предлагая им новый, более удобный формат потребления контента. Аудиостатьи увеличивают общую среднюю продолжительность сеанса, сокращая отток подписчиков и увеличивая вовлеченность, так как со смартфона можно слушать статьи во время вождения машины, занятий спортом или любым другим делом», — говорит основатель сервиса Retell Андрей Герасимов.
До этого Андрей работал директором по маркетингу в веб-студии, где и появилась идея стартапа. В конце 2018 года он обратил внимание, что в мире стало все популярнее размещать аудиоверсии интернет-контента. Однако издания использовали различные способы озвучки, иногда — крайне неэффективные.
Некоторые компании занялись разработкой своих программ, другие обратились к программным решениям сторонних ресурсов, а некоторые вовсе все делали вручную: переводили тест в звук с помощью демонстрационных версий Text-to-Speech-сервисов и самостоятельно размещали полученные файлы на соответствующих страницах.
Последний способ — самый трудозатратный. Его имеет смысл применять, если требуется озвучить 1–2 текста. Но если речь идет о 20 и более статей в день, задача становится практически невыполнимой. Для ее решения необходимо использовать автоматизированный механизм.
Андрей Герасимов вместе с командой занялся разработкой такой программы. Для распознавания и трансформации текста в речь они использовали искусственный интеллект: аудиофрагмент составляется из множества звуков, находящихся в базе данных. Компьютерная речь получается тем естественнее, чем обширнее база.
В результате была создана первая экспериментальная версия программы, которая включала в себя минимальный набор сервисов. Она позволяла подключиться с помощью внедрения в текст специальной микроразметки, хранить аудиофайлы на сервисах разработчика без возможности скачивания, разместить на сайте виджет-плеер и использовать один голос.
Таким образом, создателями Retell был разработан новый сервис, отличный от стандартных платформ Text-to-Speech, который позволил в автоматическом режиме озвучивать тексты и размещать их аудиоверсии на сайтах.
В настоящее время за сервис отвечают директор Андрей Герасимов, технический директор Дмитрий Бибик и разработчик Иван Кочура. Они работают вместе более 5 лет на рынке онлайн-маркетинга и разработки персональных решений для медиапорталов.
На 2021 год подкасты, сгенерированные с помощью сервиса Retell, прослушали более 5 млн раз. Помимо подкастов, с его помощью генерируется более 1 млрд рекламных прослушиваний в месяц по цене 22 копейки за каждое. И это не предел. Компания увеличивает количество прослушиваний на 40% ежемесячно. Кроме того, в 2021-м команда вышла в топ-25 лучших стартапов в рамках международной программы Sber500.
Обратная связь позволила стать лучше
Несмотря на то, что экспериментальная версия сервиса не отличалась большой функциональностью, разработчики решили запустить лендинг и провели небольшую рекламную кампанию. Их целями было проанализировать наличие спроса и узнать мнение пользователей.
Интернет-издания заинтересовались перспективами уменьшить отток посетителей, у которых нет времени на чтение статей, и увеличить аудиторию за счет тех, кто находится в поиске более удобных способов получения информации. За первую неделю лендинга поступило более 20 заявок на использование платформы Retell. Это позволило начать общение с интернет-изданиями и изучить их потребности.
В результате взаимодействия был обнаружен целый ряд проблем, которые следовало решить, прежде чем осуществлять полноценный выход на рынок. Разработчики решили отказаться от системы микроразметки и упростили процесс подключения, предоставили изданиям возможность ознакомления со статистикой по прослушиванию, добавили несколько голосов и сервис по созданию собственного словаря, куда вносятся редкие названия, фамилии, аббревиатуры.
В результате, чтобы внедрить на сайт озвучку, достаточно пройти стандартную регистрацию и добавить интернет-портал в систему. Нужно ввести его адрес, выбрать язык, голос и указать ссылку на RSS-ленту. Подключение может занять до 20 минут: требуется подключить актуальную RSS-ленту, указать тег, где хранится текст, и подключить виджет-проигрыватель в код шаблона страницы статьи; озвучка начнется автоматом. В личном кабинете каждый пользователь может сменить голос, язык, добавить свою аудиозапись в начале или конце озвучки, выбрать любой из более чем 50 реалистичных голосов. Заказчикам доступно изменение дизайна виджета и подробная аналитика с разбивкой по устройствам, применяющимся для прослушивания, и процентом дослушиваний каждой статьи.
Система дает возможность пользователям получать дополнительный доход за счет аудиорекламы, а рекламодателям — выйти на новый рынок слушателей. Рекламу можно загружать самостоятельно через личный кабинет. Ее эффективность оценивается по количеству прослушиваний. Также Retell позволяет выйти на подкаст-платформы. Аудитория может слушать контент через Apple Podcasts, «Яндекс.Музыке», Spotify.
Всем новым клиентам предоставляется шанс бесплатно попробовать все возможности сервиса. Для этого после регистрации в системе открывается 10-дневный неоплачиваемый период пользования. По окончании срока платформа предлагает приобрести подписку либо производить оплату за каждый заказ. Из этого формируется заработок компании. Доступны различные варианты подписок на разный срок и объем трансформируемых текстов. В зависимости от количества планируемых статей в месяц и их длины определяется сумма оплаты. Минимальный тариф включает 15 статей в месяц с длиной около 1200 символов. Таким образом, ежемесячный платеж за 18 тыс. символов составит 570 рублей. Сумма за максимально возможный тариф, который включает 30 млн символов в месяц, составит около 115 тыс. рублей.
Нет ничего невозможного
Казалось бы, Retell не только показал свою состоятельность, но и смог подстроиться под требования клиентов. Однако на пути к успеху часто возникают трудности. Не обошли они и новый сервис в сфере озвучивания контента. Один из первых пользователей платформы получил уведомление от «Яндекс.Вебмастера» о критической ошибке, связанной с турбо-страницами «Яндекса».
«В предложенном “Яндексом” варианте каждому изданию пришлось бы подключаться к нашему API для получения ссылки на звуковой файл и переписывать механизм формирования RSS для турбо-страниц», — рассказывает Андрей Герасимов.
Однако это не соответствовало первоначальной задумке о создании простого в использовании сервиса. Фактически возникшая проблема могла свести на нет все усилия разработчиков. Перед пользователями встал выбор: озвучивать контент или использовать турбо-страницы. К сожалению, он был не в пользу первого сервиса. Но команда Retell смогла найти выход из сложившийся ситуации: теперь владельцы порталов, подключенных к платформе, могут не переживать, что их турбо-страницы будут заблокированы. Сервис поддерживает не только турбо-страницы «Яндекса», но и AMP-страницы Google. Это позволило масштабировать бизнес и полноценно выйти на рынок озвучки.
Перспективы развития
Разработчики сервиса Retell по звуковому сопровождению контента не останавливаются на достигнутом. Недавно они обновили ядро платформы и доработали ее архитектуру, чтобы повысить стабильность работы, уменьшить нагрузку и уровень затрат. Такие меры позволили снизить цены на предоставляемые услуги и предложить вновь подключаемым клиентам возможность выбора более дешевых тарифов. Старые пользователи также были переведены на более выгодные условия сотрудничества, это сделали автоматически.
К концу первого полугодия 2020 года через платформу Retell уже было озвучено более 41,5 тыс. статей. После публичного запуска сервиса в числе его постоянных пользователей появились такие интернет-издания, как: Sports.ru, Dni.ru, ProUfu.ru, SuperOmsk.ru, ProVladimir.ru, Avtocod.ru, Novostroy.ru. На 2021 год услугами сервиса воспользовались на 254 сайтах. За время участия в акселераторе Sber500 компания привлекла более 50 площадок, а также провела пилот с крупнейшим медиахолдингом Shkulev Media Holding. К концу 2022 года компания планирует достичь отметки в 3000 сайтов.
Таким образом, дальнейшее развитие проекта осуществляется по направлению улучшения качества сервиса, снижения стоимости услуг и большего охвата рынка. Над этим постоянно работает команда Retell.
Автор: Кристина Фирсова



ENG
«Особенно четко прослеживается тренд на подкасты, который актуализировался на фоне роста популярности подкастов и доли процента посетителей мобильного трафика, предлагая им новый, более удобный формат потребления контента. Аудиостатьи увеличивают общую среднюю продолжительность сеанса, сокращая отток подписчиков и увеличивая вовлеченность, так как со смартфона можно слушать статьи во время вождения машины, занятий спортом или любым другим делом», — говорит основатель сервиса Retell Андрей Герасимов.
