Новости

Нейросети научились говорить с акцентом

Фото: flickr

Китайская нейросеть Baidu сможет синтезировать речь, учитывая особенности акцента. Всего за 30 минут нейросеть способна сформировать искусственный голос, который к тому же имитирует особенности речи каждого человека.

Система преобразования текста в речь с акцентом получила название Deep Voice 2. В том числе она работает с помощью алгоритмов машинного обучения, что позволяет значительно ускорить получение результата. Так, еще недавно на обработку данных  уходило почти сутки.

Что особенно интересно, нейросеть может синтезировать голос высокого качества даже на основе коротких аудиозаписей. Разработчики полагают, что новую технологию получится применить для обучения голосовых интерфейсов — последние с ее помощью смогут разговаривать с тем акцентом, который выберет владелец устройства.

Подписывайтесь на канал «Инвест-Форсайта» в «Яндекс.Дзене»
Загрузка...
Предыдущая статьяСледующая статья