Технология преобразования текста в звук Custom Neural Voice и платформа создания аудиоконтента Audio Content Creation от Microsoft помогли Пекинскому центру поддержки людей с нарушением зрения нарастить производство аудиокниг.
Синтетический голос, который озвучивает текст, при этом генерируется искусственным интеллектом на основе примеров речи реального человека. После формирования аудиодорожки, запись можно отредактировать, поправив в синтетической речи, например, тон, акцент, произношение и другие детали.
«Мы смогли выпустить большую партию аудиокниг, которые готовы к использованию в 105 китайских школах для незрячих детей», — рассказали в Пекинском центре поддержки людей с нарушением зрения.
Одним из «доноров» голосов для проекта стала диктор и преподаватель из Китая Лина Дон, потерявшая зрение в 10 лет. Она записала около 500 предложений. На их основе был создан синтетический «дублер» голоса девушки. Прежде специалист сама занималась записью аудиокниг, но подготовка каждой занимала очень много времени — от нескольких недель до нескольких месяцев. Новые технологии, благодаря которым озвучивать книги голосом Лины стал искусственный интеллект, ускорили процесс.
«Я была впечатлена тем, как хорошо программа ‘’ухватила’’ черты моего голоса», — отметила Дон.
Еще одним человеком, чей голос теперь используют в Пекинском центре при подготовке аудиокниг новым методом, стала китайская актриса Чжоу Сюнь.
По словам Лины Дон, чем больше аудиокниг становится доступно незрячим студентам, которых поддерживает Пекинский центр, тем выше становятся их оценки.
Отметим, ранее «Особый взгляд» рассказывал, какие из приложений и сервисов для чтения книг наиболее доступны для незрячих пользователей.