Реклама ООО Таймвэб
Реклама ООО Таймвэб

Нейронные сети для озвучки текста

5 комментариев
Нейронные сети для озвучки текста

Нейронные сети развиваются семимильными шагами, предоставляя пользователю доступ к огромному количеству инструментов, которые ранее не существовали или были реализованы не так хорошо. Касается это и озвучки текста, ведь всего пару лет назад можно было без проблем распознать, что содержимое озвучено роботом. Сейчас же при помощи искусственного интеллекта создаются продвинутые языковые модели, словари значительно расширяются и речь становится все более похожей на настоящую человеческую. Каждый может озвучить любое содержимое на разных языках различными голосами, выбрав один из подходящих онлайн-сервисов с поддержкой нейронной сети.

NaturalReaders

Первый сайт с названием NaturalReaders отлично подходит для озвучки сценариев или чтения книг. Пользователю достаточно выбрать одну из языковых моделей, вставить текст или загрузить его из документа в поддерживаемом формате. Бесплатно доступно только две языковые модели и 20 минут чтения текста в день, чего вполне достаточно для ознакомления с основными функциями онлайн-сервиса. Во время синтеза на экране могут появляться и субтитры по выбору пользователя, что позволит следить за текущим фрагментом и понимать, насколько качественно робот озвучивает содержимое.

Внешний вид сайта NaturalReaders для перевода текста в речь

Дополнительно разработчики NaturalReaders предлагают несколько самых разных тарифных планов под определенные задачи. Поддерживается веб-приложение, предназначенное специально для коммерческих проектов. С его помощью можно выбирать более реалистичные языковые модели и озвучивать текст для дальнейшего использования в своих целях, загружая ролики на YouTube или даже создавая аудиокниги. Что касается двух бесплатных языковых моделей, то пока что они довольно роботизированные, иногда путают ударения в словах и имеют недостаточно выраженную интонацию.

Комьюнити теперь в Телеграм
Подпишитесь и будьте в курсе последних IT-новостей
Подписаться

Oddcast

Онлайн-сервис Oddcast позиционируется как средство для создания дикторской речи с озвучкой разными голосовыми моделями. Помимо этого создается анимация, когда на экране виден сам диктор на фоне разных локаций, имитирующий ртом речь. Сейчас это выглядит немного несуразно и сразу можно понять, что картинка нереалистична, но стоит понимать, что ИИ в данной сфере только развивается и спустя некоторое время значительно усовершенствуется как в плане озвучки, так и графического сопровождения.

Использование сайта Oddcast для озвучки текста

Теперь давайте поговорим о том, какие функции доступны пользователю в демоверсии Oddcast. Изначально вы можете выбрать один из поддерживаемых языков, коих насчитывается больше двадцати, и один из существующих голосов озвучки – их количество зависит от выбранного языка. Например, для русского есть пока что три, но, скорее всего, в будущем появятся и другие модели. На голос можно наложить разные эффекты и управлять тональностью. Затем остается только ввести текст и нажать кнопку для его воспроизведения.

Zvukogram

Если говорить об отечественных онлайн-сервисах, поддерживающих искусственный интеллект для озвучки текста, то лидером в этом направлении наверняка будет Zvukogram. Связано это с многими факторами, куда относится количество существующих функций и удобство самого редактора. Вы можете не просто вставить текст, но и выделить нужные вам фрагменты, добавить паузы, затем выставить высоту тона и скорость чтения. При этом поддерживается и несколько разных словарей, поэтому между ними можно переключаться, если возникают проблемы с установкой ударений или произношением конкретных слов.

Основное меню настройки озвучки текста на сайте Zvukogram

Конечно, главной особенностью Zvukogram является поддержка просто огромного количества самых разных звуковых моделей. Их полный список вы видите на следующем изображении. Почти все из них доступны только в платной версии, но и того количества бесплатных, что предоставляют разработчики, вполне достаточно, чтобы подобрать подходящую. Итоговый результат озвучки можно будет сохранить на компьютер как аудиофайл в одном из доступных форматов.

Полный список языковых моделей для озвучки текста на сайте Zvukogram

Кстати, при выборе языковой модели Zvukogram сразу предлагает прослушать пример, чтобы понять, как звучит голос, с какой интонацией говорит диктор и правильно ли расставляются все ударения. Это позволит потратить меньше времени на подбор подходящего голоса, а перед озвучкой останется только немного отредактировать скорость и высоту тона, если это понадобится.

Cybervoice

Cybervoice – еще один онлайн-сервис для синтеза речи, который точно заслуживает вашего внимания. Все его функции доступны бесплатно, но есть ограничение по количеству символов для озвучки для тех юзеров, кто пока еще не выбрал для себя тарифный план. Лимита достаточно для проверки нескольких примеров и понимания того, подходит ли данный инструмент для ваших целей. Звуковых моделей здесь большое количество, начиная от известных голосов актеров озвучания и заканчивая голосами персонажей из игр (Ведьмак 3 или Genshin Impact).

Работа с редактором на сайте Cybervoice для озвучки текста

Из этого можно сделать вывод, что сайт Cybervoice доступен для использования как в развлекательных целях, когда вы просто хотите, чтобы ваш текст был озвучен известным голосом, так и в профессиональных – для озвучки сценариев и книг. Голосовые модели функционируют довольно хорошо, особенно те, словарный запас которых покрывает практически все слова. Иногда даже не понять, был ли записан голос вживую или это обработка при помощи нейронных сетей. 

Сам редактор в личном кабинете Cybervoice тоже удобный, в нем есть большая область для работы с текстом и разделы для настройки озвучки. Единственным минусом этого сайта можно считать редкие зависания во время синтеза речи, но на эти случаи есть кнопка обновления процесса.

Genny

Разных сайтов для озвучки текста существует еще большое количество, но многие из них базируются на уже знакомых многим языковых моделях, которые не самые качественные. Останавливаться на таких я не буду, поэтому в завершение расскажу про еще однин интересный сайт – Genny. Однако учитывайте, что пока он имеет довольно ограниченный набор русских голосов (всего три самых известных), но, судя по разделу с поиском, в будущем их добавление планируется. Genny имеет очень удобный редактор с таймлайном, что позволяет добавлять почти неограниченное количество реплик, сказанных разными голосами одновременно или последовательно.

Составление диалогов для озвучки текста на сайте Genny

Функциональность сайта позволяет вам создавать не просто базовую озвучку набранного текста, но и формировать диалоги разных людей, имитируя это с помощью искусственного интеллекта. Англоязычные голосовые модели показались мне лучшими из тех, что я слышал за время знакомства с разными сайтами, поэтому я точно могу рекомендовать данный сайт всем тем, кому подойдет озвучка на английском. Остальные, кому не подходят несовершенные русские голоса, могут пока что просто пометить данный веб-ресурс и иногда мониторить обновления, просматривая, какие новые голосовые модели были добавлены разработчиками.

В заключение

В этом материале я постарался не просто собрать известные сайты для синтеза речи, а именно сделал акцент на ресурсах, которые используют технологии ИИ и предоставляют языковые модели для самых разных целей. Пять разных сайтов точно хватит для того, чтобы среди них выбрать одного или нескольких фаворитов и использовать на постоянной основе для личных или коммерческих целей.

Наши постоянные авторы и читатели делятся лайфхаками, основанными на личном опыте. Полная свобода самовыражения.

Комментарии

Алекс Роу 0
28 янв в 08:18
А я пользуюсь https://greenballoon.ru/nejroseti/ozvuchka-tekst. Особенно нравятся голоса от OpenAi. Приколтнр
Свернуть ответы
Формула жизни 0
12 фев в 08:57
Согласен. Голоса от OpenAI это нечто. Кстати по моему в России это единственный сайт где они есть. Хотя может есть и ещё где-то...
Виктория Шишигина 0
15 мая в 12:48
Да нет вот например телеграмм бот с голосами от Open AI
https://t.me/GreenBell_bot
Mydevelopments PHP 0
14 сен в 06:25
на Аудиофай.ру лучшие голоса от OpenAi
Джалил Алиев 0
01 дек в 18:48
Привет
С помощью соцсетей
У меня нет аккаунта Зарегистрироваться
С помощью соцсетей
У меня уже есть аккаунт Войти
Инструкции по восстановлению пароля высланы на Ваш адрес электронной почты.
Пожалуйста, укажите email вашего аккаунта
Ваш баланс 10 ТК
1 ТК = 1 ₽
О том, как заработать и потратить Таймкарму, читайте в этой статье
Чтобы потратить Таймкарму, зарегистрируйтесь на нашем сайте