Компания Google обновила технологию Translatotron до второй версии. Новый продвинутый переводчик на базе искусственного интеллекта способен синхронно переводить устную речь и сохранять исходный голос говорящего. Все будет происходить в реальном времени: без необходимости подключать расшифровку текста и предоставлять другие данные, которые зачастую требуются подобным алгоритмам.
Первый релиз Translatotron состоялся в 2019 году. Спустя два года Google смог заметно усовершенствовать свой продукт и привнес массу технических улучшений, позитивно сказавшихся на общей производительности ИИ, качестве перевода и т.п. Например, Translatotron 2.0 больше не зажевывает слова, не допускает очевидных ошибок, сохраняет интонации и паузы и генерирует более естественную речь на всех уровнях.
Также Google исправил проблему с дипфейками, сообщает Tproger. Раньше при использовании Translatotron можно было включить синтезатор голоса на базе ИИ, который имитировал голос другой личности. Это могло привести к сложностям в вопросах конфиденциальности и правдивости передаваемой информации. В Translatotron 2.0 всегда сохраняется голос говорящего.
Послушать примеры работы алгоритма можно в репозитории компании Google.
Комментарии