Сервис Lyrebird из Канады запустил бесплатную бета-версию API для синтеза голоса. Этот программный интерфейс позволит сторонним разработчикам создавать цифровые копии голосов пользователей.
Как это работает?
Lyrebird позволяет создавать нужные копии голоса на основе одной минуты речи. Предполагается, что это даст возможность создавать индивидуальные «голоса» для приложений, аватаров и так далее.
Для синтеза используется нейросеть, которую разработали в университете Монреаля. В прошлом году с его помощью уже имитировали голоса Барака Обамы, Дональда Трампа и Хиллари Клинтон. Публичное тестирование было начато в сентябре 2017 года. Инструкция по применению API находится здесь. Для использования нужно зарегистрироваться в системе и дать согласие на обработку личных данных.
А это безопасно?
Разработчики пока не уточняют этого. Однако, в перспективе подобные технологии действительно могут стать источником проблем. Современные смартфоны, «умные» колонки и прочие устройства вполне могут «слушать» пользователя, фиксировать его разговоры и так далее. А также из них можно получить образы голоса и подделать их.
Lyrebird — не единственный подобный сервис. Ранее в Ирландии сообщили о разработке синтезатора речи, который не требует подключения к Сети. Он может работать на смартфоне в качестве локального приложения.
А весной 2018 года Google открыла для сторонних разработчиков доступ к собственной технологии синтеза речи.
Источник: