Инструмент для подделки голоса любого человека, эмоции и тон

cnews.ru — Microsoft разработала систему на основе искусственного интеллекта, которая может преобразовать текст в речь, произнесенную голосом любого человека, с передачей эмоций и тона говорящего. Для этого лишь понадобится трехсекундный образец его речи. По заявлению исследователей, испытавших инструмент под названием Vall-E, он значительно превосходит существующие системы синтеза речи
Новости, Технологии | spanjokus 09:40 11.01.2023
11 комментариев | 44 за, 1 против |
#1 | 09:43 11.01.2023 | Кому: Всем
думаю, что пока разработают методы распознвания, защиты и меры пресечения жуликов - много людей пострадает
#2 | 09:55 11.01.2023 | Кому: daurkin
lда оно и без этого страдаютЪ

"Есть личные последствия декабрьской провокации российских пранкеров, опубликовавших запись разговора с президентом Анджеем Дудой. По неофициальной информации журналиста RMF FM Роха Ковальски, Петр Гиллерт, директор Управления международной политики Канцелярии президента, лишился должности."
[censored]
#3 | 09:55 11.01.2023 | Кому: Всем
Вован и Лексус выходят на новый уровень!!!
#4 | 09:57 11.01.2023 | Кому: Всем
На[censored] прочёл список авторов работы и прослезился

> Chengyi Wang*, Sanyuan Chen*, Yu Wu*, Ziqiang Zhang, Long Zhou, Shujie Liu, Zhuo Chen, Yanqing Liu, Huaming Wang, Jinyu Li, Lei He, Sheng Zhao, Furu Wei
#5 | 10:02 11.01.2023 | Кому: Всем
> голосом любого человека
А если это человек изначально не выговаривает некоторые буквы?
#6 | 10:06 11.01.2023 | Кому: user2980
> А если это человек изначально не выговаривает некоторые буквы?

Или создаëт три заголовка подряд с непонятным акцентом?
#7 | 10:07 11.01.2023 | Кому: Всем
Думаю, оно пока неработоспособно в принципе, потому что в одной нерезиновой можно пару десятков вариантов произношения алфавита собрать не напрягаясь. И это только один язык в одной точке страны. И за три секунды это чудо наберёт достаточно информации, чтобы одинаково подстроится что под язык эскимосов, что под язык навахо? Не смешите.

Но начало неплохое, возможно, через год-другой сбора данных оно сможет.
#8 | 10:12 11.01.2023 | Кому: Всем
Даже у одного и того же человека в разных позициях, а бывает - и в одной и той же позиции - реализация одной и той же фонемы будет разная. На слух, видимо, будет похожий голос, но фоносокопическая экспертиза определит, что тут наебалово компутерное.
4ekist
надзор »
#9 | 10:14 11.01.2023 | Кому: Всем
Если я в течении трех секунд буду орать Бляяяяя - этого хватит? Ок
#10 | 10:17 11.01.2023 | Кому: Всем
Сразу вспомнилась очень старая и всё ещё существующая софтина MorphVOX Pro voice changer - но говорить подделаным голосом надо самому. Более продвинутые парни всегда юзали музредактор типа Cubase с плагинами.
Текст-в-речь с правильными интонациями и произношением - это традиционно Loquendo всегда был.
Блин, уж почти что лет 20 прошло, в мелкомягких эстонцы работают?
#11 | 13:54 11.01.2023 | Кому: Всем
Скорее всего имеется в виду, что подделают тембр голоса.
А произношение, манера речи и прочие характеристики будут от того, кто наговаривает текст.
Если это так, то... А где сенсация?
Войдите или зарегистрируйтесь чтобы писать комментарии.