С каждым годом возможности машинного обучения и нейросетей становятся все более впечатляющими. На днях был создан алгоритм для синтеза речи, который подделывает голос человека по фрагменту аудиофайла.
Технология основана на нейросетевых моделях Tacotron 2 и WaveNet Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.
Алгоритм использует два аудиофайла: первый содержит голос, который нужно подделать, второй – фразу, которую нужно произнести. Компьютер в реальном времени преобразует голос из второго файла так, чтобы он звучал как в первом.
Ранее команда программистов Dessa Engineers создала нейронную сеть, которая полностью скопировала голос известного американского комика и ведущего Джо Рогана. Сходство оказалось настолько точным, что испугало не только простых пользователей, но и саму знаменитость.
По данным кредитного бюро «Эквифакс» в июне 2022 года российские банки выдали кредитов на 730 миллиардов рублей
В начале нынешней недели курс доллара на Московской бирже обвалился ниже уровня в 55 рублей,…
В условиях фактического нефтяного эмбарго со стороны ЕС, Россия пытается перенаправить экспортные потоки черного золота…
В мае инфляция в США ускорилась до нового 40-летнего максимума, что является признаком ускорения ценового…
Турецкая сторона не оставляет попыток организовать вывоз экспортного украинского зерна из украинских же портов, что…
Генеральный директор Tesla Илон Маск заявил о том, что испытывает «очень плохое предчувствие» по поводу перспектив экономики…