【AIシンガー御丹宮くるみ】きみに回帰線【NNSVS新音響モデル+HN-uSFGAN】

【AIシンガー御丹宮くるみ】きみに回帰線【NNSVS新音響モデル+HN-uSFGAN】

祝・NNSVS論文公開! https://arxiv.org/abs/2210.15987NNSVS の最新の音響モデルである NPSSMultistreamParametricModel(LF0, MGC, BAP に自己回帰のついた multistream モデル, 論文中の NNSVS-WORLD v4に相当)を試してみました. VUV は phonetic/musical context と LF0 にのみ依存するよう変更しています. ニューラルボコーダは従来からサポートされていた ParallelWaveGAN ではなく新しくサポートされた HN-UnifiedSourceFilterGAN( https://chomeyama.github.io/HN-UnifiedSourceFilterGAN-Demo/ ) を使用しました.美麗なイラストは夏目悠李君のENUNUカバーで積極的に活動されている Froggy氏(@Froggy0m)にお願いしました.原曲: 稲葉曇『きみに回帰線』Vo. 歌愛ユキ https://www.nicovideo.jp/watch/sm40230104 参考にした musicxml: 【AI式HALC@LOID】きみに回帰線【NNSVS新音響モデル】 https://www.nicovideo.jp/watch/sm40231995 学習モデル生成, 歌声合成, ミキシング: 白丹太郎(@taroushirani)イラスト: Froggy(@Froggy0m)

http://www.nicovideo.jp/watch/sm41592261