NNSVS用歌声モデルをUTAU音源みたいに使えるようにするUTAUプラグイン
利用時は各キャラクターの規約に従ってください。尚、本ソフトウェアの規約は LICENSE ファイルとして別途同梱しています。
UTAU を起動し、ENUNU-{version}.zip をUTAUのウィンドウにドラッグアンドドロップしてください。
- UST を開く。
- UTAU 音源として ENUNU 用のモデルを指定するか、NNSVS 用のモデルを含むフォルダを選択する。
- UST の歌詞をひらがな単独音にする。
- UST ファイルを保存する。
- ノートを2つ以上選択してプラグイン一覧から ENUNU を起動する。
- ~ 数秒か数分待つ ~
- 生成された WAV ファイルを保存する。
-
2021年以前に配布された日本語モデルでは、促音(っ)は、直前のノートに含めることをお勧めします。
- さっぽろ → [さっ][ぽ][ろ]
-
2022年以降に配布された日本語モデルでは、促音(っ)は、独立したノートとすることをお勧めします。
- さっぽろ → [さ][っ][ぽ][ろ]
-
促音以外の複数文字の平仮名歌詞には対応していません。
-
音素を空白区切りで直接入力できます。平仮名と併用できますが、1ノート内に混在させることはできません。
- [い][ら][ん][か][ら][ぷ][て] → [i][r a][N][k a][ら][p][て]
-
音素の直接入力により、1ノート内に2音節以上を含めることができます。
- [さっ][ぽ][ろ] → [さっ][p o r o]
%e: SimpleEnunu のフォルダ%v: SimpleEnunu 用モデルのフォルダ%u: UTAU のフォルダ
# config.yaml example to activate extensions
extensions:
ust_editor: "%e/extensions/voicecolor_applier/voicecolor_applier.py"
timing_editor:
- "%e/extensions/timing_repairer.py"
- "%e/extensions/velocity_applier.py"
acoustic_editor: "%e/extensions/f0_smoother.py"- voicecolor_applier :
あ強などの表情サフィックスを使用可能にします。(例:強が含まれる場合はPowerをフラグ欄に追記します。) - lyric_nyaizer (ust_editor) : 歌詞を
ny aにします。主にデバッグ用です。
- score_myaizer : 歌詞を
my aにします。主にデバッグ用です。
- timing_repairer : ラベル内の音素の発声時間に不具合がある場合に自動修正を試みます。
- velocity_applier : USTの子音速度をもとに子音の長さを調節します。
- f0_feedbacker : ENUNUモデルで合成したピッチ線を UST のピッチにフィードバックします。EnuPitch のようなことができます。
- f0_smoother : 急峻なピッチ変化を滑らかにします。
- style_shifter (ust_editor, acoustic_editor) : USTのフラグ に
S5やS-3のように記入することで、スタイルシフトのようなことができます。 - vibrato_applier (ust_editor, acoustic_editor) : USTのビブラートを f0 に反映します。
- dummy : とくに何もしません。デバッグ用です。
ここからは開発者向けです
- Windows 10
- Python 3.12
- CUDA 13.0
通常のNNSVS用歌声モデルも使えますが、enunu training kitを使ったほうがすこし安定すると思います。採譜時の音程チェック用に、再配布可のUTAU単独音音源の同梱をお勧めします。
モデルのルートディレクトリに enuconfig.yaml を追加し、ENUNU用おふとんP歌声モデルなどを参考にして書き換えてください。question_path は学習に使ったものを指定し、同梱してください。
モデルのルートディレクトリに enuconfig.yaml を追加し、波音リツ ENUNU Ver.2 同梱のファイルを参考にして書き換えてください。question_path は学習に使ったものを指定し、同梱してください。
フルコンテキストラベルの仕様が Sinsy のものと異なります。重要な相違点は以下です。
- フレーズに関する情報を扱わない(e18-e25, g, h, i, j3)
- ノートの強弱などの音楽記号を扱わない(e26-e56)
- 小節に関する情報を扱わない(e10-e17, j2, j3)
- 拍に関する情報を扱わない(c4, d4, e4)
- 休符を挟んだ場合のノートおよび音節の前後情報(a, c, d, f)が異なる
- Sinsyの仕様では、休符の直前のノートが持つ「次のノート」の情報は休符終了後のノートを指しますが、本ツールでは休符を指す設計としています。
- 休符の直後のノートも同様に、休符開始前ではなく休符そのものを指す設計としています。
- 音節も同様です。