JVS (Japanese versatile speech) コーパスの、@Hiroshiba作のラベルです。
JVSコーパスのpalallel100(話者間で共通する読み上げ音声100発話)を、読み仮名を音声に合うように修正した上で、Juliusによる自動アライメントを行った音素系列ラベルです。
@Hiroshibaが見つけた音声の間違いをもとに、一部の音声ファイルを修正・削除しています。 実行コードはaudio.bashです。
voiceactoress100_spaced_julius.txtがテキストです。
JVSコーパス内にある日本語テキストを元に、以下の修正を加えました。
- カタカナ表記にする
- 読み仮名を音声に合わせる
- 句読点の位置を音声に合わせ、スペースにする
これらの修正を加えたテキストがvoiceactoress100_spaced.txtです。
この修正に加えて、更に以下の修正を加えました。
- 珍しい読みの
ツュ
とヴュ
を、チュ
とビュ
に変える
この修正を加えたテキストがvoiceactoress100_spaced_julius.txtです。
aligned_labels_juliusがJulius音素系列ラベルです。
テキストvoiceactoress100_spaced_julius.txtを音素系列にし、Juliusのmonophone音素モデルを用いて音素をアライメントしました。
この際、ショートポーズsp
の有無もJuliusで推定しました。
実行コードはphoneme.bashです。
aligned_labels_openjtalkがOpenJTalk音素系列ラベルです。
Julius音素系列をOpenJTalk用に変更しました。 OpenJTalk label getterを用いてOpenJTalk用の音素を取得し、一部を修正しました。 変更後の音素がvoiceactoress100_phoneme_openjtalkです。
その後、音素をJulius用のものに変換し、Juliusのmonophone音素モデルを用いて音素をアライメントしました。
実行コードはphoneme.bashです。
CC BY-SA 4.0(声優統計コーパスの音素バランス文のライセンスを継承しています)
MIT LICENSE