400P=yuukiss氏のVSQファイルの解析#4
zhuoさんが作成されたツール "Ripples 0.0.8" を使って、人間の歌声、特にビブラートがどのようなグラフを描くかを見てみました。ここに、Ripples を作成された zhuoさんに感謝いたします。
本当は浜崎あゆみの生ボーカルが分析できるとよかったのですが、CDからボーカルをきれいに抽出できなかったので、やむをえず自分で(笑)歌ってみたものを分析しました。歌詞「すべて」の「て」の部分にビブラートが聞こえているので、人間の歌唱のビブラートの実験サンプルとしては使えると思います。
分析した歌声に対応する歌詞は「すべて」で、3つの発音要素を含み、音量(DYN)と音程(PIT)に対応する部分があります。全体として音量(DYN)と音程(PIT)が極めて高い相関を示す事、発音要素の区切りごとに音量(DYN)の谷間がある事などもわかります。これらは400P=yuukiss氏の調教法の特徴でもあります。
3番目の発音要素「て」は音量(DYN)が約10Hzで振動しており、これがビブラートとして聞こえることが判ります。また、この振動波形は正弦波からほど遠い「汚い」波形であることに着目すべきです。音程(PIT)は目立った振動は見当たりません。これは自分の歌唱力の無さによるものか、それとも人間の歌唱はこのようなものなのかは不明です。また、音量(DYN)は右肩下がりとなっておりますが、これは肺の空気量が少なくなると音量が下がるという生理的現象によるものと思われます。

図1、自分の歌唱の音量(DYN)と音程(PIT)
次に、400P=yuukiss氏の VSQファイルに対応するWAVファイルを解析してみました。VSQファイルの音量(DYN)と音程(PIT)のパラメータがWAVファイル上にどのように反映されるかを見る事と、400P=yuukiss氏の VSQファイルのビブラートが、Ripples上にどのように反映されるかを見る事が目的です。

図2、400P=yuukiss氏のVSQファイルのDYN(音量)

図3、400P=yuukiss氏のVSQファイルの音階(PIT)

図4、400P=yuukiss氏のVSQファイルの音量(DYN)と音程(PIT)
Vocaloid Editor 上の音量(DYN)と音階(PIT)はWAVファイル上に精確に表されている事と、音量(DYN)のカーブは人間の(自分の)発音とほぼ一致している事が判ります。しかし、3番目の発音要素「て」の音程は、約11Hzの綺麗な正弦波を描いており、人間の(自分の)音程とやや相違します。この相違点の理由は不明です。
結論:
400P=yuukiss氏のVSQファイルは、人間の歌唱から変換したものではないと判断します。人間の歌唱を変換したならば綺麗な正弦波とはならない為です。400P=yuukiss氏は、人間の歌唱音の音程と音階を詳細に分析し、VSQファイル上に何らかの方法で再構成したのだと判断します。
| 固定リンク
「初音ミク」カテゴリの記事
- MMDの物理演算エンジン搭載テストの紹介(2009.06.07)
- VocaSim(2009.05.17)
- VSQのファイル仕様(推定)(2009.04.18)
- MIKU_TALK 修復(2008.10.22)
- 商標登録第5157451号(2008.10.13)


コメント