« ぼかりす | トップページ | 中野さん-後藤さんのコメント »

400氏のVSQファイル解析

 初音ミクみくの記事「出た!VocaListenerの秘密の一端解明か?謎の調教師が置き土産!」を見て、さっそく問題のVSQファイルを解析してみました。これにより、更に初音ミクの楽曲が高度なものとなれば幸いです。

 謎の調教師を仮に「400氏」と呼びます。400は初出のレス番号から由来するものです。

 「400氏」は噂の「ぼかりす」と匹敵するような高品質な初音ミクの歌声を作成してアップロードされ、歌声の元となるVSQファイルもアップロードされました。「400氏」のVSQファイルはこちらです。

http://www.42ch.net/UploaderSmall/source/1209596322.zip
pass=miku

(1)デフォルト歌唱スタイル

デフォルト歌唱スタイルですが、何も初期設定から変わっていません。

400_setting_2

 VEL(ベロシティ)/DYN(ダイナミックス)/PIT(ピッチベンド)のパラメータが操作されています。それ以外のBRE/BRI/CLE/GEN/POR/PBSは初期値のままです。

(2)VEL(ベロシティ)の操作の意味について

 VEL(ベロシティ)は子音の発音の強さで、小さいほど子音が強く表現されます。

 400氏のVSQファイルは、音節の最初ほどVEL(ベロシティ)が小さく、後ろにゆくほど大きくなっています。すなわち、文節の最初は子音を強く発音させ、文節の終端ほど子音を弱く発音させています。人間は文節ごとに息継ぎをします。息継ぎ後には強く発音されていた子音が、文節の終端ほど段々小さく発音されていく様を表したものとおもいます。

400_vel

(3)DYN(ダイナミックス)について
 DYN(ダイナミックス)は音量です。この値が大きければ音量が大きくなります。

 400氏のVSQファイルは、ある程度短い発音要素「す」は山なりに段々と大きくし、「べ」など極めて短い発音要素は極めて鋭い山なりにしています。
 特徴的なのは、ある程度長い発音要素の場合には、しだいに大きくなる正弦波カーブを描くことです。この正弦波によってビブラートを実現していると推定します。
 また、音節全体でゆるやかな山なりのカーブを描いている点も着目すべきです。ここでは「すべて」の山なりのカーブと、「すてて」の山なりのカーブが観察できます。

400_dyn

(4)PIT(ピッチベンド)について
 PIT(ピッチベンド)は音程です。この値が大きければ音程が高くなります。

 400氏のVSQファイルのPITをDYNと共に表示します、PITはDYNと極めて高い相関性をもって変化する特徴を有します。ただし、発音要素が短いときにはDYNは極めて大きな山なりカーブになるのに対して、PITは発音要素が短くても長くてもあまり変化せず、音節全体のカーブもゆるやかです。その代わり長い発音要素のときの正弦波状のカーブはDYNよりも振幅が大きいです。400氏のVSQファイルから感じるビブラートの主たる要素は、音程の周期的な変化で、従たる要素は音量の周期的な変化なのだと推定します。

400_pit

念押しでVSQファイルを直にエディタで見てみましたが、他に操作していたパラメータは見当たりませんでした。

 なお、MIKU_TALK の作成、及び400氏のVSQファイル解析にあたり、「日本語アクセントの概要」を参考とさせていただきました。

|

« ぼかりす | トップページ | 中野さん-後藤さんのコメント »

初音ミク」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/110295/41060095

この記事へのトラックバック一覧です: 400氏のVSQファイル解析:

« ぼかりす | トップページ | 中野さん-後藤さんのコメント »