« 400氏のVSQファイルの解析#2 | トップページ | 特開2002-221978 »

400氏のVSQファイルの解析#3

 まずは最初に前回の解析結果に関する修正報告です。

 Vocaloid2 Editorは任意時間長の入力ができます。左上のLength と Quantize 双方ともにOFFにすると、任意時間長の入力が可能であることを確認いたしました。(下図参照)コメントいただいたkmさんに感謝いたします。400氏のVSQファイルに、30の倍数以外の時間長が記載されていたとしても、何ら不思議ではありません。よって、これだけの証拠で400氏が Vocaloid2 Editor を使用していないと推定したのは、やや勇み足でした。

 

Vocaloid2editor_off_off
図1、任意時間長を入力できる設定 (Length/Quantize 双方とも off)

 今回は、400氏のVSQファイルのうちPIT(ピッチベンド・音程)と、DYN(ダイナミックス・音量)について調査してみました。400氏がどのように神調教を実現し、VSQファイルを生成したかを知るためです。

1、パラメータ調査結果について
1)PIT(ピッチベンド・音程)
 横軸を時間[mSEC]、縦軸をピッチベンド(PIT)とし、400氏のVSQファイル中の歌詞「たいせつなあ」の「なあ」の部分を赤色で描き歌詞「すてて」の2番目の「て」の部分を青色で描いたものです。
 どちらも正弦波カーブが描かれており、これがビブラートとして人間に認識されます。赤色のグラフと青色のグラフの振幅と周期は極めて良く一致します。これだけ正確な正弦波を複数箇所で人間が描けるとは考えにくいです
 また、赤色のグラフは下端の-8192でクリップされていることに着目すべきです。
人間がVocaloid2 Editor でパラメータを描画した場合、下端でクリップされることは避けて描画すると思われます。 
400_pend500_pit_2
 こちらは、発音長が300mSEC~400mSEC の場合の発音要素(基本的に仮名1文字の発音)の PIT(ピッチベンド)の正弦波曲線です。周期が極めて良く一致していることが判ります。それぞれ微妙な周期ずれが有る理由は不明です。
400_pend300_pit

2)DYN(ダイナミックス・音量)
 文節の先頭・中間・末尾種別で、発音要素(仮名文字1文字)のDYN(ダイナミックス)のカーブが相違します。最初に文節の先頭部分をご覧ください。

 黄色の曲線が「ほんとうに」の「ほ」の発音要素、赤色の曲線が「もおのいがい」の「も」の発音要素、青色の曲線が「すてて」の「す」の発音要素のDYN(ダイナミックス)のカーブです。
 赤青黄の曲線すべてが発音要素の30mSECほど前から立ち上がっています。VOCALOIDは楽譜の母音のタイミングが楽譜のタイミングと一致させるため、子音を早めに発音している事と関係すると推定しました。子音の発音が始まる前からDYN(ダイナミックス)を上げておかないと、子音部分が聞き取れず、母音部分のみが強調された不自然な歌唱となります
 試しに初音ミクのデフォルト状態で「か」と「あ」を発音させた場合、「か」の方が20mSEC先に発音が始まりました。デフォルトの初音ミクでは子音は20mSEC先行して発音が始まるようですので、それを見越してDYN(ダイナミックス・音量)を調整する必要があります。
 また、400氏のVSQファイルは次の発音に入る直前に50mSEC程度、DYN(ダイナミックス・音量)を絞っています。これにより、人間が発音要素ごとに区切って喋るさまを表したのではと思います。
 赤青の曲線は良く一致していますが。黄色の曲線はやや他と乖離しています。この理由は不明です。
400_ptop_dyn

 文節の中間部分の発音要素のDYNグラフをご覧ください。グラフ形状が極めて良く相似します。 次の発音に入る直前に50mSEC程度、DYN(ダイナミックス・音量)を絞っている様子が観察できます。水色の曲線はやや他と相違していますが、その理由は不明です。
400_pmid_dyn
 文節の末尾部分の発音要素のDYNグラフをご覧ください。ビブラートを表す正弦波曲線と共に右方下がりの曲線となっていますが、肺の中の空気量が少なくなるにつれ音量が下がるという人間の生理現象を表現していると思われます。
400_pend_dyn

2、まとめ
 400氏は、Vocaloid2 Editor のパラメータ描画機能は使っていないと推定します。フリーハンドで描画したにしては、PIT(ピッチベンド・音程)の曲線が綺麗すぎ、周期が精確すぎるからです。また、人間がパラメータを描画した場合、PIT(ピッチベンド)の下端でクリップされることは避けて描画すると思われるからです。
 400氏は、WAVファイルをVSQ変換していないと推定します。人間の歌唱ファイルを元に変換したにしては、PIT(ピッチベンド・音程)の曲線が綺麗すぎ、かつ周期が精確すぎるからです。
 では、400氏はどうやってこの VSQファイルを作成したのでしょうか? そして400氏と「ぼかりす」とは何らかの関係を有しているのでしょうか?

3、400氏へのメッセージ
 PIT(ピッチベンド)の下端クリップや上端クリップを避ける為には、PBS(ピッチベンドセンシティビティ)の値を2に設定し、PIT(ピッチベンド)の値を半分にすればOKです。ご参考までに。

追記:400氏がまた書込まれていたようです。
http://pc11.2ch.net/test/read.cgi/streaming/1209997849/

716 名前:何スレか前の400 本日のレス 投稿日:2008/05/06(火) 08:57:45 U0wKRW7z0 ?

>>686 >>687 >>691 >>694
あー、mp3は消してしまいました。
調声もまだ途中だったし、カラオケ音源を使ったものを
いつまでも残しておくのもアレったので。

進捗状況ですが、MEIKOさんと初音ミクさんの音源はとりあえず完成しました。
今はMEIKOさんの動画をしこしこ制作中です。
実は、同時公開予定のオマケ(?)のほうが先に出来上がってしまったという。

「同時公開予定のオマケ?」とは、もしかして400氏流のDYN/PIT調整ツールでしょうか?

|

« 400氏のVSQファイルの解析#2 | トップページ | 特開2002-221978 »

初音ミク」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/110295/41105627

この記事へのトラックバック一覧です: 400氏のVSQファイルの解析#3:

« 400氏のVSQファイルの解析#2 | トップページ | 特開2002-221978 »