特開2002-221978
400氏のVSQ解析中に、特開2002-221978「ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置」が、初音ミクに実装されている証拠らしきデータを得ました。特開2002-221978の要約を以下に引用します。
【課題】 音節を構成する音素のうち、子音に対向する音素を音符の発生タイミングにあわせて発声することにより、伴奏に合わせたバーチャルシンガによる自然な歌唱を実現する。
【解 決手段】 歌詞に対応した音節毎の発音タイミングデータを含むボーカルデータを予め記憶する。再生処理を始めると、音符「ド」に対応した音節「さ」を発声させると き、子音「s」の発声動作を音符の発音タイミングよりも前に始め、母音「a」の発音タイミングを音符「ド」の発音タイミングに合わせる。これにより、伴奏 に遅れることなく、バーチャルシンガによる自然な歌唱を可能にする。
こちらが初音ミクの「あ [a]」の発音波形の図で、横軸が時間[秒]で縦軸が音声の振幅です。凡そ8.058秒から発音が始まっており、主たる母音は 8.070秒から発音されていることがわかります。
図1、初音ミクの「あ」の発音波形
こちらは、全く同じタイミングで初音ミクが「か [ka] 」を発音したときの波形です。8.047秒から高い周波数成分の発音が始まり、8.070秒まで続き、その後に低い周波数成分が続きます。高い周波数成分は子音の[k]で、低い周波数成分は母音の[a]と思われます。
この推測が正しいならば、初音ミクの子音成分は母音成分よりも先に発音されており、特開2002-221978に記載された発明が、初音ミクに実装されていると確認できたことになります。
図1、初音ミクの「か」の発音波形
| 固定リンク
「初音ミク」カテゴリの記事
- MMDの物理演算エンジン搭載テストの紹介(2009.06.07)
- VocaSim(2009.05.17)
- VSQのファイル仕様(推定)(2009.04.18)
- MIKU_TALK 修復(2008.10.22)
- 商標登録第5157451号(2008.10.13)


コメント
記事とはあまり関係ないのですが、上記公開特許、
http://www1.ipdl.inpit.go.jp/RS1/cgi-bin/RS1P409.cgi
ということなので、成立して無い、と考えて良いのでしょうか?
投稿: hidon | 2008年5月13日 (火) 09時25分