« 400氏のVSQファイルの解析#3 | トップページ | vocannaindesu »

特開2002-221978

 400氏のVSQ解析中に、特開2002-221978「ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置」が、初音ミクに実装されている証拠らしきデータを得ました。特開2002-221978の要約を以下に引用します。

【課題】 音節を構成する音素のうち、子音に対向する音素を音符の発生タイミングにあわせて発声することにより、伴奏に合わせたバーチャルシンガによる自然な歌唱を実現する。
【解 決手段】 歌詞に対応した音節毎の発音タイミングデータを含むボーカルデータを予め記憶する。再生処理を始めると、音符「ド」に対応した音節「さ」を発声させると き、子音「s」の発声動作を音符の発音タイミングよりも前に始め、母音「a」の発音タイミングを音符「ド」の発音タイミングに合わせる。これにより、伴奏 に遅れることなく、バーチャルシンガによる自然な歌唱を可能にする。

 こちらが初音ミクの「あ [a]」の発音波形の図で、横軸が時間[秒]で縦軸が音声の振幅です。凡そ8.058秒から発音が始まっており、主たる母音は 8.070秒から発音されていることがわかります。

A_wav00_2
図1、初音ミクの「あ」の発音波形

 こちらは、全く同じタイミングで初音ミクが「か [ka] 」を発音したときの波形です。8.047秒から高い周波数成分の発音が始まり、8.070秒まで続き、その後に低い周波数成分が続きます。高い周波数成分は子音の[k]で、低い周波数成分は母音の[a]と思われます。
 この推測が正しいならば、初音ミクの子音成分は母音成分よりも先に発音されており、特開2002-221978に記載された発明が、初音ミクに実装されていると確認できたことになります。

Ka_wav00
図1、初音ミクの「か」の発音波形

|

« 400氏のVSQファイルの解析#3 | トップページ | vocannaindesu »

初音ミク」カテゴリの記事

コメント

記事とはあまり関係ないのですが、上記公開特許、
http://www1.ipdl.inpit.go.jp/RS1/cgi-bin/RS1P409.cgi
ということなので、成立して無い、と考えて良いのでしょうか?

投稿: hidon | 2008年5月13日 (火) 09時25分

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 特開2002-221978:

« 400氏のVSQファイルの解析#3 | トップページ | vocannaindesu »