« 特開2002-221978の帰趨#2 | トップページ | ぼかんないんです><&ぼかりす »

特開2002-221978の帰趨#3

 

特開2002-221978「ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置」とは、初音ミクに実装されていると思われる発明で、母音のタイミングを音符のタイミングと一致させる為に、子音を先行して発音させるものです。

【課題】 音節を構成する音素のうち、子音に対向する音素を音符の発生タイミングにあわせて発声することにより、伴奏に合わせたバーチャルシンガによる自然な歌唱を実現する。
【解 決手段】 歌詞に対応した音節毎の発音タイミングデータを含むボーカルデータを予め記憶する。再生処理を始めると、音符「ド」に対応した音節「さ」を発声させると き、子音「s」の発声動作を音符の発音タイミングよりも前に始め、母音「a」の発音タイミングを音符「ド」の発音タイミングに合わせる。これにより、伴奏 に遅れることなく、バーチャルシンガによる自然な歌唱を可能にする。

当該特許出願の、最初の拒絶理由通知(17条の2第1項1号)にて引用された発明 特開平10-319993 「データ編集装置」 の権利化後である特許3518253 「データ編集装置」 の請求項1を見てみました。特許発明の技術的範囲の判断は、原則として請求範囲が基準となるためです。(特許法70条1項) 括弧部分は請求項の理解のために付記しました。

【請求項1】

(公知部分1) 再生テンポに非依存のデュレーションデータにより発生時間が規定された複数の音素データから構成される音節データを含む音声データと

(公知部分2) 該音声データの発音タイミングを規定する再生テンポに依存したタイミングデータとを含むソングデータにおける

(公知部分3) 前記音節データを編集することができるデータ編集装置であって、

(特許要件1) 前記音節データを構成する前記複数の音素データのうちの1つを指定する音素指定手段と、

(特許要件2)
 前記音素指定手段により指定される音素データに対応するデュレーションデータを前記再生テンポの指定とは独立して指定される発生時間に変更する変更手段と

 を有するデータ編集装置。

特開平10-319993 の権利化後である特許3518253 「データ編集装置」 のデータ編集装置とは、Vocaloid Editor の編集機能などを指すと思われます。

 これを、特開2002-221978「ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置」の請求項1と対比します。

【請求項1】
(公知部分1) メロディおよび歌詞に対応するボーカルデータを生成するボーカルデータ生成装置であって、

(特許要件1) 歌詞の音節を前記メロディに対応する音符に割り当てる歌詞割当手段と、

(特許要件2) 前記音節を音素に分け、各音節を構成する音素のうち、母音の音素の発音タイミングを前記音符に対応する発音タイミングに合わせるべく各音節に対応する発音タイミングデータを生成する発音タイミングデータ生成手段と、

(特許要件3) 前記音節の音素列データ、前記発音タイミングデータおよび前記音節に対応した音高データをボーカルデータとして生成し、このボーカルデータを出力するデータ出力手段と、

 を備えたことを特徴とするボーカルデータ生成装置。

特開2002-221978 のボーカルデータ生成装置とは、Vocaloid Editor の音声出力機能を指すと思われます。最も大きな相違点は、引用発明は音素データの指定手段を有するのに対して、当該発明は音素データの指定手段が無い事です。
 出願人は、最初の拒絶理由通知に対する意見書で音素データの指定無しに発音タイミングを自動調整できることを主張しています。しかし、先願の特許要件を削除したならば、それは上位概念の発明となるため、拒絶査定(特許法49条)を受ける理由となると思います。
 出願人のヤマハ(株)は、Vocaloid の発声タイミングの自動調整機構は、特許3518253 「データ編集装置」 ではカバーされていないことに気づいたのだと思います。そして、特開2002-221978 を審査請求して特許権取得を狙ったが、特許3518253 「データ編集装置」 の権利化前である 特開平10-319993 「データ編集装置」で極めて近い発明が公知化されていた為、相違点は当業者に容易に想到できるとして審査官に拒絶査定を受けたのだと推定します。


 さて、今回の件で、特開平10-319993 「データ編集装置」 及び権利化後の特許3518253 「データ編集装置」 を見てみました。

H10319993_fig4
 これを Vocaloid1 Editor のPhonome編集画面と対比してみてください。酷似しているので驚いてしまいました。

 図4      - Phonome編集画面
 ノート     → (対応なし)
 発音時間   ⇔ POSITION
 歌詞      ⇔ LYRICS
 音素列データ ⇔ PHONETIC SYMBOLS
 呼気      → (対応なし)
 (対応なし)  ← PROTECT

Phenome_edit

段落0050は、ブレス音の実装を記載しています。Vocaloid2 の実装では、ブレスは音素として扱われていますが、当該発明では音素データの属性として扱われています。

【0050】呼気データ65は、息継ぎを表現することを示すデータである。音素データPDの後に呼気データ65が位置すると、その音素データPDを発音した後、息継ぎ表現を行うのため発音を無音状態に変化させることを示す。呼気データ65は、音素列データ55の最後に位置する場合に限らず、音素データPDと他の音素データPDの間に位置してもよい。

段落0052は、ベロシティ(VEL)の実装を記載しています。50音の音素ごとに子音の長さを調整するのではなく、更に細かな音素に分解し、その発音長(デュレーション)を変更可能としてます。

【0052】音節編集機能とは、該各音素のデュレーションを編集することができる機能である。例えば、音素「kha」のデュレーションを4×7.5msから、3×7.5ms又は5×7.5msに変更することができる。この機能を使えば、デュレーションを自由に設定することができるため、例えば音節「か」を発音する場合にも、多様な「か」の発音を行うことができる。

段落0053は、VOCALOIDには全く実装されていない機能について言及しています。

【0053】また、音節編集機能は、音節を構成する音素列データに新たな音素を付け加えることができる。例えば、音素列「CL+kha+aj」に新たな音素を付け加えることにより、鼻にかかったような「か」の発音を実現することも可能になる。さらに、音素を付け加える代わりに、音節を付け加えるようにしてもよい。

 上記のことを総合すると、特開平10-319993 「データ編集装置」 は、VOCALOID のプロトタイプを元に特許出願したものと推定します。VOCALOIDの編集ウインドウと酷似した画面が掲載されており、VOCALOIDに搭載された機能の多くが記載されており、かつVOCALOIDの技術発表(2003年)以前だからです。
 この推定が正しいとすると、特開平10-319993 「データ編集装置」の出願日の1997年5月22日には、既にVOCALOIDプロトタイプが開発済みであったことになります。

|

« 特開2002-221978の帰趨#2 | トップページ | ぼかんないんです><&ぼかりす »

初音ミク」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/110295/41229978

この記事へのトラックバック一覧です: 特開2002-221978の帰趨#3:

« 特開2002-221978の帰趨#2 | トップページ | ぼかんないんです><&ぼかりす »