« 論文試験合格 | トップページ | ポンペウファブラ大学 »

初音ミクの特許出願について

「初音ミク」に用いられている音声合成技術は、ヤマハが開発したものです。よって、ヤマハの音声合成に係る特許出願を調査することで、開発の推移を調べてみました。

以下に、ヤマハが出願人となっている特許のうち、音声合成に係る特許の出願数の推移のグラフを表示します。

 Yamaha

1998年以前は、音声合成とはいっても、カラオケで歌う歌声を加工して、あたかも原歌手が歌っているかのようにリアルタイムに音声加工する発明ばかりです。

特開平5-204397「音声分析合成装置」

特開平8-194495「カラオケ装置」

1998年に、特開平10-49192「歌唱音合成装置」 が出願されます。この時点でヤマハのエンジニアは、予め取り込んだ歌声から新たな歌唱を再構成することに価値が有ることに気付いたようです。すなわち、これがVOCALOIDの基礎出願と思われます。

【課題】 歌詞データに対応して高品質の歌唱音を合成する。
【解決手段】 音源部20には有声音フォルマント成分を生成する有声音成分音源(VTG)グループ21と無声音フォルマント成分を生成する無声音成分音源(UTG)グループ22とからなるフォルマント合成音源と、無声子音の音声波形が格納された波形メモリを有するPCM音源23とが設けられている。ROM11には制御プログラムのほかに、各音韻を発声するための音韻パラメータと、先行音韻と後続音韻とのわたりの部分の制御パラメータである調音結合パラメータとが記憶された音韻データベースが格納されている。データメモリ13中には楽曲の歌詞データと伴奏データなどからなるソングデータが格納されており、この歌詞データに基づいて前記音韻データベースから対応するパラメータを読み出し前記音源部20により対応する音声を合成出力する。このとき、無声子音は前記PCM音源23により発声させる。

その後の改良発明に係る出願を以下に列挙します。主に2002年度以降に出願されています。

特開平11-15489「歌唱音合成装置」

特開2002-221978「ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置」

この出願では、既に「バーチャルシンガ」という概念が記載されています。

【課題】 音節を構成する音素のうち、子音に対向する音素を音符の発生タイミングにあわせて発声することにより、伴奏に合わせたバーチャルシンガによる自然な歌唱を実現する。

特開2002-268658「音声分析及び合成装置、方法、プログラム」

特開2003-255974「歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム」

特開2003-255998「歌唱合成方法と装置及び記録媒体」

特開2004-4440「歌唱合成装置、歌唱合成用プログラム及び歌唱合成用プログラムを記録したコンピュータで読み取り可能な記憶媒体」

特開2004-061753「歌唱音声を合成する方法および装置」

特開2004-061793「歌唱合成装置、歌唱合成方法並びに歌唱合成用プログラム」

特開2004-077608「合唱合成装置、合唱合成方法およびプログラム」

発明者は、ジョルディボナタ、劔持秀紀、久湊裕司の3名が目立ちます。開発チームは2002年に組織され、恐らく10名~15名で構成されていると思われます。

出願人は、ヤマハ株式会社のほか、ポンペウファブラ大学が名前を連ねています。この大学はバルセロナにある大学で、かなり先進的な研究をおこなっています。

2003年2月に、歌詞とメロディを入力すると歌い出す ヤマハが歌声合成ソフト開発 の発表がなされます。

最近の公開特許公報から推測すると、VOCALOIDのアプリケーションの本命は、携帯電話に実装してメールを読み上げることのようです。いまだにそのアプリケーションは世に出ておりませんが、ヤマハ(株)がうまくこの事業を成功することを祈っております。

特開2006-119655「音声合成装置」

ヤマハ株式会社に置かれましては、釘宮理恵のVOCALOIDを携帯電話に組み込んで商品化いただくように、よろしくお願いいたします。(お約束)

|

« 論文試験合格 | トップページ | ポンペウファブラ大学 »

初音ミク」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/110295/16513624

この記事へのトラックバック一覧です: 初音ミクの特許出願について:

« 論文試験合格 | トップページ | ポンペウファブラ大学 »