« 深夜は口述の勉強時間 | トップページ | 鬼門は商標法#2 »

初音ミクは連結式音声合成?!

これが、今年8月にベルギー・アントワープで開催された Interspeech2007 で発表されたVOCALOIDに関する最新の論文です。

Hideki Kenmochi, Hayato Ohshita [Center for Advanced Sound Technologies, Yamaha Corporation, Japan],
"VOCALOID – Commercial singing synthesizer based on sample concatenation"


斜め読みしてみましたが、VOCALOIDはフォルマント音声合成ではなく、連結式音声合成ですね。2002年当時の公開特許公報でフォルマントの語が頻出だったので、てっきりフォルマント音声合成だとばかり思い込んでおりました。

The Synthesis Engine receives score information, selects necessary samples from Singer Library and concatenates them. (4, Synthesis Engine)

シンセシス・エンジンはスコア情報を受領し、歌手ライブラリから必要とするサンプル音声を取得し、それらを結合する。(第4章、シンセシス・エンジンより、参考訳)

以下に、システムの概念図を引用します。歌詞(Lyrics)と音色(Note)を入力し、歌手ライブラリを元に歌声(Synthesis Output) を出力するというものです。

Vocaloid_kenmochi_ohshita

|

« 深夜は口述の勉強時間 | トップページ | 鬼門は商標法#2 »

初音ミク」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/110295/16702597

この記事へのトラックバック一覧です: 初音ミクは連結式音声合成?!:

« 深夜は口述の勉強時間 | トップページ | 鬼門は商標法#2 »