« 2007年12月 | トップページ | 2008年2月 »

新人研修・演習問題#2

昨日、11件の演習問題の解答を郵送しました。書留にしなかったけど、無事に届いてくれるかな。

ところで、自分がよく拝見している「ツカドン」さんのブログに、こんな資料が紹介されていました。

弁理士試験・研修制度についての意見
http://www.jpo.go.jp/shiryou/toushin/shingikai/pdf/dai4_berisi_paper/shiryou_4.pdf

その19頁を見てみると、平成18年度新人研修の課題提出数と提出率が記載されています。全体の提出率は 33.1% だそうです。

H18_sinjin_kensyuu

総起案数 6,435件
総提出数 2,133件
提出率   33.1%

こんなに課題提出率が低いとは思いませんでした。平成20年度新人研修では、どのような数字になるのでしょうか?

まあ、他人のことなど気にせずに、e-ラーニングをこなさなければなりません。2月23日までに受講しないとならない旨が要綱に記載されていますが、まだ15講義のうち6講義しか終わっていません。

| | コメント (2) | トラックバック (0)

新人研修・演習問題

 やっと11個の演習問題がすべて終わりました。しかし、特許の課題はともかくとして、意匠・商標の演習は全く自信がありませんが、タイムアウトなので、とりあえず終わるしかないです。述べ8日を消費してしまいました。
 しかし、この演習がなければ絶対に使うことがないであろうIPDLの機能の幾つかにも触れることができましたので、自分にはとても有益だったと考えています。
 知り合いにも進捗を聞きましたが、「課題をなめていましたよ、すごいボリュームですね。」との事です。来年度の弁理士試験合格者の方は、新人研修資料のダンボール箱を受領し次第、すぐさま課題に取り掛かることをお勧めいたします。

| | コメント (0) | トラックバック (0)

鏡音リンの商標登録出願

「鏡音リン・鏡音レン」の商標登録出願がやっと出願公開されました。今日、IPDL(特許電子図書館)を検索したらヒットしました。

リンとレンは別個に出願し、かつ称呼は「考えられる限り」多くにしたのですね。個人的には、指定区分 07 指定商品 ロードローラー 類似群 09A03 が無かったのは残念です。(笑)

(210) 【出願番号】 商願2007-116456
(220) 【出願日】 平成19年(2007)11月5日
  【先願権発生日】 平成19年(2007)11月5日
  【最終処分日】
  【最終処分種別】  
  【出願種別】  

  【商標(検索用)】 鏡音リン
(541) 【標準文字商標】 鏡音リン
(561) 【称呼】 カガミネリン,カガミオトリン,キョーオンリン,カガミネ,カガミオト,キョーオン,リン
(531) 【ウィーン図形分類】

(731) 【出願人】
  【氏名又は名称】 クリプトン・フューチャー・メディア株式会社

  【類似群】 05D01 09A01 09D01 09E21 09E26 09G53 19B33 24A01 24B02 24C01 24D01 24E01 25B02 26A01 26D01 41E01 41E02 41E03 41E04 41H01 41J01 41K01 41K02 41M01 41M06 41M08 41Z99 42G01 42N01 42N02 42N03 42P01 42P02 42P03 42Q01 42Q02 42Q03 42Q99 42R02 42R03 42X04 42X11 42X14 42X31
  【国際分類版表示】 第9版
(500) 【区分数】
(511) (512) 【商品及び役務の区分並びに指定商品又は指定役務】
移 動体電話による通信を用いてダウンロードされる移動体電話機の着信用の音楽,録画済みビデオディスク及びビデオテープ,自動販売機,駐車場用硬貨作動式 ゲート,作業記録機,写真複写機,手動計算機,製図用又は図案用の機械器具,タイムスタンプ,タイムレコーダー,電気計算機,パンチカードシステム機械, 票数計算機,ビリングマシン,郵便切手のはり付けチェック装置,ウエイトベルト,レギュレーター,家庭用テレビゲームおもちゃ,電気溶接装置,メトロノー ム,携帯用液晶画面ゲームおもちゃ用のプログラムを記憶させた電子回路及びCD―ROM,電子楽器用自動伴奏プログラムを記憶させた電子回路及び CD―ROM,電子出版物
28 スキーワックス,遊園地用機械器具(業務用テレビゲーム機を除く。),愛玩動物用おもちゃ,おもちゃ,人形,遊戯用器具,ビリヤード用具,運動用具,釣り具,昆虫採集用具
41 ゲー ム機械器具を備えた遊戯場・遊園地・その他の娯楽施設の提供,映画・演芸・演劇・音楽又は教育研修のための施設の提供,電子計算機端末による通信を用いて 行うゲーム又はゲームに関する映像の提供,ボウリング場・その他の運動施設の提供,レコード又は録音済み磁気テープの貸与,録画済み磁気テープの貸与,お もちゃの貸与,遊園地用機械器具の貸与,スロットマシンの貸与,遊戯用器具の貸与,映画・演芸・演劇又は音楽の演奏の興行の企画又は運営,映画の上映・制 作又は配給,演芸の上演,演劇の演出又は上演,音楽の演奏,放送番組の制作,音響用又は映像用のスタジオの提供,映写機及びその附属品の貸与,映写フィル ムの貸与,移動体電話による通信を用いて行うゲームの提供
42 イ ンターネット・電子メールその他の通信ネットワークを用いた電子計算機用プログラムの提供,移動体電話による電子計算機用プログラムの提供,気象情報の提 供,建築物の設計,測量,地質の調査,機械・装置若しくは器具(これらの部品を含む。)又はこれらの機械等により構成される設備の設計,デザインの考案, 電子計算機のプログラムの設計・作成又は保守,電子計算機・自動車その他その用途に応じて的確な操作をするためには高度の専門的な知識・技術又は経験を必 要とする機械の性能・操作方法等に関する紹介及び説明,医薬品・化粧品又は食品の試験・検査又は研究,建築又は都市計画に関する研究,公害の防止に関する 試験又は研究,電気に関する試験又は研究,土木に関する試験又は研究,農業・畜産又は水産に関する試験・検査又は研究,機械器具に関する試験又は研究,著 作権の利用に関する契約の代理又は媒介,社会保険に関する手続きの代理,計測器の貸与,電子計算機の貸与,電子計算機用プログラムの提供,理化学機械器具 の貸与,製図用具の貸与

...

(210) 【出願番号】 商願2007-116457
(220) 【出願日】 平成19年(2007)11月5日
  【先願権発生日】 平成19年(2007)11月5日
  【最終処分日】
  【最終処分種別】  
  【出願種別】  

  【商標(検索用)】 鏡音レン
(541) 【標準文字商標】 鏡音レン
(561) 【称呼】 カガミネレン,カガミオトレン,キョーオンレン,カガミネ,カガミオト,キョーオン,レン
(531) 【ウィーン図形分類】

(731) 【出願人】
  【氏名又は名称】 クリプトン・フューチャー・メディア株式会社

  【類似群】 05D01 09A01 09D01 09E21 09E26 09G53 19B33 24A01 24B02 24C01 24D01 24E01 25B02 26A01 26D01 41E01 41E02 41E03 41E04 41H01 41J01 41K01 41K02 41M01 41M06 41M08 41Z99 42G01 42N01 42N02 42N03 42P01 42P02 42P03 42Q01 42Q02 42Q03 42Q99 42R02 42R03 42X04 42X11 42X14 42X31
  【国際分類版表示】 第9版
(500) 【区分数】
(511) (512) 【商品及び役務の区分並びに指定商品又は指定役務】
移 動体電話による通信を用いてダウンロードされる移動体電話機の着信用の音楽,録画済みビデオディスク及びビデオテープ,自動販売機,駐車場用硬貨作動式 ゲート,作業記録機,写真複写機,手動計算機,製図用又は図案用の機械器具,タイムスタンプ,タイムレコーダー,電気計算機,パンチカードシステム機械, 票数計算機,ビリングマシン,郵便切手のはり付けチェック装置,ウエイトベルト,レギュレーター,家庭用テレビゲームおもちゃ,電気溶接装置,メトロノー ム,携帯用液晶画面ゲームおもちゃ用のプログラムを記憶させた電子回路及びCD―ROM,電子楽器用自動伴奏プログラムを記憶させた電子回路及び CD―ROM,電子出版物
28 スキーワックス,遊園地用機械器具(業務用テレビゲーム機を除く。),愛玩動物用おもちゃ,おもちゃ,人形,遊戯用器具,ビリヤード用具,運動用具,釣り具,昆虫採集用具
41 ゲー ム機械器具を備えた遊戯場・遊園地・その他の娯楽施設の提供,映画・演芸・演劇・音楽又は教育研修のための施設の提供,電子計算機端末による通信を用いて 行うゲーム又はゲームに関する映像の提供,ボウリング場・その他の運動施設の提供,レコード又は録音済み磁気テープの貸与,録画済み磁気テープの貸与,お もちゃの貸与,遊園地用機械器具の貸与,スロットマシンの貸与,遊戯用器具の貸与,映画・演芸・演劇又は音楽の演奏の興行の企画又は運営,映画の上映・制 作又は配給,演芸の上演,演劇の演出又は上演,音楽の演奏,放送番組の制作,音響用又は映像用のスタジオの提供,映写機及びその附属品の貸与,映写フィル ムの貸与,移動体電話による通信を用いて行うゲームの提供
42 イ ンターネット・電子メールその他の通信ネットワークを用いた電子計算機用プログラムの提供,移動体電話による電子計算機用プログラムの提供,気象情報の提 供,建築物の設計,測量,地質の調査,機械・装置若しくは器具(これらの部品を含む。)又はこれらの機械等により構成される設備の設計,デザインの考案, 電子計算機のプログラムの設計・作成又は保守,電子計算機・自動車その他その用途に応じて的確な操作をするためには高度の専門的な知識・技術又は経験を必 要とする機械の性能・操作方法等に関する紹介及び説明,医薬品・化粧品又は食品の試験・検査又は研究,建築又は都市計画に関する研究,公害の防止に関する 試験又は研究,電気に関する試験又は研究,土木に関する試験又は研究,農業・畜産又は水産に関する試験・検査又は研究,機械器具に関する試験又は研究,著 作権の利用に関する契約の代理又は媒介,社会保険に関する手続きの代理,計測器の貸与,電子計算機の貸与,電子計算機用プログラムの提供,理化学機械器具 の貸与,製図用具の貸与

| | コメント (0) | トラックバック (0)

ブログ用音楽プレーヤー

こういう記事を見つけましたので、早速テストしてみます。

ブログで使える埋め込みフラッシュMP3プレイヤー
http://blog.so-net.ne.jp/sothis/2008-01-01

上記のプレイヤーは、以下のMP3ファイルを再生するものです。

「wagahaiha_nekodearu.mp3」をダウンロード

文章は夏目漱石著「我輩は猫である」で、miku_talk013.pl で初音ミクに喋らせています。もうちょっとピッチベンドの修正を掛けたらリリースする予定です。

 吾輩は猫である。名前はまだ無い。
 どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそれは書生という人間中で一番獰悪な種族であったそうだ。この書生というのは時々我々を捕えて煮て食うという話である。しかしその当時は何という考もなかったから別段恐しいとも思わなかった。
ただ彼の掌に載せられてスーと持ち上げられた時何だかフワフワした感じがあったばかりである。掌の上で少し落ちついて書生の顔を見たのがいわゆる人間というものの見始であろう。この時妙なものだと思った感じが今でも残っている。第一毛をもって装飾されべきはずの顔がつるつるしてまるで薬缶だ。
その後猫にもだいぶ逢ったがこんな片輪には一度も出会わした事がない。のみならず顔の真中があまりに突起している。そうしてその穴の中から時々ぷうぷうと煙を吹く。どうも咽せぽくて実に弱った。これが人間の飲む煙草というものである事はようやくこの頃知った。

| | コメント (0) | トラックバック (0)

他言語と初音ミクについて

こういう記事を見つけました。

初音ミクはエスペラントで歌えるか (Erimitejo より)

この記事が書かれたのは2007年9月15日です。初音ミクが発売されてわずか2週間で初音ミクと形態素解析について考察され、そして他言語に応用できるかと示唆されているのは流石とおもいます。

エスペラント語とは、世界共通言語として設計された人工言語のうち、もっとも成功しているものの一つです。設計者のザメンホフは、最初はラテン語を世界共通言語として考えていたが、ラテン語を実際に学ぶと難しいことに気づいたために、ラテン語をベースにスラブ系言語を取り入れて、独自の言語体系を構築したものです。

自分は、エスペラント語もさることならが、イタリア語・スペイン語などロマンス諸語ならば、初音ミクはかなり上手く歌えるのではと思います。

そういえば、初音ミク関連の主要開発者のひとりであるジョルディ・ボナタさんはスペインのボンベフラウ・ファブラ大学(UPF というそうです)の方ですね。Miku にスペイン民謡とか歌わせておられるのではないかと想像しています。

El Grup de Tecnologia Musical desenvolupa Vocaloid, un sintetitzador de veu cantada
http://www.upf.edu/cms/cms/grec/en/0304/1211.html

これは VOCALOID の最初の技術発表の頃ですね。

Universitat Pompeu Fabra’s research in Voice Processing
results into YAMAHA’s virtual singer software VOCALOID

http://www.iua.upf.es/mtg/notas_prensa/Vocaloid.htm

The European ICT Prize : Vocaloid
http://www.ict-prize.org/nominees/detail.html?id=309_330

上記2件は、MEIKO など VOCALOID 商品が発売されていた頃の記事とおもいます。

September 20 2007 :: Success of Vocaloid 2 in Japan
http://mtg.upf.edu/pages/news/single?id=76

初音ミクが日本で成功したという記事が、写真つきで紹介されています。

| | コメント (0) | トラックバック (0)

MecabとYahoo!の形態素解析の比較

Yahoo!の形態素解析を用いた miku_talk も試作してみました。Mecab と形態素解析の性能を比較するためです。速度的にはどちらでも十分に速くて実用的ですが、形態素解析にはそれぞれ一長一短あります。

今回の御題は宮沢賢治の「風の又三郎」です。青空文庫 のテキストを利用させていただきましたので、ここに感謝の意を表します。

谷川の岸に小さな学校がありました。
教室はたった一つでしたが生徒は三年生がないだけで、あとは一年から六年までみんなありました。運動場もテニスコートのくらいでしたが、すぐうしろは栗の木のあるきれいな草の山でしたし、運動場のすみにはごぼごぼつめたい水を噴く岩穴もあったのです。さわやかな九月一日の朝でした。青ぞらで風がどうと鳴り、日光は運動場いっぱいでした。黒い雪袴をはいた二人の一年生の子がどてをまわって運動場にはいって来て、まだほかにだれも来ていないのを見て、「ほう、おら一等だぞ。一等だぞ。」とかわるがわる叫びながら大よろこびで門をはいって来たのでしたが、ちょっと教室の中を見ますと、二人ともまるでびっくりして棒立ちになり、それから顔を見合わせてぶるぶるふるえましたが、ひとりはとうとう泣き出してしまいました。というわけは、そのしんとした朝の教室のなかにどこから来たのか、まるで顔も知らないおかしな赤い髪の子供がひとり、いちばん前の机にちゃんとすわっていたのです。そしてその机といったらまったくこの泣いた子の自分の机だったのです。

宮沢賢治 「風の又三郎」より

◆Mecab版 「kazeno_matasaburou.mp3」をダウンロード

1から9までの数字をちゃんと読めるが、10以上の数字を読むことはできません。
また、正確に文章を形態素に落としてくれる場合があるかと思えば、ときどきとんでもない読みをします。恐らく辞書の問題とはおもいます。
前回のブログの朗読のときでも、「初音みく」を「ハツオトミク」と読むのはまだしも、「設計者」を「せっけいもの」と読むのは失礼にあたるので、ちょっとまずいですね(笑)。
Mecabはユーザー辞書の定義ができるので、今度トライしてみたいとおもいます。

◆Yahoo!形態素解析版 「y_kazeno_matasaburou.mp3」をダウンロード

数字をまともに読まずに無視しますが、それ以外は正確に文章を形態素に落としてくれます。
Yahoo!形態素解析のいちばんの問題点は「使用者それぞれがアプリケーションIDを登録しなければならない」点です。Yahoo!のWEB-APIの利用許諾には、アプリケーションIDは一般に公開しないように記載されています。
ユーザーにそんな登録のための労力を強いるというのは、アプリケーションの使い勝手を極めて損なうものですので、リリース用アプリケーションに用いるのはためらってしまいます。

| | コメント (2) | トラックバック (1)

剣持氏インタビュー

DTMマガジン1月号増刊 「the VOCALOID CV01初音ミク」に掲載された、ヤマハ株式会社の剣持氏インタビューについて調べてみました。

◆足りない音階はピッチ変更することについて

剣持 ピッチの数は12音階全部を録るのが理想は理想なのかもしれませんが、録音に時間をかけすぎるとシンガーさんの声が変わったりしますから、実際は12音階すべては録らないようになっています。足りない音階は合成する際に内部的にピッチを変えて出力します。

(the VOCALOID CV01 初音ミク 37頁より)

12音階全てのデータを持たずに、内部的に変換を掛けることにより、シンガーの録音時間を短縮することにより声の変化を最小化するという効果が生まれますが、元々はVOCALOIDの音声データベースを圧縮することが目的だったようです。特開2005-234337「音声合成装置、音声合成方法、及び音声合成プログラム」が対応する特許出願と思われます。

【課題】 ハードウェア資源に大きな制約が課されている環境下においても、様々な種類の声質の合成音声を生成することができる音声合成装置等を提供する。
【解決手段】 1種類の音韻データを備えた音声合成装置100に声質変更部250及び声質データベース260を設ける。声質変更部250は、テキスト解析部220から供給される声質データ番号を検索キーとして声質データベース260を検索し、声質パラメータを取得する。声質変更部250は、取得した声質パラメータに基づいて、音韻データ取得部230によって取得される音韻データに示される各音韻の声質を変更する。

(特開2005-234337より)

◆音素を自然に変化させることについて

剣持 VOCALOID2では、これら素片同士の「伸ばし音区間」で要素を補完することにより、接続部で原理的に「音色の突然の変化」が発生しないようにしているんです。

(the VOCALOID CV01 初音ミク 37頁より)

音声素片の接続部での「音色の突然の変化」がおきないようにするには、スペクトル領域での調整をおこなっている、特開2003-255998「歌唱合成方法と装置及び記録媒体」が対応する特許出願と思われます。

【課題】 自然な 歌唱音声又は高品質の歌唱音声を合成する。
【解決手段】 音素又は音素連鎖からなる音声素片に対応する音声波形を周波数分析して周波数スペクトル(A)を検出する。周波数スペクトル(A)上でP1等の局所的ピークを検知し、これらのピークを含むR1等のスペクトル分布領域を指定する。各スペクトル分布領域毎に、振幅スペクトル分布を周波数軸に関して表わす振幅スペクトルデータと、位相スペクトル分布を周波数軸に関して表わす位相スペクトルデータとを生成する。各スペクトル分布領域の振幅スペクトル分布を入力音符ピッチに応じて周波数軸上で(B)の様に移動すべく振幅スペクトルデータを修正し、この修正に対応して位相スペクトルデータを修正する。所望の音色 に対応するスペクトル包絡に沿うようにスペクトル強度を調整する。修正された振幅及び位相スペクトルデータを時間領域の合成音声信号に変換する。

(特開2003-255998より)

◆所望のピッチに合わせて素片を変化させることについて

剣持 そして「こういったピッチで動く」っていうのだけ決まったら、それに合わせて他の全てのピッチが変動しますね。隣り合った素片同士は、波形自体もきれいにつながらなければならないので、・・・

(the VOCALOID CV01 初音ミク 37頁より)

ピッチに適合して音素の繋がりを調整する関する発明は、特開2002-202790「歌唱合成装置」 が対応する特許出願と思われます。発明者は、劔持秀紀さん、ザビエル・セラさんとジョルディ・ボナタさんです。

【課題】 高品質な歌声を合成する。
【解決手段】 スペクトルモデル合成(SMS)分析合成法において、音素または2つ以上の音素連鎖についてSMS分析を行いデータベース10を作成し、合成時に必要な音素または音素連鎖のSMSデータを接続し合成することで歌声を得る。前記データベース10には、同じ音素あるいは音素連鎖につき、異なるピッチ、ダイナミクス、テンポごとに別個の素片データを記憶する。調和成分調整手段22、非調和成分調整手段23で、読み出した素片データの調和成分および非調和成分を目的のピッチに合うように調整し、継続時間調整手段24で目的のテンポに合うように音素または音素連鎖の長さを調整し、素片レベル調整手段25でレベル調整した後、各素片を接続し、所望のピッチに対応した調和成分を生成して、非調和成分と合成する。
(特開2002-202790より)

◆音素ごとの繋がりについて

剣持 英語版の場合には、子音から子音につながる構造も、子音から無音につながる構造も、すべてサンプリングされて入っているということですね。

(the VOCALOID CV01 初音ミク 38頁より)

これは、特開2002-202790「歌唱合成装置」 の請求項4に記載された発明と思われます。

 

【請求項4】 前記音韻データベース中には、母音などの伸ばし音からなる音声素片データ、子音から母音あるいは母音から子音への音素連鎖からなる音声素片データ、子音か ら子音 への音素連鎖からなる音声素片データおよび母音から母音への音素連鎖からなる音声素片データが記憶されていることを特徴とする請求項1~3のいずれかに記 載の歌唱合成装置。 

(特開2002-202790 より)

◆子音のタイミング合わせについて

インタビュアー 「逆に言えば、Editor上で打ち込みをしているときは、Editor側で子音のタイミングを合わせてくれているのでしょうか。」

剣持 「そうです、子音を自動で前にシフトして合わせています。」

(the VOCALOID CV01 初音ミク 39頁より)

これは、子音の発生タイミングと音符の発生タイミングと同時にしたならば自然な歌唱にならないという課題を、子音の発生タイミングを少し前にシフトして合わせるという発明で解決したもので、特開2002-221978「ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置」が対応する特許出願とおもわれます。

【課題】 音節を構成する音素のうち、子音に対向する音素を音符の発生タイミングにあわせて発声することにより、伴奏に合わせたバーチャルシンガによる自然な歌唱を実現する。
【解決手段】 歌詞に対応した音節毎の発音タイミングデータを含むボーカルデータを予め記憶する。再生処理を始めると、音符「ド」に対応した音節「さ」を発声させるとき、子音「s」の発声動作を音符の発音タイミングよりも前に始め、母音「a」の発音タイミングを音符「ド」の発音タイミングに合わせる。これにより、伴奏に遅れることなく、バーチャルシンガによる自然な歌唱を可能にする。
(特開2002-2221978より)

◆合唱について

剣持 「あと、これはVOCALOIDシリーズに入るかどうかはわかりませんが、コーラスの合成技術も研究しています。」

(the VOCALOID CV01 初音ミク 39頁より)

合唱に関する特許出願は以下の2つと思われます。
特開2004-077608「合唱合成装置、合唱合成方法およびプログラム」
発明者は、劔持秀紀さんとジョルディ・ボナタさんです。

【課題】より自然な印象を聴取者に与えることが可能な合唱音を合成する。
【解決手段】この合唱合成装置100は、各々異なる音声に基づいて作成した3つの音声試料データ群110a,110b,110cを記憶する音声試料データベース110と、3つの歌唱生成器120,121,122とを有している。3パートからなる楽曲の合唱音信号を合成する際には、合唱制御部140の制御に下、歌唱生成器120,121,122は各々パートに歌詞情報やメロディ情報に応じて歌唱音信号を生成し、各合唱音信号を合成する。この生成の際に、各歌唱生成器120,121,122は異なる音声試料データ群110a,110b,110cに含まれる音声素片試料データを用いる。

(特開2004-077608より)

特開2006-251375「音声処理装置およびプログラム」
発明者は、劔持秀紀さん、吉岡靖雄さんとジョルディ・ボナタさんです。

【課題】 入力音声を簡易な構成によって多人数での合唱音や合奏音に変換する。
【解決手段】 ピッチ検出部12は、音声入力部61から供給される入力音声信号VinのピッチPinを検出する。エンベロープ検出部13は、入力音声信号Vinのスペクトルエンベロープを検出する。スペクトル取得手段30は、並列に発生された複数の音声を含む変換用音声の周波数スペクトルを取得する。ピッチ変換部21は、スペクトル取得手段30が取得した周波数スペクトルの各ピークの周波数をピッチPinに応じて変化させる。エンベロープ調整部22は、ピッチ変換部21による処理後の周波数スペクトルのスペクトルエンベロープをエンベロープ検出部13が検出したスペクトルエンベロープと略一致するように調整する。音声生成手段40は、エンベロープ調整部22による調整後の周波数スペクトルから出力音声信号Vnewを生成する。
(特開2006-251375より)

コーラスに関しては、論文でも発表されています。
Unisong: A Choir Singing Synthesizer
2006年10月に発表された論文で、著者は劔持秀紀さん、ジョルディボナダさん、Blaauw, Merlijnさん、Loscos, Alexさんの4名です。

Computer generated singing choir synthesis can be achieved by two means: clone transformation of a single voice or concatenation of real choir recording snippets. As of today, the synthesis quality for these two methods lack of naturalness and intelligibility respectively. Unisong is a new concatenation based choir singing synthesizer able to generate a high quality synthetic performance out of the score and lyrics specified by the user. This article describes all actions and techniques that take place in the process of virtual synthesis generation: choir recording scripts design and realization, human supervised automatic segmentation of the recordings, creation of samples database, and sample acquiring, transformation and concatenation. The synthesizer will be demonstrated with a song sample.

(Unisong A Choir Singing Synthesizer : Abstract より)

 コンピュータは合唱するように歌声を発生することを以下2つの方法で達成することができます: ただ一つの声のクローンによる変化か、又は本当のコーラス録音の連結です。現在において、これらの2つの方法の統合品質はそれぞれ自然さと明瞭さに欠けています。
 ユニソングは、スコアと歌詞によって高品質の合成音声の性能を得られるユーザ指定のコーラス歌声シンセサイザです。この記事は、仮想の統合世代の途中に行われるコーラス録音スクリプトの人間の監督された自動分割、サンプルデータベースの創造、サンプル取得、変化、および連結を実現する全ての動作とテクニックについて説明します。シンセサイザは歌のサンプルでデモンストレーションをするでしょう。
(参考訳)

'F-2 Voice Solo to Unison Choir Transformation'
2005年に発表された論文で、ジョルディ・ボナタさんが執筆しています。これはソロのボーカルをリアルタイムに多人数コーラスに変換する手法の論文のようです。

In this paper we present a transformation that pretends to convert a voice solo into a large, unison choir. The basic idea behind the presented algorithm is to morph the input voice solo (dry recording) with a recorded sustained vowel of a unison choir. The processing algorithm is based on the rigid phase-locked vocoder adapted to harmonic sounds. Pitch and timbre are taken from the voice solo, and the local spectrum comes out from the analysis of the unison choir sample.

(F-2 Voice Solo to Unison Choir Transformation)

 この論文では、私たちはソロの歌声を多人数コーラスに変換するふりをする変換について述べます。 提示されたアルゴリズムの後ろの基本的な考え方は入力声のソロの歌声(乾いた録音)を多人数コーラスの記録された持続している母音に変形することです。 処理アルゴリズムは倍音に適合させられたフェーズロック・ボコーダに基づいています。 ソロの歌声からピッチと音色を取ります、そして、多人数コーラスのサンプルの分析からローカルスペクトルを得ます。
(参考訳)

| | コメント (0) | トラックバック (1)

新人研修e-ラーニング

 遅まきながらやっと、新人研修のe-ラーニングを開始しました。まずは「登録の手続き」を半分ほど聞きました。幸いながらもJAVAのインストールも無事に終わり、個別ログにも学習記録がちゃんと残っているので問題はなさそうです。
 問題は講義と演習のボリュームです。1.5時間の講義が15回あるので最低でも22時間30分は掛かります。かつ演習課題11個も出題されており、それを1月31日までに提出しなければなりません。かつてのLECの弁理士1年コースをとっていた頃のようです。その頃は毎週土曜日に3時間の講義を2コマ受けていましたが、今回の新人研修も同様のペースでないと追いつかないようです。よって、ちょっとだけmiku_talkの進捗が遅れるとおもいます。

e-ラーニングを開始するため、日本弁理士会のホームページを開くつもりで、うっかりミスタイプして日本養鶏協会のホームページを開いてしまって苦笑い、参考までに以下にURLを記載します。

◆日本弁理士会 http://www.jpaa.or.jp
◆日本養鶏協会 http://www.jpa.or.jp

| | コメント (3) | トラックバック (0)

初音ミクに喋らせてみた(ピッチベンド利用)

やっとDTMマガジン1月号増刊「The Vocaloid CV01 初音ミク」が入手できました。

やはりヤマハ剣持氏のインタビューは面白かったですね。剣持氏といえば、12月30日のVocaloid Night Vol.2 でも登場されたそうです。年末は時間が取れなかったので自分はイベント等には行けなかったので、ちょっと残念に思っています。

この記事をもとに、自分が記載した「初音ミクの特許出願について 」の内容と照合してみます。

(1)VOCALOIDの開発開始時期の推定

自分は2002年にプロジェクトがスタートしたと推定したのですが、実際には2000年からプロジェクトがスタートしたそうです。推定と実際のズレの原因は、VOCALOIDの技術はフォルマント音声合成だと思い込んでおり、最後のチューニングが2002年の特許出願のピークだと判断したためです。実際にはフォルマント音声合成や連結型音声合成などの色々な方式を試す期間が必要であったのだろうと思われます。

(2)VOCALOIDの開発者数の推定

自分は10名から15名と推定したのですが、実際には主要メンバー2~3名+プログラマやテスターの方々が数名だったそうです。フォルマント音声合成の開発者を含めてカウントしてしまったのがズレの原因と思われます。

(3)主要開発者の推定

剣持さんが主要開発者であることは当たりました。

今回は、剣持氏のインタビュー内に記載された喋らせ方のコツ(38ページ)を読んで、VOCALOID Editor 上でミクの発音を修正してみました。流石は開発者のアドバイスですね、ミクの喋りがかなり自然になりました。

「tokkyo_2_pb.mp3」をダウンロード

「tokkyo_2_pb.vsq」をダウンロード

以前のバージョンでも、文節ごとの区切りと、音階によるアクセントの付与はおこなっていましたが、どうしても機械的になってしまいます。喋らせ方のコツに基づいて新たに行ったことは以下の2点です。

①ピッチベンド(PIT)を使用してアクセントを付与すること。音節ごとにピッチベンドのカーブを山なりにした。

②助詞と助動詞の発音を他と比して短くした。これにより品詞を理解して発音している様が表現できます。

その他、自分なりに新たに工夫したところは以下のものです。

③名詞の発音のVELを他と比して高くすること。これにより品詞を理解して発音している様が表現できます。

④OPEパラメータをPITと同様のカーブになるよう触ってみました。これはあまり利かないようです。

| | コメント (0) | トラックバック (1)

« 2007年12月 | トップページ | 2008年2月 »