« 2008年2月 | トップページ | 2008年4月 »

Yahoo!の形態素解析の動作変更?!

 今日、miku_talk の形態素解析ボタンが動作しないので、ちょっと焦りました。
 いままで、自然文を送信するのに POSTリクエストを使っていたのですが、Yahoo側の動作が変わり、POSTリクエストは受け付けなくなったようですね。仕様とおりに、自然文をGETリクエストで送信すると、うまく変換できるようになりました。やはりソフトウエアは仕様書通りに作るのが大切のようです。
 POST リクエストを使った理由は、GETリクエストよりも大量データが問題なく処理できそうという予測および、参考にしたサンプルコードがPOSTリクエストを使っていたことによります。基本を疎かにして、不具合を出してしまいました。ちょっと反省です。

| | コメント (0) | トラックバック (0)

人力ボカロ支援ツール

噂の人力ボカロ支援ツールのガイダンスビデオを見てみました。



いや凄いですね。個人が作成するフリーソフトで、これだけのことができるのは大したものです。

なお、ビデオ中の音素ファイルの名称が「釘宮理恵さま.wav」とありますが、このソフトは自分が作ったものではありません。(笑)

| | コメント (0) | トラックバック (0)

iPod mini 改造

iPod mini 第一世代の電池の持ちが悪く、容量が4Gで小さすぎ、かつマイクロドライブの起動時にいきなり電池メーターがガクンと落ちるという問題があったので、電池交換とCF16G化を同時におこないました。

手順はあちこちのブログに掲載されておりますので、参考にいたしました。写真つきで手順を記載いただいているブログ・マスターの方々に感謝です。

http://blog.cafe7th-heaven.net/?eid=269523
http://www.h3.dion.ne.jp/~bukuro/aboutus/mac/ipodmini/ipodmini.htm

バッテリーと電池を交換して、再び筐体内に本体を収納するときに、クリックホイールを破壊しないかヒヤヒヤものでした。なにせ、全て自己責任ですから。
交換後にPCに接続し、iTunes で復元を選択すればOKです。無事に容量 15.8GB の表示が出たときはちょっと嬉かったです。CFの読込速度はマイクロドライブよりもちょっと遅いかな。曲を選択してからちょっと待たされる感じがします。でも、曲を選択したときにバッテリーメーターがガクンと減る問題がなくなると、ずいぶんと稼動時間が延びるのではと思います。

| | コメント (0) | トラックバック (0)

初音ミクに喋らせてみた(0.2.0版)

初音ミクに喋らせるためのWEBアプリケーション MIKU_TALK Ver. 0.2.0 を作成いたしました。以下の URL から利用できます。

http://akiraizumi.sv1.sp-land.net/yahoo_ma20/yahoo_ma.html

MIKU_TALK Ver.0.2.0に於ける主な追加機能は以下のものです。

  • 括弧の削除機能

    形態素解析前に括弧を削除することが可能です。青空文庫は、漢字の直後に読み仮名を括弧付きで付加しており、同じ漢字を二重に発音する恐れがある為です。また、法律の条文などは付加的な説明文を括弧付きで付加していますが、冗長な場合も多い為です。

  • 長音の処理

    形態素解析パートにて、同一母音の連続又は特定母音を長音に変換する機能を付加しました。具体的には「ボオカロイド」は「ボーカロイド」に、「はつめい」は「はつめー」に変換されます。これにより、日本人の通常の発音に近づけることができました。

  • 品詞毎の調整

    VSQ生成パートにて、品詞が名詞ならば音量(DYN)を80に、形容詞/形容動詞/接頭詞/感動詞/接頭辞/副詞ならば音量(DYN)を72にして音程(PIT)を高めに設定し、それ以外の品詞ならば、音量(DYN)を64にして音程(PIT)を低めに設定いたしました。これにより、品詞の重要度に応じて音量・音程を調整している様子を表現しました。

  • 子音毎のベロシティ調整

    カ行とサ行と「つ」はベロシティ(VEL)を大きく(子音を短く)、ラ行はベロシティ(VEL)を小さく(子音を長く)発音するように致しました。これは、「初音ミク」の音素テーブルはカ行サ行「つ」の子音が強く、ラ行の子音は弱いという癖があり、その癖を矯正して自然に発音させるためです。よって、他のVOCALOID製品では異なったチューニングが必要と思われます。

  • 単語の区切り

    単語を連続で5~7音素連続して発音すると少しだけ時間間隔を空けます。日本語は5音素または7音素で区切って発音される事が多いためです。

    また、句読点「、」「。」で時間間隔を空けると同時に息継ぎをおこない、句読点の直前の単語では音程を下げます。これにより文章の構造を理解して喋る様子を表現しました。

以下が MIKU_TALK Ver. 0.2.0 のサンプルです。


ただいま留守にしております。ご用件のある方はピーッという音の後にメッセージを入れてください。

特許法第2条

蜘蛛の糸 芥川龍之介

雨ニモマケズ 宮沢賢治

| | コメント (0) | トラックバック (0)

剣持氏のセミナー講演

剣持氏がデジタルコンテンツ協会のセミナーで講演されたそうです。この記事をもとに幾つかコメントします。

「Mac版まだ?」「自分の声で歌えない?」――VOCALOID、よくある質問
http://www.itmedia.co.jp/news/articles/0803/17/news108.html

最初の図面が、かつて当ブログで引用したVOCALOID概念図そのものでした。考えて見れば剣持氏が初音ミク発売直前に学会発表したものですから当然ですね。
この記事では、ユーザーの要望が幾つか述べられています。

◆Mac版は?
 日本における MacOS Xのシェア(数%)を考えると、そんなところに開発リソースを割きたくないというのが商業的な判断なのでしょうね。でも、開発者的にはちょっとそそられる課題とおもいます。
 もしYAMAHAさんが本当にMac版VOCALOID2を開発されるならば、MOSAあたりに連絡をとると宜しいかとおもいます。恐らく日本最高の Mac OS X 使いを紹介いただけるかと思います。
http://www.mosa.gr.jp/

◆自分の声で音声合成
 剣持さんは「できません。」と答えているけれど、そのうちに出来るようになると思います。音声から本人の気道や声帯などを算出し、その気道や声帯から発生される音をシミュレーション出力することで「誰でもボーカロイド」が可能でしょう。但し、研究レベルならばともかく、商業的に成功するような品質を得るにはなかなか難しいかもしれません。

◆読み上げソフト・・・・
 これには思わずニヤニヤしてしまいました。フリーソフト作者のお遊びレベル以上にはなりませんよという意味なのでしょうね。

◆ゲーム機や携帯電話への搭載
 これは是非とも載せて欲しいですね。「こんどの携帯電話にはボーカロイドが載ってて歌ったりメール喋ったりするんだって~」なんてことになると、今の携帯電話を買い換えたくなるに違いありませんから。

| | コメント (2) | トラックバック (0)

第二種電気工事士

 侵害訴訟代理試験の能力担保研修をお断りされてしまったので、代わりに何をやろうかといろいろと考えたのち、「第二種電気工事士」でも取ろうかと考えて、「第二種電気工事士技能完全マスター」(オーム社)を買ってみました。これが有れば家の中の電気工事が自らできるという、DIY好きには良い資格です。
 試験の中身はというと、如何にして安全な電気配線をおこなうことができるかというのがポイントになります。正しく電線の長さを計り、芯線を傷めないようにビニールの被服を剥いで圧着工具で間違いなく圧着できればOKです。そういえば20代の頃、仕事で工場内設備をいろいろ作っていたときに、こんな感じの工具を使ってたような気がします。その頃はリレーやらシーケンサーやら使っていて、それなりに面白かったですね。 シーケンサーだけで簡易にバーコードを読取って、製造ラインのパレットの行き先スイッチを押してやるというソフトウエアを組んだり、MSXのプリンターポートを入力スイッチとして使って、生産個数を自動カウントして表示するソフトウエアを組んだりしていました。
 ここで第二種電気工事士でも取得して、屋内コンセントをお洒落なものに変えたり、宅内に10BASE-5を配線したら楽しそうですね。
 でも、今は子供をYAMAHA音楽教室に通わせるのが優先なので、DIYにしか使わなそうな電気工事士の資格は後回しにしました。もっと時間の余裕があれば色んなことができるのにと、ちょっと残念です。

| | コメント (2) | トラックバック (0)

iPod mini の電池

 昨日は、電気店に行って iPod mini (第3世代)の電池を買おうとしたのですが、販売されていませんでした。まあ、もともと iPod mini はユーザが電池換装することは考慮されていないし、そんなクリティカルな商品を販売して、「換装のときに iPod が壊れた」という客の対応をしなければならないリスクを考えると、最初から販売しないのが正解なのでしょうね。

Amazon で調べると上記の製品が見つかりました。それぞれ550maH, 600maH, 720maH です。

また、iPod mini のマイクロドライブ(ハードディスク)をコンパクトフラッシュに換装している方も多くおられます。駆動部分のないコンパクトフラッシュは、それだけで電池寿命に貢献するとおもいます。但し、どのコンパクトフラッシュでもよい訳ではなく、ちょっとだけクセがあるようですね。
A-DATA社 Speedy 16GB で改造されている方が多いようです。他には SanDisk Xtreme 4GB で改造されている方もおられました。

iPod mini のばらし方はこちらに詳しく写真つきで解説されています。但し、クリックホイールを壊さないように注意しなければなりません。以前に iPod mini の電池を換装したときは何にも考えずに交換したけど、良く無事に交換できたと思いました。
http://www.ifixit.com/Guide/iPod/iPod-Mini/Hard-Drive/96/6/


風邪で平成20年度新人研修を休んでいるので、退屈のあまり iPod mini 改造に思いを馳せて書き込んでいます。

| | コメント (0) | トラックバック (0)

新人研修・座学研修

 昨日から明治学院大学で平成20年度新人研修が始まりました。1日目は矢鱈と大きな教室での講義です。3時間の講義で、1時間半経過時に10分休憩とはまるで弁理士予備校のようですね。
 一日目の午後の講義では、石川ゼミを主宰された石川先生の講義でした。石川先生の印象は「名物先生」という感じです。中小企業の特許を受ける権利の予約承継や譲渡の話が興味深かったです。中小企業の社長さんが発明者と詐称した場合は冒認出願ではなく、単なる発明者の名称の誤記であり特許の無効理由とはならないそうです。言われてみれば「発明者でなく、特許を受ける権利を承継しないものがした出願」ならば冒認ですが、発明者を詐称しただけならば、冒認には当たらないですね。
 二日目の午前の講義も、べらんめえ調の江戸下町弁の講師の方で、気合充分という感じでした。演習内容については「課題の秘密を守ること」とか面倒くさい要件が付加されていますので、あえて伏せさせていただきます。
 一日目も二日目も同期の仲間と一緒に学生食堂で昼食を食べました。400円の定食は、なんだか懐かしい値段と味です。今度はカレーを食べようと考えています。
 研修後に会社に行って打合せや資料作りを行いました。ちょっとハードな毎日であります。

| | コメント (0) | トラックバック (0)

wavtone で耳コピ

waveTone とは、あっきーさんが作成された耳コピー用のスペクトルアナライザーです。音声ファイルを解析し、音階ごとの音量のグラフをピアノロール形式で表示することができます。(Readme.txt より引用)

配布元URLはこちらです。
http://user.media.nagoya-u.ac.jp/people/h054072b/

これを用いることで、miku_talk のブラッシュアップができないかと考え てみました。
まず、リファレンス音声ファイル「今日の天気は、一日中晴れ」の音声ファイルを作成して、waveTone にドラッグ&ドロップしました。

Kyouno_tenki_ha

上の画面が解析画面です。ただし、倍音も同時に表示されているので判りにくいものになっています。そこで、倍音を除去して見やすい画面にします。

Kyouno_tenki_ha_01

同時に、どのタイミングで何が発音されていたかを表示しています。

この文章の形態素解析の結果は以下です。

今日    名詞,,,,,,,きょう,きょー
の    助詞,,,,,,,の,の
天気    名詞,,,,,,,てんき,てんき
は    助詞,,,,,,,は,わ
、    特殊,,,,,,,、,、
一日中    副詞,,,,,,,いちにちじゅう,いちにちじゅー
晴れ    名詞,,,,,,,はれ,はれ
。    特殊,,,,,,,。,。

ここから読み取れる特徴は以下のものです。

(1)「今日の天気は、」と、「一日中晴れ」でそれぞれ山なりの音階になっています。つまり、読点「、」と句点「。」で区切られた直後では音階が上がり、区切られる直前の単語では音階が下がります。文頭および文末を明示する為です。

(2)語中では次第に音階が下がってゆき、読点や句点の場所でふたたび音階が上がります。発音中に次第に音階が下がるのは人間の生理的な現象で、読点や句点で音階が上がるのは、息継ぎがおこなわれるためです。

(3)「今日」「天気」など、名詞は助詞と比べて強く発音されています。文章中で重要性が高いためと思われます。

もっと正確には、アクセントなどを付与しないといけないのですが、とりあえず現状は(1)(2)(3)のみで MIKU_TALK Ver 0.2.0 を試作してみました。

「kyouno_tenki_ha.mp3」をダウンロード

真面目に単語のアクセントを付与しないといけませんね。なんとなく関西弁風になってしまいます。

| | コメント (0) | トラックバック (0)

« 2008年2月 | トップページ | 2008年4月 »