タグ: galatea

  • 島根県CMS

    2002年に、ラジオフライでは音声合成を用いたインターネットラジオ番組「ラジオフライマガジン」の制作を行いました。ラジオフライのメーリングリストでのやりとりが、編集の達人・デーブ川崎氏によって、月刊ウェブマガジンとしてまず公開されました。それを私がHTMLから音声合成用のファイルに編集し直して、合成音声と効果音とテーマ音楽を使った、約1時間分のMP3コンテンツとして公開されました。この編集作業は数ヶ月続けて、技術実験としての目的を達成しつつ(メンバーの多忙もあって)終了しました。

    こんなことをやった背景は、それまでの数年の活動で得た「インターネットラジオ番組を誰でも配信できるようになったけど、コンテンツを定期的に作るのは大変である」という経験からの着想でした。

    そして、たまたま「こんなことやってるんですよ」と、ラジオフライマガジンを(当時発売されたばかりの)Apple iPod で聞かせた相手に「これはいいね」と言われ「ユビキタスラジオ」の開発が始まりました(と私は思っているのですが・・)。

    最近、ネットワーク応用通信研究所からソースが公開された「島根県CMS」が注目を集めています。

    しかし「ウェブサイトに読み上げ機能を持たせるのは、アクセシビリティのことを誤解した邪道なシステムだ」という意見も聞かれます。

    恥ずかしながら、私は最近まで、島根県のウェブサイトで音声合成システム GalateaTalk が使われているのは知っていましたが、どのように使われているのかちゃんと知りませんでした。そこで島根県のウェブサイトを見てみました。

    右上の「よみあげ」が index.m3u へのリンクになっています。立ち上げると開くのはデフォルトで関連づけられたメディアプレイヤーです。

    島根県CMSの機能は、よくある「ActiveXで音声合成機能をクライアントにインストールしてしまうシステム」ではありません。そんなことをしてしまうと、なんのために「ユニバーサルなメディアとしてのテキスト」を公開しているのか分からなくなってしまいます。島根県CMSの機能は「ウェブアクセシビリティ」と呼ぶべきではなく、もっと別のメディアだと考えた方がよいと思うのです。

    つまりこれは、HTMLというテキスト情報に「インターネットラジオ番組」という新しいメディアを付加し、両者を効率よく制作・配信するシステムなのだと思います。それはまさに、私が「ラジオフライマガジンをもっと効率よく制作したい」と思いながらほったらかしていた、私が欲しかった機能なのです。。

    そう思いながら、島根県ウェブサイトの読み上げを聞いていると、別の問題が明らかになりました。つまり GalateaTalk の基本性能としての「読み付与」や「音声の明瞭性」などがよくないのです。無償だからといって、これは GalateaTalk の評判を下げてしまっているのではないかと。。でも、郵便番号を日付のように読み付与してしまうのは、使い方を工夫すれば解決するのでは。。

    GalateaTalk は何度か商用化の打診があり、私もいろいろ頑張ったのですが、商用レベルの品質に持って行くには相当な努力が必要である、ということで断念した経緯があります。しかし、島根県CMSがGalateaTalkのキラーアプリの一つになれば、状況は変わるかも知れません。 島根県CMSの音声読み上げの改良にも取り組んでいかなくては、と思いを新たにした次第です。

  • Galatea Dialog Studio

    オープンソースのVoiceXMLインタプリタGalatea Dialog Studioの新しいバージョンをリリースしました。

    Galatea Toolkitは2000~2002年度に情報処理技術振興協会(IPA)の支援で開発が行われ、現在は音声対話技術コンソーシアム(ISTC)の元で開発が続けられています。

    2008年3月上旬に行われるISTC総会では会員向けに2007年度版ソフトウェアの配布と技術解説を行います。その準備作業としてこの数日、私が担当している対話処理系のアップデート作業を行いました。

    これまでISTCおよび情報処理学会の委員会でマルチモーダル対話記述ワーキンググループに参加し、マルチモーダル対話システムのアーキテクチャに関して議論が続けられました。その知見を踏まえてリファクタリングを重ねた結果「Linux用の Galatea Dialog Manager を Windows で動くようにする」という作業の目処が立ち、今回のリリースではその成果を盛り込むことにしました。豊橋技術科学大学のグループで開発されている Windows 版の対話マネージャと区別するために名称を Dialog Studio に変更しました。音声合成には GalateaTalk を、音声認識にはJuliusを使用しますが、いずれも SourceForge.jp でホストされているプロジェクトです。

    Galatea Dialog Studio は現在 Eclipse 3.3 上で開発を行っています。動作環境をJava 6に移行したことで簡単に Cookie に対応することができました。昨年中に行った HTTP の POST メソッドへの対応と合わせて、いろいろなウェブアプリケーションフレームワークとの相性がよくなりました。ドキュメントでは PHP との連携例を記載しましたが、個人的にはこれから Ruby on Rails で VoiceXML アプリケーションを開発するためのツールやライブラリの整備を進めていきたいと思っています。

    Studioと名乗っているのに編集機能がないなど、まだまだお粗末なシステムであることは事実です。やりたいこともたくさん残っています。きちんと情報を公開して、少しでも多くの方に関心を持っていただけるように努力したいと思います。