Galatea Project について

Share

私が関わっている音声対話ツールキット Galatea に関するご報告です。
本記事は galatea-users ML に投稿した内容です。ご興味をお持ちの方はご参加をご検討いただければ幸いです。

昨年末にリリースされた新しいオープンソース音声合成エンジン Open-JTalk を評価中です。
リリースされたばかりの最初のバージョンでもあり、いろいろ GalateaTalk と違う部分があります。

  • バッチ処理を前提としたソフトウェアであり、 API が整備されていない
  • オーディオデバイスの制御を含んでいない
  • 話者モデルが1つしかない
  • JEITA のマークアップに対応していない

などなど。。
Windows で動くかどうかも、やってみないと分かりません。まず cygwin か mingw でコンパイルできるか、これから試すつもりです。

簡単に GalateaTalk を Open-JTalk に差し替えられる、という状況ではないのですが、Galatea プロジェクトは、特定のエンジンに依存しない、という建前です。Galatea の SSM を Open-JTalk で置き換えるラッパースクリプトは書けそうです。進捗があればお知らせします。

私が実装している Galatea Dialog Studio についても、GalateaTalk に依存する処理と、そうでない部分を、もっとうまく分離できるように、整理を進めたいと考えています。

ついでに、最近考えていることをいくつか書いてみます:

(1)
私が Galatea Dialog Studio の実装において Ruby 言語を使っている箇所がいくつかあるのですが、よりメジャーな言語だと思われる Python も積極的に使っていこうと思っています。(Ubuntu はシステムで Python を使っていますが Ruby はオプション)
また、VoiceXML によるアプリケーション開発例の執筆も、Ruby on Rails ですすめてきたのですが、並行して Python や PHP も検討しているところです。
PHP については、立命館大学の方がアプリケーションの開発に取り組んでおられて、いろいろ貴重なご意見をいただいています。

(2)
Galatea 技術を動かすデバイスのイメージとして、音声対話インタフェースに特化したOS、いわば Galatea OS のようなものを近い未来の目標として考えています。
昨年夏の ISTC 講習会で Ubuntu の独自カスタマイズを紹介しましたが、そういう方向性を意識しているからです。
そして最近「Android で動きますか?」という声がかかりました。興味はあります。Galatea Dialog Studio を iPhone で動かすのは大変そうですが、Android は Java が動くはずだから移植できるのでは。。

(3)
私宛に個別に問い合わせや要望をいただくことも多いのですが、差し支えのない範囲で、MLの場を使っていただけると嬉しいです。
特定の要望にどの程度の方が賛同されているのか、といった情報もお聞きしたいです。
(といっても現時点で galatea-users MLのメンバーは10人です。。)

今後は sourceforge のメンバー募集などの機能も積極的に使っていきたいと思います。
リリースをお手伝いいただけるという方や、git や mercurial のリポジトリを利用されたい方もお気軽にお知らせください。

ユーザとして使っていただくだけでなく、中身をいじりたい、という方をお手伝いすることが必要だと認識しています。
今後ともよろしくお願いします。