Galatea Project について

私が関わっている音声対話ツールキット Galatea に関するご報告です。
本記事は galatea-users ML に投稿した内容です。ご興味をお持ちの方はご参加をご検討いただければ幸いです。

昨年末にリリースされた新しいオープンソース音声合成エンジン Open-JTalk を評価中です。
リリースされたばかりの最初のバージョンでもあり、いろいろ GalateaTalk と違う部分があります。

バッチ処理を前提としたソフトウェアであり、 API が整備されていない
オーディオデバイスの制御を含んでいない
話者モデルが１つしかない
JEITA のマークアップに対応していない

などなど。。
Windows で動くかどうかも、やってみないと分かりません。まず cygwin か mingw でコンパイルできるか、これから試すつもりです。
簡単に GalateaTalk を Open-JTalk に差し替えられる、という状況ではないのですが、Galatea プロジェクトは、特定のエンジンに依存しない、という建前です。Galatea の SSM を Open-JTalk で置き換えるラッパースクリプトは書けそうです。進捗があればお知らせします。
私が実装している Galatea Dialog Studio についても、GalateaTalk に依存する処理と、そうでない部分を、もっとうまく分離できるように、整理を進めたいと考えています。
ついでに、最近考えていることをいくつか書いてみます：
（１）
私が Galatea Dialog Studio の実装において Ruby 言語を使っている箇所がいくつかあるのですが、よりメジャーな言語だと思われる Python も積極的に使っていこうと思っています。（Ubuntu はシステムで Python を使っていますが Ruby はオプション）
また、VoiceXML によるアプリケーション開発例の執筆も、Ruby on Rails ですすめてきたのですが、並行して Python や PHP も検討しているところです。
PHP については、立命館大学の方がアプリケーションの開発に取り組んでおられて、いろいろ貴重なご意見をいただいています。
（２）
Galatea 技術を動かすデバイスのイメージとして、音声対話インタフェースに特化したOS、いわば Galatea OS のようなものを近い未来の目標として考えています。
昨年夏の ISTC 講習会で Ubuntu の独自カスタマイズを紹介しましたが、そういう方向性を意識しているからです。
そして最近「Android で動きますか？」という声がかかりました。興味はあります。Galatea Dialog Studio を iPhone で動かすのは大変そうですが、Android は Java が動くはずだから移植できるのでは。。
（３）
私宛に個別に問い合わせや要望をいただくことも多いのですが、差し支えのない範囲で、MLの場を使っていただけると嬉しいです。
特定の要望にどの程度の方が賛同されているのか、といった情報もお聞きしたいです。
（といっても現時点で galatea-users MLのメンバーは10人です。。）
今後は sourceforge のメンバー募集などの機能も積極的に使っていきたいと思います。
リリースをお手伝いいただけるという方や、git や mercurial のリポジトリを利用されたい方もお気軽にお知らせください。
ユーザとして使っていただくだけでなく、中身をいじりたい、という方をお手伝いすることが必要だと認識しています。
今後ともよろしくお願いします。

Galatea Project について

More posts

PyCon mini Hiroshima 会計繰越金の活用と解散について

すごい広島 with Python [98] 開催報告

GAAD Japan 2025 広島会場

PCNひろしまについて

2025年2月

2024年秋

2024年7月

PCNひろしまの運営

YAPC初登壇、初スポンサー

YAPC初参加、初運営

2024年2月

広島国際会議場の受動喫煙対策

2024年1月

2023年12月

2023年9月

2023年8月

2023年夏

試して遊ぶ！Webアクセシビリティ

iPhone・iPad活用ラウンジ 2023年4月

WTM 110 登壇予定