Galatea for Linux の今後

これまでISTCの活動としてGalatea Dialog Studioの開発を続けてきたのですが、来年度以降、完全にボランティアベースの開発になる可能性もあるので、最近の統合作業と技術調査、および先日の講習会での反応を踏まえて、特に Galatea for Linux のシステム全体にかかわることとして、以下の3つを提案中です。コンソーシアム終了後、多くの人に開発に関わっていただくために、いずれも重要な課題だと考えております。ご興味をお持ちの方はぜひ御意見をお聞かせください。

  • (1)国際化の方針を決めて、まず英語の対話への対応を行う

試験的に SRM に English ASR の音響モデルを組み込んで、Galatea Dialog Studio の VoiceXML 機能が動くことを確認しました(無音の音素モデルが silB / silE ではないようなので文法生成部の切り替え処理が必要でした)。

そこで、入力については SRM (Julius-4) が各言語の音響モデルを持つ、出力については言語ごとに SSM のプロセスを起動して切り替える、といった方針でのシステム全体の国際化を検討したいと思います。

具体的にはオープンソースで入手が容易な英語TTSである eSpeak の組み込みを、ひとつの実装事例として検討しています。合わせて、インストール手順書の英語化などを行いたいと思います。

  • (2)対象プラットフォームを Ubuntu もしくは Debian とする

私が主な作業環境にしてきた Vine Linux のユーザが近年激減している模様で、講習会受講者に伺ったところ多くのユーザは Debian を使っており、Ubuntu 利用者も増えつつあるとのこと。また私が調査したところ、特にUbuntu はインストールの容易さ等から乗り換えに値すると判断しました。すでに8月のバージョンは Ubuntu で動作確認をしていますが、今後ドキュメントも Ubuntu 準拠に修正したいと思います。

  • (3)Live CD/DVD 版の Galatea を作成・公開する

ハードディスクにインストールすることなく DVD や USB メモリから起動して Linux 環境で Galatea が利用できるシステムを、できるだけ制約のないオープンソースのライセンスで提供したいと思います。これには「多くの人に気軽にさわってもらう」ことと、「オープンソース開発者のコミュニティに認知してもらう」ことの両方の意味があると思います。

ご存じの通り CD-ROM で起動する Knoppix というシステムがあります。Knoppix の最新版で Galatea Toolkit を動かすことについては、私がいくつかのPCで試したところ OpenGL が有効になっている場合が多く、パッケージをいくつか追加すれば Galatea が動作しました。各モジュールの動作確認の上では Ubuntu 対応と Knoppix 対応が(いずれも Debian ベースなので)ほぼ同じになりそうです。

対話統合部が使用している Java 実行環境については最近オープンソース化された OpenJDK への対応を検討中で、これが確認できればすべての要素をオープンソースで配付可能と思われます。

2003年に公開された「IPA最終版」の成果物は「IPAライセンス」という形で公開しましたが、公開後にライセンス条項についての問い合わせがあり、一部(下記の第4項)を修正した経緯があります。

Knoppix の派生版作成にあたってライセンスに問題がないか、Galatea を構成する各要素のライセンスやその表記方法は妥当であるか、できれば専門家の方に相談させていただきたいと思います。

これらの作業と並行して、個々の技術要素に関する改良も進めていきたいと思います。

なお、本プロジェクトに関する報告が、第73回音声言語情報処理研究会(10月24日)で予定されています。

技術サバイバル論

昨日FIT2008にてW3C関連のイベント企画「ユビキタスWeb―これからのWebのために必要な技術は何か―」のパネル討論「ユビキタスWeb実現にあたっての課題」に参加しました。日本でなぜ標準化は流行らないのか、というお題をいただいたのですが、私はこれを「よい標準化/技術は生き残ればいつか日の目を見る」という考えのもとに

  • ヒューマンインタフェース原則
  • 実装能力、開発効率
  • 国際化、アクセシビリティ、ライセンス、情報発信

などのポイントについて考察してお話させていただきました。

スライドもトークも「はしょりすぎてしまった」ので、これらの話題についてはこの日記で後日フォローしたいと思います。

自動作曲オルフェウス

昨日のお昼のテレビ番組で紹介された直後からアクセスが殺到し、数時間後にサーバがダウンしました。3月の公開以来そんなことになるとは思わなかったので驚きました。サーバのチューニングを施して今日のお昼頃に再稼働しました。これまでの200倍くらいのアクセス頻度でしょうか。。

  • 深山 覚, 中妻 啓, 米林 裕一郎, 酒向 慎司, 西本 卓也, 小野 順貴, 嵯峨山 茂樹, “Orpheus 歌詞の韻律に基づく自動作曲システム,” 情報処理学会研究報告, 2008-MUS-76-30, pp.179-184, Aug., 2008. (PDF)