投稿者: nishimotz

  • Remastering Knoppix 5.3.1 ja

    Knoppix 版 Galatea Toolkit の開発にむけて調査を進めています。下記の資料が大変参考になりました。

    この資料にしたがって、USB接続HDDを ext2 でフォーマットして作業領域にしています。

    しかし 5.3.1 ではうまくいかない要因があったので、単に CD-ROM の / に空のファイルを一つ作るだけ、という控えめなカスタマイズで練習をすることにして、何度か試行錯誤をした結果、fromhd でのイメージの検証、iso ファイルを CD-R に書き込んでのブートの両方に成功しました。

    [reboot from KNX-5.3.1-ja CD-ROM]
    $ sudo -s
    # mount /dev/sda1 /media/sda1
    # mkdir /media/sda1/knx
    # mkdir -p /media/sda1/knx/master/KNOPPIX
    # mkdir -p /media/sda1/knx/source/KNOPPIX
    # cp -Rp /KNOPPIX/* /media/sda1/knx/source/KNOPPIX
    # cd /cdrom && find . -size -10000k -type f -exec
    cp -p --parents '{}' /media/sda1/knx/master/ \;
    [customize]
    # touch /media/sda1/knx/source/KNOPPIX/nishimotz
    # cp -p /cdrom/KNOPPIX/modules/*.*
    /media/sda1/knx/master/KNOPPIX/KNOPPIX/modules
    # mkisofs -R -U -hide-rr-moved -cache-inodes -no-bak
    -pad /media/sda1/knx/source/KNOPPIX |
    nice -5 /usr/bin/create_compressed_fs -b - 65536
    > /media/sda1/knx/master/KNOPPIX/KNOPPIX
    # mkdir /media/sda1/KNOPPIX
    # cd /media/sda1/KNOPPIX/
    # ln -s ../knx/master/KNOPPIX/KNOPPIX .
    # ln -s ../knx/master/KNOPPIX/modules .
    [reboot from KNX-5.3.1-ja CD-ROM]
    [test with "fromhd" mode]
    boot: knoppix usb2 fromhd=/dev/sda1
    $ ls /nishimotz
    [reboot from KNX-5.3.1-ja CD-ROM]
    $ sudo -s
    # mount /dev/sda1 /media/sda1
    # cd /media/sda1/knx/master
    # find -type f .... > KNOPPIX/md5sums
    # mkisofs ....
    # ls -l /media/sda1/knx/knoppix.iso
    

    References:

  • Galatea for Linux の今後

    これまでISTCの活動としてGalatea Dialog Studioの開発を続けてきたのですが、来年度以降、完全にボランティアベースの開発になる可能性もあるので、最近の統合作業と技術調査、および先日の講習会での反応を踏まえて、特に Galatea for Linux のシステム全体にかかわることとして、以下の3つを提案中です。コンソーシアム終了後、多くの人に開発に関わっていただくために、いずれも重要な課題だと考えております。ご興味をお持ちの方はぜひ御意見をお聞かせください。

    • (1)国際化の方針を決めて、まず英語の対話への対応を行う

    試験的に SRM に English ASR の音響モデルを組み込んで、Galatea Dialog Studio の VoiceXML 機能が動くことを確認しました(無音の音素モデルが silB / silE ではないようなので文法生成部の切り替え処理が必要でした)。

    そこで、入力については SRM (Julius-4) が各言語の音響モデルを持つ、出力については言語ごとに SSM のプロセスを起動して切り替える、といった方針でのシステム全体の国際化を検討したいと思います。

    具体的にはオープンソースで入手が容易な英語TTSである eSpeak の組み込みを、ひとつの実装事例として検討しています。合わせて、インストール手順書の英語化などを行いたいと思います。

    • (2)対象プラットフォームを Ubuntu もしくは Debian とする

    私が主な作業環境にしてきた Vine Linux のユーザが近年激減している模様で、講習会受講者に伺ったところ多くのユーザは Debian を使っており、Ubuntu 利用者も増えつつあるとのこと。また私が調査したところ、特にUbuntu はインストールの容易さ等から乗り換えに値すると判断しました。すでに8月のバージョンは Ubuntu で動作確認をしていますが、今後ドキュメントも Ubuntu 準拠に修正したいと思います。

    • (3)Live CD/DVD 版の Galatea を作成・公開する

    ハードディスクにインストールすることなく DVD や USB メモリから起動して Linux 環境で Galatea が利用できるシステムを、できるだけ制約のないオープンソースのライセンスで提供したいと思います。これには「多くの人に気軽にさわってもらう」ことと、「オープンソース開発者のコミュニティに認知してもらう」ことの両方の意味があると思います。

    ご存じの通り CD-ROM で起動する Knoppix というシステムがあります。Knoppix の最新版で Galatea Toolkit を動かすことについては、私がいくつかのPCで試したところ OpenGL が有効になっている場合が多く、パッケージをいくつか追加すれば Galatea が動作しました。各モジュールの動作確認の上では Ubuntu 対応と Knoppix 対応が(いずれも Debian ベースなので)ほぼ同じになりそうです。

    対話統合部が使用している Java 実行環境については最近オープンソース化された OpenJDK への対応を検討中で、これが確認できればすべての要素をオープンソースで配付可能と思われます。

    2003年に公開された「IPA最終版」の成果物は「IPAライセンス」という形で公開しましたが、公開後にライセンス条項についての問い合わせがあり、一部(下記の第4項)を修正した経緯があります。

    Knoppix の派生版作成にあたってライセンスに問題がないか、Galatea を構成する各要素のライセンスやその表記方法は妥当であるか、できれば専門家の方に相談させていただきたいと思います。

    これらの作業と並行して、個々の技術要素に関する改良も進めていきたいと思います。

    なお、本プロジェクトに関する報告が、第73回音声言語情報処理研究会(10月24日)で予定されています。

  • 技術サバイバル論

    昨日FIT2008にてW3C関連のイベント企画「ユビキタスWeb―これからのWebのために必要な技術は何か―」のパネル討論「ユビキタスWeb実現にあたっての課題」に参加しました。日本でなぜ標準化は流行らないのか、というお題をいただいたのですが、私はこれを「よい標準化/技術は生き残ればいつか日の目を見る」という考えのもとに

    • ヒューマンインタフェース原則
    • 実装能力、開発効率
    • 国際化、アクセシビリティ、ライセンス、情報発信

    などのポイントについて考察してお話させていただきました。

    スライドもトークも「はしょりすぎてしまった」ので、これらの話題についてはこの日記で後日フォローしたいと思います。