投稿者: nishimotz

  • Julius の「デコーダに基づくVAD」

    音声認識エンジン Julius 4.1 に関する記録。

    「デコーダに基づく VAD は,デフォルトでは無効化されており,使用するにはコンパイル時に configure オプションで –enable-decoder-vad を指定し,実行時に -spsegmentを指定する」だそうです。

    $ sudo apt-get install cvs flex libdb-dev
    $ cvs -z3 -d:pserver:anonymous@cvs.sourceforge.jp:/cvsroot/julius co julius4
    $ cd julius4
    $ sh configure  --enable-decoder-vad
    $ make
    

    ということで現在 Galatea Dialog Studio にて評価中です。

  • ERBとインスタンス変数

    Rails の View のようなテンプレートエンジンを ERB 単体で使う例。

    詳しい説明はあちこちで見かけたのですが私が確認したかったポイントに絞ってみました。

    #!/usr/bin/ruby
    require 'erb'
    erb_doc = <<EOS
    hello world 1
    <% 1.upto(3) do |i| -%>
    <%= @hoge %>:<%= i %>
    <% end -%>
    hello world 2
    EOS
    class MyTemplate
    def initialize
    @hoge = 123
    end
    def result(script)
    ERB.new(script, nil, '-').result(binding)
    end
    end
    puts MyTemplate.new.result(erb_doc)
    # hello world 1
    # 123:1
    # 123:2
    # 123:3
    # hello world 2
    
  • オープンソースソフトウェアとWebアクセシビリティ

    上記に関連して、次回WIT研究会/HI学会研究会の企画として、ITRC UAI(Universal Access to the Internet)研究会と共催の特別企画を行います。

    • テーマ:オープンソースソフトウェアとWebアクセシビリティ
    • 共催:ITRC UAI(Universal Access to the Internet・高齢者と障害者のインターネット利用)研究会
    • 司会:西本卓也(東京大学・WIT企画幹事)
    • 特別企画の日時:2008年12月4日(木) 15:15~17:15
    • 会場:産総研臨海副都心センター別館バイオ・IT融合研究棟11階会議室

    登壇者(敬称略):

    • 渡辺隆行(東京女子大学・UAI研究会 主査)
    • 中村精親・辻勝利(ミツエーリンクス)
    • 西本卓也(東京大学)
    • 福田健太郎 (日本IBM)

    概要:World Wide Webはユニバーサルなメディアとして設計されており、例えば視覚障害者は合成音声によってWebを利用することができるが、現実には高齢者や障害者にとって使いにくいWebサイトがたくさんある。そこでWebコンテンツのアクセシビリティに関する標準化活動が行われており、海外では W3C WCAG 2.0 の策定が完了間近になっており、これを受けて日本でも JIS X 8341-3 の改訂作業が進められている。 Webアクセシビリティの新たな標準が受け入れられるために必要なのは、 Webコンテンツの新しい標準技術を生かすことができる支援技術である。

    本特別企画はまずWebアクセシビリティ標準化活動の現状を概説し、続いてWebアクセシビリティを実現する高性能なツールになりうる以下のオープンソースソフトウェアを実演を交えて紹介する。

    • スクリーンリーダー NVDA 日本語化プロジェクト
    • 音声対話ツールキット Galatea プロジェクト
    • アクセシビリティソフトウェア基盤 Eclipse Accessibility Tools Framework (ACTF)

    最後にパネルディスカッションを行い、Webアクセシビリティ関連のオープンソースプロジェクトの展望や今後の課題について議論したい。支援技術ユーザ、研究者、ソフトウェア開発者など幅広い聴衆の参加を期待する。

  • 音声インタフェースとWebアクセシビリティ

    先日、下記の発表をしました。

    この予稿の中で紹介した「インタフェースの原則」は、私の研究の中核になる概念です。今回これを吟味していて、

    • III 頑健性に関する原則
      • c. 探索可能性の原則 : あるコマンド操作とその実行結果の対応付けを容易に学習できるために、あらゆる操作は可能なかぎり取り消し可能とする。

    という項目の追加が必要だと思えてきました。

    これまでWebアクセシビリティにおいて undo 機能の重要性を確認する実験を行ってきました。現在は Ruby on Rails による VoiceXML アプリケーションフレームワークと Galatea Dialog Studio の実装に、どのように undo の機能を組み込むかを検討しています。

  • Ubuntu Linux 8.10 + freeglut3 + FreeType2

    GLUT で日本語を表示するのは面倒だと思っていましたが、意外に簡単でした。
    とはいえ、例によって単純なコピーペーストでは成功しなかったので、メモしておきます。

    // main.cpp
    // encoding : UTF-8
    //
    // sudo apt-get install libftgl-dev freeglut3-dev
    // g++ -g -I/usr/include/freetype2 -lglut -lftgl main.cpp
    //
    #include <GL/glut.h>
    #include <FTGL/ftgl.h>
    #define FONT "/usr/share/fonts/truetype/vlgothic/VL-Gothic-Regular.ttf"
    FTFont *font;
    void display(void)
    {
    glClearColor(0.0, 0.0, 1.0, 1.0);
    glClear(GL_COLOR_BUFFER_BIT);
    glClearColor(1.0, 1.0, 1.0, 1.0);
    FTPoint point(-1, 0, 0);
    font->Render("日本", -1, point);
    glFlush();
    }
    int main(int argc, char *argv[])
    {
    font = new FTGLPolygonFont(FONT);
    if (font->Error()) exit(1);
    font->FaceSize(0);
    glutInit(&argc, argv);
    glutInitDisplayMode(GLUT_RGBA);
    glutCreateWindow(argv[0]);
    glutDisplayFunc(display);
    glutMainLoop();
    return 0;
    }
  • Ubuntu Linux 8.10 + Lenovo ThinkPad X300

    トラックポイントを青ボタンと同時に押したときにスクロールする設定。

    $ sudo gedit /etc/X11/xorg.conf
    Section "ServerFlags"
    Option "AutoAddDevices" "false"
    EndSection
    Section "InputDevice"
    Identifier	"Configured Mouse"
    Driver		"mouse"
    Option		"CorePointer"
    Option    	"Emulate3Buttons"     	"false"
    Option          "EmulateWheel" 		"true"
    Option          "EmulateWheelTimeOut" 	"200"
    Option          "EmulateWheelButton" 	"2"
    Option          "XAxisMapping"        	"6 7"
    Option          "YAxisMapping"        	"4 5"
    Option          "ZAxisMapping"        	"4 5"
    EndSection
    

    参考リンク:

  • Windows Eclipse CVS sourceforge.jp

    Windows XP で Eclipse 3.4.1 の CVS クライアントを使って sourceforge.jp のアカウントで作業を。。

    anonymous ではなく sourceforge.jp のアカウントで commit ができるための設定をしました。

    最初に試したのは

    でしたが Windows ではうまくいかなかったので再度調査。

    をすこし手直ししたら成功しました。

    • 以下 PC のアカウントは nishi で SF.jp のアカウントは nishimoto という想定。

    まず Windows XP のコントロールパネル「システム」で環境変数の設定。

    HOME=c:/cygwin/home/nishi
    CVSROOT=nishimoto@sourceforge.jp:/cvsroot/galatea
    CVS_RSH=ssh
    
    [cygwin]
    $ cd
    $ ssh-keygen
    /home/nishi/.ssh/identity
    $ notepad .ssh/idendity.pub
    

    これを sourceforge.jp の Account Maitainance で CVS/SVN/SSH Shared Authorized Keys に追加。

    環境変数が反映されるように新しい cygwin コンソールで確認します。

    $ ssh -l nishimoto cvs.sourceforge.jp
    (omitted)
    You cannot execute anything here.
    Connection to cvs.sourceforge.jp closed.
    
    $ ssh -l nishimoto shell.sourceforge.jp
    Last login: Sat Nov  1 14:38:37 2008 from xxxxxxxxxxxxxxxxxxxx
    nishimoto@sf-usr-shell:~$ ls
    galatea
    nishimoto@sf-usr-shell:~$ logout
    Connection to shell.sourceforge.jp closed.
    

    環境変数が反映されるように Eclipse を新たに起動します。

    • Window – Prefefence – Team – CVS – Ext connection method
      • CVS_RSH : c:\cygwin\bin\ssh.exe
      • Parameter : -l {user} {host}
      • SSH2 (General – Network Connections – SSH2)
        • SSH2 home: C:\cygwin\home\nishi\.ssh
        • Private Keys: C:\cygwin\home\nishi\.ssh\identity
    • New – Project – Project from CVS – New repository location
    Host: cvs.sourceforge.jp
    Repo Path: /cvsroot/galatea
    User: nishimoto
    Pass: (empty)
    Conn.Type: extssh
    

    repository の中身が見えたので成功。

    上記リンクと少し違う手順が必要でしたが、参考になりました。感謝。

  • 音音研

    次回の音音研を以下の内容で予定しております。ぜひお誘い合わせの上お越しください。

    • 2008年10月20日(月曜日)18:40-
    • 場所:東大本郷 工学部6号館140号室
      • (東京大学 大学院 情報理工学系研究科 システム第一研究室)

    大竹孝司先生(E-Listening Lab)の御講演を予定しています。

    • テーマ:「語彙の活性化のメカニズムと言語遊戯(空耳アワー)」
    • 概要:音声言語の意味理解は音声の中から語彙を認識することによって実現されるが、この仕組みをモデル化して解き明かすことが語彙認識の研究の目標である。本発表では1言語話者の心的辞書がL2の音声入力によって活性化する可能性を検証する。分析対象の言語遊戯は「空耳アワー」と呼ばれるものである。分析から明らかになったことは1言語使用者であっても無意味な心的辞書が活性化される可能性が示唆された点である。

    ここ数年、私が了解度・話速・心的辞書に関する研究を進めていくうちに、日本語のモーラ知覚などに興味を持ち、大竹先生の御研究を知りました。今回は多くの方に馴染みやすい内容を考慮して、上記の話題を提供していただくのですが、私は自分の問題意識をぶつけさせてもらい、議論を盛り上げたいと思います。

  • Festival in Ubuntu

    英語の音声合成フリーソフトの現状について引き続き調査中です。

    Ubuntu Linux 8.04.1 で espeak が簡単に使えることはわかったのですが、Festival も簡単に使えました。

    $ sudo apt-get install festival festvox-don

    $ festival

    Festival Speech Synthesis System 1.96:beta July 2004

    Copyright (C) University of Edinburgh, 1996-2004. All rights reserved.

    For details type `(festival_warranty)’

    festival> (SayText “Hello”)

    #<Utterance 0xb6974f88>

    $ echo “(SayText \”Hello.\”)” | festival

    synaptic で見たかぎりでは festvox の English Female パッケージはないようです。残念。

  • 第44回WIT研究会

    次回研究会の詳細情報を公開しました。

    会場である国立障害者リハビリテーションセンターの見学会など、盛りだくさんの企画を予定しております。

    なお、7月に新潟で開催した研究会の特別企画の記録も公開中です。