カテゴリー: general

  • NVDAjp 2010.2に向けて

    NVDAjp 2010.2に向けて開発メンバーは作業を進めています。
    ここでは私の作業状況を簡単にお知らせします。
    2010.2 ベースの JTalk の話速を速くする実装の目処は立っており、 bazaar のレポジトリ
    lp:~nishimotz/nvdajp/with_jtalk
    rev.3531 として launchpad.net に置いてあります。
    ただし、このレポジトリには zjtalk.py と jtalk.py の2つのエンジンがあり、(内部の実装はどちらも _jtalk.py です)zjtalk のほうは音声設定で話速のスライダーが出てきます。
    jtalk.py のほうは話速設定がうまくできません。話速設定のために supportedSettings をいじると espeak が起動時エラーで落ちます。
    なぜ espeak に影響が及ぶのかいまだに不明なのですが、zjtalk.py にリネームしたら解決したので、クラスを読み込んで初期化する順序に依存する問題と思われます。この現象は silence.py で試しても同じでした。
    それから NVDAjp そのものではないのですが、10月の開発ミーティングの後の交流会の議論を踏まえて
    「読み上げの改良のための情報を集めるサイト」
    を試作しました。
    Python でなく Ruby on Rails で作ってますが(笑)
    こちらについても時間ができたら改良に取り組みたいので、御意見を伺えれば幸いです。
    追記(11月15日)
    10月30日に 2010.2j がリリースされています。
    話速設定については将来のバージョンで追加される予定です。

  • GoogleWaveと音声認識

    昨日「GoogleWaveとUstreamで音声認識字幕の実験」を初めて行いました。

    開始時間: 2010/06/20 11:47
    終了時間: 2010/06/20 14:05
    ユニーク視聴者数: 27
    合計視聴者数: 31
    平均視聴者数: 6

    ハッシュタグ#wavcapのつぶやきをまとめました。
    携帯電話から見たい、という御要望もあったのですが今回は対応できませんでした。
    また、直前の告知であったことについて、もっと時間をかけて幅広く告知をしては、という御意見もありました。
    (さらに…)

  • 東大先端研イベント

    東大先端研「当事者の視点によるバリアフリー研究」6月4日午前の部に参加してつぶやいてきました。
    司会は伊福部達先生。話題提供者は中野聡子さん、藪謙一郎さん、鈴木淳也さん。
    中野さんには後で質問させていただき、下記の論文を教えていただきました。

    中野聡子他, “聴覚障害者向け音声同時字幕システムの読みやすさに関する研究(1)-改行効果に焦点をあてて”, ヒューマンインタフェース学会論文誌, 第10巻第4号, pp:51-60, 2008.

    iPhone字幕システムによる情報保障の実演?もありました。ロビーで紹介されていたのは、iPhoneと通信できるBluetoothワイアレスマイクで講師の声を拾い、音声を遠隔要約筆記のサービスに送り、字幕を遠隔地のWebサーバから配信。iPhoneのSafariで字幕を閲覧、というシステムでした。
    実はポイントは「ソフトバンクだから音声もパケット通信も定額」というところで、なるほど、と思いました。
    Twitterで私をフォローしておられる何人かの方が「要約は必要か?誰にとって必要か?」という趣旨の発言をなさっているのが興味深かったです。
    音声認識技術とモバイル機器の普及は「ユーザにあわせてカスタマイズ可能な字幕提示」という新しいシステムに繋がると考えています。
    そういうことも考えつつ、来週の人工知能学会大会(長崎)で下記の発表を予定しています:

    6月9日セッション1D3「コミュニケーション支援」1D3-1 学会・研究会の情報保障におけるソーシャルネットワークの役割(西本卓也)

    藪さんのシステムは「タッチ操作で文章を入力する新しいインタフェース」になりそうな予感がします。いずれ音音研でお話ししたいとのことでした。音音研の運営が滞っててすみません。。
    (さらに…)