カテゴリー: general

  • 岩手県山田町から #olarbee

    5月31日から6月2日まで岩手県山田町に滞在しています。
    東京から高速バスに乗って高速道路から2時間、一般道での移動で宮古へ。それからさらに車で1時間くらいの移動です。
    基礎部分だけが残された町の中に、ぽつんぽつんと赤いスプレーで「解体OK」と書かれた建物が建っています。
    建物だけでなく、陸に乗り上げた船にも「OK」などと書かれています。
    ちょっと別のパターンですが「壊してよいですか?役場」という文字も目に入りました。
    ここでは津波を受けた建物が掲示板になっています。
    この間みたばかりの袋町小学校の壁文字を思い出しました。。
    持参したインターネット環境を使って、現地から Ustream 配信をおこなっています。
    昨夜と今夜の2回だけの予定ですが、18:00から22:00くらいに Olarbee チャンネル をチェックしていただけると幸いです。
    その後も #olarbee チャンネルでは「コミュニケーションとコミュニティの支援」に関する配信を行うつもりです。
    昨日の、配信中を含む私の @24motz での発言を以下にまとめます。
    (さらに…)

  • #nvdajp 2011.1.1j 公開

    日本語Windows対応のオープンソース・スクリーンリーダー NVDA 日本語版 2011.1.1j を公開しました
    これは nvda-project.org がリリースした NVDA 2011.1.1 をベースにしています。ご利用は自己責任でお願いします。
    2011.1.1j では「コマンドキーリファレンス」を最新の英語版に合わせて改訂し、特にラップトップのキー操作説明を追加しています。
    NVDA によって Web アクセシビリティに関する検証が手軽に行えるようになります。
    NVDA は Firefox 4 や Internet Exploler に対応しており、また Flash などの埋め込みオブジェクトの操作が可能です。
    Adobe Reader による PDF ファイルの読み上げもできます。
    また Java Access Bridge (2.0以上)によって Java アプリケーションに加えて OpenOffice.orgLibreOffice のアクセシビリティ機能が利用できます。
    (さらに…)

  • 博士論文公聴会

    私の博士論文公聴会の予定をお知らせします。
    音声インタフェースシステムの 効果的設計と評価に関する研究
    2011年1月26日(水)13:30~14:30
    早稲田大学 西早稲田キャンパス
    55号館N棟2階CS学科会議室
    公開とのことなので、ご興味がおありの方はお越しいただければ幸いです。
    追記 2011-01-29 公聴会は終了しました。スライド(下記)を公開しました。

  • 2011年

    2010年最後のブログ更新をさせていただきます。年賀状の代わりの近況報告としてお読みいただければ幸いです。
    まず2011年最初の予定からお知らせします。
    視覚障害の方の利用を想定した早口音声研究に関する投稿論文が採録になり、2011年1月号の電子情報通信学会論文誌(D)に掲載されることになりました。
    この研究は「情報福祉の基礎」という科研費特定領域研究の一環として2004年度に開始したものです。ずいぶん長い時間がかかって、やっと(成果の一部ではあるものの)まとめることができました。
    現在「音声インタフェースシステムの 効果的設計と評価に関する研究」という題目で早稲田大学にて博士論文作成のご指導をしていただいています。2011年1月末に公聴会を開催していただく予定になりました。
    いろいろな方にお世話になり、ご心配をかけたので、まずは、この場にてお知らせしておきます。
    なお、1月29日には Pycon mini に参加して NVDA の紹介をします。
    (さらに…)

  • NVDAjp 2010.2に向けて

    NVDAjp 2010.2に向けて開発メンバーは作業を進めています。
    ここでは私の作業状況を簡単にお知らせします。
    2010.2 ベースの JTalk の話速を速くする実装の目処は立っており、 bazaar のレポジトリ
    lp:~nishimotz/nvdajp/with_jtalk
    rev.3531 として launchpad.net に置いてあります。
    ただし、このレポジトリには zjtalk.py と jtalk.py の2つのエンジンがあり、(内部の実装はどちらも _jtalk.py です)zjtalk のほうは音声設定で話速のスライダーが出てきます。
    jtalk.py のほうは話速設定がうまくできません。話速設定のために supportedSettings をいじると espeak が起動時エラーで落ちます。
    なぜ espeak に影響が及ぶのかいまだに不明なのですが、zjtalk.py にリネームしたら解決したので、クラスを読み込んで初期化する順序に依存する問題と思われます。この現象は silence.py で試しても同じでした。
    それから NVDAjp そのものではないのですが、10月の開発ミーティングの後の交流会の議論を踏まえて
    「読み上げの改良のための情報を集めるサイト」
    を試作しました。
    Python でなく Ruby on Rails で作ってますが(笑)
    こちらについても時間ができたら改良に取り組みたいので、御意見を伺えれば幸いです。
    追記(11月15日)
    10月30日に 2010.2j がリリースされています。
    話速設定については将来のバージョンで追加される予定です。

  • GoogleWaveと音声認識

    昨日「GoogleWaveとUstreamで音声認識字幕の実験」を初めて行いました。

    開始時間: 2010/06/20 11:47
    終了時間: 2010/06/20 14:05
    ユニーク視聴者数: 27
    合計視聴者数: 31
    平均視聴者数: 6

    ハッシュタグ#wavcapのつぶやきをまとめました。
    携帯電話から見たい、という御要望もあったのですが今回は対応できませんでした。
    また、直前の告知であったことについて、もっと時間をかけて幅広く告知をしては、という御意見もありました。
    (さらに…)

  • 東大先端研イベント

    東大先端研「当事者の視点によるバリアフリー研究」6月4日午前の部に参加してつぶやいてきました。
    司会は伊福部達先生。話題提供者は中野聡子さん、藪謙一郎さん、鈴木淳也さん。
    中野さんには後で質問させていただき、下記の論文を教えていただきました。

    中野聡子他, “聴覚障害者向け音声同時字幕システムの読みやすさに関する研究(1)-改行効果に焦点をあてて”, ヒューマンインタフェース学会論文誌, 第10巻第4号, pp:51-60, 2008.

    iPhone字幕システムによる情報保障の実演?もありました。ロビーで紹介されていたのは、iPhoneと通信できるBluetoothワイアレスマイクで講師の声を拾い、音声を遠隔要約筆記のサービスに送り、字幕を遠隔地のWebサーバから配信。iPhoneのSafariで字幕を閲覧、というシステムでした。
    実はポイントは「ソフトバンクだから音声もパケット通信も定額」というところで、なるほど、と思いました。
    Twitterで私をフォローしておられる何人かの方が「要約は必要か?誰にとって必要か?」という趣旨の発言をなさっているのが興味深かったです。
    音声認識技術とモバイル機器の普及は「ユーザにあわせてカスタマイズ可能な字幕提示」という新しいシステムに繋がると考えています。
    そういうことも考えつつ、来週の人工知能学会大会(長崎)で下記の発表を予定しています:

    6月9日セッション1D3「コミュニケーション支援」1D3-1 学会・研究会の情報保障におけるソーシャルネットワークの役割(西本卓也)

    藪さんのシステムは「タッチ操作で文章を入力する新しいインタフェース」になりそうな予感がします。いずれ音音研でお話ししたいとのことでした。音音研の運営が滞っててすみません。。
    (さらに…)

  • UstreamとNVDA

    週末の2日間にかけてUstreamの放送を行いました。5月9日はNVDA日本語化プロジェクトの様子を数人の方に見守っていただきました。
    launchpad.netへのプロジェクト登録も公開の場で行いました。
    バージョン管理ツール bazaar を本格的に使いこなせるようになってきました。
    こういう仕事の仕方は「オープンソースの本質がオープンプロセス」であることを象徴していると思います。
    いろいろな可能性がありそうです。
    追記:
    私のUstream環境ですが、1日目はThinkpad X300の内蔵マイク、内蔵カメラで放送。
    2日目はカメラにMicrosoft Lifecam Cinemaを使用。2日目の後半では外付けマイクとオーディオテクニカのマイクアンプを使用。
    放送マシンではUstreamのみにログインしてTwitter連携を使っていません。
    別途モニター用マシンを用意。こちらはUbuntu 10.04環境でした。UstreamにゲストでアクセスしてUstreamの視聴画面からTwitterへのログイン。
    こうすることで、TwitterもUstreamもnishimotzアカウントだけ(サブアカウントなし)で、放送とつぶやきとモニタリングができました。
    新家さんがブログでコメントしておられます。
    ありがとうございました。
    (さらに…)

  • WordPressへの攻撃

    本サイトを含むnishimotz.comドメインのいくつかのサイトにおいて、WordPressのデータベースへの不正アクセスによる障害が発生していました。前回の投稿の後、この4日間くらいの間に問題が発生したと思われます。
    当該サイトにアクセスした際に、画面が乱れていたはずです。また Internet Exploler 8 では「安全でないサイト」という警告が表示されました。
    アクセスされた方にご迷惑をお掛けしたことをお詫びします。
    当ドメインのサイトに関してお気づきの点があれば nishimotz アットマーク gmail.com までお知らせください。
    すでにデータの修復とセキュリティ対策(データベースおよびWordPressのパスワード再設定を含む)を行いました。
    原因は今のところWordPressやデータベースエンジンの不具合ではなく、お恥ずかしいことに当方の運用上の不備をついた攻撃である可能性があります。当面は詳細を書くことは差し控えますが、引き続き情報収集に努めております。
    今後ともよろしくお願いします。
    追記(2010-04-15):本件に関するWordPress側のブログ記事(原文)が公開されました。ホスティングプロバイダの運用上の問題である可能性が高いです。

  • gitの使い方

    先ほど研究室で質問されてこんなやり取りをしました:
    「gitを勉強中だがよくわからない」
    「どういうところが?」
    「コマンドは理解したが、バージョンとかブランチとかをどう使ったらいいのか?」
    「どういうことがしたい?」
    「いまプログラムの派生版を複数のディレクトリにおいて並行作業している。これがgitを使うと上手に管理できると思うが?」
    「できる。前のリビジョンのバックアップのつもりで使っているのなら複数のディレクトリは複数のリビジョンに対応する。方向性の違う拡張を別々のディレクトリで作業しているのであれば、それぞれのディレクトリはブランチに対応する」
    (さらに…)