投稿者: nishimotz

  • CEATECにて

    来年度の福祉情報工学研究会(WIT)をCEATEC展示会の中で開催する案が出ているので、下見をかねて、幕張メッセの CEATEC に行ってきました。

    企業の新製品発表など、いろいろ報道もされていますが、大学やNICTさんの展示ブースもありました。もし来年この場所での研究会が実現したら、研究会の関係者の皆様にいろいろ回っていただけるので、よいことだと思います。

    WIT 関連でいえば、たまたま「アクセシビリティ PLAZA 」というブースが目に入ったのでお話を伺ってきました。(社)ビジネス機械・情報システム産業協会(JBMIA) の方が、JIS X-8341-5(高齢者・障害者等配慮設計指針:事務機器)の説明やバリアフリーコピー機の実演などをしておられました。

    毎年展示しているが、レポートの課題を課せられた大学生などがよく来てくれる、会議場を取るためにお金がかかるので展示のみで講演などはやっていない、というお話でした(対応してくださったのは(株)リコーの方でした)。

    こういった展示をされている方を研究会にお招きしてお話をしていただいたり、見学に来る大学生を積極的に研究会に誘導したり、いろいろ工夫できるのではないかと思いました。

    受付はWebで名前を事前に登録してコンファレンス予約などを行い、会場でバーコードリーダーまたはEdyリーダーを使うセルフサービス方式でした。研究会の入場者にもこういったことをお願いすることになるのでしょうか。うまく情報を共有できれば研究会としてもメリットがあるかも知れません。。

    あまり時間がなく、限られたブースしか見ることができませんでしたが、個人的に興味があって、並んで触ったのはSONYのVAIO Wでした。左手で持ちながら右手で操作してみましたが、紙のように軽く、Windows 7も軽快でした。初めて Let’s Note T1 の実機を触ったときの、あの衝撃に近いものを感じました。あの頃の Panasonic の立ち位置にいま SONY がいるような気がします。。

  • 音声CAPTCHAに関する発表予定

    第50回福祉情報工学研究会(2009年10月29日(木)~30日(金)、青森県青森市で開催)において、下記の発表を予定しています。

    • 著者:西本卓也(東大)・松村 瞳(東京女子大)・渡辺隆行(東京女子大)
    • 題目:音声CAPTCHAシステムにおける削除法と混合法の比較
    • 概要:我々は音声聴取課題によって対象者が人間であるか機械であるかを判別する音声CAPTCHAシステムに着目し、普遍的な設計方針の体系化を踏まえて、音韻修復効果を用いた「削除法」を提案している。本報告では「機械による破られにくさ」の予備的検討として、提案法である「削除法」および既存システムの主流である「混合法」について音声加工の条件の違いが音声認識性能に与える影響を報告する。

    これに関連して、最近気になっていることを書きます。

    先月、郡山の音響学会の3日目に「音バリアフリー」会場にいたのですが、

    • 3-10-12 単語了解度を指標とした高齢者の会話のしやすさについての検討-喫茶店を事例に-,根津さん、永幡さん(福島大学)

    の質疑応答で鈴木先生(東北大学)がおっしゃった Informational Masking (IM)という話がずっと気になっています。

    もともとの発表は、高齢者は喫茶店(他のグループの会話で妨害されやすい状況)で、背景に音楽が流れている方が会話がしやすい、という報告でした。音楽のおかげで他のグループの会話がマスキングされ、自分たちの会話に集中しやすくなるのではないか、という考察です。

    IMについて探してみると、こんな記事がありました:

    音声を聴き取りにくくする妨害に関して、「エネルギーによるマスク」「情報によるマスク」という概念が出てきます。

    昨年から「音声CAPTCHA」の実際の利用例をあれこれ聞いているのですが、その両者がありそうです。

    ちなみに私が去年発表したのは「削除法」というアイディアでした。エネルギーによるマスクの最も極端なケースとも解釈できそうですが。。

    • 福岡 千尋, 西本 卓也, 渡辺 隆行: “音韻修復効果を用いた音声CAPTCHAの検討,” 電子情報通信学会 技術報告(福祉情報工学研究会、ヒューマンインターフェース学会研究会と共催), WIT2008-54, pp.83-88, Dec 2008.

    上記のサイトはこんな文献を引用しています:

    • Watson, C.S. (2005). Some Comments on Informational Masking. Acta Acoustica 91, 502-512.
    • Durlach, N.I., Mason, C.R., Kidd, Jr, G., Arbogast, T,L Colburn, H.S.,and Shinn-Cunningham, B.G.(2003). Note on informational masking. JASA. 113, 2984-2988.
    • Tanner, W.P., Jr (1958 and 1964). What is masking? JASA 30, 919-921.reprinted and updated as Chapter24 in J.A. Swets (1964). Signal Detection and Recognition by Human Observers: Contemporary Readings, John Wiley & Sons, New York.
    • Carhart, R., Tillman, W., and Greetis, E.S. (1969). Perceptual masking in multiple sound backgrounds, JASA 45, 694-703.
    • Neff, D.L. and Green, D.M. (19987). Masking produced by spectral uncertainty with multicomponent maskers, P&P 41, 409-415.
    • Kidd, Jr, G., Mason, C.R., and Arbogast, T.L. (2002). Similarity, uncertainty, and masking in the identification of nonspeech auditory patterns, JASA 111, 1367-1376.

    私はこの話が「音声CAPTCHA」に絡む話だと気づいて勉強を始めたばかりです。

    8月ごろから音声CAPTCHAの課題設計と予備実験をやっているのですが、(実は数日中に原稿執筆と被験者実験をやらなくてはいけない。。)HMM で音声認識されにくい妨害音声の条件が、「IMが起きやすい雑音」にも対応しているように直感的に思えます。

    上記Webページの筆者である Yost は「IMは選択的注意の失敗である」と述べています。私としては、自分の実験に取り入れたい視点と思いつつも、中途半端に手を出すと危険そう、という気もしてきたので、迷いつつ、そろそろ時間切れで実験方針を決めなくてはいけません。

    私が注目していたCMUのプロジェクト reCAPTCHA は大学からスピンアウトして、そして最近 Google による買収が報じられました。音声CAPTCHAについても、古いラジオ番組の音声を聞き取りの課題にする、という面白い試みがなされていた(日本人が聴き取るには結構ハードな課題でした)ので、オープンに研究成果が発表されなくなるとしたら残念なことですが。。

    こういった議論は、私が世話役を務めている(そして最近サボっていた)「音声・音楽研究会」のメーリングリストでも行っていく予定です。お気軽にご参加ください。

    そして、今月末の青森での研究会にもふるってご参加いただければ幸いです。

    青森にはこんな活動をしておられる方もおられます。

    • 2009-10-08 追記: 西本の発表予定のタイトルを訂正しました。
  • 静原・大原・元田中

    すこし前のことになってしまったが、先月のシルバーウィークの旅行について書きたい。

    f:id:nishimotz:20090920122720j:image

    f:id:nishimotz:20090920115558j:image

    京都市静原のCafe Milletに行って、大いに元気をいただいてきた。隅岡樹里さんの「自然にはすべてが備わっている」と言う言葉が心に残った。予約していただいたランチはとても美味しくて、天気もよく、景色も美しく、素晴らしい場所だった。

    f:id:nishimotz:20090920115452j:image

    ご主人の隅岡敦史さんは、京都でSCCJというNPOに関わっておられる。私はタイピング練習ソフト「ウチコミくん」の開発にはじまり、視覚障害者支援や音声インタフェースの技術開発で、SCCJさんにいろいろお世話になった。今は「アグリライフ」という活動も積極的になさっている。

    f:id:nishimotz:20090920115213j:image

    f:id:nishimotz:20090920114857j:image

    たまたまNHK-BS「猫のしっぽ カエルの手」という番組でベニシアさんの友人として紹介されているご夫婦をお見かけして、思い切って静原にやってきた。ブログで報告されているが、樹里さんは足を怪我されており、不自由な中おもてなししていただいて恐縮だった。

    f:id:nishimotz:20090920114543j:image

    アクセスは(車で行けば何でもない場所なのだろうが)出町柳から(数少ない)34番「静原・城山行」の京都バスに乗る。バスの中から静原学校の運動会の様子が見えた。全校生徒15人とのこと。終点の「城山」で降りて、さらに徒歩。テレビに出てきた、パンを焼く石窯が目印だ。Cafe Milletさんは完全予約制なので、ご注意を。

    f:id:nishimotz:20090920114458j:image

    お話すると、かつて松ヶ崎にあった「はるや」さんのお知り合いで、吉田山の「茂庵アートマーケット」にも参加しておられた、とのこと。私は一時期「アートマーケット」の運営をお手伝いしていたので、そこで樹里さんと顔を合わせていたかも知れない。どこでどんな縁があるか、わからないものだ。。

    f:id:nishimotz:20090920114439j:image

    その日は自然歩道を歩いて、大原に降りた。一時間くらいの、ちょっと軽装では歩きづらい山道だった。人里に降りると初秋というより残暑の日差し。稲刈りの終わった田や畑が広がり、ヒガンバナが道ばたに咲き乱れていた。「里の駅」には地元の農家さんたちの野菜が、作った人の写真つきで並べられていた。

    翌日はまず建礼門院ゆかりの寂光院。庭の手入れをされていた男性が、数年前の火災の影響について語っておられた。しかし復興された本堂と庭園は、それでも十分落ち着く場所だった。

    三千院に近づくにつれて車と人の混雑が激しくなる。国宝の仏像も人垣の後ろから拝むしかなかった。午後は観光地とは違ったのんびりした大原を散策。

    夜は出町柳に戻り、かつてよく通った「老安記」と「ぐるぐるかふぇ」に久しぶりに立ち寄った。

    同じ左京区とは思えない3つのエリアの対比を楽しむことができた。慌ただしくも意義深い旅だった。

    実はこの旅行中に携帯電話を落とした。出町柳でバスに乗った直後に紛失に気づき、バスを降りて、最後に立ち寄った草木染めの「大原工房」さんに電話したら、そこに置き忘れていたことが確認できて、送っていただいた。御親切にしていただいたことを感謝します。