写真 青い空と雲と建物と木々の緑

nishimotzの日記

  • Winny裁判の影響

    金子さんが二審で無罪になった。

    彼の逮捕の日、マスコミから私にも電話がかかってきた。確かに同じ研究科の所属で職位も年齢も同じだったが、彼がどういう人なのか教えて欲しい、という質問に答えられるような個人的な接触はなかった。ただ学生は「戦略ソフトウェア」という学内の活動を通じて、プログラミングの指導などで彼のお世話になっていた。マルチスレッドの使い方など。。

    その日も私は、警察が入った建物と別の場所が居室であったため、ニュースで見るまで何が起こったのかわからなくて戸惑った。

    事件の経緯は佐々木俊尚氏の書籍(「ネットvs.リアルの衝突―誰がウェブ2.0を制するか」 (文春新書) )や記事などに詳しく報じられている。私も佐々木氏の本を読むまで知らないことがたくさんあった。学内の対応については、実は私も詳しいことは知らないのだが、大学側(教授会?)も彼を罪に問えるかどうかについて疑問を感じていたはずで、大学として彼を免職にしたという話は聞いていない。

    「匿名性の高いファイル共有ソフトが普及すると著作権法は時代遅れになる」という指摘は、前々からいろいろなインターネット技術の研究者によって(積極的な悪意ではなく客観的な予測、あるいはDRMなどの積極的な推進を訴える立場として)語られていた、と思う。二審判決直前に行きすぎた取材があったと報じられたが、そういった文脈での発言を期待したのかも知れない。

    しかしながら当時の風潮が「大容量のコンテンツを効率よく配信したいというニーズは不法な目的しかあり得ない」と決めつけていたとしたら、間違っていたと思う。

    自由な再配付を保障するソフトウェアのライセンスの普及、個人が音楽や映像をどんどん発信することが一般化してそれが重要なメディアになってきたこど、などなど。。

    逮捕後に出版された金子氏の著書「Winnyの技術」は読ませていただいた。私自身は Winny を使ったことがないが、技術書として興味深く読むことができた。こんなすごい人なら逮捕される前にもっといろいろお話しておけば良かったと残念に思った。

    私の職場である「大学院情報理工学系研究科」で、金子氏の逮捕後に起きたことは、「プライベートアドレスでネットワークに接続することを禁止」「ノートPCからP2Pアプリケーションを使用することを禁止」「その他の場合もP2Pアプリの利用は事前の届け出が必要」という規則の導入である。世の中の大学や企業でこのルールがどのくらい一般的なのだろうか。。

    これは具体的には「NAT使用不可」が前提である。研究科内のネットワーク管理者がファイアーウォール側でトラフィックを監視していて、P2P のプロトコルの通信が検出されると、「何月何日に IP アドレスどこどこが、P2P 利用していたので事実関係を確認せよ」という連絡がそのアドレスの管理者(例えば私)に届く。NAT だとルーターのアドレスまでしかさかのぼれないので、誰が何というソフトを使っていたか、を答えられない、だから NAT 不可、というわけだ。

    アジア系の外国人留学生が使っているWebブラウザやファイルダウンロードソフトには、わりと P2P 技術を使っているものが多いらしく、何度か原因究明をさせられたものの、聞いたことのないソフトや、なんと書いてあるのかわからないドキュメントなど、いろいろ苦労している。結局「使わせてはいけないソフトの一覧」をちゃんと作ることができない状態だ。

    NAT不可なので、お客さんにネットワークを一時的に使わせて欲しいと言われた場合にもグローバルアドレスをお貸しすることになる。なのでDHCPで簡単に対応できない。

    次の Ubuntu Linux Japanese Remix は BitTorrent での配付を予定している、などと聞くが、それを職場からダウンロードするのに「こういう目的でこのアドレスのマシンで何月何日にBitTorrentを使わせてください」という届け出が必要になりそうだ。

    そういえばこの手の技術を応用したと言われるSkype はすっかり「なくてはならないもの」になってしまった。Skype で警告を受けたことはないのでこれは許可されているらしい。

    そしてこの事件も影響を与えつつ、もっと大きな時代の変化、技術の変化を踏まえて、著作権法の改正が行われ、来年1月の施行が迫っている。アクセシビリティ関連でも多くの影響が(一般的には良い方向に)出ているのだが、もっと勉強しなくては、と思う。

  • CEATECにて

    来年度の福祉情報工学研究会(WIT)をCEATEC展示会の中で開催する案が出ているので、下見をかねて、幕張メッセの CEATEC に行ってきました。

    企業の新製品発表など、いろいろ報道もされていますが、大学やNICTさんの展示ブースもありました。もし来年この場所での研究会が実現したら、研究会の関係者の皆様にいろいろ回っていただけるので、よいことだと思います。

    WIT 関連でいえば、たまたま「アクセシビリティ PLAZA 」というブースが目に入ったのでお話を伺ってきました。(社)ビジネス機械・情報システム産業協会(JBMIA) の方が、JIS X-8341-5(高齢者・障害者等配慮設計指針:事務機器)の説明やバリアフリーコピー機の実演などをしておられました。

    毎年展示しているが、レポートの課題を課せられた大学生などがよく来てくれる、会議場を取るためにお金がかかるので展示のみで講演などはやっていない、というお話でした(対応してくださったのは(株)リコーの方でした)。

    こういった展示をされている方を研究会にお招きしてお話をしていただいたり、見学に来る大学生を積極的に研究会に誘導したり、いろいろ工夫できるのではないかと思いました。

    受付はWebで名前を事前に登録してコンファレンス予約などを行い、会場でバーコードリーダーまたはEdyリーダーを使うセルフサービス方式でした。研究会の入場者にもこういったことをお願いすることになるのでしょうか。うまく情報を共有できれば研究会としてもメリットがあるかも知れません。。

    あまり時間がなく、限られたブースしか見ることができませんでしたが、個人的に興味があって、並んで触ったのはSONYのVAIO Wでした。左手で持ちながら右手で操作してみましたが、紙のように軽く、Windows 7も軽快でした。初めて Let’s Note T1 の実機を触ったときの、あの衝撃に近いものを感じました。あの頃の Panasonic の立ち位置にいま SONY がいるような気がします。。

  • 音声CAPTCHAに関する発表予定

    第50回福祉情報工学研究会(2009年10月29日(木)~30日(金)、青森県青森市で開催)において、下記の発表を予定しています。

    • 著者:西本卓也(東大)・松村 瞳(東京女子大)・渡辺隆行(東京女子大)
    • 題目:音声CAPTCHAシステムにおける削除法と混合法の比較
    • 概要:我々は音声聴取課題によって対象者が人間であるか機械であるかを判別する音声CAPTCHAシステムに着目し、普遍的な設計方針の体系化を踏まえて、音韻修復効果を用いた「削除法」を提案している。本報告では「機械による破られにくさ」の予備的検討として、提案法である「削除法」および既存システムの主流である「混合法」について音声加工の条件の違いが音声認識性能に与える影響を報告する。

    これに関連して、最近気になっていることを書きます。

    先月、郡山の音響学会の3日目に「音バリアフリー」会場にいたのですが、

    • 3-10-12 単語了解度を指標とした高齢者の会話のしやすさについての検討-喫茶店を事例に-,根津さん、永幡さん(福島大学)

    の質疑応答で鈴木先生(東北大学)がおっしゃった Informational Masking (IM)という話がずっと気になっています。

    もともとの発表は、高齢者は喫茶店(他のグループの会話で妨害されやすい状況)で、背景に音楽が流れている方が会話がしやすい、という報告でした。音楽のおかげで他のグループの会話がマスキングされ、自分たちの会話に集中しやすくなるのではないか、という考察です。

    IMについて探してみると、こんな記事がありました:

    音声を聴き取りにくくする妨害に関して、「エネルギーによるマスク」「情報によるマスク」という概念が出てきます。

    昨年から「音声CAPTCHA」の実際の利用例をあれこれ聞いているのですが、その両者がありそうです。

    ちなみに私が去年発表したのは「削除法」というアイディアでした。エネルギーによるマスクの最も極端なケースとも解釈できそうですが。。

    • 福岡 千尋, 西本 卓也, 渡辺 隆行: “音韻修復効果を用いた音声CAPTCHAの検討,” 電子情報通信学会 技術報告(福祉情報工学研究会、ヒューマンインターフェース学会研究会と共催), WIT2008-54, pp.83-88, Dec 2008.

    上記のサイトはこんな文献を引用しています:

    • Watson, C.S. (2005). Some Comments on Informational Masking. Acta Acoustica 91, 502-512.
    • Durlach, N.I., Mason, C.R., Kidd, Jr, G., Arbogast, T,L Colburn, H.S.,and Shinn-Cunningham, B.G.(2003). Note on informational masking. JASA. 113, 2984-2988.
    • Tanner, W.P., Jr (1958 and 1964). What is masking? JASA 30, 919-921.reprinted and updated as Chapter24 in J.A. Swets (1964). Signal Detection and Recognition by Human Observers: Contemporary Readings, John Wiley & Sons, New York.
    • Carhart, R., Tillman, W., and Greetis, E.S. (1969). Perceptual masking in multiple sound backgrounds, JASA 45, 694-703.
    • Neff, D.L. and Green, D.M. (19987). Masking produced by spectral uncertainty with multicomponent maskers, P&P 41, 409-415.
    • Kidd, Jr, G., Mason, C.R., and Arbogast, T.L. (2002). Similarity, uncertainty, and masking in the identification of nonspeech auditory patterns, JASA 111, 1367-1376.

    私はこの話が「音声CAPTCHA」に絡む話だと気づいて勉強を始めたばかりです。

    8月ごろから音声CAPTCHAの課題設計と予備実験をやっているのですが、(実は数日中に原稿執筆と被験者実験をやらなくてはいけない。。)HMM で音声認識されにくい妨害音声の条件が、「IMが起きやすい雑音」にも対応しているように直感的に思えます。

    上記Webページの筆者である Yost は「IMは選択的注意の失敗である」と述べています。私としては、自分の実験に取り入れたい視点と思いつつも、中途半端に手を出すと危険そう、という気もしてきたので、迷いつつ、そろそろ時間切れで実験方針を決めなくてはいけません。

    私が注目していたCMUのプロジェクト reCAPTCHA は大学からスピンアウトして、そして最近 Google による買収が報じられました。音声CAPTCHAについても、古いラジオ番組の音声を聞き取りの課題にする、という面白い試みがなされていた(日本人が聴き取るには結構ハードな課題でした)ので、オープンに研究成果が発表されなくなるとしたら残念なことですが。。

    こういった議論は、私が世話役を務めている(そして最近サボっていた)「音声・音楽研究会」のメーリングリストでも行っていく予定です。お気軽にご参加ください。

    そして、今月末の青森での研究会にもふるってご参加いただければ幸いです。

    青森にはこんな活動をしておられる方もおられます。

    • 2009-10-08 追記: 西本の発表予定のタイトルを訂正しました。