如法会 2 と「2つのPython」

如法会2の報告を書いていただいたのですが、過大に評価していただいたようなので言い訳を書きます。

私のトークはこういう内容でした。

Pythonで統計や機械学習という記事、文献、書籍がこの1年くらい日本語でもどんどん出版されています。

私は英語の書籍も含めてそうした資料をいろいろ読んでいて「いわゆる PyData とオリジナルの Python は本当に同じ言語仕様なんだろうか」と疑問に感じてきました。

そこで NumPy が Python という言語をどのように拡張しているのか、という観点から資料を探していたら見つけたのが神嶌さんの「機械学習とPythonとの出会い」でした。

無料で公開されている文献なら紹介しやすいし、単純ベイズだけを扱っているので、やりたいことはわかりやすい。通して読んでみたのですが、さて勉強会で紹介するとしたら「単純ベイズ」のところだけが難しく感じられるだろうなあ。そう思って準備したのが「『機械学習とPythonとの出会い』との出会い」でした。

このテキストを説明しようとして、別の文献をいろいろ読むことになったので、私自身も勉強のきっかけになりました。また、いわゆる Jupyter Notebook をスライドのように使う方法もあわせて勉強させてもらいました。

1990年代の音声認識技術からパターン認識の分野に関わったので、ひとつのアプリケーションで有用な技術がどう他の対象に応用できるか、といった発想で物事を考えることはあいかわらず多く、そういうことが(データさえあれば)すぐに形にできる時代になったのはすごいことだなあと思いつつ、一見時代遅れのパターン認識手法をどこかでしゃべるのも、なにか新しいことに役立つかも、と思ったりもします。

Pythonのエコシステムが機械学習をコモディティ化してしまった現実に凄まじさすら感じた、というのが私にとっての PyCon JP 2016 でしたが、オマケのように喋ったのが「2つのPython」というキーワードでした。

Python 2 と Python 3 ですよね、と思われるかも知れませんが、もうその話は終わってたんだな、ということを東京で納得してきました。

むしろ新たな「2つのPython」は、簡単に言えば pip でパッケージ管理される公式 Python の世界と、Anaconda に代表される数値計算コミュニティ向け Python の世界ですね。いろいろ温度差があるということを薄々感じ始めています。。

このニーズや方向性の微妙に違う2つのコミュニティが関わり合って未来の Python が作られている、その現場を私は PyCon JP で見た気がしました。

コミュニティが分断されないためには多様性が尊重されるカンファレンスの場が必要なのだ、ということも強く感じました。

如法さんのブログでは PyCon mini Hiroshima 2016 (11月12日開催)でこの続きが聞きたいと書いておられましたが、取っておこうと思ったことを如法会で喋ってしまい、大したことでもなかったな、と思えてしまったので、私はたぶん別の話を(時間があれば)すると思います。

実は講演プロポーザルの締切を10月5日まで延長したので、まだ講演の提案をお待ちしているところです。詳しくは connpass をご参照ください。最後はまたイベントの宣伝になってしまってすみません。

NVDA 日本語版 2012.1j 公開

オープンソースのWindows用スクリーンリーダーであるNVDAを日本のユーザーのために改良する nvdajp プロジェクトは2012年4月20日に最新の日本語版 2012.1j をリリースしました。インストーラー版とポータブル版の2種類の実行ファイルを公開しています。ライセンスは GPL v2 です。

NVDA日本語版のスクリーンショット

NVDAユーザ会広島が運用する nvda.jp も今回のリリースに合わせて更新を行いました。http://i.nvda.jp にて、NVDA 2012.1j インストーラー版をダウンロードできます。
“NVDA 日本語版 2012.1j 公開” の続きを読む

#VoiceLink 番組への出演 4/4 12:00

「日本発の音声版SNS」としてSynergyDrive社が提供しているVoiceLinkには私も注目していますが、参加するきっかけがつかめなくて、ユーザー登録をしただけの状態になっていました。

最近、パイロット企画さん @pilot_kikaku に誘っていただいて、下記の番組の「第1回」に参加することになりました。

【番組名】
私的インタビュー放送「誰でも記者会見」

【日時】
第1回放送は2012年4月4日水曜日
昼12時~13時の60分間

【視聴方法】
放送時間の15分前からアクセスできます。
PC,Macのブラウザより以下のサイトにアクセスしてください。
https://www.vlvlv.jp/#!/room1435
*携帯電話には対応していません。
*要FlashPlayer

番組を聞く方は VoiceLink にユーザー登録する必要はないとのことです。
お昼のひととき、お花見に行かないで、ちょっとだけお付き合いください。

NVDAの活動だけでなく、ラジオ番組音声応用システム、音声インタフェースの話もさせていただこうと思っています。
1998年とニコニコ動画にもちらっと書いたことがありますが、私も以前から「音声SNS」に興味を持ってきました。
私が音声SNSの研究をしていた1998年は「社長失格」が出版された年だったようです。探せば倉庫にあるはず。。
VoiceLink の方がお聞きになるかと思うと緊張しますが、楽しみにしております。

参考までに。。日本発の音声版SNS、「VoiceLink」が「Facebook」を抜く日(長谷川高) – BLOGOS(ブロゴス)

2012年

元日の空に、龍の顔のような雲が見えました。

2011年3月に私はこんなことを書いていました:

「それは危機のように見えるかもしれないが、実は幻想の終わりにすぎない」「危機をいっそう悪化させるのは現状維持のために注ぎ込むエネルギー」ワインバーグ「コンサルタントの秘密」第9章より

10年以上前に京都に住んでいたころ、起業家やNPOや芸術家の人と多く知り合った。みんな口を揃えて「震災が人生を変えた」と語ってくれた。それがどういうことなのか、これから首都圏の人々が理解しはじめるだろう。

今日、日付が1月1日に変わったときに私はこんなことを書きました:

いくら「良い年に」と願っても、待っているだけでは物事は良くならない。自分が動くしかない。険しい道でも歩いて行くしかない。2012年はそんな覚悟の年です。

自分の活動のキーワード「オープンソース・アクセシビリティ・音声インターフェース」は10年前と変わっていません。いや、原点に戻ってきたというべきか。。

2011年はオープンソースのスクリーンリーダー NVDA 日本語版 (nvdajp) のリリースを担当しました。先日、開発者 Skype 会議を行って NVDA 2012.1 の日本語化も担当せよという話になったので、私が担当させていただきます。

昨日、2011年の最後にこんなことを書きました:

音声研究者が膨大な時間とお金をかけて作り出した技術が、もはやタダ同然でみんなの手に。。

音声対話・音声インターフェースの技術がやっと身近なものになりました。
この分野で博士号の学位を授与された研究者・技術者の一人として、「勝負が終わった」のではなく「ゲームのルールが変わった」と捉えながら、新しい現実に向き合い続けていきたい。
そんな風に思っています。

オープンソースのスクリーンリーダーNVDAとその日本語化

昨日、日本音響学会東海支部 技術講習会 視覚・聴覚障害のための支援技術の現状と展望 にて「オープンソースのスクリーンリーダーNVDAとその日本語化」という講演をしました。
スライドは ja.nishimotz.com/screen_reader として私のサイトで公開中です。右上の画像をクリックするとブラウザ内でスライドショウになります。
参加してくださった皆様、企画や運営にかかわられた皆様に御礼を申し上げます。

講演の合間に開発中のバージョンを使って実演を行いました。JTalk による早口音声、かな漢字変換のフォネティック読みや詳細読み、Windows エクスプローラーを例にMSAAのオブジェクト情報とNVDAでの音声化の比較などをお見せしました。点字ディスプレイは機材を持参できなかったので、動画でご紹介しました。
Web閲覧の実演をする時間が取れませんでしたが、NVDA の日本語化を例に、「日本におけるスクリーンリーダーの歴史と現状」をご紹介できたのではないかと思います。

アクセシビリティにおけるGUIの影響についてご質問をいただきました。
一般的にはGUIは「画面表示から文字情報を取り出しにくくなった」「キーボードだけで操作できないアプリケーションが増えた」ということで、アクセシビリティが悪くなった原因と考えられています。
しかし私が10年前に「視覚障害者のための電子メール環境における操作性の検討」で触れた考察ですが、「階層化メニューなどの操作が標準化された」というメリットも無視できないと思います。

操作性の変化の問題よりも大きいのは、時代とともに変化するアプリケーションやサービスの環境に取り残されたくない、という意識でしょう。MS-DOSの時代はパソコン通信の時代でした。Windows の時代は電子メールとWebの時代であり、そして近年のスマートフォンの時代はソーシャルメディアの時代でもあります。

アクセシビリティのためにはメカニカルなスイッチの存在は重要で、タッチインタフェースでアクセシブルなデバイスを作ることは難しい、と考えられてきました。
しかし、Apple の VoiceOver など工夫されたインタフェースの登場は、この常識を変えて、視覚障害をお持ちの方に受け入れられつつあります。Windows 8 の Metro UI は構成要素がシンプルであり、工夫次第では従来の Windows アプリケーションよりもアクセシブルにできるかも知れません。

最後に、最近 iPhone 4S の新機能として話題になった音声認識・音声対話は、そろそろスクリーンリーダーの入力手段として再評価されると考えています。

NVDA 日本語化プロジェクトは、まもなく本家が最終版をリリースする 2011.3 の日本語版に向けて、作業を進めています。先日リリースした jpdev11114 では日本語IMEサポートの改良が完全ではないので、あと数回の開発版スナップショットの公開と検証が必要です。

オラビー・ジャパンの活動としては今後、NVDA 技術を基盤にインタフェースのイノベーションにも取り組んでいく予定です。

NVDAユーザ会広島 報告とMLのお知らせ #nvdajp #nvdahiro

NVDAユーザ会広島(代表:西本卓也 nishimotz [at] gmail.com )は2011年6月13日に最初のミーティングを行いました。
会場での参加者は4名(視覚障害をお持ちの方1名を含む)でした。
また Ustream 配信を行いました(ユニーク視聴者数13)。Twitter経由でのご発言もいただきました(Togetter まとめ)。
より詳しい議事録(案)はこの記事の後半にまとめます。

今後の活動方針について議論し、 nvda-hiroshima メーリングリスト(Google Groups)を作りました。
今後、メーリングリストへの登録を入会の手続きとみなし、ただし会費は無料とします。
詳細な規約や運営についてはひきつづきメーリングリストで議論します。

今後、広島を中心にパソコンボランティア、Webアクセシビリティ、オープンソースなどのイベントに参加していきます。
また、NVDA 本家コミュニティ、NVDA日本語化プロジェクト (NVDAJP) などにも積極的に参加していきます。

“NVDAユーザ会広島 報告とMLのお知らせ #nvdajp #nvdahiro” の続きを読む

広島への移転のお知らせ

2011年5月16日から、故郷の広島県広島市にて個人事業者としての活動を本格的に開始します。

東日本大震災がなければ、東京大学を退職しても、東京にとどまって技術コンサルタントとして活動するつもりでした。
この1年くらい NVDA 日本語版に本気で取り組まなくてはならないと考え直した結果、@hoozukiyama さんの住む広島への転居は、自然に出てきた選択肢でした。決断を支えてくれた実家の家族、そして kikurako.com として活動中の @kikurako に感謝しています。
今後は広島でアクセシビリティやオープンソースなどのコミュニティをお手伝いしたいと思います。

アクセシビリティ、情報保障、音声技術、パターン認識、オープンソースに関する技術コンサルティング・講演・開発支援などについて、お気軽にご相談いただければ幸いです。遠方での仕事も可能な限り対応いたします。
特に、障害をお持ちの方が参加されるプロジェクトについては、コミュニケーションに関する配慮をさせていただきます。

昨年度末にまとめた博士論文をお世話になった方々にお送りする作業が滞っていることをお詫びします。
また、退職と転居に関してご迷惑をおかけした方々に、改めてご挨拶をさせていただきたいと思います。
今後ともよろしくお願いします。

Open JTalk の音素継続長の不具合を回避する

NVDA日本語化プロジェクト(nvdajp)は、オープンソース日本語音声合成エンジン Open JTalk公式サイト)に基づく音声エンジン JTalk を本家 NVDA に追加しています。

このエンジンで、読み上げるメッセージが長いときに、メッセージの後半で「極端に遅い音声」あるいは「不自然な音声」が生成されるという問題がありました。これは最新の HTS engine API 1.04 および Open JTalk 1.02 と m001 1.02 でも発生します。
もしかしたら MMDAgent や、その他のシステムの一部としてこの音声エンジンをお使いの方も、同じような現象にお気づきかも知れません。

この問題について、完全に解明できたわけではありませんが、このパッチ(github)にて回避できたように見えますので、ご報告します。

なお、この記事は私が libopenjtalk.dll の開発のために、独自に調査した内容です。もし誤り等がありましたら御指摘いただければ幸いです。
“Open JTalk の音素継続長の不具合を回避する” の続きを読む

NVDA #pyconjp スライド

PyCon mini JPNVDA 日本語化プロジェクトの話をしました。運営に関わられた皆様、発表の機会を与えてくださった皆様、プロジェクトを支えてくださる皆様に感謝します。そして今回もまた @hoozukiyama さんにスライド作成から発表まで、何度も助けていただきました。

自分の発表の間はタイムラインを見ていませんでしたが、Togetterなどを見た限りでは、スクリーンリーダを支える技術、アクセシビリティと関わりのある技術について知っていただけたようです。
Ustream配信の録画がありました。2:15あたりから私の話です。

スライドは下記です。「おまえ誰よ?」を作りそびれたのが残念です(笑)

なお、テキストだけのスライドなので、中身を下記に転載します。
こういうことをすると Sphinx でプレゼンテーションとかやってみたくなりますね。。
自己紹介で喋った昔の話は、いずれ改めてブログ記事にしたいと思います。

“NVDA #pyconjp スライド” の続きを読む

参加型授業を目指して

9月末から半年間、東京女子大学で非常勤講師をしています。4年ぶりに機会を与えていただきました。
情報福祉とコミュニケーションをテーマに、視覚障害、聴覚障害のある方々を支援する技術や現場の実情をお話ししつつ、私が東京女子大学の先生方や学生さんと続けてきた研究(音声による視覚障害者の支援技術)も紹介しています。
そして問題の本質に迫るために「ヒューマンインタフェースの原則」を考える必要があることを、少しずつ伝えていきたいと考えています。
“参加型授業を目指して” の続きを読む