nishimotzの日記

タグ: speech

GoogleWaveと音声認識

昨日｢GoogleWaveとUstreamで音声認識字幕の実験｣を初めて行いました。

開始時間: 2010/06/20 11:47
終了時間: 2010/06/20 14:05
ユニーク視聴者数: 27
合計視聴者数: 31
平均視聴者数: 6

ハッシュタグ#wavcapのつぶやきをまとめました。
携帯電話から見たい、という御要望もあったのですが今回は対応できませんでした。
また、直前の告知であったことについて、もっと時間をかけて幅広く告知をしては、という御意見もありました。
(さらに…)

2010年6月21日
人工知能学会全国大会

人工知能学会全国大会（第24回）で「学会・研究会の情報保障におけるソーシャルネットワークの役割」(1D3-1)という発表をしてきました。
スライド（最終版の一つ手前の版）も公開しています。
福祉情報工学研究会での経験を踏まえて考えた個人としての見解でしたが、直前に作ったビデオ（GoogleWaveと音声認識による字幕配信の可能性）について、いろいろな人に興味をもっていただいているので、これから実験を進めたいと思っています。
(さらに…)

2010年6月11日
東大先端研イベント

東大先端研「当事者の視点によるバリアフリー研究」６月４日午前の部に参加してつぶやいてきました。
司会は伊福部達先生。話題提供者は中野聡子さん、藪謙一郎さん、鈴木淳也さん。
中野さんには後で質問させていただき、下記の論文を教えていただきました。

中野聡子他, “聴覚障害者向け音声同時字幕システムの読みやすさに関する研究(1)－改行効果に焦点をあてて”, ヒューマンインタフェース学会論文誌, 第10巻第4号, pp:51-60, 2008.

iPhone字幕システムによる情報保障の実演？もありました。ロビーで紹介されていたのは、iPhoneと通信できるBluetoothワイアレスマイクで講師の声を拾い、音声を遠隔要約筆記のサービスに送り、字幕を遠隔地のWebサーバから配信。iPhoneのSafariで字幕を閲覧、というシステムでした。
実はポイントは「ソフトバンクだから音声もパケット通信も定額」というところで、なるほど、と思いました。
Twitterで私をフォローしておられる何人かの方が「要約は必要か？誰にとって必要か？」という趣旨の発言をなさっているのが興味深かったです。
音声認識技術とモバイル機器の普及は「ユーザにあわせてカスタマイズ可能な字幕提示」という新しいシステムに繋がると考えています。
そういうことも考えつつ、来週の人工知能学会大会（長崎）で下記の発表を予定しています：

６月９日セッション1D3「コミュニケーション支援」1D3-1 学会・研究会の情報保障におけるソーシャルネットワークの役割（西本卓也）

藪さんのシステムは「タッチ操作で文章を入力する新しいインタフェース」になりそうな予感がします。いずれ音音研でお話ししたいとのことでした。音音研の運営が滞っててすみません。。
(さらに…)

2010年6月5日

タグ: speech

GoogleWaveと音声認識

人工知能学会全国大会

東大先端研イベント