タグ: twitter

  • orpheus_tw

    こんなものを作っています。

    Mon, Nov 16

    • 23:08  歌詞を入力すると東京大学「自動作曲システム オルフェウス」で作曲し、その曲をTwitterの@orpheus_twのツイートとして公開するシステムを作っています http://orpheus-tw.heroku.com/

    Tue, Nov 17

    • 09:10  フォロー感謝 @orpheus_tw どういうbotに育てていけばよいのか、御意見を伺いたいです。

    なお、作曲された曲のデータは1ヶ月しかサーバに保存されません。

    heroku ってなに?という方は私の記事 heroku をどうぞ。残念ながら無料サービスの範囲内では実現できず、$15/month のオプションである delayed job を使っています。

    オルフェウスについては 自動作曲システムオルフェウスの説明 をどうぞ。

    今年の流行語「クラウド」をただニュースとして追いかけるのではなく、rails と git を覚えて、手を動かしてみるのが(いろいろ落とし穴もあったけど)楽しいです。どうして日本には heroku のようなサービスがないのだろう。。

  • ツイート

    だんだんまとまった文章を書くことがおろそかになりつつあります。。

    Tue, Nov 10

    • 09:11  いまTwitter界隈から起きつつある社会の変化が「リアルタイムWeb」の普遍的な現象なのか、Twitterでなくてはならないのか、それが気になる。アメブロを採用した日本の首相はいずれ「アメーバなう」を使うと思うので。
    • 09:14  インターネットのインフラの「自前主義」は戦略的に見直す時代かも。例えば日本政府は日本の企業のサービスにこだわるのだろうが、過去に日の丸OSも日の丸PCも失敗したじゃないか。。
    • 09:19  複数の類似サービスを有機的に連携させれば、自前主義でなくても特定企業のサービスへの過度な依存のリスクは回避できる。手段ではなく結果・効果にこだわるべき。例えばgmailを使わないのも、gmailしか使わないのも、リスクのように思える。
    • 21:23  加藤ただし「エンジニアのための開発生活ガイド」 講談社ブルーバックス を読んでいる。工学系大学研究室の研究生活ガイドとしてお勧めできるが、大学から出たことがない私には社会勉強になる。

    Wed, Nov 11

    • 08:02  学会の研究会予稿や論文誌がどんどん電子化されているが、いずれkindleのようなデバイスで読むのが当たり前になるかも。情報処理学会はPC画面に特化した横長の書式を導入したけれど、早まったのではなかろうか。。

    Thu, Nov 12

    • 11:27  科研費や共同研究に頼らずに、法人や個人から少額の寄附金を幅広く集めて活動し、目的に合わせて成果の社会還元方法を選択する、NPO型の研究プロジェクトができないだろうか、と常々考えている。
    • 17:06  WIT(福祉情報工学研究会)更新しました http://www.ieice.org/~wit/
    • 22:22  クラウドの課金の説明とか読んでると、遠い昔の大型計算機のTSSってこんな感じだったのかなあ、と思う。だとしたら大学の研究室がAmazonにお金払ってサーバを借りるのも当たり前になるのかな。。

    Fri, Nov 13

    • 00:01  久しぶりに heroku を触った。 http://ja.nishimotz.com/heroku
    • 00:31  「天才数学者はこう賭ける~誰も語らなかった株とギャンブルの話~」を読み始めた。読みにくいと不評らしいのだが、私はプロローグと第1章ですでに大満足している。。100年前のAT&T、50年前のベル研。。
    • 08:49  TSSに反応されてしまった。大昔と違うのは、昔はパンチカードでいまはシンクライアントってところでしょうか。それとも昔はFORTRANでいまはMapReduceか。。
    • 12:06  HCGシンポジウムの事前受付を開始しました http://www.ieice.org/~hcg/sympo2009/
    • 23:57  自分の研究活動や学会活動の意義や現状について情報発信をしている研究者がまだまだ少ないと思う。でもみんなそんなことする暇があったら論文を書かなければ生き延びられない、という現実があるのもよくわかる。悪循環。

    Sat, Nov 14

    • 11:50  メーリングリストや電子掲示板では得られない価値のために「実際に人が集まる学会・研究会」は重要だ。でもTwitterのリアルタイム性、カジュアルさ、人との交流しやすさ、そしてアクセシビリティは、とても大きな可能性だと感じる。
    • 14:39  音声認識どんどん使って見せるべき。そしてまだまだ不完全、もっと研究が必要だということも広く理解してもらうべき。
    • 16:30  とはいえ、短期的な利益に繋がらなくても、真実を探求したり、社会理念を実現したり、不測の事態に備えたりする科学研究は、日本が誇らしい国であるために必要。言語や音声の研究って、安直に仕分けされるような近視眼的な仕事ばかりではないはず。

    一部ID入りの発言を修正しました。

  • 音声言語情報処理研究会 2009-SLP-78

    第78回 音声言語情報処理研究会 (SIG-SLP)(第5回 音声言語情報処理技術デベロッパーズフォーラム) に行ってきました。つぶやいていたらフォローが増えました。感謝。

    • 10:19  SLP研究会なう。西早稲田という最寄り駅ができたから西早稲田キャンパスになったのか。。
    • 10:25  検索して見つからないから #SIGSLP を使っていいのかな。。
    • 10:31  #SIGSLP 講演(1)「長時間スペクトル変動と調波構造に基づく発話区間検出法の音声認識による評価」福田さん他
    • 10:58  #SIGSLP 講演(1)質疑:フレームドロッピングの必要性?VADで発話前後の無音がすでに落ちているのでは?意図的にやっていないか?
    • 10:58  #SIGSLP 講演(2)「ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討」倉田さん
    • 11:25  #SIGSLP 講演(2)質疑:エラー時の振る舞いは今後の課題。自然言語理解は最大エントロピー法。もっと軽い手法ではだめか?学習データ数とカバー率の関係は?未知語を含む発話に対する正解判断は?
    • 11:27  #SIGSLP 講演(3)「音声対話システムにおける暗黙的な教師信号に基づく音声認識率の推定とそれを用いたエラー予測」駒谷さん
    • 11:50  #SIGSLP 講演(3)質疑:評価尺度は文認識率に相当。絶対値としては低い?バージインを対話状態によって分けて検討しては?
    • 12:38  #SIGSLP 昼休みなう http://sig-slp.jp/2009-SLP-78.html
    • 12:47  #SIGSLP 講演(4)音声中の検索語検出のためのテストコレクション構築 -中間報告-
    • 13:52  #SIGSLP 講演(5)で5分だけ喋りました。さっきの報告の続き。
    • 13:53  #SIGSLP 講演(4)質疑:検索速度の評価は?要望は誰に?検索速度の評価に音声認識の処理は含む?
    • 13:53  #SIGSLP 講演(5)「階層的MMIアーキテクチャに基づくプラットフォーム実装方法の検討」
    • 13:54  #SIGSLP 講演(5)質疑:リアルタイムでの応答は6階層モデルでできるのか?
    • 13:55  #SIGSLP (6)(招待講演) 「音声認識実用化事例の紹介とその課題」藤田 泰彦さん (アドバンストメディア)
    • 13:55  スーツ率が高くて私もびっくり RT @whym #sigwi2 から #SIGSLP に移動したら会場の雰囲気がガラッと違う。wi2は大半が私服、slpはほぼ100%スーツ
    • 13:59  #SIGSLP 招待講演:音声認識AmiVoiceの実績紹介。医療分野で2900施設以上。画像を見ながら入力。電子薬歴は保険点数に。専門用語が多いのでカナ漢字変換よりも有利。入力効率が34~73%改善。
    • 14:01  #SIGSLP 招待講演:東京都議会の議事録作成で導入。速記会社とアドバンストメディアさんの連携でサービスとして提供。
    • 14:04  #SIGSLP 招待講演:音声認識によって大阪府では速記者の人件費を削減できた。課題は話しことば対応、速記者の使いやすいインタフェース。
    • 14:05  #SIGSLP 招待講演:ここまではビジネスとして成熟した事例。コールセンターでの利用は多種多様。モニタリング、コンプライアンス強化、分析。
    • 14:09  #SIGSLP 招待講演:コールセンターでの利用、オペレータ音声の認識だけでも有効。
    • 14:13  #SIGSLP 招待講演:らくらくホンやiPhoneでの音声認識。自動学習がポイント。単語やユーザ言語モデル。App Storeのアンケート評価は良好だが、今後も使い続けたい人が少ない?
    • 14:16  #SIGSLP 招待講演:音声認識による英語教材。楽しいコンテンツが作りやすい。月額使用料によるライセンス。課題は市販ハードや他ソフトとの共存。
    • 14:18  #SIGSLP 招待講演:実用化における課題。ビジネスモデルの確立。第一印象=イニシャルの認識率。継続利用の支援=適応など。データ収集の障害。
    • 14:26  #SIGSLP 招待講演:質疑:いまの手法では性能を出すためのコストに収入が見合わない。研究機関に期待すること=性能を上げるためのブレークスルーを。
    • 14:27  #SIGSLP 講演 (7) 「第5回SLPデベロッパーズフォーラムイベント企画の趣旨について~コーディネータの立場から~」庄境さん
    • 14:28  #SIGSLP 庄境さん「ハイテクの落とし穴=キャズム」
    • 14:33  #SIGSLP 庄境さん「ハイテクオタク相手では投資を回収できない。マジョリティに受け入れられるためには?要求=低コスト、高品質、限定機能」
    • 14:36  #SIGSLP 庄境さん「車載機器における音声入力の市場。必須機能だが使われているかどうか不明。安価で真に役立つ音声認識に需要=キャズムを超える好機?」
    • 14:40  #SIGSLP 講演(8)「音声インタフェース普及促進のため開発支援技術」中野さん
    • 14:45  #SIGSLP 中野さん「音声インタフェースの設計手法と評価手法、パタンランゲージによる記述」「利用環境を絞り込む」「視覚フィードバックが不要な環境、キーボードの利用困難な環境」「不正確性、処理時間の問題を回避」「片手コントローラとの併用」
    • 14:48  #SIGSLP 中野さん「敏速かつ正確な操作はコントローラで、絞り込みは音声で」実装例の紹介。
    • 14:57  #SIGSLP 中野さん「タスク達成率が異なる際の達成時間の比較が困難」「制限時間に実験者の主観が混入する」「T-Aグラフを使う手法を提案」
    • 15:07  #SIGSLP 講演(8)質疑:音声で入力してテンキーで修正、という状況も評価すべきでは?設計の問題になる。主観評価も重要。
    • 15:08  #SIGSLP 講演(9)「音声UI設計とその評価 ~普及促進にむけて,システム構築の立場から~」石川さん「今日もヨタ話?」
    • 15:14  #SIGSLP 石川さん「製品設計の場に音声UI設計の専任がいない」「人間中心の設計開発のプロセス」「ものづくりアーキテクチャのポジショニング=製品内部構造×製品外部構造、インテグラル型/モジュール型」
    • 15:18  #SIGSLP 石川さん「日本のUI設計の現状=アプリケーションごとの要求をすりあわせる。機能に対するUI設計。電源入れるとナビ」「欧米=UIもモジュールで、アプリと独立に検討、最後につなぐ。電源を入れるとまずメニューが出る」
    • 15:24  #SIGSLP 石川さん「音声が着目すべき特徴=一貫性、確実性、効率」「今後の製品=アーキテクチャの大変革が間近。社外サービスとの連携を。車載機器は安全性を確保できる一貫したUIを」
    • 15:27  #SIGSLP 石川さん「記述できること、ではなく、UIの基本原理が含まれたインタフェースモジュールを」
    • 15:35  #SIGSLP 石川さん:質疑:モバイルPCを車内に置けばよい?安全性に考慮したUIが前提?自動車メーカーのビジネスチャンスの考慮?
    • 15:35  #SIGSLP 休憩なう
    • 15:49  #SIGSLP 講演(10)「人間の多様な振る舞いを考慮した音声UIの必要性」岡本さん。昨年度までの国プロの成果。ユーザは困るまでマニュアルを読まない。画面に表示されている情報や音声ガイダンスに誘導される。開発者の意図が伝わらない。
    • 15:52  #SIGSLP 岡本さん「テストとプロトタイプ改良をスパイラルに繰り返した」「被験者は画面からヒントを探そうとしない」「ユーザの多様な行動を想定しているか?」「仕組みがわかるUIになっているか?」「ユーザに役立つシンプルで的確な情報を」
    • 15:59  #SIGSLP 岡本さん「具体的な対応方法を知らせる。xxするにはxxと発話してください、など」「情報を垂れ流すだけでは気づいてくれない。使用法を文字と音声で説明する。注意してくれているか確認する。準備ができたらスタートとお話しください、など」
    • 16:06  #SIGSLP 岡本さん「使用意欲を調査。使用前は5点でも使用後に4点に。慣れてきたらガイダンス不要。手動バージインを使ってもらえない。使っている状況をモニタして習熟度を判断し、習熟度にあったUIを提供すべき」
    • 16:08  #SIGSLP 習熟度の定義は難しそうですね。音声入力への熟練、アプリケーションへの熟練、ヒントに気づくことへの熟練、などなど。
    • 16:09  #SIGSLP 講演(11)「実世界に存在する音声・音響を対象とした認識技術」大淵さん
    • 16:13  #SIGSLP 大淵さん「技術になれていないと音声認識を使いこなせない現状」「どこまで完璧に作ればマジョリティは満足してくれるか」
    • 16:17  #SIGSLP 大淵さん「音声認識はキーボードやタッチパネルに勝てるか?」「機械に向かって話してもらう、をやめる=書き起こしの下請け、監視など、インタフェースでない用途?」
    • 16:23  #SIGSLP 大淵さん「画像認識はどう使われているか?画像認識してもらうために人間が行動することは少ない。すでにそこにある姿を認識する」「従来は議事録を作らなかったような会議の音声を・・」
    • 16:28  #SIGSLP 大淵さん「そこそこの認識率のものを有効活用できる応用を」「侵入音や銃声などの音響イベント認識」「意図的音声コマンド検知」
    • 16:31  #SIGSLP 大淵さん「一秒を完璧に認識?一万時間を適当に認識?」
    • 16:41  #SIGSLP 朝からの話を振り返って。音声インタフェースは「車輪の再発明」され続ける運命なのかな http://bit.ly/KpSLj
    • 16:43  #SIGSLP (パネル討論) 「音声認識技術がキャズムを越えるには?」なう
    • 16:49  #SIGSLP 西村さん「InventionとInnovation」「セグウェイ=技術の高度さがビジネスの成功につながらない例」
    • 16:53  #SIGSLP 西村さん「世界が大きく変化している」「技術者が自分の取り組んでいる技術ありきで使い道を考えていないか」「10年前と同じ発想、同じ仮定でいいのか」「アフリカでは音声通話しかない携帯電話が数ドルで売られている」
    • 17:02  #SIGSLP 質問なう「オープンソースの役割」「アクセシビリティ」
    • 17:11  #SIGSLP ビジネスモデルの議論に。イニシャルの性能をいかに上げるか。コストの問題。独自の文化へのこだわり。
    • 17:14  #SIGSLP 技術の独占?オープンイノベーション?音声認識技術は枯れているので自前で作れる。オープンソース的なコーパス?
    • 17:19  #SIGSLP 評価結果の共有。ソリューションを考える人を増やすべき?企業の研究所にいてもビジネスはわからない。学会とは別の場を作るべきかも。組織がやるべきことが個人に押しつけられている
    • 17:22  #SIGSLP 成功している分野としてない分野があるA社。いかに差別化するか。先行するか。分野ごとにアライアンスを組む必要がある。業界が参入を恐れている?使えるものが作れる自信はでてきた。
    • 17:26  #SIGSLP 「フィールドで評価までやったうえでソリューションとして売れば成功できるはず」「ビジネスと研究所が思考を共有できない」「オープンソースはソリューションさえ公開しているのでは?」
    • 17:29  #SIGSLP ソリューションビジネスの経験。「手組み」か「パッケージ」かの判断から始まる。判断する人が情報を持っていない。よほど音声に思い入れがないとSI事業は成立しない。既存パッケージとの音声の連携は?
    • 17:32  #SIGSLP 最近は音声認識のソリューションが消費者から見えなくなっている。既存パッケージはPCが前提で音声が有効性を見いだしにくい。PDA連携は実績につながりやすい。
    • 17:37  #SIGSLP 「習熟度の定義」を。道は一本ではないはず。システムの透過性がしっかりしていれば、その人なりの道がある。
    • 17:44  #SIGSLP 開発者の意図を伝えること=習熟度かも。習熟度ごとにインタフェースを適応するのは音声固有の問題?
    • 17:47  #SIGSLP 議論:ユーザがシステムを擬人化するかどうか。設計の違いが大きいのでは?擬人性を考えるならアダプティブに。道具型の場合は透明性が重要?
    • 17:50  #SIGSLP 議論:システムを知的に見せるとユーザは過信し、問題は難しくなる。機械の頭の悪さをいかにユーザに知らせる。ユーザが期待するタスクを絞って選択肢を呈示してはどうか
    • 17:52  #SIGSLP 議論:マジョリティに向けた戦略。カーナビについて日本はもう舵を切ったと思う。最初に音声でセットアップさせるなど、成功体験を与えたい。
    • 17:55  #SIGSLP 議論:対話だと思うとぐちゃぐちゃになる。インタフェースだと割り切る。人間は人工的に作れない。検索は迷わず使える。「見える化」が重要
    • 17:55  #SIGSLP 終了。

    Powered by twtr2src