投稿者: nishimotz

  • 電話音声認識の記録

    宅配便の不在連絡票には「音声またはプッシュボタンで自動受付」というものがありますが、プッシュボタンでしか操作したことがありませんでした。

    先日、固定電話から音声入力を試してみたら、こんな感じになりました。

    • お客様のお電話番号:ボタンで入力。
    • 送り状番号:3桁、2桁、3桁、4桁の合計13桁。音声で読み上げていたら、最後まで読み終わる前にタイムアウトしたので、ボタンで最初から入力し直す。
    • 営業所番号:6桁。音声で「XXXのXXX」と発話して入力に成功。
    • 配達ご希望日:1桁。音声で「2番」と発話して入力に成功。
    • ご希望時間帯:1桁。音声で「1番」と発話して入力に成功。

    振り返ると、桁数の少ない部分は音声でもうまく入力できる、という結果です。

    本当は「数字をボタンで入力するのが苦痛な項目」を音声で入力できて、全体として効率的になればいいのですが、現実はそうでもないようです。

  • Interface as Mimesis

    Brenda K. Laurel: “Interface as Mimesis”, User Centered System Design, pp.67-85, Lowrence Erlbaum Aassociates, Inc., 1986.

    を読んだら面白かったので簡単に内容をまとめます。

    • インタフェースは本質的にミメシスである
    • インタフェースの科学は成立していない?演劇や詩など「ミメシスの芸術」における理論はインタフェースにも有用なはず
    • 対話的ソフトウェアの目的=人間にいろんなことをさせること
      • インタフェースは、演劇と同じく、理解されうる世界を、わかりやすく表現すべき
    • ミメティックとは
      • 偶然や気まぐれではない。写実よりデフォルメがよい場合もある
      • 対象はリアルな事物でも仮想現実でもよい
      • システムは閉じていること。世界観が一貫していること
      • 閉じた世界だからこそ拡張できる:スタートレックのエピソード
      • 理論的に知ることができる世界を構築せよ
        • 原則論と確率論から演繹できるべき
    • アリストテレスの「詩学」はミメシスの形式を論じている
      • 「心地よい約束」
    • 1:手段
      • 調和がとれて心地よい手段=マルチモーダルが必要
    • 2:様式
      • ユーザに嘆願と説明をするUIは望ましくない
      • 物語形式:小説やテキストデータベース
      • 戯曲形式:演劇、アクションによるUI(望ましいインタフェース)
    • 3:目的・対象
      • オブジェクト表現がインタラクションをもたらす
      • ユーザは表出されたコンテクストの中で役割を演じる
      • インタフェースの役割=表現の提示
      • 操作の対象はミメティックコンテクストである
        • 道具としてのコンピュータ:偶然の産物。必然ではない
      • 媒介物=約束によってギャップを埋めるのは得策ではない
        • 道具メタファはユーザから直接行為の経験を奪う
        • ユーザがミメティックコンテクストに完全に参加するべき
    • 一人称メタファはインタラクティブなミメシスに最適
      • 二人称:説明書
      • 三人称:映画や小説
    • 設計原則1:表現の側面
      • レーシングゲーム=一人称
        • スピードを数字でキー入力させてはダメ
        • ペダルを踏む強さを数字で提示してはダメ
      • ファイル操作
        • 消去したいものを線で囲む:一人称
        • 「私は***を消したい」と音声入力:一人称
      • シミュレータやゲームは一人称ミメシスの正しい方向
      • 自然言語インタフェースも正しい方向
    • 設計原則2:インタラクションの側面
      • frequency : どのくらいの頻度で入力を受理(あるいは受理できるという表示)
      • range : 二値?連続値?語彙サイズ?(選択肢数を自覚させることも)
      • significance : 入力や選択に対するインパクト
    • 設計原則3:ユーザ制約の設計
      • よい制約=創造性、ユーザをミメティックワールドにとどめる役目
      • 可視的制約:コマンドメニュー アクションの前に提示すれば有効
      • 暗黙的制約:システムの振る舞いからユーザが察する
      • 外的制約:コンテクストの外、リセットボタン、電源スイッチ
      • 内的制約:コンテクストに合わせてESCキーを意味づける
      • Phone Slave (Schmandt 1984) ユーザ発話を効果的に制約する例
    • Selection Criteria
      • 「詩学」より:あってもなくても気づかないものは無効
      • 役立たない Help、意味のないインシデント、CAIにおける無意味な「動機付け」
    • Traits
      • アーティスティックな表現の中でインタフェースエージェントは直接的に実現できる
      • エージェントが参加するアクションの特性を定義すること
      • そのアクションをミメティックに表現するための特性を定めること

    直接操作インタフェースの根拠をアートに求めていて、著者自身の演劇体験なども書かれており、なかなか興味深い文章です。

    自然言語インタフェースや音声認識の有用性にも言及されていましたが、その部分に素直に賛成できない気がするのはなぜでしょう。

    もっと根っこの部分から考え直すと、音声認識や自然言語技術をどうやったらうまく使えるか、ヒントが見えてくるのではないか、と感じました。

  • Windows Update が失敗し続ける

    先週末、Windows Vista の「安定性を改善する」というパッチが公開されましたが、そのパッチの適用が失敗し続ける、という現象が起こりました。

    失敗し続けたのは KB941649 というやつですが、

    http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1013482485

    この方の症状と同じですね。

    いま確認すると回答はついたようですが、私も「イベントビューア」を見て、

    インストールの失敗: エラー 0x8007007e で次の更新プログラムのインストールに失敗しました: Windows Vista 用の更新プログラム (KB941649)。

    だったので、「0x8007007e KB941649」で検索して、同様の書き込みを英語のサイトで見つけました。

    ところが、手作業でアップデートしたあと、再び Windows Update が KB941649 をインストールしようとします。そして素直にしたがってしまうと、「再起動してインストールを試みる」「インストールに失敗」「アンインストール」をしてしまうらしく、KB941649 が入っていない状態に戻されてしまいます。

    結局、Windows Update の設定を変えて「推奨される更新プログラムについてもダウンロード、インストール、および通知する」をオフにしました。

    SP1 でも何でもいいから、早く安定して欲しいものです。