写真 青い空と雲と建物と木々の緑

nishimotzの日記

  • 展示と点字

    2007 国際ロボット展

    東京ビッグサイトで今日から12月1日まで開催。

    昨日、会場の設営現場に行ってきました。工業用ロボットの並ぶ大きなブース群ではなく、サービスロボットという分野の小さなブースに、音声認識を使った簡単なデモを搬入してきました。最近ずっとこれをやっていたので、とにかく形になってホッとしました。

    東3ホールのSR-14というブースで、ユニバーサルロボットさんという会社の展示です。

    最近 CodeGear C++Builder のことを何度か書きましたが、この仕事を通じて C++Builder の経験を積むことができました。まだまだですが。。

    UDソリューションセミナー

    夕方、毎日新聞の「ユニバーサロン」が企画するセミナーに参加。視覚障害者の支援技術をいろいろ見せていただきました。

    今回はグラフィックスや地図や触覚がテーマでしたが、自分が3年前にやった「谷中標本」とかなり近いコンセプトでICタグを使う提案もあり、音声と組み合わせる提案もいろいろで、新鮮でした。

    懇親会に参加したら、いろいろな方に声をかけていただいて、すっかり料理を食べそびれました。

    2次会に参加したら、10人のうち晴眼者は2人だけ、という状態。いろいろ本音を伺うことができました。

    「視覚障害者がどのくらい触覚から情報を得ることができるか」

    これは、本人がどれくらい前向きな気持ちになるかどうか、という要素が大きい。

    点字が使える視覚障害者は10%程度と言われています。訓練を受けないまま中途失明した方は、いまさら点字なんか覚えたくない、という方が多いようです。しかし立体コピーなどの機器が普及して、

    「こんな情報なら頑張って読んでみたい」

    と思うようなことがたくさん出てくれば、状況は変わるだろう、とのことです。

  • 電話音声認識の記録

    宅配便の不在連絡票には「音声またはプッシュボタンで自動受付」というものがありますが、プッシュボタンでしか操作したことがありませんでした。

    先日、固定電話から音声入力を試してみたら、こんな感じになりました。

    • お客様のお電話番号:ボタンで入力。
    • 送り状番号:3桁、2桁、3桁、4桁の合計13桁。音声で読み上げていたら、最後まで読み終わる前にタイムアウトしたので、ボタンで最初から入力し直す。
    • 営業所番号:6桁。音声で「XXXのXXX」と発話して入力に成功。
    • 配達ご希望日:1桁。音声で「2番」と発話して入力に成功。
    • ご希望時間帯:1桁。音声で「1番」と発話して入力に成功。

    振り返ると、桁数の少ない部分は音声でもうまく入力できる、という結果です。

    本当は「数字をボタンで入力するのが苦痛な項目」を音声で入力できて、全体として効率的になればいいのですが、現実はそうでもないようです。

  • Interface as Mimesis

    Brenda K. Laurel: “Interface as Mimesis”, User Centered System Design, pp.67-85, Lowrence Erlbaum Aassociates, Inc., 1986.

    を読んだら面白かったので簡単に内容をまとめます。

    • インタフェースは本質的にミメシスである
    • インタフェースの科学は成立していない?演劇や詩など「ミメシスの芸術」における理論はインタフェースにも有用なはず
    • 対話的ソフトウェアの目的=人間にいろんなことをさせること
      • インタフェースは、演劇と同じく、理解されうる世界を、わかりやすく表現すべき
    • ミメティックとは
      • 偶然や気まぐれではない。写実よりデフォルメがよい場合もある
      • 対象はリアルな事物でも仮想現実でもよい
      • システムは閉じていること。世界観が一貫していること
      • 閉じた世界だからこそ拡張できる:スタートレックのエピソード
      • 理論的に知ることができる世界を構築せよ
        • 原則論と確率論から演繹できるべき
    • アリストテレスの「詩学」はミメシスの形式を論じている
      • 「心地よい約束」
    • 1:手段
      • 調和がとれて心地よい手段=マルチモーダルが必要
    • 2:様式
      • ユーザに嘆願と説明をするUIは望ましくない
      • 物語形式:小説やテキストデータベース
      • 戯曲形式:演劇、アクションによるUI(望ましいインタフェース)
    • 3:目的・対象
      • オブジェクト表現がインタラクションをもたらす
      • ユーザは表出されたコンテクストの中で役割を演じる
      • インタフェースの役割=表現の提示
      • 操作の対象はミメティックコンテクストである
        • 道具としてのコンピュータ:偶然の産物。必然ではない
      • 媒介物=約束によってギャップを埋めるのは得策ではない
        • 道具メタファはユーザから直接行為の経験を奪う
        • ユーザがミメティックコンテクストに完全に参加するべき
    • 一人称メタファはインタラクティブなミメシスに最適
      • 二人称:説明書
      • 三人称:映画や小説
    • 設計原則1:表現の側面
      • レーシングゲーム=一人称
        • スピードを数字でキー入力させてはダメ
        • ペダルを踏む強さを数字で提示してはダメ
      • ファイル操作
        • 消去したいものを線で囲む:一人称
        • 「私は***を消したい」と音声入力:一人称
      • シミュレータやゲームは一人称ミメシスの正しい方向
      • 自然言語インタフェースも正しい方向
    • 設計原則2:インタラクションの側面
      • frequency : どのくらいの頻度で入力を受理(あるいは受理できるという表示)
      • range : 二値?連続値?語彙サイズ?(選択肢数を自覚させることも)
      • significance : 入力や選択に対するインパクト
    • 設計原則3:ユーザ制約の設計
      • よい制約=創造性、ユーザをミメティックワールドにとどめる役目
      • 可視的制約:コマンドメニュー アクションの前に提示すれば有効
      • 暗黙的制約:システムの振る舞いからユーザが察する
      • 外的制約:コンテクストの外、リセットボタン、電源スイッチ
      • 内的制約:コンテクストに合わせてESCキーを意味づける
      • Phone Slave (Schmandt 1984) ユーザ発話を効果的に制約する例
    • Selection Criteria
      • 「詩学」より:あってもなくても気づかないものは無効
      • 役立たない Help、意味のないインシデント、CAIにおける無意味な「動機付け」
    • Traits
      • アーティスティックな表現の中でインタフェースエージェントは直接的に実現できる
      • エージェントが参加するアクションの特性を定義すること
      • そのアクションをミメティックに表現するための特性を定めること

    直接操作インタフェースの根拠をアートに求めていて、著者自身の演劇体験なども書かれており、なかなか興味深い文章です。

    自然言語インタフェースや音声認識の有用性にも言及されていましたが、その部分に素直に賛成できない気がするのはなぜでしょう。

    もっと根っこの部分から考え直すと、音声認識や自然言語技術をどうやったらうまく使えるか、ヒントが見えてくるのではないか、と感じました。