投稿者: nishimotz

  • 音声対話講習会

    7月31日から8月3日まで京都大学で「音声認識・音声対話技術講習会」があり、私は最終日で「ISTCソフトウェア紹介」というテーマの時間をいただき、ソフトウェアの実演をしました。

    私がGalatea Projectで開発を担当しているGalatea Toolkit Linux版の紹介をしました。主に VoiceXML による対話シナリオ記述について御説明して、まだ正式対応ではありませんが Windows 環境で VoiceXML のシナリオを実行してデモを行いました。

    実演で御紹介したソースコードをいくつかお見せします。

    以下は PHP で動的にVoiceXMLを生成する例です。

    <?php echo '<?xml version="1.0" encoding="utf-8"?>' ."\n" ?>
    <?php mb_http_output('utf-8') ?>
    <vxml version="2.0" xml:lang="ja">
    <?php
    if(isset($_REQUEST['region']) && $_REQUEST['region'] != '') {
    $region = $_REQUEST['region'];
    mb_convert_variables("UTF-8", mb_detect_encoding($region), $region);
    ?>
    <form id="answer">
    <block>
    <log>地域:<?php echo $region ?>,今日:晴れ,明日:曇り</log>
    <prompt>
    天気予報です。
    <?php echo $region ?>の、
    今日の天気は晴れです。
    明日は曇りです。
    <break/>
    </prompt>
    <goto next="#ask"/>
    </block>
    </form>
    <?php } ?>
    <form id="ask">
    <field name="region">
    <prompt timeout="20s">
    天気を聞きたい地域を、東京、横浜、京都から選んでください。
    </prompt>
    <grammar version="1.0" root="#region_rule">
    <rule id="region_rule">
    <one-of>
    <item> <token sym="まいくてすと">マイクテスト</token> </item>
    <item> <token sym="とうきょう" slot="region">東京</token> </item>
    <item> <token sym="よこはま" slot="region">横浜</token> </item>
    <item> <token sym="きょうと" slot="region">京都</token> </item>
    </one-of>
    </rule>
    </grammar>
    </field>
    <block>
    <submit next="<?php echo basename(__FILE__) ?>"/>
    </block>
    </form>
    </vxml>
    

    また、以下は PostgreSQL とも連携して、音声認識文法も動的に生成し、出力する情報もデータベースから取得して読み上げる例です。

    <?php echo '<?xml version="1.0" encoding="utf-8"?>' ."\n" ?>
    <?php mb_http_output('utf-8'); ?>
    <vxml version="2.0" xml:lang="ja">
    <?php
    $db_user = "galatea";
    $db_pass = "galatea";
    $db_host = "localhost";
    $db_name = "galatea_db";
    $db = pg_connect("host=$db_host port=5432 dbname=$db_name user=$db_user password=$db_pass");
    if (isset($_REQUEST['item']) && $_REQUEST['item'] != '') {
    $item = $_REQUEST['item'];
    mb_convert_variables("UTF-8", mb_detect_encoding($item), $item);
    $rs = pg_query($db, "SELECT name,price FROM goods WHERE code = $item");
    if ($row = pg_fetch_assoc($rs)) {
    $name  = $row['name'];
    $price = $row['price'];
    }
    ?>
    <form id="answer">
    <block>
    <log>name: <?php echo $name ?>,price: <?php echo $price ?></log>
    <prompt>
    <?php echo $name ?><?php echo $price ?>円です。
    <break/>
    </prompt>
    <goto next="#ask"/>
    </block>
    </form>
    <?php } ?>
    <form id="ask">
    <field name="item">
    <prompt timeout="20s"> 値段を聞きたい果物は何ですか? </prompt>
    <grammar version="1.0" root="#item_rule">
    <rule id="item_rule">
    <one-of>
    <item> <token sym="まいくてすと">マイクテスト</token> </item>
    <?php
    $rs = pg_query($db, "SELECT code,name,yomi FROM goods");
    while ($row = pg_fetch_assoc($rs)) {
    $code = $row['code'];
    $name = $row['name'];
    $yomi = $row['yomi'];
    echo "      <item> <token sym=\"$yomi\" slot=\"item\" value=\"$code\">$name</token> </item>\n";
    }
    ?>
    </one-of>
    </rule>
    </grammar>
    </field>
    <block>
    <submit next="<?php echo basename(__FILE__) ?>"/>
    </block>
    </form>
    </vxml>
    

    最後に、音声認識エンジンに対してユーザが発話している途中にどのようなフィードバックをユーザに見せるべきか、ということを考えていただくために、試作中の「音声インクリメンタルサーチ」のデモをお見せしました。

    音声対話システムの開発において VoiceXML が常に最適な技術とは限りません。

    ISTC-SIG-MMIでは、Galatea Toolkit 開発の経験を生かしつつ、W3Cでの標準化の動向も踏まえて、マルチモーダル対話システムのアーキテクチャーと記述言語の検討を進めています。

    Galatea Dialog Manager もそれらの成果を取り込みながら、さらに開発を続けていきたいと思っています。

  • 研究者のための査読マニュアル

    はじめに

    表題のような著書やサイトが少しはあってもいいような気がするのですが、匿名査読の原則があるせいか、皆様がどのように査読の仕事をなさっているかは、伺うことが少ないです。

    私なんかは査読を受けたことの何倍も査読を頼まれたことの方が多い人間なので、(それは論文を書かない自分が悪いが。。)査読を頼まれるたびに困っていました。いまだに困ってますが。。。

    でも、表題のようなマニュアルが普及すれば、査読される側に回ったときも役に立つと思うのです。。

    投稿するたびに不採録になっていた日々を経て(いまだに?)、たまたま査読を依頼する側も経験して、あくまでも個人的な意見として、言わば「裏・査読マニュアル」を書いてみることにしました。

    第1章 査読の断り方

    のっけからこんなこと書いてしまいますが、どうせボランティアです。

    自分には引き受けられない、と思ったら、断った方がいいと思うのです。

    私がかつて依頼する側に回ったときに、なるほど、と思った「断られ方」は、

    「すでに2つ査読を抱えているので。。。」

    みたいなパターンでした。

    たとえその人が査読者としてふさわしくても、そんな人に頼んだら、きっと締切を守ってはもらえないでしょう。

    そう思うと頼む側も諦めがつきそうです。

    そこで

    「じゃあ適切な人を紹介してください」

    と食い下がる依頼者もいると思うのですが、仕事を振った先に恨まれるかも知れないので、気軽に紹介していいかどうか悩みますね。。

    もちろん本当に専門外の内容で引き受けられないときにはそう言えばいいのですが、頼む側も

    「この人なら専門外とは言われないだろう」

    という判断をしていると思うので、受ける側も「読めるか読めないか微妙」という場合があると思うのです。

    でも、そこから先は「頼む側の責任」だと開き直って、受ける側としては

    「責任は負うけど100%の責任ではない」

    と開き直れると助かります。

    そして、特定の査読者に100%の責任を押しつけない、そういう論文誌編集委員会であって欲しい、と思ったりしています。

    第2章 なぜ査読を引き受けるのか

    私たちはなぜ査読を引き受けるのでしょうか。

    まず、依頼された編集委員の方に協力したい、あるいはその人を困らせたくない、という理由があり得ます。

    だからと言ってできないことは無理にやるべきではありません。

    いずれにせよ、編集委員の方の意図を推測してみましょう。

    打診された内容は、依頼された自分のやっている仕事と似ていたり、分野が同じだったり、あるいは自分の既発表の論文が参考文献として挙げられていたり。。

    なるほど、だから自分が打診を受けたのか、ということが納得できるのが普通です。

    (私の経験では、ですが。。)

    仮に自分の研究テーマと同じ内容であったり、自分の研究が引用されていれば、査読者としての自分がやるべきことは、単に論文の善し悪しを判断したり論文を世に出すお手伝いをするだけではなく、自分の研究を妨害されていないか(笑)、を判断することも査読者の仕事にならざるを得ません。

    よくないことかも知れませんが、仕方ありませんね。。

    もちろん、議論は合理的に、論理的に行うべきで、感情的に他人の仕事を妨害してはいけません。

    他人の業績の多寡を左右することにつながるのですから。。

    さて、「自分の仕事を妨害されていないか」という言い方は乱暴だったかも知れませんが、具体的にはどういうことでしょうか?

    たとえば、自分がやろうとしている仕事を、その投稿論文が「実現した」「解明した」と主張していたらどうしましょう?

    題名を読んで「やられた」と悔しく思うかも知れません。

    しかし、悔しいからという理由で感情的に妨害するのは研究者にふさわしい行為ではありません。

    負けは負け、素直に認めるべきです。

    ですが、もしその投稿論文を読んでみて、不備があったらどうでしょう?

    あるいは、「できた」と主張されていることの一部しか実際には実現されていなかったらどうでしょう?

    指摘してあげることが自分の利益でもあり、読者のためでもあり、著者のためでもあるはずです。

    あるいは、投稿論文の中で引用されている自分の論文が誤解されて説明されている、といった場合には、それを指摘してあげるのも、みんなの利益になる行為といえるでしょう。

    (言い換えれば、採録された論文を読んだ第三者に「誰だ、こんなひどい論文を通した奴は」と言われて、あなたは責任を取れますか? ということかも知れません)

    こんな風に「自分の取り分をきちんと守る」ということが、査読を依頼された自分の務めだと考えてはどうかと思います。

    さて、ここまで書いてきて思うのは、「そういうことは研究会や全国大会とか国際会議とかでやっとけばいいのでは?」という疑問です。

    まったくそうだと思います。

    著者が論文を投稿する前に口頭発表をするのは、フルペーパーを投稿したときにどんなダメ出しを食らうかを予見するためであるべきだし、将来低レベルの査読の仕事が来るのを未然に防ぐために、研究者はもっと講演に対して質疑をするべきだと思うのです。

    次に、もう一つ査読を引き受ける理由があるとしたら、自分の勉強のため、情報収集のためです。

    自分が研究会で聞きそびれたトピックについてきちんと理解する(理解できる話であれば、ですが)チャンスだし、得た情報は守秘義務があるとはいえ、その投稿論文に引用されている論文を「お、こんな文献もあるのか」と読んでみるチャンスであったりします。

    あるいは、与えられた文章を批判的に読んでみることは、自分の文章力や論理的思考のトレーニングになります。

    これに関連して「査読術に役立つ」と思うのは次のような文献でしょうか。。

    反論の技術―その意義と訓練方法 (オピニオン叢書)
    香西 秀信
    明治図書出版
    売り上げランキング: 5540
    おすすめ度の平均: 4.5

    4 この部分以外は納得
    5 これは単なる「読みもの」ではない。
    5 「意見」ならば必ず反論されうる、ということがわかった
    4 他人の意見をあっさりと受け入れるな、のメッセージ
    5 毒の効いた良書です

    「社会調査」のウソ―リサーチ・リテラシーのすすめ (文春新書)
    谷岡 一郎
    文藝春秋
    売り上げランキング: 7259
    おすすめ度の平均: 4.5

    5 他の文献でも利用されている
    2 悪い本ではないけれど
    5 新聞・雑誌の正しい読み方が学べる良書
    3 面白い本だが
    5 攻撃的啓蒙書

    以上、この章では、どちらかといえば「不純な動機」に絞って査読の意義を述べてきました。

    もちろん、学会の論文誌にはそれぞれ査読の目的や方法を定めた文章があるはずです。

    あくまでも各学会の規定する目的や方法こそが「正式」のものです。

    きちんと目を通して従ったうえで、公平・公正に行わなくてはいけません。

    第3章 結論を決めて報告書を書く

    ありがちな査読報告書の書式は「採録」「不採録」「条件付き(照会後)採録」などの選択肢を選んで、「新規性」「信頼性」「有用性」などを評価して、それから具体的なコメントを書く、というものであったりします。

    真面目に書こうと思うと、まずこの論文がなぜ・どのように優れているのか、あるいはどんな問題点があるか、といったことを列挙して、総合的に「採録か否か」を判断すると思うのです。

    でも、そうやって書いていると、下手な論文と同じで、何を言いたいのかよくわからない報告書になってしまいそうです。

    最近は私は、論文をざっと読んで、時間が許すかぎり細かく読んで、気になったところには書き込んだりメモをしたりして、しばらく考えて「じゃあ不採録ということで理由を書くぞ」てな感じで報告書を書くようにしています。

    やり方は人それぞれだと思うのですが、結論ありきで書き始めると、報告者である自分の立場がはっきりします。

    例えば「致命的な問題点はこれとこれの2つです」「他のコメントは参考意見であり、不採録に値する致命的な指摘ではありません」のように書けば、査読報告を受け取った人が「この報告書の内容は妥当だろうか」「総合的にどう判定したらいいだろうか」と考えることが容易になるのではないかと思います。

    また、不採録なら不採録に値する理由をきちんと書こうと努力してみて、後で読み返してみて、「やっぱりこんな理由で不採録だと言ってしまうのは言いすぎだなあ」と反省して、そのコメントを「条件付き採録」の「採録の条件」、あるいは「単なる参考意見」に格下げする、といったこともあると思うのです。

    私は報告書は「です・ます」体で書くようにしています。

    お互いに立場が分からない人間同士のやりとりですから、不快感を与えることなく、たとえネガティブな内容であっても冷静かつ対等にやりとりをしたいからです。そして、冷泉彰彦氏は下記の書籍で「だ、である」は権力や親疎外感をむき出しにしやすく、「です・ます」は(敬語の一種と考えるよりも)日本語の会話の標準スタイルとすべき対等なコミュニケーションのスタイルである、と説いています。

    「関係の空気」 「場の空気」 (講談社現代新書)
    冷泉 彰彦
    講談社
    売り上げランキング: 91425
    おすすめ度の平均: 3.5

    5 日本語を切り口にした鋭いビジネス論
    2 山本七平先生が泣くのではないか
    3 現代日本におけるコミュニケーションのあり方に納得
    3 軽い読み物としては面白いが。
    5 その場の雰囲気、「空気」に頼らない。

    まず「この論文はXXXについて扱った論文で、大変意義のある研究です」など、論文の良いところをきちんと評価します(褒めるところがない場合は無理矢理にでも作ります)。

    採録と判断する際には、なぜ採録に値するかを著者に対してというよりもむしろ編集委員の方に客観的に伝わるように説明します。また、誤字脱字や体裁の不備などを指摘します。ただし、ちゃんとした論文誌なら、些細な誤字脱字は採録決定後の校正でチェックされるはずです。

    世の中には「めんどくさいから採録」という判定をする査読者がいるのかいないのか、真実は闇の中かも知れませんが、いいことではないですよね。。

    条件付き採録と判断する際には、「こういう風に修正しないと採録できない」という「条件」と、単なる「参考意見」を明確に区別できるように書きます。

    「条件付き採録」と「不採録」の判定基準は論文誌によって決まっていると思いますが、大幅に内容が変わってしまう要求になりそうだったら不採録にすべし、といった感じでしょうか。

    不採録と判断する際にもやはり「致命的な問題点」と単なる「参考意見」を区別して書きます。特に問題点は「照会後採録」に値しないくらい致命的な問題点であることを、著者に客観的に納得してもらえるように書きます。

    その他細かいことは各学会論文誌の査読要領に従います。

    おわりに

    以上、私の個人的意見を書き連ねてきました。

    同業の方々から忌憚のない御意見をお待ちしております。

    本当は論文誌ではなくシンポジウムや国際会議の査読はどうしたらいいのか、特に英語で査読報告書を書くときにはどうしたらいいのか、といった話題が残っていますが、また日を改めて書きたいと思います。

    査読の仕事がたまっているので(笑)本日はこれで失礼します。

  • ワザオギ落語会

    第3回ワザオギ落語会に行ってきました。

    場所は国立演芸場。チケットは前売りで完売とのことで、観客にまで

    大入り袋が出ました。最初「なんだろう?」と思いました。

    DVD販売が予告されている落語会ということで、

    第1回のときは「DVDをご覧の皆様」と舞台の上で話しかける方が

    いらっしゃったりしましたが、今回はそういう演出ではなく、

    古典落語で、できるだけ動きや仕草が楽しめるものを、

    出演者はみんなお選びになったのだろう、という、そういう演目ばかりでした。

    そういえば新作落語の大御所ばかりだったにも関わらず、

    みなさん古典落語を個性たっぷりに演じておられました。

    3回目にして、今度こそDVDを買わなくてはと思いました。。

    くわしくはこちらを:

    http://www.wazaogi.jp/