写真 青い空と雲と建物と木々の緑

nishimotzの日記

  • オープンソースと経済活動

    擬人化音声対話エージェントツールキット Galatea Toolkit は、広く人間と機械の音声対話の技術を開発・普及するべく、以下の特長を持つ技術として開発されました。

    • 人間の顔と表情を持ち、音声で対話するエージェントを作成できる
    • 顔、声、音声合成テキスト、認識文法、対話の流れなどがカスタマイズ可能
    • 構成要素(音声認識、音声合成、顔画像合成など)を別々に利用できる
    • オープンソース、無償で利用でき、商用利用も可能

    Galatea Project では2000年~2002年度に情報処理技術振興協会(IPA)の支援 (2000, 2001年度 独創的情報技術育成事業、2002年度 重点領域情報技術開発事業) を受け、財団法人京都高度技術研究所 (ASTEM) とIPAの契約の元に、主に大学の十数名の研究者が協力して開発を行ないました。この成果は2003年に「IPAライセンス版(galatea-linux-ipa および galatea4win-ipa)」としてリリースされました。現在は sourceforge.jp にプロジェクトのサイトを開設しています。

    西本個人も関連する技術情報を提供しています。

    2003年11月から2009年3月まで、情報処理学会 音声言語情報処理(SLP)研究会のもとで音声対話技術コンソーシアム(ISTC) が活動を行い、このツールキットの改良を行いつつ、技術講習会などを行いました。この期間の成果は「IPAライセンス版のアップデート」という形でのリリースを予定しています。

    この活動にずっと関わってきた私は「オープンソースプロジェクトであることの意味」を改めて考え直しているところです。

    すでに商用の音声合成エンジンが複数存在します。一方で、商用のエンジンに依存せず行いたい研究開発や標準化検討などの活動は重要です。

    例えば、スクリーンリーダや音声ブラウザなどのアクセシビリティ支援技術は、そもそも市場が小さく、ビジネスになりにくい、だから、こうした技術に使われる音声合成エンジンが無償であることに意味がある、という意見も頻繁に伺います。

    一方で、ビジネスになるかどうかは「やり方次第」であり、既存のビジネスを破壊することが一方的な正義であってはいけない、という立場も納得できます。

    私はオープンソースを「オープンプロセス=開発プロセスをオープン化した結果として生じる成果」と捉えています。オープンソースの発展は、「インターネットの速度感」に「ソフトウェア開発の速度感」が追いついてきた過程だと思います。その意味で、例えばCVSからGITへとオープンソフト開発のモデルが進化したことを好ましく思います。

    また、いわゆるフリーソフトであることを保証するライセンスとは、利用、配付、改変に関する「コミュニケーションのコスト」を不要にするシステムと捉えています。

    オープンソースソフトウェアでビジネスを行っていただくことは有意義だと私は考えています。既存の市場の構造にとらわれない枠組みを実現することは、新しいビジネスモデルの創出につながると期待できるからです。

    例えば Galatea Toolkit は経済産業省の外郭団体であるIPAから支援を受けており、これは「いずれ経済活動に貢献せよ」という趣旨の支援であったと私は考えています。実際「IPAライセンス版」のツールキットは成果がどのように製品化されているか完全には把握できていませんが、「どこどこのなになには GalateaTalk の合成音声らしい」という話はときどき研究者同士で語られています。

    一方で、プロジェクトの目標が野心的であればあるほど、研究開発には時間がかかります。Galatea Toolkit が本来の目標を達成するためには、技術や世の中の動向を正しく把握しながら、「売り物になる技術」に向かって進化させていく必要があります。企業に取り組んでいただくにはリスクがあります。研究者が本務の合間に取り組む活動としても限界があります。

    この6年間はコンソーシアムという形で活動をさせていただきました。会員の方から多くの御意見を伺うことができ、有意義ではありました。しかし、一方で、コンソーシアムの外部の方から具体的な御要望や依頼をうけたときに、個別に対応させていたくための組織としては若干不適切のようにも感じました。

    例えば、コンソーシアムが開発に関わり、会員向けに配付しているソフトウェアがあるとします。そしてこの技術をベースにある企業が独自に仕様を作って製品を開発したいとします。ベース技術の提供を受けるために会費を払っていただいてコンソーシアムの会員になっていただいたあとで、さらに「カスタマイズについて相談したい」という場合には「ベース技術に詳しい研究者・研究機関と個別に相談」ということになります。そのようなサービスを提供するにあたっては、守秘義務契約なども必要です。新たに技術者を探して作業を依頼する場合もあるでしょう。

    今後の Galatea Toolkit について、私の立場で、こういったサポートを提供する一つの選択肢は、共同研究だと考えています。不自然な枠組みという気もしますが、自分の就業規定と「利益相反」という問題をクリアするにはやむを得ません。

    具体的には、企業の方に、私の所属(東京大学)と共同研究契約を結んでいただき、私から情報提供や技術支援などのサービスを提供することが可能です。必要に応じて、さらに適切なパートナーをご紹介することもありえます。予算については(下限の規定がないので)柔軟に対応できると思います。ただし成果の帰属や公開等について、大学の基本方針に従った契約を結んでいただく必要があります。

    もう一つの可能性として、これまで述べてきた趣旨の活動を遂行する非営利組織の設立が考えられます。具体的には、以下のような考え方の組織です:

    • オープンソースソフトウェア開発に貢献する
    • 用途をなるべく限定せず、多様な応用に対応する技術を育成する
    • オープンソースソフトウェア技術によりビジネスや雇用を創出する
    • 技術の非専門家、ユーザの視点でサポートを行う
    • 秘密保持、知的財産権管理などを適切に行う
    • 商用ソフトウェアに関する既存のビジネスを破壊しない
    • 大学等の研究者にとって望ましい協力関係を構築する
    • 既存のプロジェクトとの活動の重複を避ける
    • 運営や活動方針などの情報を積極的に公開する
    • 自発的に(楽しく)活動する

    もう少し活動の内容を具体的に挙げてみます:

    • ソフトウェアの配付、カスタマイズ用データの提供
    • サポート、カスタマイズ、講習会などの業務
    • 技術情報の提供・執筆
    • 事業者、研究者、開発者などの仲介

    後者は最近読んだ藤井孝一さんの「週末起業」 (ちくま新書)からヒントを得ました。大学に所属して研究と教育以外のことをするのは「週末起業」に似ているように思えて、興味深く感じます。

    「ビジネスの手法で社会に貢献する方法」については、最近考え始めたばかりです。いろいろな立場の方の御意見を伺おうと思っています。既存の組織を活用させていただく場合にも、上記の考察を踏まえて検討をするつもりです。

    自分の関わってきた技術を形にすることについて、これからもいろいろ考えたいと思います。

  • HCGシンポジウム発表締切延長

    「2009年度ヒューマンコミュニケーショングループ(HCG)シンポジウム」(12/10~12開催)の発表申込締切を 9/17(木) に延期いたしました。皆様奮って発表申込み頂けますようお願い申し上げます。

    招待講演としてクリプトン・フューチャー・メディア株式会社 伊藤 博之 社長による御講演「初音ミク as an interface」および、ヒューマンコミュニケーショングループの設立に携わられた元・東京大学の 原島 博 先生による御講演を予定しております。

  • HCGシンポジウムとWEIMS2009

    12月に開催される研究集会 WEIMS2009 の案内が届きました。科学・数学文書へのアクセシビリティがテーマです。

    12月10日~12日のHCGシンポジウム http://www.ieice.org/hcg/sympo2009/ と日程が1日かぶってしまいます。福岡と北海道なので、掛け持ちをされる方は移動も大変と思われます。

    今回のHCGシンポジウムはもともと3日目を(発表件数が多かった場合の)予備日としており、できるだけ12月10日および11日に発表を集めるようにプログラム編成を行う予定です。また、公式にはアナウンスしていませんが、発表日に関する希望があれば、可能な限り考慮する予定です。

    両方のイベントに参加をお考えの方はお気軽に御相談いただければ幸いです。

    なお、関連分野のイベントとの日程調整について、WIT研究会では関連イベント日程のページ http://www.ieice.org/~wit/about/link.html を作成しつつ配慮を行うように努力をしております。ぜひWIT幹事団宛に関連イベントの情報をお知らせください。