音音研

次回の音音研を以下の内容で予定しております。ぜひお誘い合わせの上お越しください。

  • 2008年10月20日(月曜日)18:40-
  • 場所:東大本郷 工学部6号館140号室
    • (東京大学 大学院 情報理工学系研究科 システム第一研究室)

大竹孝司先生(E-Listening Lab)の御講演を予定しています。

  • テーマ:「語彙の活性化のメカニズムと言語遊戯(空耳アワー)」
  • 概要:音声言語の意味理解は音声の中から語彙を認識することによって実現されるが、この仕組みをモデル化して解き明かすことが語彙認識の研究の目標である。本発表では1言語話者の心的辞書がL2の音声入力によって活性化する可能性を検証する。分析対象の言語遊戯は「空耳アワー」と呼ばれるものである。分析から明らかになったことは1言語使用者であっても無意味な心的辞書が活性化される可能性が示唆された点である。

ここ数年、私が了解度・話速・心的辞書に関する研究を進めていくうちに、日本語のモーラ知覚などに興味を持ち、大竹先生の御研究を知りました。今回は多くの方に馴染みやすい内容を考慮して、上記の話題を提供していただくのですが、私は自分の問題意識をぶつけさせてもらい、議論を盛り上げたいと思います。

Festival in Ubuntu

英語の音声合成フリーソフトの現状について引き続き調査中です。

Ubuntu Linux 8.04.1 で espeak が簡単に使えることはわかったのですが、Festival も簡単に使えました。

$ sudo apt-get install festival festvox-don

$ festival

Festival Speech Synthesis System 1.96:beta July 2004

Copyright (C) University of Edinburgh, 1996-2004. All rights reserved.

For details type `(festival_warranty)’

festival> (SayText “Hello”)

#<Utterance 0xb6974f88>

$ echo “(SayText \”Hello.\”)” | festival

synaptic で見たかぎりでは festvox の English Female パッケージはないようです。残念。

Galatea Dialog Studio の開発状況

いろいろなマシンで作業する必要がでてきたので、懸案だった sourceforge.jp の CVS リポジトリへの移行をしたいと思い、Eclipse で行っている作業ファイル一式を下記にインポートしました。Galatea Dialog Studio 2.2.3 に向けた作業中です。

暫定的ですが英語の音声認識と音声合成への対応を行いました。システムの入口である galatea スクリプトをオプション付きで実行すると Julius を英語音響モデルで起動し、GalateaTalk の代わりに espeak を使用します。英語音響モデルを使用するためには ISTC で配布されている english-asr-kit の音響モデルが必要です。

$ galatea --lang en tests/vxml/en/english.vxml

みたいになります。いずれは複数の言語の認識と合成が一つの対話アプリケーションの中で行えることが望ましいと思います。

ツールキットの開発と並行して対話デモを Ruby on Rails を使って開発しています。

また、ドキュメントの内容を更新しつつ、英語と日本語の併記化を進めています。

Remastering Knoppix 5.3.1 ja

Knoppix 版 Galatea Toolkit の開発にむけて調査を進めています。下記の資料が大変参考になりました。

この資料にしたがって、USB接続HDDを ext2 でフォーマットして作業領域にしています。

しかし 5.3.1 ではうまくいかない要因があったので、単に CD-ROM の / に空のファイルを一つ作るだけ、という控えめなカスタマイズで練習をすることにして、何度か試行錯誤をした結果、fromhd でのイメージの検証、iso ファイルを CD-R に書き込んでのブートの両方に成功しました。

[reboot from KNX-5.3.1-ja CD-ROM]
$ sudo -s
# mount /dev/sda1 /media/sda1
# mkdir /media/sda1/knx
# mkdir -p /media/sda1/knx/master/KNOPPIX
# mkdir -p /media/sda1/knx/source/KNOPPIX
# cp -Rp /KNOPPIX/* /media/sda1/knx/source/KNOPPIX
# cd /cdrom && find . -size -10000k -type f -exec
cp -p --parents '{}' /media/sda1/knx/master/ \;
[customize]
# touch /media/sda1/knx/source/KNOPPIX/nishimotz
# cp -p /cdrom/KNOPPIX/modules/*.*
/media/sda1/knx/master/KNOPPIX/KNOPPIX/modules
# mkisofs -R -U -hide-rr-moved -cache-inodes -no-bak
-pad /media/sda1/knx/source/KNOPPIX |
nice -5 /usr/bin/create_compressed_fs -b - 65536
> /media/sda1/knx/master/KNOPPIX/KNOPPIX
# mkdir /media/sda1/KNOPPIX
# cd /media/sda1/KNOPPIX/
# ln -s ../knx/master/KNOPPIX/KNOPPIX .
# ln -s ../knx/master/KNOPPIX/modules .
[reboot from KNX-5.3.1-ja CD-ROM]
[test with "fromhd" mode]
boot: knoppix usb2 fromhd=/dev/sda1
$ ls /nishimotz
[reboot from KNX-5.3.1-ja CD-ROM]
$ sudo -s
# mount /dev/sda1 /media/sda1
# cd /media/sda1/knx/master
# find -type f .... > KNOPPIX/md5sums
# mkisofs ....
# ls -l /media/sda1/knx/knoppix.iso

References: