次世代コンピューティングインフラストラクチャに関する合同ワークショップ(早稲田大学)

これは,実は中島達夫教授と山名早人教授の両研究室の成果発表会で,基本的に研究室の全員が英語でポスターを作り,自分の研究を紹介する.

最初は両教授の講演.山名教授の講演では,現在のWebページ数をLawrenceの"Accessibility of information on the web"で提案されている手法を用いて推定すると396億ページらしく,さらにDeep Webのサイズは,その400〜550倍らしい.そのうち,サーチエンジンが数百億ページを索引付けしていることを挙げ,最近のYahoo!Googleの収集ページ数に関する争いを紹介していた.最終的に,この膨大な情報がある状況下で効率的な情報利用をするためには,新しい情報探索手法を生み出す必要があると強調していた.

山名研は,数年前からおこなってきた分散ロボットプロジェクトにより,すでに百億ページ以上を収集しているのだが,最近ではその統計的解析やWebマイニング,応用技術の開発をはじめているようだ.まだ未発表のものも多いので具体的な内容は書かないが,そのうち研究会などで発表されるであろう.

感心したのは,山名教授の学生のサポートがうまいこと.例えば,言語検出モジュールを企業から購入したり,統計データの分析に産総研のグリッドとGfarmを使ったりしており,学生では容易に手を出せないような部分を支援してあげている.実世界の膨大なデータを相手にするのだから,うまくサポートしないと,肝心な部分以外でつまずいてしまうことが多いので,これは非常に重要なのだ.

なお,山名教授とは,他にもいろいろ話をする機会があったのだが,最近は情報検索分野の学生は引っ張りだこらしい…ただし,やはりちゃんと技術を身につけた修士や博士の学生を要求してくるそうだが.また,GoogleYahoo! Japan,MSNと会社が違えば,欲しい人材が違うようで,GooglePh.Dが中心(でも修士でも採用可).,Yahoo! Japan修士以上,そしてMSNは特に新卒募集はしてこないらしいが,人材紹介会社などを利用して中途採用を行っているようである.少なくとも大量のデータを扱うことになるWeb分野とユビキタス分野では,情報検索やデータマイニングなどの技術が鍵であり,それはまだまだ研究的側面を持つということであろう.工学部学生は,情報検索研究を目指せば,世界の一流会社に就職できる???(笑…でも結局は本人の能力と実績次第なんですけどね)

最後に,国立情報学研究所佐藤一郎助教授にも久しぶりにお会いした(日記を毎日熟読しているので,一方的によく知っている気になっているのだが(苦笑))が,あの過酷なスケジュールの中,こういう小さなワークショップまでちゃんと来て,他大学の研究をチェックしているとは,その行動力は賞賛に値する.まさに,研究者の鏡である.