[back to the index page]


WWW上のテキストデータの収集を支援する大容量公開キャッシュサーバの設計と実装

黒田洋介、村岡洋一

早稲田大学理工学部

{ykuroda, muraoka}@muraoka.info.waseda.ac.jp


概要

WWWはおそらく世界で最も巨大な自然言語テキストによるデータベースであり、 このデータベース全体を処理の対象とすることで 検索エンジン作成や辞書作成などさまざまな利用法が可能になる。 しかしこのデータベース全体を取得する作業はネットワークとWWWサーバに 多量のトラフィックと大量の負荷を発生させるため問題となっている。 本研究ではこの問題を解決するための大容量公開キャッシュサーバを開発した。

[PS file]