« PDFの目印の色を変えました | メイン | 中華と和食 »

2003年12月21日

計算機システム特別講義IB

本日、この科目の講義は2回目になります。「進化するインターネット」という題で、インターネットに関する多くの事柄を取り上げて紹介するような感じです。(講師はBIGLOBEサービス事業部の方)
んで、前回「http://www.ceek.jp/ は良い!」と10人くらいで書いたので、今回CEEK.JPを最後に取り上げてくれました。あんまし褒められずにションボリ。事前に連絡をいただけたら、CEEK.JP NEWSのアカウントを発行したのになぁ。ちなみに、CEEK.JP NEWS(ニュース検索システム)は統合型のメタサーチではなく、独自のクローラーを走らせているロボット形検索エンジンの一種です。
あと、この講義を聴いて、CEEK.JPに興味を持ち、聞きたいことがある方はお気軽にご連絡ください。
ちなみに、講師の方は、SoftEtherをご存知のようでした。

2003年12月21日 01:38 | University

トラックバック

コメント

講義中にパチパチやられると五月蝿いのですが。

投稿者 名無し : 2003年12月25日 04:50

検索エンジンのクローラーを作りたいが、
どこを探しても、参考になる書物がありません。
作った際に参考になった書物やプログラム等あれば、
ご教示願います。

宜しくお願いします。

投稿者 くろーらー : 2004年05月18日 11:43

僕も資料があればみたいですねぇ。ネットでは、クローリング技術についての資料はほどんど無いかと思います。
僕が参考にしたのは、
http://bach.istc.kobe-u.ac.jp/metcha/
だけど、大規模には向いてません。やっぱり、分散処理ができないと難しいのでは無いかと思う。
CEEK.JP NEWS は2つのプログラムでクローリングしています。1つは、サイト情報を元に記事URLと見出しをGETするもの。もう一つは、前者のプログラムでGETした、記事URLを巡回するプログラム。

投稿者 ceekz : 2004年05月20日 22:28