« 今日は雨でひきこもり | メイン | 開発環境 »

2004年03月20日

データベーステーブルを分けました

CEEK.JP NEWS のデータベーステーブルを月ごとに分けました。
今までは、 Not Found であるかどうかの2つのテーブルで処理していたわけですが、「最新ニュースを一覧で」というコンセプトから見れば、時間を軸に表示する方がよいだろうということです。現在10万件以上の記事データを保有しています。
MySQL + Perl で処理しているのですが、5万件を越えたあたりで速度に厳しさが出てきました、、、なので、 Not Found と OK で分割したのですが、OK が7万件以上あるので、厳しさは変わらず。ということで、過去記事テーブルを月別に分けることにしました。なので、原則的に初期状態では、その月の記事しか検索できません。(CEEK.JPの上部に表示されているのも同様)
後は、どのタイミングで過去記事にするかです。月が替わってすぐに過去記事にしたら、検索対象が10件とかになってしまう、、、1日1000件以上の割合で記事が増えているので、10日目くらいに過去記事にしようかと思ってます。
つーか、Full Text Search で大容量をあるかえる方法はないだろうか。未踏の「圧縮方式高速全文検索エンジンの開発」に期待しているのだが、まだ成果が公開されていないようだし。僕が作るのは、多分無理でつ。データベースにはまったく詳しくない。

2004年03月20日 23:08 | Development

トラックバック

コメント