« 2005年02月28日 | メイン | 2005年03月02日 »

2005年03月01日

DB Magazine 2005 APR

ほとんど読んだ事の無い DB Magazine を買った。

月間2億ページビューをMySQLで支える 「はてな」のDB運用の裏側すべて見せます

という特集に惹かれてしまったのです。ご存知の通り、僕も MySQL を使ってますが、技術的には SELECT がわかりますが何か?くらい。なので、もっと上手に MySQL を運用したいのだけど、何から学べばいいのか良くわからなかった。

やっぱし、具体例がある方が理解しやすいってもんだ。

マスタとスレーブを分割した方がよさげ。んでもって、スレーブは、オンメモリで運用。マシンが2台あるので、両方をばらばらにマスタ的に運用するよりも、片方をマスタで運用した方が、お財布的にも優しそう(RAID とかね)。

レプリケーションについて調べないとな。

データベースサーバ (RAID)
 ・マスタデータベース
 ・クローラ関係

ウェブサーバ
 ・スレーブデータベース (オンメモリ)
 ・ウェブサーバ

こんな感じになるのかな。2台しかないしね。いずれにせよ、データベースサーバは、分けておかないと HDD が死んでしまったときに痛いことになる。

それにしても、全てのデータを MySQL で管理してるのはすごいなぁ。画像データも入れてるみたいだし。サービス運用の面や、データマイニングを考えると MySQL で全て管理する方が良いのかな。

DB Magazine 2005 APR は、はてなの記事だけでも、とても面白いのでぜひ。

【関連情報】
・DBMagazine 4月号にはてなのDB運用記事 (NDO::Weblog)
 http://naoya.dyndns.org/~naoya/mt/archives/001607.html

02:57 | コメント (0) | トラックバック | Life

301 Moved Permanently

CEEK.JP NEWS でも、大手書籍通販会社 Amazon が採用している技術を採用することにした。

検索ロボットからアクセスがあった場合に URL の正規化を行います。アマゾンも、アソシエイトのリンクを正規化して統一化しています。これを真似したわけですな。

Google に CEEK.JP NEWS がどれだけ登録されているかは、以下のようにすれば簡単にわかる。

site:news.ceek.jp

見ていただけるとわかると思うが、インデックスされている URL の形式は、まちまちである。ということで、ルールを決めて URL を正規化しました。

どんな感じに正規化したかは、そのうち Google の結果に出てくると思いますので。

プログラムの一部分を。

print "Status: 301 Moved Permanently\n";
print "Location: http://news.ceek.jp/search.cgi\n\n";
exit;

こんな感じでリダイレクトしているんだけど、大丈夫かな。Google 以外は、ステータスコード 301 を正常に認識しないという噂も聞くんだけど。そもそも Yahoo! JAPAN に CEEK.JP NEWS の検索ページが、反映されてないんだけど。

動的生成を行っている場合は、クエリーを統一すれば、きれいに検索エンジンに反映されるんじゃないかな。クローキングになる可能性も否定できないけど。

02:27 | コメント (0) | トラックバック | Development

おめでとうございます

今日は、前学内広報担当者の誕生日でした。ということで、昨日(28日)の食事内容です。
昼は、夜に食べようと思っていたカップヌードルを食べる。もちろんカレー味。とはいっても、起きたのが午後4時なんだけれども。
夜は、外食しようかと思ったけど、自炊。米を炊いて、レトルトのハヤシライスをかけるだけという、とても便利なソリューションです。美味しいからいいや。

自宅 (昼)
 カップヌードル
自宅 (夜)
 ハヤシライス

02:23 | コメント (0) | トラックバック | Meal