« 2005年02月28日 | メイン | 2005年03月02日 »
2005年03月01日
DB Magazine 2005 APR
ほとんど読んだ事の無い DB Magazine を買った。
月間2億ページビューをMySQLで支える 「はてな」のDB運用の裏側すべて見せます
という特集に惹かれてしまったのです。ご存知の通り、僕も MySQL を使ってますが、技術的には SELECT がわかりますが何か?くらい。なので、もっと上手に MySQL を運用したいのだけど、何から学べばいいのか良くわからなかった。
やっぱし、具体例がある方が理解しやすいってもんだ。
マスタとスレーブを分割した方がよさげ。んでもって、スレーブは、オンメモリで運用。マシンが2台あるので、両方をばらばらにマスタ的に運用するよりも、片方をマスタで運用した方が、お財布的にも優しそう(RAID とかね)。
レプリケーションについて調べないとな。
データベースサーバ (RAID)
・マスタデータベース
・クローラ関係
ウェブサーバ
・スレーブデータベース (オンメモリ)
・ウェブサーバ
こんな感じになるのかな。2台しかないしね。いずれにせよ、データベースサーバは、分けておかないと HDD が死んでしまったときに痛いことになる。
それにしても、全てのデータを MySQL で管理してるのはすごいなぁ。画像データも入れてるみたいだし。サービス運用の面や、データマイニングを考えると MySQL で全て管理する方が良いのかな。
DB Magazine 2005 APR は、はてなの記事だけでも、とても面白いのでぜひ。
【関連情報】
・DBMagazine 4月号にはてなのDB運用記事 (NDO::Weblog)
http://naoya.dyndns.org/~naoya/mt/archives/001607.html
02:57 | コメント (0) | トラックバック | Life
301 Moved Permanently
CEEK.JP NEWS でも、大手書籍通販会社 Amazon が採用している技術を採用することにした。
検索ロボットからアクセスがあった場合に URL の正規化を行います。アマゾンも、アソシエイトのリンクを正規化して統一化しています。これを真似したわけですな。
Google に CEEK.JP NEWS がどれだけ登録されているかは、以下のようにすれば簡単にわかる。
site:news.ceek.jp
見ていただけるとわかると思うが、インデックスされている URL の形式は、まちまちである。ということで、ルールを決めて URL を正規化しました。
どんな感じに正規化したかは、そのうち Google の結果に出てくると思いますので。
プログラムの一部分を。
print "Status: 301 Moved Permanently\n"; print "Location: http://news.ceek.jp/search.cgi\n\n"; exit;
こんな感じでリダイレクトしているんだけど、大丈夫かな。Google 以外は、ステータスコード 301 を正常に認識しないという噂も聞くんだけど。そもそも Yahoo! JAPAN に CEEK.JP NEWS の検索ページが、反映されてないんだけど。
動的生成を行っている場合は、クエリーを統一すれば、きれいに検索エンジンに反映されるんじゃないかな。クローキングになる可能性も否定できないけど。
02:27 | コメント (0) | トラックバック | Development
おめでとうございます
今日は、前学内広報担当者の誕生日でした。ということで、昨日(28日)の食事内容です。
昼は、夜に食べようと思っていたカップヌードルを食べる。もちろんカレー味。とはいっても、起きたのが午後4時なんだけれども。
夜は、外食しようかと思ったけど、自炊。米を炊いて、レトルトのハヤシライスをかけるだけという、とても便利なソリューションです。美味しいからいいや。
自宅 (昼)
カップヌードル
自宅 (夜)
ハヤシライス