« 不健康食生活に格下げ | メイン | 寿司食った »

2004年11月15日

いつも 404 Not Found を返す

ひそかに RSS Reader 用の Robot を作ってるのですが、一部サーバで常に 404 Not Found を返してくる。でも、ブラウザで見ると見れるんだよね。

その筆頭が Seesaa BLOG なわけですが、原因が分かる人いますか?

ちょっと困った。

※追記 (11月16日 0:47)
原因が分かりました。リクエストヘッダがおかしかったです。

print $sock "Host: $s{$href}\r\n";

print $sock "Host: $s{$href}:80\r\n";

前者が正解。後者が間違い。ポート番号を与えちゃダメなのか。

【関連情報】
・Seesaa ブログ(blog)
 http://blog.seesaa.jp/

2004年11月15日 06:40 | Development

トラックバック

コメント

UA偽装してもダメですか?

投稿者 うーん : 2004年11月15日 08:52

>> うーん さん
ダメっぽいです。色々な条件で試してみるかなぁ。

投稿者 ceekz : 2004年11月15日 11:30

wgetでいくつかのseesaa Blogのindex.rdfを落としてみましたが、大丈夫みたいです。
私のBlogSurfではそういうことは見られませんでしたよ。

投稿者 かぜぶろ : 2004年11月15日 22:09

>> かぜぶろ さん
なんと。原因が分かりました。
Socket の中で Host にポート番号(:80 な感じ)を与えていたのが原因。書いちゃダメだったのかorz

投稿者 ceekz : 2004年11月16日 00:45

いまさらですが、

> 書いちゃダメだったのかorz

そんなことはないです。:80 を受け付けられないなら
サーバ側のバグでしょう。

http://www.studyinghttp.net/rfc_ja/rfc2616.ja.xhtml.gz#sec14.23

投稿者 名無し : 2005年02月20日 00:09

>> 名無しさん
古いエントーリーへのコメントありがとうございます。
読んでみました。サーバ側のバグですかなぁ。困ったもんです。

投稿者 ceekz : 2005年02月20日 21:10