« 不健康食生活に格下げ | メイン | 寿司食った »
2004年11月15日
いつも 404 Not Found を返す
ひそかに RSS Reader 用の Robot を作ってるのですが、一部サーバで常に 404 Not Found を返してくる。でも、ブラウザで見ると見れるんだよね。
その筆頭が Seesaa BLOG なわけですが、原因が分かる人いますか?
ちょっと困った。
※追記 (11月16日 0:47)
原因が分かりました。リクエストヘッダがおかしかったです。
print $sock "Host: $s{$href}\r\n";
print $sock "Host: $s{$href}:80\r\n";
前者が正解。後者が間違い。ポート番号を与えちゃダメなのか。
【関連情報】
・Seesaa ブログ(blog)
http://blog.seesaa.jp/
2004年11月15日 06:40 | Development
トラックバック
コメント
UA偽装してもダメですか?
投稿者 うーん : 2004年11月15日 08:52
>> うーん さん
ダメっぽいです。色々な条件で試してみるかなぁ。
投稿者 ceekz : 2004年11月15日 11:30
wgetでいくつかのseesaa Blogのindex.rdfを落としてみましたが、大丈夫みたいです。
私のBlogSurfではそういうことは見られませんでしたよ。
投稿者 かぜぶろ : 2004年11月15日 22:09
>> かぜぶろ さん
なんと。原因が分かりました。
Socket の中で Host にポート番号(:80 な感じ)を与えていたのが原因。書いちゃダメだったのかorz
投稿者 ceekz : 2004年11月16日 00:45
いまさらですが、
> 書いちゃダメだったのかorz
そんなことはないです。:80 を受け付けられないなら
サーバ側のバグでしょう。
http://www.studyinghttp.net/rfc_ja/rfc2616.ja.xhtml.gz#sec14.23
投稿者 名無し : 2005年02月20日 00:09
>> 名無しさん
古いエントーリーへのコメントありがとうございます。
読んでみました。サーバ側のバグですかなぁ。困ったもんです。
投稿者 ceekz : 2005年02月20日 21:10