« 記事データ死にました(T_T) | メイン | 記念すべき100エントリー »
2004年01月12日
セグメンテーション違反の原因
jcode.pl, Jcode, NKF の開発者の方ごめんなさい。原因は、そこじゃありませんでした。
まず、文字コード周りの処理は以下のようになってます。
HTML取得 → 改行除去 → 本文摘出 → 文字コードをEUC → ASCII, EUC以外を除去 → タグなどを除去
で、私は「文字コードをEUCに統一」でエラーがでてると思ってたんですが、実際は「ASCII, EUC以外を除去」でエラーが出てました。でも、なぜセグメンテーション違反になるのかがわからん。とりあえず明日にでも、言語マスター(JAVA王)の某M先輩に助言をいただくことにする。今は、暫定的に、エラーの出る配信元ではその処理を行わないようにした。
【関連記事】
・セグメンテーション違反 (2004年01月11日)
2004年01月12日 15:06 | Development