« 2005年05月19日 | メイン | 2005年05月21日 »

2005年05月20日

Encode と Unicode::Japanese (2)

Encode と Unicode::Japanese を過去に取り上げたのだけど、また調べてみた。というか、軽くベンチマークを取ってみた。

UTF-8 -> Shift_JIS -> EUC-JP -> UTF-8 -> ...
の変換を、1000回行ったときの time を取ってみました。結構適当なので、参考程度に。

Encode

real    0m0.352s
user    0m0.320s
sys     0m0.010s

Unicode::Japanese

real    0m1.189s
user    0m1.150s
sys     0m0.000s

結果から言うと Encode の方がいいのだけど、僕は、一部で Unicode::Japanese を使うことにした。

UTF-8 -> EUC-JP の変換が、標準モジュールである Encode を使うと、うまくできない。「〜」が変換できずに ? に置き換わってしまうんだよね。逆を試しても変な感じ。というか UTF-8 が絡むとダメだと思う。

Unicode::Japanese を使うと UTF-8 -> EUC-JP がうまく変換できていい感じ。バックグラウンドで動くクローラーは、全部 Unicode::Japanese を使おうかな。バックグラウンドに限らず使う方が良いかもしれない。

文字コードの問題は、悩める。

【関連記事】
Encode と Unicode::Japanese (2005年01月08日)

01:12 | コメント (0) | トラックバック | Programming

米を久しぶりに炊いた

まぶたが重く。ということで、昨日(19日)の食事内容です。
昼は、明太子パスタを食べた。そろそろ飽きがくるかもしれないが、またソースを買ったので当分は食べ続けます。
夜は、刺身を買ってきた。ご飯を炊いて、味噌汁と一緒に食べる。とてもおなかがいっぱいになったのだけど、普通に寿司を買ってきた方が安いかもしれないことに気づいた。

自宅 (昼)
 明太子パスタ
自宅 (夜)
 ご飯, 刺身, 味噌汁

00:56 | コメント (0) | トラックバック | Meal