Tuesday 29 May 2007

Unicode



なんか「Unicode なんてボロボロの規格は使えません」とか言っている人をfjで見掛けましたが... もはや、事実上の標準になっている規格に唾はいてもなぁ。

ボロボロな理由の一つは、JIS X 0208 を全部含んでいるからなので、ある意味でどうしようもないです。

もう一つの「アルファベットには国識別があるのに、CJKには国識別がない」ってのは、僕は「諦める」のが簡単だと思う。ja_UTF-8.jp みたいな手もあるけどね。一つの文章内で混在させるのは面倒だが...

前の、\と¥の問題とかは、JIS X 0208 でもある問題なので、Unicode のせいじゃないし。

つうか、Unicode だめっていう人って、ちょっと頭悪い気がする。規格ってのは、妥協の産物なので完全なんてあり得ない。完成度としては、ISO-2022-JP だって同じくらいだめだめ。でも、UTF-8 で、文字の先頭を見付けやすくなったのはうれしいはず。Shift JIS あるいは、ISO-2022-JP では、それは、非常に困難な問題なので。

自分的には、ほとんど Unicode に移行してしまったので、nkf なんちゃらする機会は、ほんどなくなったし。

携帯の EasyWeb の「Shift JISしか受け付けません」という大馬鹿さえなければ、WWWもUTF-8 base にしていたと思う。Docomo の方は対応しているのにね。

No comments: