2009年11月13日金曜日

[文字] 漢数字のソート

漢数字は思い通りにソートできない。
my @chars = qw/一 二 三 四/;
print join(', ', sort @chars); # 一, 三, 二, 四
文字コード順が次のようになっているので、
正しく並べたい場合は自前でソートしないとダメ。
字 区 点 JIS  SJIS EUC  UTF-8  UTF-16
一 16 76 306C 88EA B0EC E4B880 4E00
二 38 83 4673 93F1 C6F3 E4BA8C 4E8C
三 27 16 3B30 8E4F BBB0 E4B889 4E09
四 27 45 3B4D 8E6C BBCD E59B9B 56DB

0 件のコメント: