« Unicodeエンコード関連 | トップページ | 05月30日のココロ日記(BlogPet) »

2008年5月29日 (木)

Unicode関連 その2

実はその1だけで解決していない

既存のプログラムをどう変えていくかで悩み中

Perlで文字列をHTML数値文字参照に変換
Perl で文字列を数字文字参照に変換する方法


とりあえず↓のような感じにしようかなと

#!/usr/bin/perl

use Encode;
#use utf8;

$str="~";
$str=decode('utf8',$str);


$str2="〜";
$str=~ tr/[\x{ff5e}\x{2225}\x{ff0d}\x{ffe0}\x{ffe1}\x{ffe2}]/[\x{301c}\x{2016}\x{2212}\x{00a2}\x{00a3}\x{00ac}]/;


print utf8::is_utf8($str) ? 'flagged' : 'no flag';
print "\n";

if(utf8::is_utf8($str)){
$str=encode('utf8',$str);

}

print "$str:",str2byte($str), "\n";
print "$str2:",str2byte($str2), "\n";


sub str2byte
{
my $str = shift || return(undef);
my $fmt = shift || '%X';

$str =~ s/(.)/sprintf($fmt, ord($1))/eg;

return($str);
}


|

« Unicodeエンコード関連 | トップページ | 05月30日のココロ日記(BlogPet) »

プログラム」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: Unicode関連 その2:

« Unicodeエンコード関連 | トップページ | 05月30日のココロ日記(BlogPet) »