UnicodeからSJISへの変換
2005年8月15日SJISは、JISX0201+JISX0208+JISX0212で構成されている。Unicode-1.1(USC-2)からこれらに対応する文字コードのテーブルを作っておき、変換に用いる。
http://www.asahi-net.or.jp/~hc3j-tkg/unicode
順序としては、Unicode->JISXxxxx->SJISという変換過程を取る。
JISxxxx->SJISの変換過程は下記URLを参照
http://www.debian.or.jp/~kubota/unicode-symbols-map2.html
Unicode-1.1は2byte固定長であるため、グループとプレーンはBMP (Basic Multilingual Plane、基本多言語面) 固定となって省かれているため、プログラムの際は扱いやすい。
この方法には問題があって、MicrosoftはSJIS+Microsft固有文字セットを用いたCP932(かなり狭義ではあるが)を利用しているため、一部文字列が上のマップでは対応しきれないという問題がある。
ただ、固有文字列を使わないという制限突きで利用するなら大した問題ではないので、上の構造で組んでもいいと思う。
http://www.asahi-net.or.jp/~hc3j-tkg/unicode
順序としては、Unicode->JISXxxxx->SJISという変換過程を取る。
JISxxxx->SJISの変換過程は下記URLを参照
http://www.debian.or.jp/~kubota/unicode-symbols-map2.html
Unicode-1.1は2byte固定長であるため、グループとプレーンはBMP (Basic Multilingual Plane、基本多言語面) 固定となって省かれているため、プログラムの際は扱いやすい。
この方法には問題があって、MicrosoftはSJIS+Microsft固有文字セットを用いたCP932(かなり狭義ではあるが)を利用しているため、一部文字列が上のマップでは対応しきれないという問題がある。
ただ、固有文字列を使わないという制限突きで利用するなら大した問題ではないので、上の構造で組んでもいいと思う。
コメント