文字コードのメモ
Posted on Mon 03 December 2007 in Windows
ASCII文字以外の知識があいまいなのでメモ
ASCII 0x00-0x7fの値で表される文字コード
マルチバイト文字 1ビットと2ビットが混じっている形式
Shift-JIS
EUC-JP
ISO-2022-JP
UTF-8
一バイト目が0x80-0xffで始まる。
int isleadbyte(int c) マルチバイトの一文字目を判定する。
これが0以外の値を返すとき後ろの値も一緒に扱うとうまくいくようだ。
ワイド文字 すべて2ビット(Windowsでは)の形式 wchar_tであらわす。
UTF-16
TCHAR 状況にあわせてマルチバイト・ワイドに切り替わってくれる型