文字コードのメモ

Posted on Mon 03 December 2007 in Windows

ASCII文字以外の知識があいまいなのでメモ

ASCII 0x00-0x7fの値で表される文字コード

マルチバイト文字 1ビットと2ビットが混じっている形式
Shift-JIS
EUC-JP
ISO-2022-JP
UTF-8
一バイト目が0x80-0xffで始まる。
int isleadbyte(int c) マルチバイトの一文字目を判定する。
これが0以外の値を返すとき後ろの値も一緒に扱うとうまくいくようだ。

ワイド文字 すべて2ビット(Windowsでは)の形式 wchar_tであらわす。
UTF-16

TCHAR 状況にあわせてマルチバイト・ワイドに切り替わってくれる型