1.名稱:
GB 2312-1980(信息交換用漢字編碼字符集 基本集)
GBK-1995(漢字內碼擴展規范)
GB13000.1-1993(信息技術 通用多八位編碼字符集(UCS)第一部分:體系結構與基本多文種平面(idt ISO/IEC 10646.1-1993))
GB 18030-2000(信息交換用漢字編碼字符集 基本集的擴充)
2.關系:
GB 18030完全兼容GBK、GB2312,并且是后二者的替代標準,也將是今后唯一的字符集國家標準。
GB 18030和GB13000.1的關系:在字匯上兼容,碼表則不兼容。例如,兩個標準中都會有“啊”字,但兩個標準中,“啊”的內碼是不同的。
GB13000.1和ISO10646為同一體系,與工業標準Unicode3.1是兼容的。
3.GB18030:
該標準分為兩個部分:雙字節部分和四字節部分。
雙字節部分和GBK基本完全相同。
四字節部分到目前為止,比GBK多了6582個漢字(27484-20902),x8139ef30~0x82358738。對應GB13000.1則為0x3400~0x4db5。
4.目前支持GB18030的OS:
2001年9月1日后的Windows2000 的補丁版;
Windows XP;
以及一些Linux、Unix的OS。
5.GB18030的問題
由于GB18030中包括了4字節編碼漢字,和目前Windows平臺中普遍使用的2字節編碼的GBK和Unicode3.1有較大區別,因此在使用中出現了很多問題。例如微軟的Windows XP中實際上只支持Unicode3.1編碼,并不支持GB18030的4字節編碼漢字。