Unicode 4.1汉字
为使 Unicode 向下兼容 GB 18030 和香港增补字符集(HKSCS)的所有汉字,而扩展C区又迟迟未能出笼,在 Unicode 4.1 版中引进了14个香港增补字符集的用字和8个 GB 18030 用字。该22字被编于 U+9FA6—U+9FBB 的位置。
另外,在 U+FA70—U+FAD9 的位置,放了106个来自北朝鲜的兼容汉字。
Unicode 5.1汉字
在2008年4月推出的 Unicode 5.1 版本,收录7个由日本 Adobe 公司递交的个日语汉字(U+9FBC-U+9FC2)[2],和目字旁加㚒(大字加两个入字,就如陕西省的陝字换上目字旁)的字 U+9FC3。本来 Unicode 3.0 收录了目字旁加夾(大字加两个人字)字的“䀹”(U+4039),目字旁加㚒字的字,与“䀹”无论在意义和发音均不相同,故 Andrew West 和 John Jenkins 申请追加此字[3]。
扩展C区
按计划,中日韩统一表意文字扩展C区将收录4,149个汉字,包括来自中国大陆、澳门、台湾、日本、越南等尚未被编码的汉字。这些汉字预计会收录在下一版的 Unicode 版本中,位置在 U+2A6E0—U+2B734。根据IRG N1266号文件(另见 N3270),这四千多个汉字分别从以下字典或字集中取得:
中国大陆
- 《中国大百科全书》
- 北大方正排版系统
- 《汉语大字典》
- 《汉语大词典》
- 《古代汉语词典》
- 商务印书馆用字
- 《现代汉语词典》
- 《辞海》
- 《康熙字典》及补遗
- 中国测绘科学研究院用字
- 《汉语方言大辞典》
- 殷周金文集成引得
澳门
台湾
- CNS 11643-1992 第12字面
- CNS 11643-1992 第13字面
- CNS 11643-1992 第14字面
日本
- 日本国字集(Japanese KOKUJI Collection)
韩国
- 韩国 IRG 汉字集第5版(Korean IRG Hanja Character Set 5th Edition: 2001)
北朝鲜
越南
- 喃字词典(Từ điển chữ Nôm), 阮光红(Nguyễn Quang Hồng), 2006
- Từ điển chữ Nôm Tày, Hoàng Triều Ân, 2003
- Bảng tra chữ Nôm miền Nam, Vũ Văn Kính, 1994
UTC来源
- ABC Chinese-English Dictionary, John DeFrancis(德范克), et al., eds., 2nd edition. (1998) Honolulu: University of Hawaii Press
- 耶稣基督后期圣徒教会香港分会用字
- Mathews' Chinese-English Dictionary, Robert H. Mathews (1975) Cambridge; Harvard University Press
- 宋本《广韵》
- 《中国鸟类系统检索》,郑作新等(2000),北京,科学出版社
- 段玉裁《说文解字注》