Skip to content

常用中文汉字表和字符集:汉字 / 漢字 / かんじ Kanji / 한자 hanja / 𡨸漢 hán tự

Notifications You must be signed in to change notification settings

zispace/hanzi-chars

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

31 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

常见汉字字表和字符集

本仓库仅梳理常见的汉字字表和字符集(汉字来自CJKV)

Warning

本仓库资料仅供参考,如有错误等请及时反馈。

说明

Important

更新和勘误

更新和勘误记录参见CHANGELOG.md,详情见文件开头部分。

字表来源

  • 参见下面相关资料,特别是zispace/hanzi-docs中PDF资料
  • 维基百科、zi.tools
  • 教育部门官方网站
  • Github等网络资料

对存疑部分和各个资料不一致,文件头部有说明。

文件格式

数据以纯文本方式展示,file.txt文件格式(UTF-8格式编码)如下:

# 注释:字表名
# 注释:汉字数
# 注释:其他说明
 # 空行分隔
汉 # 每字一行(或一组字,以括号表示繁体、异体字、旧字形等)
字
简〔繁〕
简〔异〕〔〖IDS〗〕

如需读取字表,通常仅需忽略#开头的行和空行,读取每行第一个字符。

一般地,如下用括号符号区分不同字形:

  • 【】表示新字形或简化字;
  • []、〔〕或﹝﹞表示繁体字(传承字、正字)、异体字以及旧字体等,有时不区分繁体异体;
  • 〖〗表示IDS,用于表示缺少编码或无法显示的汉字,整体视作一个字。
  • ※表示特殊说明;
  • ◎表示占位字符,通常配合〖〗使用。

相关资料

常用字字表

  • 《通用规范汉字表》:8105字(一级字3500,二级字3000,三级字1605)
  • 《义务教育语文课程》(2022年版)
    • 识字写字教学基本字表:300字
    • 常用字表:3500字(同《通用规范汉字表》一级字)分为:
      • 字表一2500字
      • 字表二1000字
  • 《汉字应用水平等级及测试大纲》字表:5500字(《通用规范汉字表》全部一级字3500个+二级字2000个)
  • HSK(汉字水平考试/国际中文教育):
    • 《国际中文教育中文水平等级标准》汉字表:3000字(《通用规范汉字表》一级字2967个+二级字33字)
    • 《国际中文教育中文水平等级标准》手写汉字表:1200字
  • 香港《常用字表》:约4762字(组)
  • 香港《小學學習字詞表》:4804字
  • 香港《小學分級常用字表》:2600字(组)
  • 臺灣《常用國字表》(常用國字標準字體表,「甲表」):4808字
  • 臺灣《次常用國字表》(次常用字國字標準字體表,「乙表」):6343字(含9個單位詞、5字待考正字)
  • 日本《常用漢字表》:2136字(组)
  • 日本《学年別漢字配当表》:1026字
  • 韩国《漢文教育用基礎漢字》:1800字
  • 《中日韩共用常见八百汉字表》:808字

旧字表

  • 《汉语水平词汇与汉字等级大纲字表》(2001年版)字表(汉语水平考试HSK):约2900字
  • 《现代汉语通用字表》(1988年):7000字(包括《现代汉语常用字表》(1988年)全部3500字)
  • 《现代汉语常用字表》(1988年):3500字(常用字2500字+次常用字1000字)
    • 语体文应用字汇(4261字) 1928年6月 陈鹤琴
    • 常用字选(2000字) 1946年8月 四川省教育科学院
    • 常用汉字登记表(1017字) 1950年9月 中央人民政府教育部社会教育司
    • 常用字表(2000字) 1952年6月 中央人民政府教育部公布
    • 识字正音3500字表(3559字) 1954年7月 中国大辞典编纂处
    • 普通话常用字表(3000字) 1958年8月 山东省教育厅
    • 常用字表(3100字) 1965年3月 北京市教育局中小学教材编审处
    • 4500字表(4444字) 1975年 中国文字改革委员会汉字组
    • 汉字频度表(6376字,常用字部分4152字) 1976年12月 七四八工程查频组
    • 增订2500字表 1979年7月 中国文字改革委员会汉字组
    • 六年制小学语文统编教材生字表(3189字) 1984年 人民教育出版社
    • 常用构词字典(3994字) 1984年3月 中国人民大学语言文字研究所
    • 社会科学自然科学综合汉字频度表(7754字,常用字部分3500字) 1985年3月 北京航空学院计算机科学工程系 中国文字改革委员会汉字处
    • 汉字频率表(4574字) 1985年7月 北京语言学院语言教学研究所
    • 现代汉语词典 1978年8月 中国社会科学院语言研究所
    • 新华字典 1979年 商务印书馆
    • 信息交换用汉字编码字符集·基本集(6763字,一级字3755个) 1981年5月 国家标准局发布【GB/T 2312-1980】
    • 标准电码本(7292字) 1983年 邮电部 【《标准电码本》】
    • 印刷通用汉字字形表(6196字) 1965年1月 中华人民共和国文化部和中国文字改革委员会联合发布 【《印刷通用汉字字形表》】
    • 1986年度新闻信息流通频度(6001字) 1987年1月 新华社技术研究所
  • 《简化字总表》(1986年新版):2235字(组)
  • 《标准电码本》(1983年修订本):7079字
  • 《简化字总表》(1964年版):2236字(组)
  • 《印刷通用汉字字形表》(初版1965年):约6000字(组)
  • 《第一批异体字整理表》(初版1955年):共810组
  • 日本《当用漢字表》(1946年):1850字(组)

字符集

  • Unicode CJK 汉字合集:98682字(包括“〇”)
    • 细分:基本汉字、基本汉字扩展 A ~ I 等(Unihan)
    • 以及:汉字部首、注音、笔画等
  • GB/T 2312-1980 “国标码”(GB0):6763字
  • GB/T 12345-1990 “国标码繁体版”(GB1):6866字
  • GBK 1.0 “国标扩”:21003字
  • GB 13000-2010:70207字 (等同ISO/IEC 10646:2003=Unicode 4.0)
    • 原 GB 13000.1-93:20902字 (等同ISO/IEC 10646-1:1993=Unicode 1.1,包含CJK统一汉字共20902字)
    • GB 13000-202X (等同ISO/IEC 10646:2020=Unicode 13.0):正在批准中
  • GB 18030-2022:87887字
    • GB 18030-2000:27533字
    • GB 18030-2005:70244字
  • Big5 “大五码”:13060字
    • 常用字共5401字
    • 次常用字共7652字
  • CNS 11643(臺灣)中文標準交換碼(全字庫):约 10 万字
  • HKSCS《香港增補字符集》:4602字
  • MSCS《澳門增補字符集》:427字(去重后约348字,本文件已经去重复)
  • 日本《JIS X 0208》:6355字(辅助集、扩充集增加 3695字)
  • 韩国《KS X 1001》:4888字(去重后约4620字)
  • IICore《国际表意文字核心》:9810字

其他字表

  • 《古籍印刷通用字规范字形表》:14250字
  • 《现代常用独体字规范》:259字
  • 臺灣《本土語言成果參考字表》(台語客語):6792字

生僻字表

  • 臺灣《罕用國字標準字體表》「丙表」(1983年/民國七十二年):共收罕用字18388字。
  • 臺灣《異體國字字表》「丁表」/原異體字表(1984年/民國七十三年):共收異體18588字,補遺22字。
  • 臺灣《新增正字表》「N表」:編輯《異體字字典》時,新增錄之正字

About

常用中文汉字表和字符集:汉字 / 漢字 / かんじ Kanji / 한자 hanja / 𡨸漢 hán tự

Topics

Resources

Stars

Watchers

Forks

Contributors 2

  •  
  •