楼主: zdic

历代部分字书收字情况简表

  [复制链接]
发表于 2007-12-13 16:50:51 | 显示全部楼层
樓上的香港同胞,漢字最常用的字有1000多,一般常用的也就3000多,其他的多為不常用字。相比英語及一他一些語言,應該算是很少暸吧。
回复

使用道具 举报

发表于 2007-12-16 10:40:22 | 显示全部楼层
原帖由 初二生 于 2007-12-13 16:37 发表

以unicode為標準,也可以將今昔文字鏡放到上表吧

unicode是全球共用的编码字符集。就汉字而言,它吸收的字,是中日韩越等所有使用汉字国家的汉字,其中当然也包括今昔文字镜里的汉字,目前unicode已公布并正式使用的汉字集有:基本集CJK Ext  20924字,CJK ExtA  6582字,CJK Ext B  42711字,尚有CJK ExtC的约20000字尚未正式批复使用(其中有4219字海峰五笔可以输入),而且还有ExtD和ExtE也已经收集了不少汉字,现在字库里还没有的字,相信总有一天是有希望可以输出来的。
回复

使用道具 举报

发表于 2007-12-23 04:29:12 | 显示全部楼层
不,就是‘英语’单词,由于发音语言不存在大的记忆问题,也使英语单词向无限量发展
回复

使用道具 举报

发表于 2008-1-20 20:41:03 | 显示全部楼层
但是英语如果碰到新生词或新词,即使你能读出来也还是要查字典,否则你不知道它是什么(有的虽然有字根,但寻常人也很难断出来);从另一个角度来看,每个新生词或新词,汉语都完全可以用已有的汉字构成相应词,即使很晦涩的学术词,汉语也一般给它一个非常通俗的俗称。比如“condom”,英语没啥特别意思,你第一次见它就必须查字典,汉语把它称为“避孕套”,不用新造字;又如“methylenedioxymethamphetamine”,即使你能很正确的断英文词根你还是需要查字典看它是干什么的,汉语按其化学构成和英文字根可以称为“亚甲基二氧基甲基苯丙胺”,可能很多非专业人士还是不明白,但如果我说它是“摇头丸”,估计很多中国人都能看懂这个词了。
我觉得单纯比较“汉字”和“英语单词”完全没有可比性,不同的文字系统。
回复

使用道具 举报

发表于 2008-2-13 13:21:24 | 显示全部楼层
这个表在冷玉龙主编的《中华字海》卷首附有,可以看一下。
回复

使用道具 举报

发表于 2008-4-22 21:18:04 | 显示全部楼层
历代字书收字数目一览表

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复

使用道具 举报

发表于 2008-5-25 23:37:15 | 显示全部楼层
原帖由 叶子 于 2007-11-3 21:22 发表
汉字最多也才11万字左右,不算多,英文单词动辄1000000多个。呵呵

晕你,搞错没有。
英语单字(Letter)只26个,占一字节。汉字单字(Charactor)八万,占两个字节。
同样在Unicode 中占两个字节(16Bits),看谁的意思多?
同样在Unicode中处于电脑里四个字节(两个汉字组成的词与四个字母组成的单词比,看谁多)
……
用词与单字比,是没有可比性的,兄弟。
回复

使用道具 举报

发表于 2008-6-8 14:52:57 | 显示全部楼层
原帖由 poetbox 于 2008-5-25 23:37 发表

晕你,搞错没有。
英语单字(Letter)只26个,占一字节。汉字单字(Charactor)八万,占两个字节。
同样在Unicode 中占两个字节(16Bits),看谁的意思多?
同样在Unicode中处于电脑里四个字节(两个汉字组成的词与四个字母组成的单词比,看谁 ...


經典,到位,恰當
回复

使用道具 举报

发表于 2008-6-15 15:12:38 | 显示全部楼层
原帖由 xax65 于 2007-12-16 10:40 发表

unicode是全球共用的编码字符集。就汉字而言,它吸收的字,是中日韩越等所有使用汉字国家的汉字,其中当然也包括今昔文字镜里的汉字,目前unicode已公布并正式使用的汉字集有:基本集CJK Ext  20924字,CJK ExtA  6582字,CJK Ex ...

难道要出到CJK ExtZ??
回复

使用道具 举报

发表于 2008-7-13 15:45:11 | 显示全部楼层
汉字组成词你能数出数来吗?
回复

使用道具 举报

发表于 2008-8-30 18:13:12 | 显示全部楼层
原帖由 哥舒天野 于 2007-9-4 18:33 发表
我们在整理
会尽快健全的。
没有总比错了好。

谢谢了,尽快形成数据库,最好出个小软件来,名字就叫汉典词库
回复

使用道具 举报

发表于 2008-11-8 18:46:39 | 显示全部楼层

回复 6# cnfa4444 的帖子

现汉比较新
回复

使用道具 举报

发表于 2008-11-8 19:26:27 | 显示全部楼层

《玉篇》的字數問題

本帖最后由 baiyu 于 2010-8-15 22:34 编辑

管理員主帖說明了歷代主要字書收錄漢字的情況,其中關於《玉篇》的字數記載不夠準確。
《玉篇》一書在歷史上有三個發展階段。先是梁武帝大同九年(公元543年)南朝顧野王撰成《玉篇》;唐高宗上元元年(公元674年),處士孫強曾修訂增字;再至宋真宗大中祥符六年(公元1013年),敕令陳彭年等再次重修,增字較多,書名改為《大廣益會玉篇》。
顧野王所撰書稱為原本《玉篇》,據載收字為16917字。現僅存殘卷,存2000餘字。唐修本增字數不詳,宋修本收字為兩萬兩千多,如樓主所發即22726。
據此史實,將宋代增修本字數安在原本《玉篇》下,顯然是不妥當的。
此外,稱《玉篇》為現存最早的楷書字典也不盡合適。因為原本《玉篇》已祇剩殘卷,而在宋本《玉篇》之前的現存字書還有《廣韻》。《廣韻》既是韻書,也是字書,其成書早於《玉篇》數年,故當可稱為最早字書。
回复

使用道具 举报

发表于 2009-1-3 11:12:49 | 显示全部楼层
这个表应该抄自《中华字海》。最近韩国出版一本《韩汉大辞典》,收录汉字了6万个,词汇量达到50万。
回复

使用道具 举报

发表于 2009-1-17 22:27:39 | 显示全部楼层
楼主所提供表中《集韵》的收字数有误,《集韵》实收32381字,53525字是因为把多音字在不同的韵部中重复计算了,《康熙字典》是古代收字最多的字书
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|

Copyright © 2006-2015 | 汉典论坛  all rights reserved ( 粤ICP备10071303号 ) | GMT+8, 2018-1-18 21:33

返回顶部