历代部分字书收字情况简表
[table=98%][tr][td=1,1,14%]书 名[/td][td=1,1,15%]成书时间(时代)[/td][td=1,1,9%]作 者[/td][td=1,1,8%]收字头数[/td][td=1,1,54%]备 注[/td][/tr][tr][td=1,1,14%]《説文解字》[/td][td=1,1,15%]公元100年(东汉)[/td][td=1,1,9%]許 慎[/td][td=1,1,8%]9,353[/td][td=1,1,54%]加上重文1163字,共计收字头10516,字头为小篆,按540部首排列,是我国第一部字典。[/td][/tr][tr][td=1,1,14%]《字林》[/td][td=1,1,15%](晋)[/td][td=1,1,9%]吕 忱[/td][td=1,1,8%]12,824[/td][td=1,1,54%]按《说文解字》540部首排列,已佚。[/td][/tr][tr][td=1,1,14%]《玉篇》 [/td][td=1,1,15%]公元543年(南朝梁)[/td][td=1,1,9%]顧野王[/td][td=1,1,8%]22,726[/td][td=1,1,54%]按542部首排列,是我国现存的第一部楷书字典。[/td][/tr][tr][td=1,1,14%]《龍龕手鑑》 [/td][td=1,1,15%]公元997年(辽)[/td][td=1,1,9%]行 均[/td][td=1,1,8%]26,430[/td][td=1,1,54%]部首按平上去入四声顺序排列,共242部,其中平声97部,上声60部,去声26部,入声59部。收录俗字较多。[/td][/tr][tr][td=1,1,14%]《廣韻》[/td][td=1,1,15%]公元1011年(宋)[/td][td=1,1,9%]陳彭年等[/td][td=1,1,8%]26,194[/td][td=1,1,54%]按206韵平上去入四声顺序排列,平声57韵,上声55韵,去声60韵,入声34韵。每韵再分小韵,共9300多小韵。[/td][/tr][tr][td=1,1,14%]《類篇》[/td][td=1,1,15%]公元1066年(宋)[/td][td=1,1,9%]司馬光等[/td][td=1,1,8%]31,319[/td][td=1,1,54%]按《说文解字》部首排列,其中“艸”、“食”、“木”、“水”四部各分为上下,故共有544部。同部的字依韵排列。[/td][/tr][tr][td=1,1,14%]《集韻》[/td][td=1,1,15%]公元1067年(宋)[/td][td=1,1,9%]丁度等[/td][td=1,1,8%]53,525[/td][td=1,1,54%]编排方式基本与《廣韻》同。[/td][/tr][tr][td=1,1,14%]《改併五音聚韻四聲篇海》[/td][td=1,1,15%]公元1212(金)[/td][td=1,1,9%]韓道昭[/td][td=1,1,8%]35,189[/td][td=1,1,54%]共444部首,按36字母顺序排列,同母的部首,又按平上去入四声排列,同部首的字头,按笔画多少为序排列。[/td][/tr][tr][td=1,1,14%]《字彙》[/td][td=1,1,15%]公元1615年(明)[/td][td=1,1,9%]梅膺祚[/td][td=1,1,8%]33,179[/td][td=1,1,54%]按214部首排列,首创部首按笔画多少顺序排列法。同部首的字头,按笔画多少顺序排列。[/td][/tr][tr][td=1,1,14%]《正字通》[/td][td=1,1,15%]公元1671年(明)[/td][td=1,1,9%]張自烈[/td][td=1,1,8%]33,549[/td][td=1,1,54%]编排方式基本与《字彙》同。[/td][/tr][tr][td=1,1,14%]《康熙字典》[/td][td=1,1,15%]公元1716年(清)[/td][td=1,1,9%]張玉書[/td][td=1,1,8%]47,035[/td][td=1,1,54%]沿用《字彙》、《正字通》214部首排列法。正文外有补遗和备考。加上古文字字头共49030,其中重收字头81个。[/td][/tr][tr][td=1,1,14%]《中華大字典》[/td][td=1,1,15%]公元1915年(中华民国)[/td][td=1,1,9%]陸費逵等[/td][td=1,1,8%]48,000多[/td][td=1,1,54%]沿用《康熙字典》部首,但顺序有所调整。[/td][/tr][tr][td=1,1,14%]《漢語大字典》[/td][td=1,1,15%]公元1986年——1990年(中华人民共和国)[/td][td=1,1,9%]《漢語大字典》編輯委員會[/td][td=1,1,8%]54,678[/td][td=1,1,54%]按200部首排列。部首按笔画多少为序排列,每部之字亦按笔画多少为序排列。同笔画的部首和每部之内同笔画的字,均按横竖撇点折笔顺排列。正文外有补遗和附录11种。[/td][/tr][/table] 补充几条:1959年日本诸桥辙次的《大汉和辞典》收字49964。
1971年张其昀主编的《中文大辞典》收字49888。
1994年冷玉龙等的《中华字海》收字达85000。
(资料来源:互联网) 1994年冷玉龙等的《中华字海》收字达85000。
太恐怖了 汉典目前收录的标准汉字
也就是国际通行的标准
大约有75000字 康熙字典網上版
[url]http://www.kangxizidian.com/index2.php[/url] 怎么没《现代汉语词典》?
--/----------------------------------------
>> 我的[url=http://www.ipipnet.com]门禁[/url],我的世界 请教高手:
目前适于电脑文字输入法的字库中,哪个字库的可用字数最多?哪种字库最适用于五笔字形输入法? [quote]原帖由 [i]qyhzzhqxf[/i] 于 2007-5-24 12:58 发表 [url=http://bbs.zdic.net/redirect.php?goto=findpost&pid=139566&ptid=103259][img]http://bbs.zdic.net/images/common/back.gif[/img][/url]
请教高手:
目前适于电脑文字输入法的字库中,哪个字库的可用字数最多?哪种字库最适用于五笔字形输入法? [/quote]
海峰五笔及其字库
标准汉字,75000字。
下载:[url]http://www.zdic.net/appendix/f18.htm[/url]
《今昔文字镜》
怎么没《今昔文字镜》呀??????????????????????????????????????????????????????????????????????????????? 汉典里的字有些没有释义,有些连注音都没有,要是补充完整就好了。 我们在整理会尽快健全的。
没有总比错了好。 汉字最多也才11万字左右,不算多,英文单词动辄1000000多个。呵呵 [quote]原帖由 [i]vkbkjk[/i] 于 2007-8-4 19:37 发表 [url=http://bbs.zdic.net/redirect.php?goto=findpost&pid=144672&ptid=103259][img]http://bbs.zdic.net/images/common/back.gif[/img][/url]
怎么没《今昔文字镜》呀??????????????????????????????????????????????????????????????????????????????? ... [/quote]
[font=微软雅黑][size=4]《今昔文字镜》虽然收字数量多,但是却是另一种独特的编码方式,和目前的 Unicode 不兼容,汉典作为一个全球性的网站,当然只能以最广泛使用的 Unicode 作为标准啦。[/size][/font] 全球性的:funk: [quote]原帖由 [i]叶子[/i] 于 2007-11-3 21:22 发表 [url=http://bbs.zdic.net/redirect.php?goto=findpost&pid=153141&ptid=103259][img]http://bbs.zdic.net/images/common/back.gif[/img][/url]
汉字最多也才11万字左右,不算多,英文单词动辄1000000多个。呵呵 [/quote]
11萬不算多,那多少才算多??
你講那些英文單詞,應該加上了歐洲各方言,古希臘羅馬,以及其他國家的譯音吧?? [quote]原帖由 [i]tantiancai[/i] 于 2007-11-3 22:00 发表 [url=http://bbs.zdic.net/redirect.php?goto=findpost&pid=153144&ptid=103259][img]http://bbs.zdic.net/images/common/back.gif[/img][/url]
《今昔文字镜》虽然收字数量多,但是却是另一种独特的编码方式,和目前的 Unicode 不兼容,汉典作为一个全球性的网站,当然只能以最广泛使用的 Unicode 作为标准啦。 ... [/quote]
以unicode為標準,也可以將今昔文字鏡放到上表吧 樓上的香港同胞,漢字最常用的字有1000多,一般常用的也就3000多,其他的多為不常用字。相比英語及一他一些語言,應該算是很少暸吧。 [quote]原帖由 [i]初二生[/i] 于 2007-12-13 16:37 发表 [url=http://bbs.zdic.net/redirect.php?goto=findpost&pid=156573&ptid=103259][img]http://bbs.zdic.net/images/common/back.gif[/img][/url]
以unicode為標準,也可以將今昔文字鏡放到上表吧 [/quote]
unicode是全球共用的编码字符集。就汉字而言,它吸收的字,是中日韩越等所有使用汉字国家的汉字,其中当然也包括今昔文字镜里的汉字,目前unicode已公布并正式使用的汉字集有:基本集CJK Ext 20924字,CJK ExtA 6582字,CJK Ext B 42711字,尚有CJK ExtC的约20000字尚未正式批复使用(其中有4219字海峰五笔可以输入),而且还有ExtD和ExtE也已经收集了不少汉字,现在字库里还没有的字,相信总有一天是有希望可以输出来的。 不,就是‘英语’单词,由于发音语言不存在大的记忆问题,也使英语单词向无限量发展 但是英语如果碰到新生词或新词,即使你能读出来也还是要查字典,否则你不知道它是什么(有的虽然有字根,但寻常人也很难断出来);从另一个角度来看,每个新生词或新词,汉语都完全可以用已有的汉字构成相应词,即使很晦涩的学术词,汉语也一般给它一个非常通俗的俗称。比如“condom”,英语没啥特别意思,你第一次见它就必须查字典,汉语把它称为“避孕套”,不用新造字;又如“methylenedioxymethamphetamine”,即使你能很正确的断英文词根你还是需要查字典看它是干什么的,汉语按其化学构成和英文字根可以称为“亚甲基二氧基甲基苯丙胺”,可能很多非专业人士还是不明白,但如果我说它是“摇头丸”,估计很多中国人都能看懂这个词了。
我觉得单纯比较“汉字”和“英语单词”完全没有可比性,不同的文字系统。 这个表在冷玉龙主编的《中华字海》卷首附有,可以看一下。 历代字书收字数目一览表 [quote]原帖由 [i]叶子[/i] 于 2007-11-3 21:22 发表 [url=http://bbs.zdic.net/redirect.php?goto=findpost&pid=153141&ptid=103259][img]http://bbs.zdic.net/images/common/back.gif[/img][/url]
汉字最多也才11万字左右,不算多,英文单词动辄1000000多个。呵呵 [/quote]
晕你,搞错没有。
英语单字(Letter)只26个,占一字节。汉字单字(Charactor)八万,占两个字节。
同样在Unicode 中占两个字节(16Bits),看谁的意思多?
同样在Unicode中处于电脑里四个字节(两个汉字组成的词与四个字母组成的单词比,看谁多)
……
用词与单字比,是没有可比性的,兄弟。 [quote]原帖由 [i]poetbox[/i] 于 2008-5-25 23:37 发表 [url=http://bbs.zdic.net/redirect.php?goto=findpost&pid=172454&ptid=103259][img]http://bbs.zdic.net/images/common/back.gif[/img][/url]
晕你,搞错没有。
英语单字(Letter)只26个,占一字节。汉字单字(Charactor)八万,占两个字节。
同样在Unicode 中占两个字节(16Bits),看谁的意思多?
同样在Unicode中处于电脑里四个字节(两个汉字组成的词与四个字母组成的单词比,看谁 ... [/quote]
經典,到位,恰當 [quote]原帖由 [i]xax65[/i] 于 2007-12-16 10:40 发表 [url=http://bbs.zdic.net/redirect.php?goto=findpost&pid=156751&ptid=103259][img]http://bbs.zdic.net/images/common/back.gif[/img][/url]
unicode是全球共用的编码字符集。就汉字而言,它吸收的字,是中日韩越等所有使用汉字国家的汉字,其中当然也包括今昔文字镜里的汉字,目前unicode已公布并正式使用的汉字集有:基本集CJK Ext 20924字,CJK ExtA 6582字,CJK Ex ... [/quote]
难道要出到CJK ExtZ?? 汉字组成词你能数出数来吗? [quote]原帖由 [i]哥舒天野[/i] 于 2007-9-4 18:33 发表 [url=http://bbs.zdic.net/redirect.php?goto=findpost&pid=147594&ptid=103259][img]http://bbs.zdic.net/images/common/back.gif[/img][/url]
我们在整理
会尽快健全的。
没有总比错了好。 [/quote]
谢谢了,尽快形成数据库,最好出个小软件来,名字就叫汉典词库
回复 6# cnfa4444 的帖子
现汉比较新《玉篇》的字數問題
管理員主帖說明了歷代主要字書收錄漢字的情況,其中關於《玉篇》的字數記載不夠準確。《玉篇》一書在歷史上有三個發展階段。先是梁武帝大同九年(公元543年)南朝顧野王撰成《玉篇》;唐高宗上元元年(公元674年),處士孫強曾修訂增字;再至宋真宗大中祥符六年(公元1013年),敕令陳彭年等再次重修,增字較多,書名改為《大廣益會玉篇》。
顧野王所撰書稱為原本《玉篇》,現僅存殘卷,據載收字為16917字,唐修本增字數不詳,宋修本收字為兩萬兩千多,如樓主所發即22726。
據此史實,將宋代增修本字數安在原本《玉篇》下,顯然是不妥當的。
此外,稱《玉篇》為現存最早的楷書字典也不盡合適。因為原本《玉篇》已祇剩殘卷,而在宋本《玉篇》之前的現存字書還有《廣韻》。《廣韻》既是韻書,也是字書,其成書早於《玉篇》數年,故當可稱為最早字書。
[[i] 本帖最后由 baiyu 于 2008-11-8 19:33 编辑 [/i]]
页:
[1]
2