27 12
发新话题
打印

历代部分字书收字情况简表

引用:
原帖由 tantiancai 于 2007-11-3 22:00 发表

《今昔文字镜》虽然收字数量多,但是却是另一种独特的编码方式,和目前的 Unicode 不兼容,汉典作为一个全球性的网站,当然只能以最广泛使用的 Unicode 作为标准啦。 ...
以unicode為標準,也可以將今昔文字鏡放到上表吧
我來自香港
一個中學生

TOP

樓上的香港同胞,漢字最常用的字有1000多,一般常用的也就3000多,其他的多為不常用字。相比英語及一他一些語言,應該算是很少暸吧。

TOP

引用:
原帖由 初二生 于 2007-12-13 16:37 发表

以unicode為標準,也可以將今昔文字鏡放到上表吧
unicode是全球共用的编码字符集。就汉字而言,它吸收的字,是中日韩越等所有使用汉字国家的汉字,其中当然也包括今昔文字镜里的汉字,目前unicode已公布并正式使用的汉字集有:基本集CJK Ext  20924字,CJK ExtA  6582字,CJK Ext B  42711字,尚有CJK ExtC的约20000字尚未正式批复使用(其中有4219字海峰五笔可以输入),而且还有ExtD和ExtE也已经收集了不少汉字,现在字库里还没有的字,相信总有一天是有希望可以输出来的。

TOP

不,就是‘英语’单词,由于发音语言不存在大的记忆问题,也使英语单词向无限量发展
我为祖国的语言戴上光环 我为自己的思想插上翅膀

TOP

但是英语如果碰到新生词或新词,即使你能读出来也还是要查字典,否则你不知道它是什么(有的虽然有字根,但寻常人也很难断出来);从另一个角度来看,每个新生词或新词,汉语都完全可以用已有的汉字构成相应词,即使很晦涩的学术词,汉语也一般给它一个非常通俗的俗称。比如“condom”,英语没啥特别意思,你第一次见它就必须查字典,汉语把它称为“避孕套”,不用新造字;又如“methylenedioxymethamphetamine”,即使你能很正确的断英文词根你还是需要查字典看它是干什么的,汉语按其化学构成和英文字根可以称为“亚甲基二氧基甲基苯丙胺”,可能很多非专业人士还是不明白,但如果我说它是“摇头丸”,估计很多中国人都能看懂这个词了。
我觉得单纯比较“汉字”和“英语单词”完全没有可比性,不同的文字系统。

TOP

这个表在冷玉龙主编的《中华字海》卷首附有,可以看一下。
请多指教!

TOP

历代字书收字数目一览表
附件: 您所在的用户组无法下载或查看附件

TOP

引用:
原帖由 叶子 于 2007-11-3 21:22 发表
汉字最多也才11万字左右,不算多,英文单词动辄1000000多个。呵呵
晕你,搞错没有。
英语单字(Letter)只26个,占一字节。汉字单字(Charactor)八万,占两个字节。
同样在Unicode 中占两个字节(16Bits),看谁的意思多?
同样在Unicode中处于电脑里四个字节(两个汉字组成的词与四个字母组成的单词比,看谁多)
……
用词与单字比,是没有可比性的,兄弟。

TOP

引用:
原帖由 poetbox 于 2008-5-25 23:37 发表

晕你,搞错没有。
英语单字(Letter)只26个,占一字节。汉字单字(Charactor)八万,占两个字节。
同样在Unicode 中占两个字节(16Bits),看谁的意思多?
同样在Unicode中处于电脑里四个字节(两个汉字组成的词与四个字母组成的单词比,看谁 ...
經典,到位,恰當

TOP

引用:
原帖由 xax65 于 2007-12-16 10:40 发表

unicode是全球共用的编码字符集。就汉字而言,它吸收的字,是中日韩越等所有使用汉字国家的汉字,其中当然也包括今昔文字镜里的汉字,目前unicode已公布并正式使用的汉字集有:基本集CJK Ext  20924字,CJK ExtA  6582字,CJK Ex ...
难道要出到CJK ExtZ??
少年不知勤学苦,老来方悔读书迟。
行万里路,读万卷书。

TOP

汉字组成词你能数出数来吗?

TOP

引用:
原帖由 哥舒天野 于 2007-9-4 18:33 发表
我们在整理
会尽快健全的。
没有总比错了好。
谢谢了,尽快形成数据库,最好出个小软件来,名字就叫汉典词库

TOP

 27 12
发新话题