该用户从未签到 - UID
- 8165
- 帖子
- 562
- 精华
- 1
- 积分
- 4639
- 软件
- 2444 套
- 稻币
- 1138 元
- 贡献
- 569
- 违规
- 0 次
- 注册时间
- 2011-3-1
|
汉语大字典第二版检索表excel版
汉语大字典(第二版)检字表说明
一.本检字表以第一版字表为基础,经与第二版逐页对照,调整次序,增加字数,将每页的第一个字头及最后一个字头标注页码,而后在EmEditor中利用正则表达式形成每个字头的页码,在excel中利用计算重复次数的countif函数生成每个字头的页内次序,从而完成本表的制作,除外下文提到的那11个字,应该包括了第一版字表上的所有字。
二.按汉语大字典第二版所言,本版共收字60370个,可是我所整理出来的字头共有60232个,比所说的少了138个,可能是由于我赶进度以及疏忽,把这138个字漏掉了。
三.在这60232个字头中,用五笔打不出来的共有4590个(我用的五笔码表收录了CJK基本及扩展ABCD区中的全部字,也就是包括了目前所有已编码的汉字)。我说的打不出,指的是我自己打不出来,应该一部分是拆码错误,另一部分是目前的unicode标准确实尚未收录该字。等CJK-E,F发布后估计会补充一部分?
四.我把这4590个字头分为两部分:异体替代字头(149字)和待定字头(4441字)。前者指该字头虽然打不出来,但可以找到该字头的异体字,于是用异体字加中括号来代替该字头;后者指导该字头打不出来,也未找到异体字,于是用字母X来表示。
五.在这60232个字头之外,尚有第一版收录的11个字头在第二版中我自己找不到任何对应字头。这11个字头为:六.有的字头后跟的小括号里面的字为该字的简体字;有的字头后跟的中括号里面的字为该字在第一版中的异体字(由于新旧字形的关系,第一版中新旧字形同收的字比如併和倂,在第二版中已经合而为一,只收新字形,不收旧字形。这类字大多是以幷或幵作部件的字)。有的字头后跟的大括号里面的字为该字的类推简化字,这些类推简化字第二版不一定收录。
七.表中跨页1,跨页2,跨页3表示连续这几页都有该字头的义项。这个我主要是想把汉语大字典做成mdict格式的电子词典而用的。
八.该字表目前并不是太完善,但日常查询使用应该基本上不成问题了。只是希望发出来以后大家能一起校对完善它。如果大家在使用过程中发现了错误,找到了所漏的字,打出了我没有打出的字,希望都能够在此提出来以便共同更新。
::下载地址:: |
|