稻草软件论坛's Archiver

ntcjq999 发表于 2014-3-20 16:53

汉语大字典第二版检索表excel版

汉语大字典第二版检索表excel版
汉语大字典(第二版)检字表说明
一.本检字表以第一版字表为基础,经与第二版逐页对照,调整次序,增加字数,将每页的第一个字头及最后一个字头标注页码,而后在EmEditor中利用正则表达式形成每个字头的页码,在excel中利用计算重复次数的countif函数生成每个字头的页内次序,从而完成本表的制作,除外下文提到的那11个字,应该包括了第一版字表上的所有字。
二.按汉语大字典第二版所言,本版共收字60370个,可是我所整理出来的字头共有60232个,比所说的少了138个,可能是由于我赶进度以及疏忽,把这138个字漏掉了。
三.在这60232个字头中,用五笔打不出来的共有4590个(我用的五笔码表收录了CJK基本及扩展ABCD区中的全部字,也就是包括了目前所有已编码的汉字)。我说的打不出,指的是我自己打不出来,应该一部分是拆码错误,另一部分是目前的unicode标准确实尚未收录该字。等CJK-E,F发布后估计会补充一部分?
四.我把这4590个字头分为两部分:异体替代字头(149字)和待定字头(4441字)。前者指该字头虽然打不出来,但可以找到该字头的异体字,于是用异体字加中括号来代替该字头;后者指导该字头打不出来,也未找到异体字,于是用字母X来表示。
五.在这60232个字头之外,尚有第一版收录的11个字头在第二版中我自己找不到任何对应字头。这11个字头为:六.有的字头后跟的小括号里面的字为该字的简体字;有的字头后跟的中括号里面的字为该字在第一版中的异体字(由于新旧字形的关系,第一版中新旧字形同收的字比如併和倂,在第二版中已经合而为一,只收新字形,不收旧字形。这类字大多是以幷或幵作部件的字)。有的字头后跟的大括号里面的字为该字的类推简化字,这些类推简化字第二版不一定收录。
七.表中跨页1,跨页2,跨页3表示连续这几页都有该字头的义项。这个我主要是想把汉语大字典做成mdict格式的电子词典而用的。
八.该字表目前并不是太完善,但日常查询使用应该基本上不成问题了。只是希望发出来以后大家能一起校对完善它。如果大家在使用过程中发现了错误,找到了所漏的字,打出了我没有打出的字,希望都能够在此提出来以便共同更新。

[url=http://jsbpzx.net.cn/Soft/ebook/201403/17656.html][color=#0000ff]::下载地址::[/color][/url]

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.

桂ICP备09005550号