早鸽—汇聚行业精英
  • 联系客服
  • 帮助中心
  • 投诉举报
  • 关注微信
400-006-1351
您的问题早鸽都有答案
3000+专业顾问
搜索
咨询

汉字形音编码法制作方法

  • 专利名称
    汉字形音编码法制作方法
  • 发明者
    奚宇
  • 公开日
    1988年5月18日
  • 申请日期
  • 优先权日
  • 申请人
    奚宇导出引文BiBTeX, EndNote, RefMan
  • 文档编号
  • 关键字
  • 权利要求
    1.一种汉字形音编码法,其特征在于按人们已习惯的公认的汉字基本笔划调整定义分别予以代码,用汉字的单首笔划、笔划总数、单末笔划组合形成三位编码体系,并辅以音码2.根据权利要求1所述的编码法,其特征在于把汉字基本笔划撇、捺类并为斜类,按所定义的点、横、竖、斜、折五类,依次命以代号1、2、3、4、53.根据权利要求1和2所述的编码法,其特征在于三位编码体系是依照书写顺序,以首、末笔划按同一定义,分别代码,作为首、末位数码,以笔划总数值的个位数作为中间位数码4.根据权利要求3所述的编码法,其特征在于对特定的部分汉字的末码加上一个数字“5”的特定均衡系数5.根据权利要求1所述的编码法,其特征在于把汉语拼音头一个字母作为提示区别键码,定义在标准键盘的英文字母键上6.根据权利要求1和3所述的编码法,其特征在于三位编码体系作为主码,定位在标准键盘上的一组数字键上
  • 专利详情
  • 全文pdf
  • 权力要求
  • 说明书
  • 法律状态
专利名称:汉字形音编码法的制作方法本发明是一种较为简便的易于接受的形码为主码,音码为辅的汉字形音编码方法。由七十年代末至今,国内外众多的汉字编码专家,已从数以万计的浩瀚的汉字海洋中,探索出了公布于众的400多种汉字编码法及在计算机领域中实现汉字输入的40多种各有所长的汉字输入法。如CN85100837-“优化五笔字型编码法及其键盘”;CN85102777-“汉字字形输入法”等。这些是目前比较具有代表性的二种字形编码法。它以字根、字元为码源,但字根,字元的各自人为定义的诸多规则与人们公认且已习惯接受的汉字基本笔划规则、构字规则是截然不同的,所需重新记忆的因素太多,加之重码率也较高,故使初学者或非专职操作人员,往往感到难于灵活掌握。本发明是从人们已习惯的或公认的汉字基本笔划定义出发,提出一种易于接受且简便的,降低重码率的汉字形音编码法。本发明的要点是,长期以来,人们已自然习惯、公认的汉字基本笔划为点、横、竖、撇、捺、折六类,按此,首先将其个别类调整,并分别予以代码,同时,取汉字的单首笔划,笔划总数、单末笔划组合形成三位编码体系,辅助以音码。调整撇、捺二类为斜类,依照所定义的点、横、竖、斜、折五类基本笔划,依次用阿拉伯数字1、2、3、4、5命以代码。(图1笔划顺序袭用人们公认的标准书写顺序,即先横后竖,先撇后捺,先上后下,从左到右,从外到里,先里头后封口,先中间后两边分别取汉字单笔划,总笔划数、单末笔划为三位数进行编码。单首笔划与单末笔划均用上述同一定义,分别取码。所取单首笔划的数码作为三位编码体系中的第一位数码,其数值变化量受上述五类笔划定义编码体系中的第二位数码,例如,“慧”的总笔划数为15,依上规则,取个位数“5”作为数码;所取单末笔划的数码作为三位编码体系中的第三位数码,同样,所取数值也将受到五类基本笔划定义的限定,但因对特定的部分汉字的末码还加上了一个数字为“5”的特定均衡系数,所谓之特定的部分汉字是指笔划总数超过10笔划以上的汉字(包括10笔划在内的10笔划以下的汉字均不予加之),故此类汉字的末笔划数码值必然在0-9的10个数字间变化。以三位编码体系作为主码,而以音码作为辅助码,主码定在标准键盘的数字键上,而音码定位在标准键盘上的英文字母键上,所称之的音码是用该汉字的拼音中首字母作为提示区别键码。图1,汉字五类基本笔划的名称,相对应的代码,笔划形类。 图2,本发明33键输入法键位图。 参照图1,对本发明的编码规则做如下示例示例1+=>“223”,单首笔划为“一”,代码为“2”;总笔划数为2,代码为“2”;单末笔划为“丨”,代码为“3”。依次取码组合成该汉字的三位数编码为“223”。 示例2欢=>“564”,单首笔划为“
”,代码为“5”;总笔划数为6,代码为“6”;单末笔划为“乀”,代码为“4”。得码为“564”。
示例3慧=>“256”单首笔划为“一”,代码为“2”;总笔划数为15,根据本发明规则仅取个位数为代码,而得代码“5”;单末笔划“丶”,代码为“1”,但因该字属笔划数10笔划以上的区域字,所以,还需将此码加上个均衡系数“5”,结果,末代码为1+5=“6”。得编码“256”。
示例4懿=>“226”取码法同上。
示例5鱓=>“438”繁体字同法取码。
示例6馬=>“201”取码法同上。
现就王维的《渭城曲》做形音码编码示范“渭城朝雨邑轻尘,客舍青青柳色新。
劝君更尽一杯酒,西出阳关无故人。”示范表
示范验证结果以上共输入“27”个汉字。盲打字数达19个,占总数的70.37%;同码最高4个字的重码占11.1%;同码3个字的重码占7.4%;同码2个字的重码占11.1%。因本法出现的重码仅占小部分,且最高重显4个字,用当前显示10个字的容量是富富有余的,因而输入快捷。
本发明与现有编码法相比,乃是一种新颖的形音码法,由于本编码规则是根据历来人们已自然习惯且公认的汉字最基本的笔划定义,故,易于接受掌握,编码规则简捷,方便。对国家(二级字库)标准信息交换用汉字编码字符集基本集(GB2312-80)中的6763个汉字,完全可以使用本法进行处理,并且可以一码一次性当前提示行显示有余,其70.37%的汉字实现盲打。对10笔划以上的汉字末笔划代码附加特定的均衡系数“5”及引入拼音中首字母,以英文键代之输入做当前提示行区分辅助键码,故重码率降低至了相当低的程度。使得当前显示行(10个字)的容量富富有余,提高了输入速度。
本发明用于计算机领域可用标准西文键盘作为输入工具。如表2-本发明33键输入法键位图。如用于IBM-PC/XT/AT等微机上,配一个中文操作系统支持即可实现。
此编码法是建立在合乎罗辑的基础上,根据浅显的汉字结构的简便统一的认识,避免了以字根、字元、象形等各异规则取码法而造成的因人为的理解能力的差异而对字形结构复杂的汉字切分而各持己见造成的取码误差。


本发明是一种新颖的形音汉字编码方法。发明以人们长期以来自然习惯、公认的标准识字规则,按汉字字型的特点及五类最基本的笔划、笔划数、汉语拼音相关的原理,用1至5的阿拉伯数字及拼音字母首字母码对汉字依形简便的进行编码。因此编码规则简捷,逻辑性强,重码率低。适用于非专职输入人员,便于普及推广。该法对简体字和繁体字均适用,在汉字电脑处理系统中及徒手检索汉字的领域均可广泛的应用。



查看更多专利详情

下载专利文献

下载专利

同类推荐

您可能感兴趣的专利

专利相关信息