《海阔天空》网站按语:这是一篇前几年在网上出现的文章,一篇很优秀的文章。作者以非常认真非常细致的态度,深入探讨五笔字型两个版本之间的差异,指出86版一些不足之处,肯定了98版的进步。这里所说的“五笔字型”俗称王码五笔86版或86王码。由于汉字形体错综复杂,给形码输入带来许多困难,很难编制出一套完全科学合理的取码软件。98版的确在某些方面比86版合理,但也是相对而言。它本身也有不少不合理的地方。所以王码公司曾经想推出一套“大一统”的版本。即使“大一统”出来了,可能也难以做到十全十美。在科学发展的道路上永远只有更好,没有最好。   如果要问输入汉字最“键步如飞”的输入法是什么的话,那么大多数的人都会说是“五笔字型”。虽然很难说最快的汉字输入法是什么(笔者就曾经见过一个专业郑码高手的精彩表演),但有一点可以肯定,五笔字型作为一种专业级的快速输入法,是十分深入人心的。
据说五笔字型的汉字输入全国冠军可以达到每分钟键入256个汉字。经过测试,一篇同样内容的文章,英语的字符数量大约是汉字字符的五倍,使用五笔字型输入法,平均每击键1.5-2.5次就能输入一个汉字,这样应该说有了五笔字型的出现,汉字的输入速度已经超过了西文的输入速度。
  五笔字型是王永民在1986年发明的,已经风行十几年了。到了1998年,王永民“十年磨一键”,又推出了五笔字型的兄弟“98王码”。
笔者原本没有学过五笔字型,因为工作关系需要写大量的文章,很想学一种快速的汉字输入法,这自然想到了五笔字型。但是“阴差阳错”地买回了一个“98王码”软件,从而有幸成为第一批98王码的使用者,学习使用98王码大约一年多时间,那么“王码”和“五笔字型”到底有什么不同?“王码”到底有什么好呢?有了“五笔字型”为什么还要推出“98王码”呢?经过笔者使用体会,再加之反回去又学会了“五笔字型”,可以和大家谈谈这方面的感想。
  首先,王码可以输入繁体字。中国的汉字千千万万,康熙字典收入了47000多个汉字,汉字到底有多少恐怕就是文字学家也说不清,但万事不能没有一个 “底”,于是就得人为地确定一个“底”,所以就有了几种流行的字符集,最标准的就是GB国标简体字,共有6763个字,在我国大陆的现代生活中这6763 个字已经够用了,我国文字专家通过对7075篇现代文章的2162万汉字的统计,一共也只发现了汉字6300个(引用)。我们现在大量使用的多种输入法,大都只能输入这6763个字,当然86版的五笔字型也只能输入这些字。
  不过事情有时不那么简单,有些字你可能天天碰到,但却打不出来,这大都是因为一些人名造成的,像“朱镕基”的“镕”,还有“冯喆”的“喆”,还有 “弨”、“堃”等等,因为这些字都是GB国标以外的汉字。目前流行的绝大多数的输入法对它们都无能为力(全拼和标准郑码等除外)。作为专业输入的龙头老大,五笔字型是基于国标简体字而发明的,字根的设置在当时没有考虑到繁体汉字。而五笔字型的新兄弟“98王码”,却在五笔字型的基础上仅仅作了一点修改就可以简单地处理这些字了,甚至可以处理CJK大字符集的21003个汉字(这个字符集包含了古字和韩国、日本等国的一些汉字),所以即使你是个不识简体字的同胞,也可以通过王码轻而易举地输入繁体汉字了。
  第二,码元的设置更科学。五笔字型输入的基本原理就是通过字根的“拼装”组成汉字,98王码则把字根称为码元,其意思是一样的。为了便于记忆,五笔字型把汉字笔划分为五大类(所以叫五笔字型),并把有同样或相似笔划的字根安排在这五大区里。但是你会发现像“力”、“几”等字根安排在了“竖”区内,不十分科学,而王码则把它们安排在了“撇”区,合理多了;“×”(叉)这个字根使用频率很高,但五笔字型把它安排在“Q”键上,所以在用五笔字型打字时,左手的小指会很频繁,这是不符合键盘使用规律的,同时也造成了一些重码字。同样,“乃”、“舟底”、“臼”、“荒底”等字根也换到了合理、容易记忆的位置上。
  还有,王码删除了少量不十分有用的字根。像五笔字型中有一个“戋”的字根,钱、线、笺等字都要由它组成,不过“戋”可以用“一”和“戈”两个现成字根简单地组成,所以在王码中这个字根被去掉了。
  同时,王码增加了大量的有用的字根,像“夫”,有了它使得潜、扶、年、制等字特别好打;有了“甫”,使得浦、铺、簿、敷等字变得十分容易打;有了 “甘”、“丘”、“未”、“母”、“皮”、“戊”……不用看,有了这些字根使得许多字变得更易于理解了,字根也看得更清晰了。五笔字型一共有字根130 个,王码达到了245个,更难能可贵的是仔细研究后会发现,这些字根都是繁体字的重要组成部分,使得王码可以轻松处理繁体字。另外,这些有用的字根的出现,使得重码字减少,像五笔字型中出现最多的重码字是YNKY有“赢、嬴、蠃、羸”四个字,而在98王码中,这四个字则不重码。98王码的重码字比五笔字型要少。
(笔者新注:版主说98王码的重码字比86版多,这点笔者并不十分同意,从笔者的使用感觉来看,98版重码只有少。)
  第三,“组”字的方法更为合理,更加考虑对文字的第一直观。作为一种笔型输入法,“组”字的方法有很多,比如一个“养”字,笔者可以用七种方法来拆分它,每一种都可以说出道理来,但只有一种是正确的,所以五笔字型规定了自己的拆字的规则和习惯,不过五笔字型由于发明时间早,所以在拆字有很多不科学之处。
  像离、脑等字,规范地讲是“亠”和“×”的结合,并不是一个“文”字,但五笔字型却将它理解为“文”,严格地讲是不科学的。
  像“曳”字,学五笔字型的人都会在这个字上“走弯路”,很少有人能“看出”这是“日”和“匕”的结合,而在98王码中,“曳”的组合方法就科学得多。
  “余”这个常用字,和它配合又能组成不少字,但它的下面并不是一个“禾”字,而是“一”和“木”的组合。
  “越”是个常用字,但是要把它理解成“土”、“止”、“右框”、“丿”总有些别扭。
  “兼”字,要理解为“亦底”,没有一定的“水平”也看不出来。还有“丑”的下面也不是一个   “土”。“予”的下面怎么也看不出是个“卩”底。
  “延”字,是一个几乎每个人都容易写错的字,五笔字型把它理解为是“丿”和“止”,恰恰是错的,作为小学生,这个字千万注意不要写错。
  汉字中的两个常用字“像”和“象”,中间都取了“日”字码,这本身无可厚非,要这样理解也可以,发明人可以有这样的“权力”。但同型字“免”、“兔”和“逸”等,中间却取了“口”字码,初学五笔字型的人在这里都会“犯错”。
  再看一些细节上的,“求”的选码,两种版本不一样,98版选的是“一”、“水”、“点”,86版选的是“十”、“四点”、“点”,从发明人的角度看,哪一种都可以,不过五笔字型有一个规律,就是第一码和第二码有多种选择时,往往是“一小二大”,比方“生”第二码不是“土”而是“青头”;“来”选“米” 而不选“木”;“不”第二码也是选“小”……,所以从规律上看98版更科学。
  从取码的一致性上,86版也有问题,“万”字有三个重码字,如果认为这样取码是正确的话,那么像“敖”之类的字理解起来就有一定的困难,它的取码和“万”的思路不一样,初学者会走弯路。
  98王码有些简化带来很大方便,五笔字型的高手最容易出现的错误是像“即”、“退”、“既”等字,因为这几个字分别是“VC”或“VE”,但一旦盲打快了,很容易错,98王码将两种并成了一种,决不会出现错误。
  五笔字型的组字取码甚至有“错误”的现象出现。像“靥”字,毫无疑问,这个字的下面是一个“面”字,在五笔字型中“面”字的取码被规定为“厂”、 “冂”、“丨丨”和“三”。如果这样取码的话,“靥”字的最后一码应该是“三”,但是这样你会发现“靥”字就和键名汉字“大”重码,由于键名汉字是不能有重码的,所以五笔字型就只好规定了“靥”的最后一码为“囗”(L)。
  “蔻”字也常用到,笔者的一个同事的名字就有这个字。但不知是为了避免和“莞”字重码,还是避免和“劳动”两字重码,五笔字型也人为地将“蔻”的最后一码定在了“囗”(L)上。的确这样做重码字少了,但这样人为的规定就影响了五笔字型的科学性、一致性。如果你有兴趣钻研一下所有的五笔字型编码字典,有相当一部分都另外标出了这些字正确的取码,包括王永民自己编写的《王码字典》“靥”和“蔻”也分别标明的是“DDDD”和“APFC”,但如果你这样打的话是打不出这两个字的。
其实,在五笔字型里“囗”(L)这一码是另有特殊意义的,笔者研究了许多版本的五笔字型,在早期版本里,像在2.2版,为了避免重码,很多常用字是靠 “囗”码来区分的,像“风和冈”、“去、支和云”、“仁和仕”、“太和丈”、“半和斗”等等;后来王永民是采用“默认第一字,空格键取第二字”的方法来区分的,像4.0版和4.5版。但仍有一些没有改,就是“靥”、“蔻”,即使是目前十分流行的“五笔字型教材”,也都没有指出“囗”的特殊意义和这几个特殊字的打法,更没有说明为什么这样打。当然话又说回来,即使王永民错了也只好“将错就错”,你所要做的就是记住,因为你用正确的取码方法反而打不出这几个字。(笔者新注:这段从今天笔者的感受来看,有些偏颇)
  其它还有像“乐”、“乌”、“舆”、“戍”、“阑”、“鸟”、“行”、“步”、“束”、“凹”、“段”、“追”、“凸”等等一些字,这些字在五笔字型中的“组”字方法或是不十分准确;或是难以理解,不过这些在98王码中都得到了很好的改正,使之更加完善科学,更加兼顾了对汉字的直观理解。(笔者新注:此处笔者对原文有简化)
  更难能可贵的是王码特别注意了笔划顺序,对于成年人来说,强调汉字的笔顺好像没什么必要,但对于中小学生来说,养成一个良好的笔顺习惯却很重要,中考一定有一道考笔顺的题目,查阅工具书没有正确的笔顺也不行。五笔字型因为发明时间较早,为了组字而去硬“凑”字根,从而形成了一些倒笔划,所以五笔字型不十分适合小学生学习。
  像“非”的笔顺应该是“丨”、“三”、“丨”、“三”,五笔字型中是“三”、“丨丨”、“三”。  
  像“桃”的正确笔顺是“木”、“儿”、“四点”,但五笔字型是以“从左至右”的取码为原则,就弯成了“木”、“四点”、“儿”的倒笔顺了。
  像“瓦”字,末笔应该是“丶”。但在五笔字型中却是“乙”。
  另外,五笔字型本身的取码顺序也不一致,像“率”是“亠”、“纟”、“四点”和“十”组合,先取了中间的“纟”,但“燕”又是“艹”、“ 两点”、“口”、“四点”的组合,先取了旁边的“两点”,取码的顺序前后矛盾,没有一个前后一致的统一规范。98王码改正了早期五笔字型为“凑”字根而引起的不必要的倒笔划,所以98王码“开创了将汉字输入法大规模纳入中小学教学的新局面,标志着我国汉字输入技术进入了一个新的历史阶段。”(王永民原话)
  第四,使“补码”更加完善。“补码”是五笔字型的精华所在,是减少重码,加快汉字盲打速度的最聪明的办法,应该说是王永民的智慧结晶。“补码”对不足四码的汉字以汉字的“上下”、“左右”和“组合”三种结构为原则,规定了一些取码方法。
  但是应该说王永民在86年五笔字型发明的时候,补码的取码原则还不是十分完善,像“君”、“乏”等无论怎么看“上下”结构要比“组合”结构要更合适一点,同时也使“君”和“群”避开了重码。
  “亏”字是常用字,没有补码打不出来,五笔字型认为这是个“三型”字,但要把它理解为“组合”结构的“三型”字总好像有些困难。