再造汉字
2018科普创客大赛复赛成人组晋级作品。
〖2018年“科普创客大赛”参赛作品,版权归大赛主办方所有,任何媒体、网站或个人不得转载!违者追究相应法律责任!〗
01
1979年1月,美国蒙纳公司宣布,他们研发出了汉字激光照排系统,计划于夏秋之际,在北京和上海进行展览。
消息传来,有人精神振奋,“古老的汉字,终于要搭上信息时代的列车”;也有人震惊。震惊的人里,有一个,叫王选。
蒙纳公司的激光照排系统(图片来源:prepressure.com)
02
曾有外国友人说,中国人是幸运的——只要认识一两千个汉字,就能毫不费力地阅读两岸三地的书籍、今人古人的文章。其实,传承数千年的汉字,曾有两个生死攸关的时刻。一个是民国时期,当时有过废除汉字的讨论,另一个,就在不久前。
80年代初,英语国家普遍进入电子排版时代,而国内,仍然使用活字印刷。据统计,当时印刷业一共使用了20万吨铅合金。20万吨什么概念呢?以高铁做例子,高铁的核定载客量,大约在600人左右,假设所有乘客都是体重100公斤的大胖子,满员的情况下,也不过60吨。
耗资尚是小问题,更麻烦的,是慢。铅字印刷,需要先选字,排布到板子上。一本图书,从确认稿件到成功出版,往往费时一年以上,若是版面较为复杂的科技图书,则需要两到三年。
正是百废待兴的时候,书印不出来怎么行呢?王选决定解决这个问题。
活字印刷(图片来源:北京周报)
03
“人非生而知之者。”王选先生也不是一开始就对汉字感兴趣。
王选,1937年出生于上海,在家里排行第五。表面上,他与父亲很像。王选的父亲为人认真、严肃,给别人写信,都会用复印纸留一份底稿、再按照日期进行排列,方便日后查阅。实际上,他只继承了父亲的认真,写完作业就想着玩,也有淘气的时候,比如,跟同学合谋,一起捉弄老师。
人都会长大、都要面临专业选择。马克思在《青年在选择职业时的考虑》中,鼓励年轻人服务社会;爱因斯坦之所以没有选择数学,据说是因为数学体系过于完美,不够好玩。王选则兼而有之,进入北大之后,他选择了计算机系,因为他认为,计算机有着广阔的用途,可以服务社会的方方面面,再者,当时计算机技术尚处于起步阶段,空白的地方很多。
北大读书时期的王选,后排中(图片来源:wangxuan.net)
幼年贪玩的王选,不怕开拓。
04
计算使用二进制语言,换言之,任何信息,在计算机看来,都不过是0、1的排布;英语只有二十六个字母,任何文本,都不过是字母的组合。只要把字母数字化,一切问题就迎刃而解了。
古老的东方,在这件事上比较“吃亏”。
1971年,日本提出了“图像信息处理系统”计划,打算解决日文电子排版问题。可惜,当时的存储设备性能有限,日文又与英语不同,日文中有九十六个假名、两千多个汉字,处理起来麻烦得多。费时十年,仍没有什么进展。
磁鼓,早期电脑储存设备(图片来源:维基)
相比之下,《康熙字典》收录的汉字,有四万七千余个,即使只考虑常用字,也有五六千个。每一个字,在不同的字形、字号下,都有自己的特点。想把汉字数字化,谈何容易。
王选不信邪。
他从妻子陈堃銶那里听说,国家准备搞数字出版技术,立刻产生了兴趣。
05
汉字印刷的方案不止一种,当时国内有搞二代机的,也有搞三代机的。
王选认为,这些都不够理想。二代机对机械加工的要求很高,即使研发出来,也不堪用;三代机又要求高质量底片,以当时国内的生产水平,很难满足印刷业的需求。技术虽起源于原创研究,但更强调实用。他决定,绕过二代机、三代机,直接研发四代机,将汉字数字化,用激光进行排版。
要想把汉字数字化,同样绕不开存储问题。
工作中的王选(图片来源:腾讯网)
正如前面所说,一切信息,在计算机眼里,都是0、1的排列。要想告诉计算机,一个人长什么样儿,可以把他的照片,横竖切割成尽可能多的小块,告诉计算机,每一处的数据是什么;也可以选择一些标志性的点,教计算机按照一定的逻辑(算法),将它们连接起来。后者所需要的信息量,自然小得多。
百变针,便是一种数据压缩(图片来源:ruten.com)
王选经过仔细研究发现,汉字虽然多,但是汉字的笔画不多,无非横竖撇捺数个。而这些笔画,又可以分为两类,一类是规则的,比如横竖,各种字体中都比较相似,另一种是不规则的,比如点和勾,不同字体下差异极大。
王选手稿(图片来源:北京大学)
他决定,为汉字建立坐标系,将笔画的宽度、起笔位置,进行编号,对于不规则笔画,在上面选一些点,以折线相连,用点和折线表示其轮廓。
王选的构想(图片来源:影响世界的发明专利)
06
借助数学,王选实现了汉字的数字存储。然而,就在他准备大干一场的时候,传来了蒙纳公司的消息。
技术要面向用户,若被别人抢了先,便可能失去整个市场。王选知道,就给自己的时间不多了,必须尽快从实验室走向印刷间。在领导和课题组的帮助下,他与潍坊计算机所合作,加班加点,生产出了样机。
以今天的眼光看,这套设备是简陋的、粗笨的。因为集成电路的规模小,所以体积很大,由28个大插板组成。稳定性也不好,紧张调试之后,机器终于能正常工作了,新的问题接踵而来——印出来的字,是弯曲的。
细心的王选发现,这是由照排机的抖动引起的。当时的机房,地下中空,人员走路,会引起照排机抖动。于是,每次实验时,他都用凳子和照排机围起来,禁止走动,就这样,终于做出了一份样报。
样报(图片来源:wangxuan.net)
07
1983年,人民日报社准备采用激光照排技术,召集专家,进行论证。会上,出现了两种声音。有些人认为,人民日报是中国发行量最大、最权威的综合性报纸,容不得一点差错,最好还是选用外国设备——外国设备的质量更好一些。另一种声音则单薄许多,王选详细描述了蒙纳公司照排系统的不足之处,力荐自己研发的、具有完整知识产权的华光激光照排机。
可惜,前者压倒了后者。
这次论证失败,对王选的打击,必然很大。十数年间,他一直保持着每周65小时以上的工作时间,没想到最后败给了别人的“不放心”。
对于工程师来说,解决方案大约相当于子女。谁会愿意自己孩子被人嫌弃呢?
不过,工程师,没有时间怨天尤人。论证失败了,可以靠事实说话。华光激光照排机采用滚筒式结构,需要工人收工上下底片,不太方便,此外,在王选眼里,它体积大,外观不美,对机房的要求高,软件也比较初步,难以应对复杂的版面。好在国家重视,从不多的外汇中拨出20万美元;北大项目组,又与杭州通信设备厂合作,改进了滚筒结构。
杭州设备厂生产的照排机(图片来源:腾讯网)
夙兴夜寐,枕戈待旦,精益求精,终于等来一个机会。1986年,经济日报社,决定采购华光III型照排机。
可惜好事多磨。仅仅7天之后,编辑们就集体决定,不用照排机了——改回铅字。因为华光III在使用过程中,出现了重字、重行、错字等多种问题。为此,王选和多方专家展开会诊,两周内就解决了问题。
辛苦工作,终于带来了回报。1987年,恰逢中国共产党十三次代表大会,工作报告全文三万四千余字。面对如此重大的报道,每家出版社都不敢怠慢。事实证明,倘若使用活字印刷,即是选用最熟练的工人,也需要三四个小时;而经济日报,借助华光系统,20分钟便完成了排版。
1989年,包括蒙纳在内的多家外国排版公司,彻底退出中国。
1995年,王选荣获联合国教科文组织科学奖(图片来源:新华网)
08
2002年,王选先生从江泽民同志手中,接过了国家最高科学技术奖的证书。
此时的他,已经脱离科研第一线。不过这种脱离,不是因为贪图享受,而是因为一件小事。1993年春节期间,他一天都没有休息,终于做出一个设计,没想到,开学以后,被学生一句话否定。
他没有伤感,反而十分高兴。汉字需要传承,知识、技术也是。波澜壮阔的岁月中,他竭尽自己的才智,帮助汉字搭上数字化的列车,打赢了一场时光之战。后生可畏,焉知来者之不如今也。
他说:“我觉得,现在礼拜天可以去颐和园了。”
晨练中的王选(图片来源:王选我的人生抉择)
----------------------------------
参考文献:
[1]周程. “死亡之谷” 何以能被跨越?——汉字激光照排系统的产业化进程研究[J]. 自然辩证法通讯, 2010(2): 30–42.
[2]张恩台. 希望就在前方[M]. 千華駐 崧博, 2018.
[3]胡佐超主编;戴吾三等著. 影响世界的发明专利[M]. 清華大學出版社, 2010.
[4]丛中笑. 王选传(全两册)[M]. 2012.
[5]宁肯. 中关村笔记[M]. 北京十月文艺出版社, 2017.
[6]王选. 计算机-激光汉字编辑排版系统简介[J]. 计算机学报, 1981, 2: 000.
[7]王选. 我的人生抉择[J]. 共产党人, 2006, 4: 022.
[8]大家[EB/OL]. [2018-11-18]. http://tv.cctv.com/lm/dajia/.
[9]著作文萃[EB/OL]. [2018-11-20]. http://www.wangxuan.net/intro/content_800.htm.