山丰反反覆复他写的材料,认真核对其中的公式,不断找到bug,实验结果终於在有一天,当某个关键bug排除后,不再徘徊,猛然提高了一大步,山丰再接再厉,最终全部实现了他在理论上的结论。这件事让山丰认识到了科学理论的重要X,一个严密、正确的理论对实践的指导有重大意义。这件事给山丰的鼓舞很大,山丰完全相信自己的理解程式、编写程式、调试程式的能力。不过山丰对英文论文、理解英文论文、写作英文论文依然没有信心,因此也对提出高质量的新方法、新理论没有信心。
这个研究的成果很快写成论文,研究如何让计算机系统学会婴儿学习词语的能力,因为人类婴儿天生具备很强的语言学习能力。Lawrence主笔,他和山丰共同署名,发表在下一年NLP领域最重要的会议ACL上。这对山丰而言,是一个了不起的成果,极大地增强了山丰在研究中的自信,但是,没有激发起山丰的研究热情,相反,山丰感觉到一丝空虚和幻灭。在1992年的那个夏天召唤自己投入到这个领域的那些激情、梦想、壮志、豪情,在随後几年的研究生阶段逐渐失望、破灭,来到美国後又重新焕发,但是目标达到後,又开始离山丰而去。因为,以Lawrence的天分和勤奋,以业界的高度评价,也只是做到一个很勉强的地步,从人的角度衡量,只是一个很勉强的水平。而且很容易看到这个方法继续推进的空间很小很小,这基本揭示当今计算机的最高水准,距离理解人类语言还相当遥远,甚至大致揭示了大家不愿说破的秘密,计算机根本就不可能真正理解人类语言。果不其然,Lawrence和山丰随後的努力没能进一步改善处理结果。
山丰平时常常感动於一些文章、文字,山丰多麽盼望能够把这份感动清晰地表述,也教给计算机,让它不再神秘,现在,山丰开始明白,人类对於人类语言的那份感动唯有存在於人类自身。平时空闲时,还是坚持自己的和感悟吧,不再对计算机抱有幻想。Lawrence後来多次给山丰讲,「我们重新提出一套数学模型,下一篇文章要做大文章。」山丰顺口附和着,心里其实觉得没什麽意义,也许能够获得更多经费,也许能够得到更高的学术职位,可是,对那个x1引自己进入这个领域的最根本问题的解决真正有多大帮助呢?那也不是x1引山丰进入这个领域的初衷。Lawrence後来让山丰开展研究,自己全面转向生物信息学,试图用计算机寻找人类基因序列中的规律,这其实和计算语言学相似,如果将长长的基因序列也视为一段文字,那麽问题的关键仍然是如何理解这段文字。但是,基因序列是自然的产物,而人类语言是人工的产物,人类的活动不会影响自然的产物,却可能影响人工的产物,也就是说,研究者在试图寻找语言规律时,同时也可能在改变语言规律本身。山丰想,如何让计算机理解人类语言,Lawrence大概也感觉到了瓶颈。
Lawrence的办公风格非常独特且简朴,他只用一个很小的笔记型电脑,放在一个类似乐队指挥家放乐谱的细铁杆高架台上,立在房间的最中间,他坐着一个很小的凳子上,整日不停地敲打键盘,都是悬臂敲打,换成山丰,很快手臂就会疲劳。靠窗的书桌虽然很大,却只是用来放书、资料等物品,从未见他坐在那里工作,也没有留出空间来工作。山丰偶尔进去,感觉他就像一个指挥家。他的隔壁大房间,就是他的实验室,里面有20来位学生,从实习的本科生,到博士後,他轮流找每个学生交谈,查看学生最新的实验结果,安排下一步的实验,指挥着众人一起奏响这部科研交响曲,所有的乐谱都在那台小小的笔记型电脑中。
初到圣路易斯,山丰最不习惯的是饮食,Lawrence本人吃得惊人的简单,他中午一般托秘书Ang外出就餐时,带一个三明治回来。山丰难以想像,这麽一个小小的三明治能够让他工作到晚上7、8点。山丰一般买6寸的Subway,挤在上面的各种调料山丰都不知,山丰让服务员自由安排,主要是听说Subwayb较健康,而且相bMald的汉堡包便宜很多,不过Subway的味道真是不好,吃了好久,才慢慢适应其中一两种口味,後来山丰基本只吃加tuna的Subway。每逢星期三,有教会的人送免费披萨到学校,还有一听免费的可乐,山丰一般都会去领,虽然不是很好吃,但其他选择也一样不好吃,实验室的人都会去领,既能随大流,还能省点钱。星期四经常有华人教会送免费中餐来,山丰大概就吃过几次,一是味道不好,二是觉得自己也不能总吃免费的东西,听有的人讲,如果愿意多跑点路,多打听,几乎每天都能找到领免费食品的地方。
从山丰住处步行5分钟有一家很不错的电影院,叫ChaseParkPzaema,也在LindellBLVD上,对WashU的学生还优惠,大约3元多的票价,那时6寸的Subway,也是这个价,非学生票是5元多,和footlong的Subway价格差不懂。山丰有时进去,一口气看好几个厅,各个电影都看一点,工作人员也不管,有时看到,还微笑示意。很久以後,山丰才听人讲,这是违反电影院规定的。陈意新来St.Louis後,他们一起看过好几次,她也很满意这个电影院的设施和氛围。
山丰在圣路易斯期间,结识了几个中国人,他们大都在华盛顿大学里工作,除了一开始来接山丰的田祥生,还有就是施瑞泽。田祥生夫人是Lawrence夫人实验室的工作人员,Lawrence夫人是华大生物系教授,据说掌管着一个bLawrence的还大的实验室,Lawrence转向生物信息学,与他夫人关系很大。山丰去Lawrence实验室时,Lawrence实验室还没有中国人,Lawrence於是找夫人帮助,於是找来了田祥生。田祥生帮山丰找好住处后,还带着山丰熟悉周边生活环境,看山丰一个人在此,大概想让山丰尽快融入当地的华人圈,不久邀请山丰去他家参加Party,山丰在美国极少参加Party,尤其不熟悉的人的Party,这大概是唯一的一次。他和夫人相当热情,来了好多人,可是,山丰不知道和大家聊什麽,只是呆呆地,看着大家聊天,那些话题山丰丝毫没有兴趣,甚至都听不太懂,时不时夹杂一些英语词。晚饭有各家带来的一些菜,山丰不懂这些规矩,基本上空着手去的。主要还是有赖田祥生夫人的辛勤C办,晚饭很丰盛。吃完饭,大家围坐一屋看录像,应该是好莱坞最新的电影,山丰本来对电影就不是很喜欢,西方电影更欣赏不来,还是英语,山丰完全不懂,不过有人兴致B0B0,时不时cHa话评述一下剧情,山丰还是不懂,只觉得2小时的录像时间尤为漫长。结束後,劳驾田祥生开车送山丰回家。全然不觉好玩,但是非常感谢田祥生夫妻的用心接待,只是自己不适合这样的场合,北美华人的娱乐方式实非山丰所Ai,从此大致奠定了山丰在美国不与普通人结交、不参加陌生人聚会的基本生活方式。
田祥生和施瑞泽相识已久,山丰因为需要买一辆车,施瑞泽正好要卖一辆车,因此田祥生介绍他们认识。施瑞泽和田祥生是南开大学生物系的同学,他是云南人,算半个四川老乡,当时在医学院的一个实验室工作。施瑞泽淳朴热情,令山丰感动的是,施瑞泽不仅很便宜地把车卖给山丰,还顺便教会了山丰开车,还指导山丰如何考取驾驶执照。後来,施瑞泽想转行到计算机公司,到华大计算机系选修课程,请山丰帮助他完成作业,准备考试,山丰在帮助他的过程中,发现自己其实对教学很感兴趣,也有些办法教会别人,这进一步促进了山丰下决心将来去大学当老师。
华盛顿大学和圣路易斯市让山丰大开眼界,在当时,中国的大学和城市与之相b有很大差距,特别是大学的差距,无论yT建设,还是规则制度,还是学术风气,还是人员素质,各个方面差距都是巨大的。不过有些因素,让山丰无法放弃回国的念头,首先,山丰的J1签证,按规定最多在美国三年,就必须回到中国,其次,饮食对山丰的影响,於山丰而言,美国的食物b中国差很远,吃饭完全谈不上享受,不如说是受罪,有时即使肚子很饿了,出去走一圈,满眼只有汉堡、三明治、披萨等,感觉再饿也不想吃,又回家来,实在饿的不行了,才匆匆去吃一点。而中国菜,尤其是川菜的师傅,山丰觉得他们真正掌握了人类味觉的奥秘,能够那麽过瘾而不过分地满足味觉的需要,川菜的JiNg髓其实不在麻辣,而在咸,咸是其他味觉的基础,川菜首先将咸味发掘到了其他菜难以企及的高度。第三,当时中国有种蓬B0发展的势头,而且政治上、文化上趋向开明,与西方关系趋向友善、合作。第四,山丰想在大学当老师,以山丰的背景,在美国非常困难,回到中国,则有可能进入一所很不错的大学。第五,山丰和陈意新的关系存在不确定X。总之,山丰後来基本确定了三年後就回国的计划。
山丰在圣路易斯也发现了美国不好的一面。圣路易斯是美国一个相当危险的城市,华盛顿大学所在位置还不错,山丰居住的地方则有点问题——处於好区接近坏区的地方。田祥生接待山丰的第一天就告诫山丰,晚上8点之後,不要上街。圣路易斯有些街区,即使白天去也非常危险,多数中国人如果无法避开这些街区,都是开车紧闭车窗,迅速驶过。不过很多人讲,这都不算啥,密西西b河对岸的东圣路易斯才是真正的危险地方。山丰那时每天晚上9点左右乘校车回住所,下车后,大约要步行五六分钟,基本上街上空无一人。短短五六分钟,山丰遇到好多次,突然走过来找山丰要钱的人,一般情况下,他都说自己饿了,需要买个汉堡,山丰通常给个几美元,他就会离开,也碰到过要求更高的。还有一次,山丰打开钱包,里面有5元和10元,正在迟疑是给他5元还是10元,他一把抢过去,自己掏出里面的两个5元和一个10元,然後还给山丰,扬长而去。中国也有乞丐,大都看上去很孱弱,看不出对人有什麽威胁,但是山丰在美国遇到的要钱的人,大都b山丰壮实很多,确实让山丰感觉到了威胁,不敢不满足他的要求。中国古话「仓廪实知礼节」,山丰不太理解美国社会,如此富裕了,为什麽还存在那麽多不知「礼节」的人?安全是一个地方、一个国家首要解决的问题,中国远不如美国富裕,可是社会安全,尤其是心理上的安全,却是远远高於美国的。山丰有时也想,会不会是在美国的中国人过於敏感,当地人并没有这麽强的不安全感。
山丰对美国的东西很好奇,整天呆在实验室,休息时就翻看实验室的各种书籍、资料、物品,有很多Lawrence的私人物品,後来山丰才知道,Lawrence刚刚搬到WashU,临时租的房子不大,正在看房准备买房,就把很多私人物品放在实验室。有好几次,Lawrence突然来实验室,正好看见山丰在翻看他的那些东西,闪过一丝诧异的表情,但通常当作什麽也没发生。只有一次,山丰翻到一个很大的纸盒,打开里面估计满满好几千张y纸卡片,每张卡片大约掌心那麽大,一面是用通常在白板上写的很粗的记号笔写了汉字,另一面则是这个字的各种解释、发音、例句等等,有英文,有日文,Lawrence看见了,和山丰聊起这些卡片的故事,是他在MIT学习日语时自己制作的,原来那些都是日本汉字。他说当时学中文的人很少,否则他可能会选中文而不是日语。他觉得研究计算机处理自然语言,仅仅懂一门母语是不够的,从第二语言的学习中获得的启发能够帮助设想计算机学习语言的机制。他说,外国留学生都没有这个问题,而美国人缺乏外力b迫,要学好一门外语很难,尤其像中文、日语这种和英语差别巨大的语言。不过,山丰猜想他低估了学习和维持一门新语言能力的难度,因为,山丰从未听他讲过一句日语,也从未在他的文章中见到一句日语。那些卡片,当年肯定花了他很多JiNg力,现在完全无用地扔在实验室了,因为不久後,他买了房,实验室的很多个人物品都搬到新房,但是那盒汉字卡片始终留在实验室,也许他等待一个合适的学生送出去。
内容未完,下一页继续阅读