继续转载冯志伟老师的《我与计算语言学》,原文发表在《现代语文》07年第9期,全文完。
在中学任教期间,我除了认认真真地教好学生,努力搞好本职工作外,还利用一切业余时间,密切地关注着国外学术发展的动向。数理语言学仍然像磁石一样强烈地吸引着我,在云南边疆那样闭塞的环境中,在信息不足、资料缺乏的困难条件下,我阅读了当时所能搜集到的各种关于数理语言学的资料,为了阅读散见于各种外文书刊中的数理语言学文献,我学会了英、法、德、俄、日等五种外国语,紧跟着世界上数理语言学发展的步伐。1973 年,我在云南省图书馆看到了美国语言自动处理咨询委员会(Automatic Language ProcessingAdvisory Committee) 于1966 年11 月发表的《语言与机器》(Language and Machine)这个关于机器翻译的调查咨询报告,这个报告一方面对于机器翻译采取了消极悲观的态度,一方面强调了继续从计算角度研究自然语言规律的重要性,明确地提出了要研究“计算语言学”(computational linguistics)。这是我第一次接触到“计算语言学”这个名称,从此以后,计算语言学便成为了我终身为之奋斗的事业。
后来我才知道,早在1962 年美国就成立了计算语言学学会,每年召开一次年会,并且出版学术季刊《美国计算语言学杂志》(American Journal of Computational Linguistics),后改名为《国际计算语言学杂志》(International Journal of Computational Linguistics)。1965年在美国纽约成立了国际计算语言学委员会(International Committee of ComputationalLinguistics,简称 ICCL),每两年召开一次国际会议,叫做 COLING。在四人帮横行的那些年代,我们与国际的学术几乎完全隔绝了,所以,我在1973 年才第一次接触到“计算语言学”这个名称,估计我是中国第一个接触到这个名称的学者,而其他没有机会阅读到《语言与机器》这个报告的中国学者,还根本不知道世界上还存在着“计算语言学”这个学科。可是,1973 年我第一次接触到“计算语言学”这个名称时,离开美国计算语言学学会成立的时间,已经整整11 个年头了。我们已经远远落后于美国,这是多么可惜呀!
粉碎四人帮之后,迎来了科学的春天,我有了归队的可能。但是,这次我归的队不是文科的队,而是理科的队。为了提高自己的数学和计算机科学的知识水平,我于1978 年通过理科考试,考上了中国科学技术大学研究生院信息科学系的研究生,弃文学理,又开始了理科的学习,从云南边疆回到了北京。1979 年,《计算机科学》杂志创刊,我在《计算机科学》创刊号上发表了《形式语言理论》的长篇论文,用严格的数学表达方式向计算机科学界说明语言学中的形式化方法如何推动了当代计算机科学的发展,并且指出,在语言学研究中发展起来的形式语言理论事实上已经成为了当代计算机科学不可缺少的一块重要的理论基石,计算机科学绝不可忽视形式语言理论。这样,我便从语言学的领域跨入了计算机科学的领域,开始从计算机科学的角度来研究语言学问题。
不久,我被中国科学技术大学研究生院选送到法国格勒诺布尔理科医科大学应用数学研究所(IMAG)自动翻译中心(GETA)学习,师从当时国际计算语言学委员会主席、法国著名数学家沃古瓦(B. Vauquois)教授专门研究机器翻译和计算语言学问题。1981 年回国后,我在中国科学技术信息研究所计算中心从事机器翻译的研究工作,仍然是从计算机科学的角度来研究语言学问题。直到1985 年11 月,由于语言文字工作的需要,我又一次弃理从文,调入国家语言文字工作委员会语言文字应用研究所工作。这是在我第一次弃理学文26 年之后的又一次改行,最后还是回到了语言学的队伍。这时我已经是47 岁的人了,斗转星移,人事沧桑,其中的甘苦有谁知道呢?
现在我已经是白发苍苍的68 岁的老人了,从1957 年我开始做计算语言学研究之梦到现在,我从事计算语言学研究已经整整五十年了。在这五十年的时间里,我国的计算语言学已经取得了很多成就,机器翻译、信息自动检索、信息自动提取等都已经投入了实用,有的达到了国际水平,这是令人欣慰的。我希望学习语言学的年轻学子注意这门新兴的语言学科,努力学好语文、数学和外语,练好基本功,为将来从事计算语言学的研究打好基础,我相信你们一定会为我国计算语言学的发展做出新的贡献。
注:转载请注明出处“我爱自然语言处理”:www.52nlp.cn
本文链接地址:https://www.52nlp.cn/i-and-computational-linguistics-three