本文选自《中文信息学报》09年第6期中科院计算所米海涛,赵红梅,刘群老师的《第十二届机器翻译峰会和NIST2009 机器翻译评测研讨会简介》,将分为两部分分别介绍第十二届机器翻译峰会和NIST2009机器翻译评测研讨会。
第十二届机器翻译峰会和NIST2009 机器翻译评测研讨会简介
作者:米海涛,赵红梅,刘群
今年第十二届机器翻译峰会(MT Summit XII)和NIST2009 机器翻译评测研讨会(NIST Open MT 2009 Evaluation Workshop) 这两个会议在风景优美的加拿大首府渥太华举行,时间分别为: 8 月26 日到30 日、8 月31 日到9 月1 日。作为参会者,我们给大家简要介绍一下这两个会议的大致情况,希望与读者分享我们的体会和感受。
第十二届机器翻译峰会:
MT Summit (机器翻译峰会) 在机器翻译领域有较大的影响力,它历史较长,每两年举行一次,今年已经是第十二届。该会议不仅关注机器翻译研究,而且也关注机器翻译的应用,因此每次参会者中除了有机器翻译研究人员外,还有相当多的政府部门与商业机构的人员。机器翻译峰会分别由亚洲机器翻译协会(AAMT , the Asia2Pacific Association for Machine Translation ) 、欧洲机器翻译协会( EAMT) 、美洲机器翻译协会(AMTA ,the Association for Machine Translation in the Americas) 轮流举办。今年的MT Summit XII 会议由国际机器翻译协会( IAMT ,the International Association for Machine Translation ) 及美洲机器翻译协会(AMTA )共同举办。
今年的机器翻译峰会从8 月26 日开始到8 月 30 日结束,为期五天,共有300 人参加了这个会议, 他们有的是机器翻译国际性研究开发机构的科学家和工程开发人员,有的是政府和商业部门的机器翻译用户。会议活动内容很丰富,旨在: 让来自研究、政府、商业部门的与会者借助专家之力,共同探讨怎样利用机器翻译技术来克服语言障碍和数字化鸿沟。
我们的总体感觉是: 机器翻译峰会在关注机器翻译研究的同时,更加侧重于关注机器翻译的实际应用,更加贴近机器翻译用户。除了机器翻译产品外,研发人员还带来了其他的语言处理工具在这个会上进行展示。
这届机器翻译峰会为期五天的会议主要包括以下几部分内容:
1) 机器翻译研究;
2) 政府和商业部门的机器翻译应用;
3) 关于翻译人员培训和翻译工具使用技术;
4) 技术展示: 包括机译系统以及结合机译技术的应用软件的展示;
5) 与会议内容相关的专题知识讲座(Tutorials) 。
会议第一天安排了专题知识讲座,而随后的27 、28 、29 三天是主会时间,27 日上午全体人员济济一堂,聆听了IAMT 主席Laurie Gerber 的欢迎致辞以及会议概要。上午的报告中比较精彩的有来自Translated. com 的首席执行官Marco Trombetti 所作的“Getting a share of the human translation market with the world’s largest translation memory”,介绍了一个网站是如何通过共享翻译记忆的方式运营的,让人很受启发。另外,本次会议的程序主席之一Pierre Isabelle 先生针对机器翻译目前的研究现况作了题为“MT : The current research landscape”的回顾性报告,有趣的是,他特别提到由于国际上对汉英机器翻译研究的关注,使得越来越多的中国学者投入到这一研究领域中。上午的会议中,来自政府和商业部门的用户非常活跃,提问很积极,讨论也比较热烈。用户提问所站的角度经常是与研究人员明显不同,有些问题在我们研究者看来,初听上去似乎有些幼稚,细想起来又确实是机器翻译用户在使用中所遇到、却往往被研究者所忽略的实际问题,很值得我们深入思考。例如在政府用户报告中,有一篇报告的题目就是“如何读懂一篇机器翻译的文本( How to Read a Machine2Translated Text ) ”,让我们这些研究人员不禁有点哭笑不得,又有点汗颜,如果我们的系统翻译质量能更好一些,也许就不需要这位用户来做这种研究了。这从一个侧面反映了机器翻译确实已经在很多场合有了非常具体的应用,也让人体会到MT Summit 会议与ACL 这样的纯学术会议明显不同之处。
从下午开始研讨会分设机器翻译研究、政府用户和商业用户三个分会场。我们参加的是机器翻译研究分会场,本届机器翻译峰会共收录了正式研究论文48 篇,张贴论文27 篇,此次会议口头报告共有21 场,其中有计算技术研究所赵红梅老师等撰写的论文“Introduction to China’s CWMT2008 Machine Translation Evaluation”报告,该报告向与会者简明扼要地介绍了第四届全国机器翻译研讨会(CWMT2008) 评测的情况,使得国际上机器翻译的同行们对中国的机器翻译评
测有了更多的了解。
政府用户和商业用户两个分会场也很有意思,这里有很多政府用户或者商业用户的需求分析、使用报告、经验交流、教育培训等等方面的内容,非常丰富多彩,反映了国际上机器翻译应用方方面面的问题,很值得深入去研究和思考。可惜我们分身无术,没有太多去关注这些报告。
除了主会以外,本届峰会还设有技术展示( Technology showcase) 以及专题讨论会(Workshop) 。
为期半天的技术展示的参展单位包括: Microsoft、Systran 、AAI Group & Advanced Computing Training School 、C2DAC、Language Weaver、Basic Basis Technology 等多家著名企业,他们展示了各自的机器翻译应用系统和其他自然语言处理软件。参加展示的公司虽然不算很多,不过展示的内容都非常精彩,很有意思。
专题讨论会共分7 场,其中机器翻译峰会第三届专利翻译研讨会( 3rd Workshop on Patent Translation) 吸引了我们更多的注意。该讨论会还邀请了来自中国国家知识产权局的王丹作了题为“SIPO’s Effort s On Improving Quality of Chinese-English Patent Machine Translation Service”的报告,介绍了知识产权局在提高汉英机器翻译质量方面所做的工作。随着机器翻译研究和技术的不断发展,机器翻译在专业翻译方面的优势日渐凸显,专利翻译是机器翻译技术应用的一个非常好的突破点,不论在欧洲、日本,还是中国,专利机器翻译的市场都是被一致看好的。
本届机器翻译峰会确定了下一届机器翻译峰会(MT summit XIII) 将于2011 年在中国厦门召开, 该峰会的主办方是亚太机器翻译协会(AAMT) ,承办方是厦门大学。
注:转载请注明出处“我爱自然语言处理”:www.52nlp.cn
本文链接地址:https://www.52nlp.cn/第十二届机器翻译峰会和nist2009机器翻译评测简介1
本人新手,不知道在这里留言合不合适
我想问向参加类似会议的高校索取会议资料是否合适。
比如我想得到TREC的training datasets,而我查了一下02年国内参加的只有中科大和复旦,那我发邮件向他们索取可行么?
[回复]
52nlp 回复:
15 4 月, 2010 at 20:20
可以试试,不过我估计文献之类的资料应该可以,但是数据集不一定,某些时候是有版权限制的。
[回复]