偶然读到EuroMatrix项目联络人Hans Uszkopeit教授(德国萨尔兰大学计算语言学教授,德国人工智能研究中心(DFKI)主任及DFKI语言技术实验室首席研究员)09年一月份的一个报告,上面提到机器翻译八个主要研究挑战(Main Research Challenges),觉得很有启发性,这里引述如下:
✩ 混合翻译方法(hybrid translation methods);
✩ 现有语言资源的开发利用(exploitation of existing linguistic resources);
✩ 在机器翻译(MT)中利用Web2.0方法(utilization of Web 2.0 approaches for MT);
✩ 在翻译中引入语义技术(bringing semantics into translation);
✩ 实践驱动的评测标准(practice-driven evaluation standards);
✩ 寻找和使用其他数据(find and utilize additional data);
✩ “自信”和“自我批判”的机器翻译(self-confident and self-critical MT);
✩ 在“语言智能”工作流程中嵌入机器翻译(embedding MT in language-smart workflows);
这里,我只对第一点做个补充说明,其他几个方面大家可以探讨一下。Hans Uszkopeit教授提到目前从欧洲语料库基础上的机器翻译评测结果来看:基于统计的系统(SMT)在翻译结果上往往能有较好的词汇选择(lexical choice),但是经常选择错误的语法结构和得不到完整的译文;而基于规则的系统(RBMT)很难解决歧义问题及选择合适的词汇和短语,但是却能得到在语法结构、词汇顺序上比较完整的译文。因此,结合这二者优点的系统应该是一个比较好的研究方向。
关于当前机器翻译所面临的挑战,我觉得一个很不错的话题,大家可以在这里各抒己见,为今后的研究提供一个好的思路。
注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn
本文链接地址:
https://www.52nlp.cn/the-eight-major-challenges-of-machine-translation/
难点:怎么把规则融入统计体系中去
[回复]
admin 回复:
10 3 月, 2009 at 22:21
同意这个观点,这也是目前的一个热点和研究方向,在SMT中融入更多的语言知识应该是大势所趋,Hans Uszkopeit教授也提到了:Since statistical and rule-based MT make different errors,we should try to combine them or alternatively enrich statistical MT by more linguistic structure。
[回复]
Hans Uszkopeit教授虽然头衔这么多,其实已经不怎么干活了
[回复]
admin 回复:
13 3 月, 2009 at 08:17
这个级别国内外基本都差不多吧,真正还在一线的没几个,能在大方向上指导一下就不错了。
[回复]