偶然读到EuroMatrix项目联络人Hans Uszkopeit教授(德国萨尔兰大学计算语言学教授,德国人工智能研究中心(DFKI)主任及DFKI语言技术实验室首席研究员)09年一月份的一个报告,上面提到机器翻译八个主要研究挑战(Main Research Challenges),觉得很有启发性,这里引述如下
  ✩ 混合翻译方法(hybrid translation methods);
  ✩ 现有语言资源的开发利用(exploitation of existing linguistic resources);
  ✩ 在机器翻译(MT)中利用Web2.0方法(utilization of Web 2.0 approaches for MT);
  ✩ 在翻译中引入语义技术(bringing semantics into translation);
  ✩ 实践驱动的评测标准(practice-driven evaluation standards);
  ✩ 寻找和使用其他数据(find and utilize additional data);
  ✩ “自信”和“自我批判”的机器翻译(self-confident and self-critical MT);
  ✩ 在“语言智能”工作流程中嵌入机器翻译(embedding MT in language-smart workflows);
  这里,我只对第一点做个补充说明,其他几个方面大家可以探讨一下。Hans Uszkopeit教授提到目前从欧洲语料库基础上的机器翻译评测结果来看:基于统计的系统(SMT)在翻译结果上往往能有较好的词汇选择(lexical choice),但是经常选择错误的语法结构和得不到完整的译文;而基于规则的系统(RBMT)很难解决歧义问题及选择合适的词汇和短语,但是却能得到在语法结构、词汇顺序上比较完整的译文。因此,结合这二者优点的系统应该是一个比较好的研究方向。
  关于当前机器翻译所面临的挑战,我觉得一个很不错的话题,大家可以在这里各抒己见,为今后的研究提供一个好的思路。

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:
https://www.52nlp.cn/the-eight-major-challenges-of-machine-translation/

作者 52nlp

《机器翻译的八大挑战》有4条评论
  1. 难点:怎么把规则融入统计体系中去

    [回复]

    admin 回复:

    同意这个观点,这也是目前的一个热点和研究方向,在SMT中融入更多的语言知识应该是大势所趋,Hans Uszkopeit教授也提到了:Since statistical and rule-based MT make different errors,we should try to combine them or alternatively enrich statistical MT by more linguistic structure。

    [回复]

  2. Hans Uszkopeit教授虽然头衔这么多,其实已经不怎么干活了

    [回复]

    admin 回复:

    这个级别国内外基本都差不多吧,真正还在一线的没几个,能在大方向上指导一下就不错了。

    [回复]

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注