机器翻译的八大挑战

作者52nlp

3 月 10, 2009 #EuroMatrix, #Hans Uszkopeit, #RBMT, #SMT, #机器翻译, #统计机器翻译

　　偶然读到EuroMatrix项目联络人Hans Uszkopeit教授（德国萨尔兰大学计算语言学教授，德国人工智能研究中心(DFKI）主任及DFKI语言技术实验室首席研究员）09年一月份的一个报告，上面提到机器翻译八个主要研究挑战（Main Research Challenges），觉得很有启发性，这里引述如下：
　　✩ 混合翻译方法（hybrid translation methods）；
　　✩ 现有语言资源的开发利用（exploitation of existing linguistic resources）；
　　✩ 在机器翻译(MT)中利用Web2.0方法（utilization of Web 2.0 approaches for MT）；
　　✩ 在翻译中引入语义技术（bringing semantics into translation）；
　　✩ 实践驱动的评测标准（practice-driven evaluation standards）；
　　✩ 寻找和使用其他数据（find and utilize additional data）；
　　✩ “自信”和“自我批判”的机器翻译（self-confident and self-critical MT）；
　　✩ 在“语言智能”工作流程中嵌入机器翻译（embedding MT in language-smart workflows）；
　　这里，我只对第一点做个补充说明，其他几个方面大家可以探讨一下。Hans Uszkopeit教授提到目前从欧洲语料库基础上的机器翻译评测结果来看：基于统计的系统(SMT)在翻译结果上往往能有较好的词汇选择（lexical choice），但是经常选择错误的语法结构和得不到完整的译文；而基于规则的系统(RBMT)很难解决歧义问题及选择合适的词汇和短语，但是却能得到在语法结构、词汇顺序上比较完整的译文。因此，结合这二者优点的系统应该是一个比较好的研究方向。
　　关于当前机器翻译所面临的挑战，我觉得一个很不错的话题，大家可以在这里各抒己见，为今后的研究提供一个好的思路。

注：原创文章，转载请注明出处“我爱自然语言处理”：www.52nlp.cn

本文链接地址：
https://www.52nlp.cn/the-eight-major-challenges-of-machine-translation/

作者 52nlp

AINLP 人工智能机器翻译翻译模型自然语言处理

《机器翻译的八大挑战》有4条评论

一个自然语言处理爱好者说道：

2009年03月10号 19:20

难点：怎么把规则融入统计体系中去

[回复]
admin 回复:
10 3 月, 2009 at 22:21
同意这个观点，这也是目前的一个热点和研究方向，在SMT中融入更多的语言知识应该是大势所趋，Hans Uszkopeit教授也提到了：Since statistical and rule-based MT make different errors,we should try to combine them or alternatively enrich statistical MT by more linguistic structure。

[回复]
Ana说道：

2009年03月13号 05:17

Hans Uszkopeit教授虽然头衔这么多，其实已经不怎么干活了

[回复]
admin 回复:
13 3 月, 2009 at 08:17
这个级别国内外基本都差不多吧，真正还在一线的没几个，能在大方向上指导一下就不错了。

[回复]

机器翻译的八大挑战

作者52nlp

作者 52nlp

相关文章

文言文白话文互转：文言文转白话文（现代文），白话文（现代文）转文言文

哥伦比亚大学经典自然语言处理公开课，数学之美中盛赞的柯林斯（Michael Collins）教授授课

中文自然语言处理相关的开放任务，数据集, 以及当前最佳结果

《机器翻译的八大挑战》有4条评论

发表回复

You missed

基于飞桨框架3.0单机部署 DeepSeek-R1-Distill-Qwen-14B 实战

Qwen2.5-Omni：迈向通用多模态AI的里程碑——解读首个支持实时多模态输入与输出的统一模型

Google DeepMind 发布多模态轻量级开源模型 Gemma 3：性能与功能全面升级

DeepSeek-V3解析及技术报告英中报告对照版

作者52nlp

相关文章：

作者 52nlp

相关文章

《机器翻译的八大挑战》有4条评论

发表回复

You missed