最近迷上了《明朝那些事儿》,周四从当当网收到寄过来的三、四、五册之后,本计划半个月的精神食粮就在这三天完成了,这也差点耽误了“我爱自然语言处理”的周末任务。不过还好,读《明朝那些事儿》的时候,王守仁(阳明)先生的“知行合一”给我留下了深刻的印象,且下意识的联想到了自然语言处理,于是就准备在这里瞎侃侃自己的感受了!
  “知行合一”是王阳明先生“心学”的精华和核心,是他老人家花了几十年吃了无数苦悟出来的,说深奥很深奥。我没有这样的悟性,但是当把“知行合一”与自然语言处理联系起来的时刻,第一个想起来的便是为什么喜欢自然语言处理?
  高中很喜欢数学,自以为是学数学的料,周围的人也都这么认为,但是当我在大学读数学系的时候,发现自己很不喜欢或者不适应枯燥的理论证明,于是在读研时放弃了理科选择了工科。这大概是一种变相的逃避吧,不过幸运的是,读研时导师认为我本科读数学,就理所当然的让我做起了统计机器翻译的相关项目,于是就这样我进入了自然语言处理这个领域,确切的说,是统计自然语言处理,因为她,根本就离不开数学特别是统计理论的支持,而我,这几年也没有能离开数学,反而愈发明白学习数学的重要性了。但是统计自然语言又全不是数学,还要一定的工程能力去实现一些paper上的理论或者自己的想法,我很快的就迷上了这个领域,并且开始乐此不疲起来。而兴趣带来的源源不断的驱动力也让我知道了自己未来的方向,我相信,选择自然语言处理,是最好的选择,对于我个人来说,她既能让我掌握一门理论,又能让我把这样的理论付诸实践,达到理论与实践(或者工程)能力的一种平衡,这大概就是自然语言处理中“知行合一”的最高境界了!而我从未达到,仍在追求!
  如果能达到这个“知行合一”的境界,无论在哪个领域,似乎都可以成为一位绝顶高手,譬如王阳明先生,在未看《明朝那些事》之前,我只知道他是一位大学问家,而看完之后,才知道他老人家还能带兵打仗,而且立了赫赫战功,是绝对的文武双全、德才兼备的“圣贤”!请注意,是圣贤,是历史上数的出来的几位圣贤!
  而在自然语言处理领域,也有些人达到了“知行合一”的境界,譬如Franz Josef Och,在统计机器翻译领域,绝对算得上是一位绝顶高手,而他之所以能成为这样的绝顶高手,不仅仅因为他在“知”(理论)方面的功力了得(将判别模型引入机器翻译,从根本上取代noisy-channel模型而成为目前统计机器翻译的标准模型框架),还因为他“行”(实践、工程)能力也非比寻常(开源的Giza++、YASMET及mkcls都出自Och本人之手,特别是Giza++,其对于统计机器翻译近十年来的发展有着举足轻重的影响)!“统计机器翻译第一人”的美誉绝非浪得虚名,这方面的资料,有兴趣的读者可以参考《统计机器翻译英雄谱一:Franz Josef Och》。
  对于学习自然语言处理,如果从“知行合一”的角度来看,《自然语言处理综论》、《统计自然语言处理基础》等多数的自然语言处理书籍主要是从“知”的角度讲述自然语言处理理论的,而与nltk工具包相关的《Natural Language Processing with Python》,则是近年来难得的从“行”的角度入手的自然语言处理书籍,而对于选择这些书来进行学习的读者来说,要做到“知行合一”,最好能几本书结合起来看,这样就不会在学习理论书籍时仅仅停留于理论,而在学习实践书籍时知其然而不知其所以然!
  这样的例子还有很多,譬如数不胜数的paper多在“知”,而众多的自然语言处理开源工具又重于“行”!剩下的,欢迎大家补充和探讨!

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:https://www.52nlp.cn/the-knowledge-and-action-in-natural-language-processing

作者 52nlp

《“知行合一”与自然语言处理》有4条评论
  1. 合一才能激发人最大的兴趣,但知行往往不能同步。

    [回复]

    admin 回复:

    不能同步也许就是“知易行难”或者“知难行易”了!

    [回复]

  2. 多谢分享如此多的和NLP相关的信息。知行合一。NLP领域在计算机各领域中确实享有这样的特权呢。

    [回复]

    52nlp 回复:

    谢谢!

    [回复]

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注