NLTK配套书《用Python进行自然语言处理》(Natural Language Processing with Python)已经出版好几年了,但是国内一直没有翻译的中文版,虽然读英文原版是最好的选择,但是对于多数读者,如果有中文版,一定是不错的。下午在微博上看到陈涛sean 同学提供了NLTK配套书的中译本下载,就追问了一下,之后译者和我私信联系,并交流了一下,才发现是作者无偿翻译的,并且没有出版计划的。翻译是个很苦的差事,向译者致敬,另外译者说里面有一些错误,希望能得到nlper们的指正,大家一起来修正这个珍贵的NLTK中文版吧。另外译者希望在“52nlp”上做个推荐,这事是造福nlper的好事,我已经在“资源”里更新了本书的链接,以下是书的下载地址:

PYTHON自然语言处理中文翻译-NLTK Natural Language Processing with Python 中文版

  翻看了一下翻译版,且不说翻译质量,单看排版就让人觉得向一本正式的翻译书籍,说明译者是非常有心的。以下是从翻译版中摘录的“译者的话”:

  作为一个自然语言处理的初学者,看书看到“训练模型”,这模型那模型的,一直不知
道模型究竟是什么东西。看了这本书,从预处理数据到提取特征集,训练模型,测试修改等,一步一步实际操作了之后,才对模型一词有了直观的认识(算法的中间结果,存储在计算机中的一个个pkl 文件,测试的时候直接用,前面计算过的就省了)。以后听人谈“模型”的时候也有了底气。当然,模型还有很多其他含义。还有动词的“配价”、各种搭配、客观逻辑对根据文法生成的句子的约束如何实现?不上机动手做做,很难真正领悟。

  自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。从这个角度
讲,本书是目前世界上最好的自然语言处理实践教程。初学者若在看过理论之后能精读本书,必定会有获益。这也是翻译本书的目的之一。

  本书是译者课余英文翻译练习,抛砖引玉。书中存在很多问题,尤其是第10 章命题逻
辑和一阶逻辑推理在自然语言处理中的应用。希望大家多多指教。可以在微博上找到我(w
eibo.com/chentao1999)。虽然读中文翻译速度更快,但直接读原文更能了解作者的本意。

  原书作者在书的最后列出了迫切需要帮助改进的条目,对翻译本书建议使用目标语言的
例子,目前本书还只能照搬英文的例子,希望有志愿者能加入本书的中文化进程中,为中文
自然语言处理做出贡献。

  将本书作学习和研究之用,欢迎传播、复制、修改。山寨产品请留下译者姓名和微博。
用于商业目的,请与原书版权所有者联系,译者不承担由此产生的责任。

翻译:陈涛(weibo.com/chentao1999)

2012 年4 月7 日

   最后希望大家在读这本书的过程中,记录一下需要勘误的地方,可以在“评论”中给出勘误建议,一起来修正这本书。谢谢!

作者 52nlp

《推荐《用Python进行自然语言处理》中文翻译-NLTK配套书》有45条评论
  1. 非常感谢译者~~
    提个小小的校正建议..刚刚看到第17页:
    “它是一个 string 对象,包含用来把字 符串分割成词的 split()方法(或叫操作、函数)。我们在对象名称后面写句号(点)再写方 法名称就可以调用对象的一个方法,即 line.splie()。"
    最后的splie是不是应该是split呢?..

    [回复]

    52nlp 回复:

    谢谢,应该是split,最快的勘误者!

    [回复]

  2. 感谢。泪奔~中
    能否把中英文的术语对照表公布,就更加完美了。
    我注意到第9.1节有“术语”的小节,不知道为何其他章节没有。

    [回复]

  3. 看中文的好处是 ?不解?

    [回复]

    52nlp 回复:

    个人认为,能看英文尽量看英文,但是还是有很多读者有中文版需求的,要照顾多数。

    [回复]

    goog 回复:

    hi! 随便问下,我不是数学专业的,请问有什么crf资料可以让我看懂其原理啊 thx!

    [回复]

    52nlp 回复:

    建议看看"pgm"课程。

  4. @goog
    可能这篇paper对你理解crf比较有帮助,我当初是参考的这篇paper
    http://www.scai.fraunhofer.de/fileadmin/images/bio/data_mining/paper/crf_klinger_tomanek.pdf

    [回复]

    Pasenture 回复:

    感动到哭。。一直在看crf。。对于一个基础入门的小博来说看了一些paper,表示能看懂大概理论,凡是涉及到数学公式或者类似的东西立马就跪了!求大神给点建议。。

    [回复]

  5. 谢谢译者!谢谢分享!
    刚刚开始读,遇到个问题不知道有什么相关的论坛可以提问,所以冒昧来这里留个言:
    我在试运行Babelizer的时候显示错误:
    BabelfishChangedError: Can't recognize translated string.
    在nltk的网上也没有发现相应的排错说明,恳请各位帮忙~谢谢!

    [回复]

    52nlp 回复:

    建议直接问 @陈涛sean 同学。

    [回复]

  6. 楼主,有个问题,我安装nltk_data时,总有两个包安装不成功,我甚至自己下载了,也同样不行,这两个包是:propbank.zip和nombank.1.0.zip。同时,还有一个问题,在输入text3.generate(),出现Building ngram index...AssertionError:的错误信息,这是怎么回事呀

    [回复]

    52nlp 回复:

    抱歉,我大概三年前玩过NLTK,已经很久没碰了,你的问题,不太清楚,建议你直接在微博上问 @陈涛sean 同学吧。

    [回复]

  7. [...] 2、引入NLTK NTLK是著名的Python自然语言处理工具包,但是主要针对的是英文处理,不过课程图谱目前处理的课程数据主要是英文,因此也足够了。NLTK配套有文档,有语料库,有书籍,甚至国内有同学无私的翻译了这本书: 用Python进行自然语言处理,有时候不得不感慨:做英文自然语言处理的同学真幸福。 [...]

  8. 致敬,我是一开始想找一个Linux下语音处理软件,查到了HTK;不知HTK为何,查到了HMM;不知什么是隐式马尔科夫模型,查到了wiki,百度空间;百度空间介绍的内容据说链接自这里,最终才来到这个神秘的博客群!很酷的博客,内容真的不错,很多惊喜,想学习人工智能,偏于应用的,不知有什么推荐的方向或指导?

    [回复]

    52nlp 回复:

    这个博客不神秘,呵呵。自然语言处理就是一个很偏应用的方向,当然机器人也是激动人心的方向。

    [回复]

  9. 想学习下语音识别,并能够自己做个简单的应用,给自己用下。陈涛真牛,下载了这个文档,感谢译者的无私奉献。

    [回复]

  10. 博主~~~ 问个问题,输入一个句子:
    I like swim。
    输出 其中可能的语法错误如 swim -> swimming

    能否给点思路
    谢谢

    [回复]

    52nlp 回复:

    抱歉,这个不是很清楚,你可以搜一下国外的grammar checker看看

    [回复]

  11. 我看连接取消了。谁能发一份‘《用Python进行自然语言处理》中文翻译-NLTK配套书’到我的邮箱wenhong1984@126.com。先谢过了。

    [回复]

  12. 谢谢分享,正好要学nltk,非常感谢!

    [回复]

    咸鱼 回复:

    免费领了 译者的资源,谢谢了

    [回复]

  13. 百度云链接失效了,有没有好心人重新发一下呢

    [回复]

    52nlp 回复:

    这个版本译者应该是重新校正翻译出版了,直接去买一本吧,中文书不贵,另外正式版应该fix了很多小问题。

    [回复]

  14. 你好 这本书中文版链接失效啦 可以重新分享一下嘛 多谢啦

    [回复]

    52nlp 回复:

    关注“AINLP”公众号,回复"nltk"获取

    [回复]

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注