资源

虽然知道大多数同学都有资料收藏癖,还是给大家准备一份自然语言处理学习资源大礼包,主要是之前陆陆续续分享的NLP学习资源,包括自然语言处理、深度学习、机器学习、数学相关的经典课程、书籍和学习笔记,这些资料基本上都是公开渠道可以获得的,整理到一起,方便NLP爱好者收藏把玩。当然,学习的前提依然是”学自然语言处理,其实更应该学好英语“

获取方法很简单,关注AINLP公众号,后台回复关键词:ALL4NLP,一键打包收藏NLP学习资源:

这些自然语言处理相关资源列表如下,欢迎收藏:

相关的资源的过往文章大致介绍如下,不限于下述文章:

斯坦福大学自然语言处理经典入门课程-Dan Jurafsky 和 Chris Manning 教授授课

哥伦比亚大学经典自然语言处理公开课,数学之美中盛赞的柯林斯(Michael Collins)教授授课

认真推荐一份深度学习笔记:简约而不简单

Andrew Ng 老师新推的通俗人工智能课程以及其他相关资料

那些值得推荐和收藏的线性代数学习资源

Philipp Koehn大神的神经网络机器翻译学习资料:NMT Book

凸优化及无约束最优化相关资料

斯坦福大学深度学习自然语言处理课程CS224N 2019 全20个视频分享

自然语言处理经典书籍《Speech and Language Processing》第三版最新版下载(含第二版)

强化学习圣经:《强化学习导论》第二版(附PDF下载)

新书下载 | 面向机器学习的数学(Mathematics for Machine Learning)

Springer面向公众开放正版电子书籍,附65本数学、编程、数据挖掘、数据科学、数据分析、机器学习、深度学习、人工智能相关书籍链接及打包下载

最后,欢迎关注AINLP,回复"all4nlp"获取:

=============================================Old 分割线======================================================

这里提供一些52nlp博客的一些系列文章以及收集的自然语言处理相关书籍及其他资源的下载,陆续整理中!如有不妥,我会做删除处理!

关注我们的公众号 AINLP,回复相关关键词获取:

1、关注AINLP公众号,后台回复 “文章、历史消息、历史、history、存档” 任一关键字获取历史文章存档消息。

2、回复“正态分布,rickjin, 正态分布前世今生, 正态分布文章, 正太分布, 正太, 正态”任一关键字获取Rickjin正态分布前世今生系列:

正态分布系列文章索引

3、回复“nlp, 自然语言处理,学习自然语言处理,学习nlp, 如何学习nlp,如何学习自然语言处理” 任一关键字获取文章:如何学习自然语言处理

4、回复"slp" 获取:斯坦福NLP书籍和课程网盘链接和密码

5、回复"slp3" 获取:自然语言处理综论英文版第三版及斯坦福NLP课程链接和密码

6、回复"ng" 获取:Andrew Ng老师课程相关资料链接和密码

7、回复"aic" 获取:AI Challenger 2018 文本挖掘类竞赛相关代码及解决方案汇总
博客版本持续更新,欢迎提供线索:https://www.52nlp.cn/?p=10998

8、回复"bert" 获取:BERT相关论文、文章和代码资源汇总
博客版本持续更新:https://www.52nlp.cn/?p=10870

9、回复"HMM" 获取:HMM学习最佳范例全文PDF
HMM学习最佳范例全文PDF文档及相关文章索引

10、回复"Hinton" 获取:面向机器学习的神经网络公开课视频及课件
Geoffrey Hinton 大神面向机器学习的神经网络公开课及相关视频资料

11、回复"NLTK" 获取: NLTK相关资料
Python自然语言处理工具NLTK学习导引及相关资料

12、回复"youhua"获取:优化相关资料
凸优化及无约束最优化相关资料

13、回复"xiandai"获取:线性代数相关资料
那些值得推荐和收藏的线性代数学习资源

14、回复"cs224n"获取:深度学习自然语言处理课程最新视频:
2019斯坦福CS224n深度学习自然语言处理课程视频和相关资料分享
斯坦福大学深度学习自然语言处理课程CS224N 2019 全20个视频分享

15、回复"kuakua"获取:夸夸语料库(500条)
为了夸夸聊天机器人,爬了一份夸夸语料库

16、回复"fenci"获取:中文分词相关资源
中文分词文章索引和分词数据资源分享

17、回复”tongjixuexi”获取:李航老师统计学习方法第一版PPT(清华大学深圳研究生院袁春老师精心制作)
李航老师《统计学习方法(第二版)》出版及统计学习方法第一版PPT课件下载

18、如何计算两个文档的相似度全文文档

一、书籍:
1、《自然语言处理综论》英文版第二版
2、《统计自然语言处理基础》英文版
3、《用Python进行自然语言处理》,NLTK配套书
4、《Learning Python第三版》,Python入门经典书籍,详细而不厌其烦
5、《自然语言处理中的模式识别》
6、《EM算法及其扩展》
7、《统计学习基础》
8、《自然语言理解》英文版(似乎只有前9章)
9、《Fundamentals of Speech Recognition》,质量不太好,不过第6章关于HMM的部分比较详细,作者之一便是Lawrence Rabiner;
10、概率统计经典入门书:《概率论及其应用》(英文版,威廉*费勒著)
第一卷  第二卷  DjVuLibre阅读器(阅读前两卷书需要)
11、一本利用Perl和Prolog进行自然语言处理的介绍书籍:《An Introduction to Language Processing with Perl and Prolog
12、国外机器学习书籍之:
1) "Programming Collective Intelligence",中文译名《集体智慧编程》,机器学习&数据挖掘领域"近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的"
2) "Machine Learning",机器学习领域无可争议的经典书籍,下载完毕将后缀改为pdf即可。豆瓣评论 by 王宁):老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能"新"到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。
3) “Introduction to Machine Learning
13、国外数据挖掘书籍之:
1) "Data.Mining.Concepts.and.Techniques.2nd",数据挖掘经典书籍 作者 : Jiawei Han/Micheline Kamber 出版社 : Morgan Kaufmann 评语 : 华裔科学家写的书,相当深入浅出。
2) Data Mining:Practical Machine Learning Tools and Techniques
3) Beautiful Data: The Stories Behind Elegant Data Solutions( Toby Segaran, Jeff Hammerbacher)
14、国外模式识别书籍之:
1)“Pattern Recognition
2)“Pattern Recongnition Technologies and Applications
3)“An Introduction to Pattern Recognition
4)“Introduction to Statistical Pattern Recognition
5)“Statistical Pattern Recognition 2nd Edition
6)“Supervised and Unsupervised Pattern Recognition
7)“Support Vector Machines for Pattern Classification
15、国外人工智能书籍之:
1)Artificial Intelligence: A Modern Approach (2nd Edition) 人工智能领域无争议的经典。
2)“Paradigms of Artificial Intelligence Programming: Case Studies in Common LISP
16、其他相关书籍:
1)Programming the Semantic Web,Toby Segaran , Colin Evans, Jamie Taylor
2)Learning.Python第四版,英文

二、课件:
1、哈工大刘挺老师的“统计自然语言处理”课件;
2、哈工大刘秉权老师的“自然语言处理”课件;
3、中科院计算所刘群老师的“计算语言学讲义"课件;
4、中科院自动化所宗成庆老师的“自然语言理解”课件;
5、北大常宝宝老师的“计算语言学”课件;
6、北大詹卫东老师的“中文信息处理基础”的课件及相关代码;
7、MIT Regina Barzilay教授的“自然语言处理”课件,52nlp上翻译了前5章;
8、MIT大牛Michael Collins的“Machine Learning Approaches for Natural Language Processing(面向自然语言处理的机器学习方法)”课件;
9、Michael Collins的“Machine Learning (机器学习)”课件;
10、SMT牛人Philipp Koehn “Advanced Natural Language Processing(高级自然语言处理)”课件;
11、Philipp Koehn “Empirical Methods in Natural Language Processing”课件;
12、Philipp Koehn“Machine Translation(机器翻译)”课件;

三、语言资源和开源工具:
1、Brown语料库:
a) XML格式的brown语料库,带词性标注;
b) 普通文本格式的brown语料库,带词性标注;
c) 合并并去除空行、行首空格,用于词性标注训练:browntest.zip
2、NLTK官方提供的语料库资源列表
3、OpenNLP上的开源自然语言处理工具列表
4、斯坦福大学自然语言处理组维护的“统计自然语言处理及基于语料库的计算语言学资源列表
5、LDC上免费的中文信息处理资源
6、中文分词相关工具:
1)Java版本的MMSEG:mmseg-v0.3.zip,作者为solol,详情可参见:《中文分词入门之篇外
2)张华平老师的ICTCLAS2010,该版本非商用免费一年,下载地址:
http://cid-51de2738d3ea0fdd.skydrive.live.com/self.aspx/.Public/ICTCLAS2010-packet-release.rar
7、热心读者“finallyliuyu”提供的一批新闻语料库,包括腾讯,新浪,网易,凤凰等,目前放在CSDN上:http://finallyliuyu.download.csdn.net/
另外finalllyliuyu在2010年9月又提供了一批文本文类语料,详情见:献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之二

四、文献:
1、ACL-IJCNLP 2009论文全集:
a) 大会论文Full Paper第一卷
b) 大会论文Full Paper第二卷
c) 大会论文Short Paper合集
d) ACL09之EMNLP-2009合集
e) ACL09 所有workshop论文合集

《资源》有75条评论
  1. 你好,我想问一下有没有关于hownet的一些介绍呢?我下载的一个工具,但是不知道怎么使用,网上的介绍资料也非常少,看到你介绍的这些东西,感觉你知识领域面非常广阔,所以想问下,如果你知道的话,可否告知?

    [回复]

    52nlp 回复:

    关于知网的使用,我不太清楚,你可以去知网的官方网站看看:
    http://www.keenage.com/

    [回复]

  2. 52nlp您好,非常感谢您上传的资料,对我来说十分珍贵,十分受用。
    但在我下载其中一本书的时候遇到了点问题,国外模式识别书籍之:1)“Pattern Recognition”。网页上提示“該文件已經被上傳用戶刪除或長時間沒有下載自動刪除。用戶無法繼續下載該文件!”,我想请教一下,还有什么其他办法能阅读到这本书吗,谢谢您。

    [回复]

  3. 追加自上条消息,14.国外模式识别书籍之:2)“Pattern Recongnition Technologies and Applications”也遇到了同样的情况,如何解决,请大牛指点,谢谢。

    [回复]

    52nlp 回复:

    谢谢提醒!本来想将这两本书通过邮箱发给你,不过有些大,我明天找个机会重新传上去,晚上这里的网络太慢了。

    [回复]

    52nlp 回复:

    已经更新链接了,再试试吧!

    [回复]

    蔡传港 回复:

    还是不行,能否把下面的书发到我邮箱
    hzauccg@126.com

    1)“Pattern Recognition”
     2)“Pattern Recongnition Technologies and Applications”
    3)“An Introduction to Pattern Recognition”
     4)“Introduction to Statistical Pattern Recognition”
     5)“Statistical Pattern Recognition 2nd Edition”
     6)“Supervised and Unsupervised Pattern Recognition”
     7)“Support Vector Machines for Pattern Classification”

    [回复]

    52nlp 回复:

    晚上回去重新上传到爱问,稍等一下吧。

    52nlp 回复:

    抱歉 ,昨晚上传爱问时一直不成功,可能与几个文件大小有关(比较大,几十M)。关于模式识别的书籍,建议你重点关注prml吧,经典的书籍,可以在这里下载:
    http://ishare.iask.sina.com.cn/f/12622825.html

  4. 您好,我也是爱好者,看到您的回复中提到您有GIZA++.Win32.BlueGene.rar,请您发给我一份好么,麻烦了。

    [回复]

    52nlp 回复:

    已经发到你邮箱了。

    [回复]

    Grace 回复:

    我想要一份儿GIZA++.Win32.BlueGene.rar,麻烦你发给我可以吗?谢谢!

    [回复]

    skywelkin 回复:

    你好,你能把GIZA++.Win32.BlueGene.rar也发给我一份吗?我急用,麻烦你了~

  5. 请问有哪位大牛有前几届SIGHAN bakeoff中提供的几大公共语料库(PK,CITYU,CTB,MSRA,AS)吗?我自己改进了一个中文分词方法,想看下效果如何,用于毕业论文。希望好心人能够提供数据源,就是那些曾经被用于测评的训练语料和测试语料,主要是为了实验并进行结果对比分析呢。谢谢各位了,请好心人发到我的邮箱yuxin20604@163.com

    [回复]

    袁莺 回复:

    在这篇博文里有详细说明中文分词入门之资源

    [回复]

  6. 你好,请问链接是否都失效了呢?都打不开...

    [回复]

    52nlp 回复:

    我随机试了一个,还是可以的!

    [回复]

    nupta 回复:

    谢谢啊,今天可以下载了~~最近在看Python自然语言处理

    [回复]

  7. 博主您好,我也是即将读研,想做下NLP方面的,您的博客对我帮助很大
    我挑的第一本书就是按照您的推荐列表内选择的
    我听说 斯坦福大学有个 自然语言处理 公开课 视频
    因为我是刚开始看这方面的,所以想问下博主是否有这个视频的下载
    谢谢

    [回复]

    52nlp 回复:

    不好意思,没有这个视频的下载,不过你可以在线观看吧:https://www.52nlp.cn/%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5%AD%A6-%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86-%E6%8E%88%E8%AF%BE%E8%A7%86%E9%A2%91

    [回复]

    penny 回复:

    我发现博主好善良啊!

    [回复]

    52nlp 回复:

    o(∩_∩)o

  8. 您好,请问哪里可以找到python写的日语或法语的词法分析工具呢?
    谢谢您了~

    [回复]

    52nlp 回复:

    关于日文的词法分析器,中文分词方面的可以看看这篇介绍:http://www.newsmth.net/bbscon.php?bid=1018&id=6417
    核心是用C++实现的,有python的接口;纯粹用python事项的词法分析器我还没有见过,抱歉;法语方面的我不清楚。

    [回复]

    龙之白云 回复:

    谢谢您了

    [回复]

  9. 没找到页面的search box 博主弄一个吧 找东西方便点儿

    [回复]

    52nlp 回复:

    谢谢提醒,已经加了!其他评论不一一回复了,也经常看你的博客,多谢分享!

    [回复]

  10. xun6网盘挂了啊已经....翻墙能上,但是下载过程总中断,能否重新上传至别的网盘?

    [回复]

  11. 大陆xun6已经上不去了。。。通过其他方式上的去但东西下到一半总断,能否传到别的网盘上?

    [回复]

    52nlp 回复:

    抱歉,我尽快重新找个地方吧,稍等一段时间。

    [回复]

    kirakirasakuya 回复:

    lz可以考虑开个dropbox共享。

    [回复]

    52nlp 回复:

    好注意,我看一下能不能弄一下,但是需要等待一下,最近实在太忙了。

  12. 你好,《用Python进行自然语言处理》,NLTK配套书
    怎么不能下载啊?方便的话发我邮箱呗!谢谢comey.ko@163.com

    [回复]

    52nlp 回复:

    之前的链接出问题了,刚才试了一下新浪爱问,还可以,换到这个链接了,可以试试:http://ishare.iask.sina.com.cn/f/22442315.html

    [回复]

  13. 你好,我也是做NLP的,之前也一直关注我爱自然语言处理,也是今天才发现资源这个好东西,很多优秀的资源啊!
    我现在在做词对齐的工作,看到您也有GIZA++.Win32.BlueGene.rar,请发我一份,万分谢谢!

    [回复]

    52nlp 回复:

    放到新浪微盘了,点下面链接下载吧:http://vdisk.weibo.com/s/3qN_s

    [回复]

    狄颖 回复:

    谢谢~东西很好啊!~~

    [回复]

  14. 很喜欢您的文章 感谢您的贡献。
    我是刚要学习NLP的学生, 请问您推荐用什么语言学? perl ? python? java? 开源工具里java好像很多啊

    [回复]

    52nlp 回复:

    建议python + c/c++

    [回复]

  15. 你好,感谢分享!但是从《自然语言处理中的模式识别》开始的好几本书怎么都链接至114导航了?没法下载呀。

    [回复]

    52nlp 回复:

    之前上传的网盘挂了,只转移了部分到新浪爱问上。

    [回复]

    ark 回复:

    那能否把剩下的几本也转移一下,多谢了!
    或者能否把
    "5、《自然语言处理中的模式识别》
    6、《EM算法及其扩展》
    7、《统计学习基础》"
    这三本书发到我的邮箱arksor@163.com,不胜感激!

    [回复]

    52nlp 回复:

    可以,晚上回家试一下,不过之前上传了几本书到爱问都不成功,我再试试。

    52nlp 回复:

    抱歉,刚把《统计学基础》上传到微盘了,可以在这里下载:
    http://vdisk.weibo.com/s/8tSeC

  16. 老师,我现在初学NLP,想问下中文和英文的断句工具,用得多的有哪几个?急切,谢谢!

    [回复]

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注