这第一板砖,就谈谈大家可能感兴趣的讨论题目吧。
我接触NLP的时间很短,在最初的几年里,兴趣也不浓厚,只是被动的去听课,听听报告(现在想起来错过了很多牛人的报告)。应该是我的导师不厌其烦的鼓励,还有当时的新室友(samcd)让我有了一些兴趣去尝试深入了解一些NLP问题。
随后就在水木nlp版和52nlp出没,到现在已经有挺长一段时间了,从开始看大家讨论,到跟着掺和,学到了不少东西,也纠正了很多错误的概念,受益匪浅!总体上感觉有一些问题是比较引人注意的,经常引发讨论。 希望我们能像52nlp建议的那样, 充分发挥自己的特长,在自己关注的,或者工作的领域上引导一些专题讨论,由浅入深,进而汇总成一组对更多nlpers(从入门到进阶)都有帮助的资源。
希望大家积极揭发身边的领域内“知名人士” 来主持感兴趣的专题:-)
0,宏观介绍NLP研究趋势(符号规则,统计学习,等等)—-这个需要大牛来做。。。
1, 有关自然语言处理的一些基本问题, 同时也是经典问题,尤其以不同语言的预处理(哪怕是英语,细问起来,你会发现不同人对不同任务的预处理习惯差别还挺大, tokenization? lemmatizatioin? ), 中文分词,POS标注,computing word similarity, WordNet 和语言模型(LM). (谈这些问题就不可避免地会谈及一些经典模型,从规则到统计,我想可以穿插进行,现在流行的ML paper不是经常拿pos-tagger等小任务来展示自己嘛)
2, 一些NLP的综合应用,从经典的自动语音识别(ASR),语音合成(TTS),到语义分析(semantics,例如,语义消歧(WSD),语义表示 (semantic space),semantic role labelling),句法分析(各种语法:PCFG, HPSG,甚至CCG, TAG, QG)。我们不可能找个人出来精通所有这些,但大家都贡献自己专长的某一部分的经验,综合起来就会非常漂亮了(欢迎大家互相揭发)。
3,面向实际的深层次综合应用。这个就不用列举了吧,大家都是各方面的行家。从Natural Language Generation, 机器翻译(MT),自动文本摘要(summarization, text2text compression),情感分类(sentiment analysis),对话系统(dialogue),问答系统(QA),推荐系统,基于信息抽取(IE),信息检索(IR)的一大类需求(Keyword Extraction , Relation Extraction, Text Representation, Text Classification)
4,一些经典的模型(各种机器学习模型等等),方法(bayesian方法--这个我来揭发PCA),这个52nlp已经做了大量的工作了:)
5,一些资源,工具的介绍,使用心得。WordNet, Penn TreeBank,(常用语言资源),机器翻译资源(europar?), FrameNet,probank, 各种 POS-taggers, 中文分词包,parsers,一些常用的工具,Lingpipe,SRILM, 等等
完全覆盖所有这些话题是不太现实,不过至少我们可以挑选一些有广泛代表性的问题开始,然后再开展一些更深入的专题。
欢迎大家拍砖,希望我们能尽快确定一个大致的列表。下周ACL的deadline一过,就可以找各位牛人“志愿”了:)
一觉醒来,真是好消息不断啊!
非常支持加非常感谢Cat老兄的鼎立支持!
[回复]
finallyliuyu 回复:
15 12 月, 2010 at 20:38
赞boycat
[回复]
好多觉之后醒来,发现52nlp好像比当初做链接时热闹了很多?
[回复]
52nlp 回复:
12 12 月, 2010 at 22:19
嗯,的确要热闹很多!
[回复]
我在写一篇汇编语言的基于哈希表和二叉树的中文词典的文章,写完了,放上来,希望能抛砖引玉。
[回复]
52nlp 回复:
14 12 月, 2010 at 20:56
非常感谢!非常期待!
[回复]
这是改版了啊!哈
52nlp快成社区了,哇咔咔!
[回复]
52nlp 回复:
14 12 月, 2010 at 20:56
应该是介于社区和介于博客之间的“群体博客”!
[回复]
shimo 回复:
16 12 月, 2010 at 09:54
前段时间还在水木上说改版,这么快就好了~送赞~顺赞boycat牛~
[回复]
52nlp 回复:
16 12 月, 2010 at 13:31
欢迎注册!欢迎分享!
关注你的博客有段时间了,来冒个泡泡。 顺祝新年好,期待讨论版块!
[回复]
52nlp 回复:
5 1 月, 2011 at 00:30
新年快乐!常来看看!
[回复]
google里搜到,自然语言处理 博客,第一个就是这里。
最近心情特别郁闷,一直处在焦虑中,不知道各位是不是都是学生,是不是有就业的压力。
用了很久,CL接收了我的文章,好容易能毕业了,可是就业路漫漫,投简历都是无回音。
[回复]
52nlp 回复:
6 1 月, 2011 at 23:27
这里应该有学生也有工作者~
CL指的是权威的《Computational Linguistics》杂志吗?如果是这个,只能说非常非常佩服。
关于工作的问题,慢慢来吧,其实NLP的工作机会还是蛮多的,可以看看水木自然语言处理版,最近有很多的招聘信息。
[回复]
necrostone 回复:
7 1 月, 2011 at 13:35
感谢博主回我。
是那个CL。
刚读博的时候方向是随意的,确实也对NLP不了解也不是很感兴趣,不过既然是进了就应该做出点什么。
想找个地方踏实的做研究特别难。体制内的似乎是个选择,不过已经没有地方了...;体制外的根本就不是搞研究的,他们可容不得你思考的时间。
[回复]
52nlp 回复:
7 1 月, 2011 at 22:59
谢谢你今天回了这么多,我可能不能一一答复了!
我觉得你既然能在CL上发文章,确实很适合做研究,不过感觉你对体制内和体质外的认识也仅仅停留在认识上,因为你还不曾经历,所以下这样的结论未免有点早。
祝早日找到适合自己的工作!