前不久发现了一个“自然语言处理词典(The Natural Language Processing Dictionary)”,觉得很有意思。作者Bill Wilson是澳大利亚新南威尔士大学的一名教授,因为开了一门“人工智能”课程,就为这门课程分别编制了Prolog,人工智能(Artificial Intelligence),机器学习(Machine Learning)以及自然语言处理(Natural Language Processing)的相关术语词典。这几个词典建于1998年,Bill Wilson教授似乎还在进行维护和更新,所以目前仍很有参考价值。

  以下是“自然语言处理词典”页面上的相关介绍:

You should use The NLP Dictionary to clarify or revise concepts that you have already met. The NLP Dictionary is not a suitable way to begin to learn about NLP. Further information on NLP can be found in the class web page lecture notes section.

Other places to find out about artificial intelligence include the AAAI (American Association for Artificial Intelligence) AI Overview page or AI Reference Shelf

If you wish to suggest an item or items that should be included, or if you found an item that you felt was unclear, please let me know (E-mail: billw at cse.unsw.edu.au).

  如果读者对这几个词典感兴趣,可以通过如下链接访问它们:
  1) 自然语言处理词典(The Natural Language Processing Dictionary) – URL: http://www.cse.unsw.edu.au/~billw/nlpdict.html
  2) Prolog词典(The Prolog Dictionary) – URL: http://www.cse.unsw.edu.au/~billw/prologdict.html
  3) 人工智能词典(The Artificial Intelligence Dictionary) – URL: http://www.cse.unsw.edu.au/~billw/aidict.html
  4) 机器学习词典(The Machine Learning Dictionary) – URL: http://www.cse.unsw.edu.au/~billw/mldict.html

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:https://www.52nlp.cn/一个不错的自然语言处理词典

作者 52nlp

《一个不错的自然语言处理词典》有4条评论
  1. 您好,我想问下
    现代汉语短语结构信息库
    2700万字现代汉语分词与词性标注语料库
    现代汉语树库
    现代汉语短语结构规则库
    您手上有txt文件的吗?

    [回复]

    52nlp 回复:

    没有。

    [回复]

  2. 分词之后进行词性标记是不是必须得做词典?词典中如果用python的字典或是java中的hashmap这样的话,如果键一样的话,如何处理多值情况?

    [回复]

    shan 回复:

    最好是做字典,如果不用字典,用ndarray或者几个单独的array,tuple,list也都能操作吧,但是不如字典方便,容易乱,而且还是察觉不到的乱。对于多值,个人觉得应该是看目的,我之前比较两个topic时,需要记录每个词的频率,而且stopwordlist我也会加入那些超低频词,所以我会有一个dict里面key是关键词,value是词频,做一些预处理。如果是把string map 到 id 的话,那么一个关键词的出现频率就不重要。

    [回复]

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注