这篇不是计划内的“中文分词入门系列”,所以称之为篇外。上一篇《中文分词入门之最大匹配法扩展1》提到了MMSEG国内的一些情况:

  不过国内也有该文的简介文章:《MMSeg分词算法简述》,原文似乎出自“www.solol.org”,但是我一直没打开这个网站,因为Java版的mmesg也是其提供的,不知道是已经关闭了还是被“墙”了。另外,leeing也翻译了全文《MMSEG 中文分词算法》,我粗略的读了一下,感觉翻译的不错。


  没想到《MMSeg分词算法简述》的原作者solol和我取得了联系,而leeing也留了言。难能可贵的是,由于solol.org目前已经关闭,而Google Group被墙,Java版的MMSEG代码目前已无法下载,solol希望通过52nlp这个途径提供给大家,这里非常感谢solol的分享!目前我已将Java版的代码上传到网络硬盘,同时会在”资源“页面里做个备注,有需要的读者可以在这里下载:mmseg-v0.3.zip
  同时,我发现python版的mmseg目前也无法下载,这个基于python的中文分词项目放在Google code上:pychseg,但是在”Downloads“页面里却没有可下载的版本,不知是何原因?如果哪位读者知情或者手头上有这个版本,欢迎和我联系,或者在这里留个言,希望python版本的MMSEG也能像Java版本一样,能共享给大家。此处先谢过了!

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:https://www.52nlp.cn/中文分词入门之篇外

作者 52nlp

《中文分词入门之篇外》有11条评论
  1. 你好,我是pychseg的作者,一直没时间加上download,大家check out源代码就可以用了。。。

    另外coreseek里带的c版本的mmseg很快而且也有python接口,推荐大家用那个了

    [回复]

    52nlp 回复:

    非常感谢!我也计划写coreseek的LibMMSeg的。

    [回复]

  2. 这个java版本下载不了啊 楼主

    [回复]

    52nlp 回复:

    链接失效了,由于换了电脑,我自己的备份可能不太好找了

    [回复]

    李霖 回复:

    好的

    [回复]

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注