这篇不是计划内的“中文分词入门系列”,所以称之为篇外。上一篇《中文分词入门之最大匹配法扩展1》提到了MMSEG国内的一些情况:
不过国内也有该文的简介文章:《MMSeg分词算法简述》,原文似乎出自“www.solol.org”,但是我一直没打开这个网站,因为Java版的mmesg也是其提供的,不知道是已经关闭了还是被“墙”了。另外,leeing也翻译了全文《MMSEG 中文分词算法》,我粗略的读了一下,感觉翻译的不错。
没想到《MMSeg分词算法简述》的原作者solol和我取得了联系,而leeing也留了言。难能可贵的是,由于solol.org目前已经关闭,而Google Group被墙,Java版的MMSEG代码目前已无法下载,solol希望通过52nlp这个途径提供给大家,这里非常感谢solol的分享!目前我已将Java版的代码上传到网络硬盘,同时会在”资源“页面里做个备注,有需要的读者可以在这里下载:mmseg-v0.3.zip。
同时,我发现python版的mmseg目前也无法下载,这个基于python的中文分词项目放在Google code上:pychseg,但是在”Downloads“页面里却没有可下载的版本,不知是何原因?如果哪位读者知情或者手头上有这个版本,欢迎和我联系,或者在这里留个言,希望python版本的MMSEG也能像Java版本一样,能共享给大家。此处先谢过了!
注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn
本文链接地址:https://www.52nlp.cn/中文分词入门之篇外
你好,我是pychseg的作者,一直没时间加上download,大家check out源代码就可以用了。。。
另外coreseek里带的c版本的mmseg很快而且也有python接口,推荐大家用那个了
[回复]
52nlp 回复:
22 1 月, 2010 at 20:55
非常感谢!我也计划写coreseek的LibMMSeg的。
[回复]
过来踩下,下了些资料,谢谢你啦
[回复]
52nlp 回复:
3 4 月, 2010 at 21:56
不用客气,欢迎常来!
[回复]
谢谢啊,学习了很多,感谢
[回复]
52nlp 回复:
19 9 月, 2012 at 23:04
不客气
[回复]
有没有哪位大神对比过ansj和mmseg呢?
[回复]
这个java版本下载不了啊 楼主
[回复]
52nlp 回复:
15 1 月, 2016 at 22:01
链接失效了,由于换了电脑,我自己的备份可能不太好找了
[回复]
李霖 回复:
15 1 月, 2016 at 22:03
好的
[回复]
感谢分享。。 刚接触自然语言处理,过来下点资料学习学习。。
[回复]