周末,继续自动文本生成的话题。前些天我们基于 Hugging Face 的中文歌词GPT-2 预训练模型(Chinese GPT2 Lyric Model)、文言文 GPT-2 预训练模型(Chinese Ancient GPT2 Model)和通用中文 GPT-2 预训练模型(Chinese GPT2 Model) , 在AINLP公众号后台添加了中文歌词生成器文言文生成器现代文生成器

今天,我们换一个开源的自动中文作文项目:

https://github.com/yangjianxin1/CPM

这个自动作文开源项目我们之前在AINLP公众号上介绍过,由坚新同学基于CPM模型开发维护的中文文本生成项目:自动写作文?来看看这个开源项目

CPM(Chinese Pretrained Models)模型是北京智源人工智能研究院和清华大学发布的中文大规模预训练模型。官方发布了三种规模的模型,参数量分别为109M、334M、2.6B,用户需申请与通过审核,方可下载。 由于原项目需要考虑大模型的训练和使用,需要安装较为复杂的环境依赖,使用上也较为复杂。 本项目采用了109M的CPM模型(若资源允许也可以考虑334M的模型),并且简化了模型的训练和使用。
本项目是基于CPM模型的中文文本生成项目,可用于作文、小说、新闻、古诗等中文生成任务,并且训练和分享了中文作文生成模型,取得了不错的生成效果。 本项目提供了数据预处理、模型训练、文本生成、Http服务等代码模块。 详情可参考CPM模型论文CPM官网项目源码 。

这个项目相当完备,从数据准备到模型训练,从生成代码到模型分享,甚至包括http服务的代码和部署以及测试,应有尽有,完全可以作为一个优秀的文本生成项目来学习,推荐Star。

基于这个开源项目的相关代码,我在 AINLP 公众号后台文本生成服务中添加了中文作文生成器,感兴趣的朋友可以关注AINLP公众号后对话测试自动作文生成:

此图像的alt属性为空;文件名为ainlp.jpg

回复“写作文 作文标题”进行测试,例如:

也可以在标题后添加一个开头语,回复“写作文标题 开头内容”进行测试,注意标题和开头内容之间有一个空格,例如:

这个自动写作文的结果还是相当切题了,从此小学生朋友再也不用怕两百字的命题作文了。关于这个中文自动作文的项目的详细介绍,还是请参考原项目:

https://github.com/yangjianxin1/CPM

特别感谢智源研究院开源的CPM模型以及坚新同学基于此训练分享的自动作文模型。

以下是AINLP目前支持的自动生成模块,之后将加入更多的领域生成测试模块,欢迎关注测试:

风云三尺剑,花鸟一床书---对联数据集和自动对联机器人
自动对联活动获奖结果以及机器对联赏析
"自动作诗机"上线,代码和数据都是公开的
鼠年春节,用 GPT-2 自动写对联和对对联
用 GPT-2 自动写诗,从五言绝句开始
自动作诗机&藏头诗生成器:五言、七言、绝句、律诗全了
仅供娱乐,藏尾诗生成器来了

中文歌词自动生成器:来试试自动写歌

文言文自动生成器:来试试自动写古文

现代文自动生成器:来试试用GPT2自动写中文

作者 52nlp

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注