周末,基于 Hugging Face 的中文歌词模型(Chinese GPT2 Lyric Model)在AINLP公众号后台添加了中文歌词生成器,感兴趣的朋友可以关注AINLP公众号测试自动写歌:
回复“写歌+开头内容”测试,例如:
HuggingFace的模型用起来很方便,示例也很简单,可以直接测试:
>>> from transformers import BertTokenizer, GPT2LMHeadModel, TextGenerationPipeline
>>> tokenizer = BertTokenizer.from_pretrained("uer/gpt2-chinese-lyric")
>>> model = GPT2LMHeadModel.from_pretrained("uer/gpt2-chinese-lyric")
>>> text_generator = TextGenerationPipeline(model, tokenizer)
>>> text_generator("最美的不是下雨天,是曾与你躲过雨的屋檐", max_length=100, do_sample=True)
[{'generated_text': '最美的不是下雨天,是曾与你躲过雨的屋檐 , 下 课 铃 声 响 起 的 瞬 间 , 我 们 的 笑 脸 , 有 太 多 回 忆 在 浮 现 , 是 你 总 在 我 身 边 , 不 知 道 会 不 会 再 见 , 从 现 在 开 始 到 永 远 , 想 说 的 语 言 凝 结 成 一 句 , 不 管 我 们 是 否 能 够 兑 现 , 想 说 的 语 言 凝 结'}]
上面截图前两个是用得官方的开头语,后两个是刘若英《后来》的开头句,发现第一个写出来的几乎完全是原歌词的翻版,只有一点不一样,后面还出现了bug版本。总之,如果你不想用程序调用测试这个模型,欢迎关注AINLP公众号回复“写歌+开头引导句”测试,目前生成的长度有100个字的限制。
作为自然语言处理的一个重要方向,自动文本生成(自然语言生成,NLG)目前大概比较时候这些比较务虚的东西的生成,好与坏,仅博君一笑!
最后,以下是AINLP目前支持的自动对联及作诗机,之后将加入更多的领域生成测试模块,欢迎关注:
风云三尺剑,花鸟一床书---对联数据集和自动对联机器人
自动对联活动获奖结果以及机器对联赏析
"自动作诗机"上线,代码和数据都是公开的
鼠年春节,用 GPT-2 自动写对联和对对联
用 GPT-2 自动写诗,从五言绝句开始
自动作诗机&藏头诗生成器:五言、七言、绝句、律诗全了
仅供娱乐,藏尾诗生成器来了