关于较主流的通用大模型在轻小说创作上的对比

我也不知道为什么评测了这样一个主题,大概是昨天凌晨的时候睡不着发疯的产物。由于文学创作的评价有相当强的主观性,本评测仅代表本人的见解。


对比模型:

  • GPT-5 Thinking Mini
  • Gemini 3 Pro Preview
  • Deepseek-V3.2
  • Qwen3-Max-Thinking-Preview

评测方法:

非常简单,给出同样的人物人设要求和世界观,尝试让大模型生成一段轻小说文本。


评测正文:

GPT-5 Thinking Mini

使用 Thinking Mini 是因为只能找到它的API了(

我原以为它能写得比 Deepseek 好的,结果发现我错了。GPT 的这个思考模型在轻小说创作方面疑似有点烂了,它完全没按照给出的人设进行创作,而且每次也只会写一点点,不知道为什么不愿意多写点。但故事情节的设计还算合理且有创造力,人物的对话也比较正常,并没有特别跳脱或者尴尬到令人读不下去,只是没按照要求创作这点有点难以让人满意。

Gemini 3 Pro Preview

感觉可以获得本次评测的最佳选手称号。虽然生成的内容相当老套但是贴合人设,让他生成一段长文本也完全没问题,处理多人物的对话也比较可以,在一个范围内生成的文本内容相当连贯,只是在多轮生成(大约 100K token)之后发生了灾难性遗忘,考虑到别的模型在差不多的地方也有发生,这点应该还说得过去。

Deepseek-V3.2

好吧,出乎我的意料,DS的新模型(25年12月刚推出)在这个领域比GPT要出色一点——至少它生成的内容贴合要求,而且写的内容还不少。不过它的创造力疑似有点过分了,写的故事和人物的对话都有点“癫”感。总体观感而言中规中矩吧。

Qwen3-Max-Thinking-Preview

烂中烂了,人设也不对,故事内容也不知道是哪个三流网文里搬过来的,看着就唐中唐,评价为没有看下去的欲望。


好了这就是我的沟槽的野榜,本人文笔不佳,比不上大模型的万分之一,有什么想法欢迎交流。顺带说说,其实感觉论坛可以再活跃点啊,多点帖子什么的,不知道这篇评测能不能抛砖引玉啊 :saluting_face:

3 个赞

评测是不是可以给大家各个模型的生成内容 :face_savoring_food:

如果贴出来太长了也可以考虑加上附件?

以及我一直觉得DeepSeek写中文材料真比GPT好太多了: 以前GPT是最典型的AI味儿,现在GPT写东西还是会带有一股味儿。虽然和以前的AI味不同了,但还是总能一眼看出来有一种”俏皮”的感觉, 是正常人说话写作不会有的感觉。deepseek常被用于各类创作,然后由于之前训练基础,语料,微调和大家实际使用的场景, deepseek经常会被写一些比较颠的文章(

2 个赞

话说有什么好的技巧能够让AI输出长一点的文字吗?最近想做个Pipeline让AI自动生成(水一篇)课程论文,但是生成的长度每次都不长,最后还得用额外的工序去扩写
(感觉输出长度是现在模型的通病,不过这确实也符合人类的能力设定 :innocent:

感觉一次性让他是一大长串话不如按照老方法,先生成大纲,再每节按点扩充

不对啊,你这么说你的gptapi并不是官方的API是吧?

难道是公益免费的API吗?推荐点:face_blowing_a_kiss:

求原文 zsbd

求原文+1求原文+1