我也不知道为什么评测了这样一个主题,大概是昨天凌晨的时候睡不着发疯的产物。由于文学创作的评价有相当强的主观性,本评测仅代表本人的见解。
对比模型:
- GPT-5 Thinking Mini
- Gemini 3 Pro Preview
- Deepseek-V3.2
- Qwen3-Max-Thinking-Preview
评测方法:
非常简单,给出同样的人物人设要求和世界观,尝试让大模型生成一段轻小说文本。
评测正文:
GPT-5 Thinking Mini
使用 Thinking Mini 是因为只能找到它的API了(
我原以为它能写得比 Deepseek 好的,结果发现我错了。GPT 的这个思考模型在轻小说创作方面疑似有点烂了,它完全没按照给出的人设进行创作,而且每次也只会写一点点,不知道为什么不愿意多写点。但故事情节的设计还算合理且有创造力,人物的对话也比较正常,并没有特别跳脱或者尴尬到令人读不下去,只是没按照要求创作这点有点难以让人满意。
Gemini 3 Pro Preview
感觉可以获得本次评测的最佳选手称号。虽然生成的内容相当老套但是贴合人设,让他生成一段长文本也完全没问题,处理多人物的对话也比较可以,在一个范围内生成的文本内容相当连贯,只是在多轮生成(大约 100K token)之后发生了灾难性遗忘,考虑到别的模型在差不多的地方也有发生,这点应该还说得过去。
Deepseek-V3.2
好吧,出乎我的意料,DS的新模型(25年12月刚推出)在这个领域比GPT要出色一点——至少它生成的内容贴合要求,而且写的内容还不少。不过它的创造力疑似有点过分了,写的故事和人物的对话都有点“癫”感。总体观感而言中规中矩吧。
Qwen3-Max-Thinking-Preview
烂中烂了,人设也不对,故事内容也不知道是哪个三流网文里搬过来的,看着就唐中唐,评价为没有看下去的欲望。
好了这就是我的沟槽的野榜,本人文笔不佳,比不上大模型的万分之一,有什么想法欢迎交流。顺带说说,其实感觉论坛可以再活跃点啊,多点帖子什么的,不知道这篇评测能不能抛砖引玉啊
。