[水]好的，现在我是体验完DeepSeek-V4的那个用户了

注意

这个blog，应该是4.24/4.25发的，但是因为我懒/别的原因，才拖到Update的这个时间发。
里面的内容，不做标注（一般是嵌入原文的地方）的话，都是当天浅浅体验几个小时的感觉

4.24 dsv4发布了

一开始还不知道这个消息，只是回到家后用专家模式问了一个问题，发现思考和以前不太一样。

简单来说，好像就是思考的多一点，全一点，比稍往前的时候更会/更像思考了，有的还会有个问题组织，对不同客户端的排版考虑……总之哪里都有一点不一样的感觉，显然是新版本发布了吧

直接用ds取搜，证实了。

价格挺出人意料，flash版本（缓存命中输入）1Mtoken/0.02CNY，（缓存为命中输入）1Mtoken/1CNY，（输出）1Mtoken/2CNY，白菜价；而pro呢，（缓存命中输入）1Mtoken/0.1CNY，（缓存为命中输入）1Mtoken/12CNY，（输出）1Mtoken/24CNY，这样的价格第一次见。

甚至现在deepseek-v4-pro 模型 2.5 折，优惠期延长至北京时间 2026/05/31 23:59，那很便宜了

网上传闻说华为新卡发布后会降价，这就不在（本篇）的考虑范围内了。

谈谈我注意到的：

注意

这个blog，应该是4.24/4.25发的，但是因为我懒/别的原因，才拖到Update的这个时间发。
里面的内容，不做标注（一般是嵌入原文的地方）的话，都是当天浅浅体验几个小时的感觉，所以可能会有点错/原始

风格

语言风格似乎有些变化，在目前短暂使用中还没有发现在什么地方比较明显的话，但就是感觉和V3.2不太一样，从思考就可以看出来了
不过ds味还是在的（？）

幻觉/提示词遵从

注意

做一下内容补充，ds对于长上下文似乎不是特别好，flash的幻觉问题还是有点（能意识到的）
幻觉补充见后续补充

v4的发散性（创造性？）似乎没有V3.2的好？
（据网上说）LLM的发散性和幻觉其实有一定关系，降低了幻觉多少会有些影响到发散性。

回复风格

（因为是手机上用的，可能有所不同）

有部分情况，v4（pro）的回复风格比较简洁，没那么多Markdown语法，主要就是分割线，比较传统的1、2、3分段，有点少见。

更愿意画字符画？v4进行可视化图表的积极性显然比V3.2高，V3.2几乎不会画图。
不过正如所说，是字符画。
v4似乎认为，当前环境是无法预览mermaid图表的，因此会更容易画字符画？

口语化/拟人化表达有变化：似乎是更进一步。

好的，现在我是我了

（以上标题为ds思考原话）

一般深度思考时候，ds起手式是嗯，好的，现在用户...，然后再是一段结构化程序化（v4更明显），ds风格的深度思考。
（网页搜索是个例外，但是v4的思考深度在这方面更好，也能简单思考了，不知道为什么触发思考的ds风格/能力表现全不一致，不清楚api环境怎样）

补充见后
下面这个是当时总结的，可能片面/不准确

不过和v4对话，在用户提出的内容较有深度，多轮对话/对话较长，涉及有角色特性的理解/需要换位思考或切换角色的情况时，dsv4有概率以好的，现在我是（那个）（+任务等描写内容）+身份+了的起手式，思考内容也会随着这样的起手式而变得具有风格性/角色性。

目前（我）有两个不互斥的猜测。

一是，v4对于“续写”任务的意识，AI在长对话中需要锚定描写锚点，触发了这一种句式。

还有一种是AI有一种角色扮演的模式被模型运用到了其他地方，以提高表现。

总结就是：对话情景判断和角色扮演行为运用。

角色扮演行为在思考现在也能做到。记得这是以前R1才能做到的事，现在v4也有了。照这样看，v4还要比R1广泛些。

如果你让v4“是一只猫娘”/“扮演一只猫娘（像猫娘一样思考）”，马上就可以看到效果。

对于对话情景判断，我补充：本来想说的是，有可能ds误判了文本，认为对话中user和assistant都是自己生成的，需要在思考时切换角色。

我现在看感觉有点扯

虽然可能有一定合理性，但是连间接证据（表现）还没有，更别说可能的直接体现了，所以在我倾向认为不存在。

~~这下可以更沉浸地角色扮演了（雾~~

结

好的，现在我是那个写deepseek最新款模型使用感受的用户了。

总之，这是我晚上小几个小时对话的体验感受，有的方面有提升，好像有点方面不明显，风格有点变化，价格是个惊喜。

这个新起手式，还挺有意思的，不知道有多少能力提升。

（内容可能有差错）

后续补充

注意

这里不是当时写的

幻觉

对于dsv4-flash的幻觉问题，可以尝试那种了解确认提示词的方式，有的内容是你说什么就是什么，和系统提示词没关系，纯瞎编

就比如：你进行网页搜索后是如何标识来源的
这样的问题

你再问问他有关 【4†L3-L5】 这样的指示，大概率会编，但是pro会说我的标准标注格式只有 [citation:数字] 这一种

这是在某次使用时ds出现生成【4†L3-L5】，后续想了解搜索内容标注的系统提示词大概是怎么样发现的

现在我是我了

对于这个，最近才有一点了解MoE专家模型和思考的不同pattern（也是模式？我那个评论原话）

dsv4的训练，似乎是先炼专家，后蒸馏整和
个人觉得，整合后（其实也应该包括传统MoE方法）可能会因为“领域不同”而有不同风格存在

而且这样似乎AI表现更“吃场景”了？

对于思考pattern

很容易联想到那个ds一旦触发联网搜索，就像换了人一样专注搜而更少关注推理了一样（其实ds触发联网时的风格也不一样，可能是有个“专家”）

可能可以用来解释那个好的，现在我是我了。这样的思考行为了——触发了某一个思考pattern

有的时候，v4还会出现在思考中说自己需要为回复生成思考，那这个就…有点意思

对于角色扮演思考模式，我不太清楚，可能也是这样？

不过，现在倒是见的少了，不知道是修了还是因为我现在一直的使用场景（内容）和当时不一致没触发而已

~~我要视觉模式灰度啊啊啊啊啊~~