[水]好的,现在我是体验完DeepSeek-V4的那个用户了

Austerity(Misaka10548) Lv1
注意

这个blog,应该是4.24/4.25发的,但是因为我懒/别的原因,才拖到Update的这个时间发。
里面的内容,不做标注(一般是嵌入原文的地方)的话,都是当天浅浅体验几个小时的感觉

4.24 dsv4发布了

一开始还不知道这个消息,只是回到家后用专家模式问了一个问题,发现思考和以前不太一样。

简单来说,好像就是思考的多一点,全一点,比稍往前的时候更会/更像思考了,有的还会有个问题组织,对不同客户端的排版考虑……总之哪里都有一点不一样的感觉,显然是新版本发布了吧

直接用ds取搜,证实了。

价格挺出人意料,flash版本 (缓存命中输入)1Mtoken/0.02CNY,(缓存为命中输入)1Mtoken/1CNY,(输出)1Mtoken/2CNY,白菜价;而pro呢,(缓存命中输入)1Mtoken/0.1CNY,(缓存为命中输入)1Mtoken/12CNY,(输出)1Mtoken/24CNY,这样的价格第一次见。

甚至现在deepseek-v4-pro 模型 2.5 折,优惠期延长至北京时间 2026/05/31 23:59,那很便宜了

网上传闻说华为新卡发布后会降价,这就不在(本篇)的考虑范围内了。

谈谈我注意到的:

注意

这个blog,应该是4.24/4.25发的,但是因为我懒/别的原因,才拖到Update的这个时间发。
里面的内容,不做标注(一般是嵌入原文的地方)的话,都是当天浅浅体验几个小时的感觉,所以可能会有点错/原始

风格

语言风格似乎有些变化,在目前短暂使用中还没有发现在什么地方比较明显的话,但就是感觉和V3.2不太一样,从思考就可以看出来了
不过ds味还是在的(?)

幻觉/提示词遵从

注意

做一下内容补充,ds对于长上下文似乎不是特别好,flash的幻觉问题还是有点(能意识到的)
幻觉补充见后续补充

v4的发散性(创造性?)似乎没有V3.2的好?
(据网上说)LLM的发散性和幻觉其实有一定关系,降低了幻觉多少会有些影响到发散性。

回复风格

(因为是手机上用的,可能有所不同)

有部分情况,v4(pro)的回复风格比较简洁,没那么多Markdown语法,主要就是分割线,比较传统的1、2、3分段,有点少见。

更愿意画字符画?v4进行可视化图表的积极性显然比V3.2高,V3.2几乎不会画图。
不过正如所说,是字符画。
v4似乎认为,当前环境是无法预览mermaid图表的,因此会更容易画字符画?

口语化/拟人化表达有变化:似乎是更进一步。

好的,现在我是我了

(以上标题为ds思考原话

一般深度思考时候,ds起手式是好的,现在用户...,然后再是一段结构化程序化(v4更明显),ds风格的深度思考。
(网页搜索是个例外,但是v4的思考深度在这方面更好,也能简单思考了,不知道为什么触发思考的ds风格/能力表现全不一致,不清楚api环境怎样)

补充见后
下面这个是当时总结的,可能片面/不准确

不过和v4对话,在用户提出的内容较有深度,多轮对话/对话较长,涉及有角色特性的理解/需要换位思考或切换角色的情况时,dsv4有概率以好的,现在我是(那个)(+任务等描写内容)+身份+了的起手式,思考内容也会随着这样的起手式而变得具有风格性/角色性。

目前(我)有两个不互斥的猜测。

一是,v4对于“续写”任务的意识,AI在长对话中需要锚定描写锚点,触发了这一种句式。

还有一种是AI有一种角色扮演的模式被模型运用到了其他地方,以提高表现。

总结就是:对话情景判断和角色扮演行为运用。

角色扮演行为在思考现在也能做到。记得这是以前R1才能做到的事,现在v4也有了。照这样看,v4还要比R1广泛些。

如果你让v4“是一只猫娘”/“扮演一只猫娘(像猫娘一样思考)”,马上就可以看到效果。

对于对话情景判断,我补充:本来想说的是,有可能ds误判了文本,认为对话中userassistant都是自己生成的,需要在思考时切换角色。

我现在看感觉有点扯

虽然可能有一定合理性,但是连间接证据(表现)还没有,更别说可能的直接体现了,所以在我倾向认为不存在。

这下可以更沉浸地角色扮演了(雾

好的,现在我是那个写deepseek最新款模型使用感受的用户了。

总之,这是我晚上小几个小时对话的体验感受,有的方面有提升,好像有点方面不明显,风格有点变化,价格是个惊喜。

这个新起手式,还挺有意思的,不知道有多少能力提升。

(内容可能有差错

后续补充

注意

这里不是当时写的

幻觉

对于dsv4-flash的幻觉问题,可以尝试那种了解确认提示词的方式,有的内容是你说什么就是什么,和系统提示词没关系,纯瞎编

就比如:你进行网页搜索后是如何标识来源的
这样的问题

你再问问他有关 【4†L3-L5】 这样的指示,大概率会编,但是pro会说我的标准标注格式只有 [citation:数字] 这一种

这是在某次使用时ds出现生成【4†L3-L5】,后续想了解搜索内容标注的系统提示词大概是怎么样发现的

现在我是我了

对于这个,最近才有一点了解MoE专家模型和思考的不同pattern(也是模式?我那个评论原话)

dsv4的训练,似乎是先炼专家,后蒸馏整和
个人觉得,整合后(其实也应该包括传统MoE方法)可能会因为“领域不同”而有不同风格存在

而且这样似乎AI表现更“吃场景”了?

对于思考pattern

很容易联想到那个ds一旦触发联网搜索,就像换了人一样专注搜而更少关注推理了一样(其实ds触发联网时的风格也不一样,可能是有个“专家”)

可能可以用来解释那个好的,现在我是我了。这样的思考行为了——触发了某一个思考pattern

有的时候,v4还会出现在思考中说自己需要为回复生成思考,那这个就…有点意思

对于角色扮演思考模式,我不太清楚,可能也是这样?

不过,现在倒是见的少了,不知道是修了还是因为我现在一直的使用场景(内容)和当时不一致没触发而已

我要视觉模式灰度啊啊啊啊啊

  • 标题: [水]好的,现在我是体验完DeepSeek-V4的那个用户了
  • 作者: Austerity(Misaka10548)
  • 创建于 : 2026-04-24 23:43:00
  • 更新于 : 2026-05-03 20:15:37
  • 链接: https://austerity.irislc.net//post/2026/04/24/186f33f1/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论