DeepSeek 重大更新,是时候告别 DeepSeek-R1 了!

10次阅读
没有评论

共计 1350 个字符,预计需要花费 4 分钟才能阅读完成。

DeepSeek 昨晚发文正式推出 DeepSeek-V3-0324,各方面能力都得到大幅增强!
DeepSeek 重大更新,是时候告别 DeepSeek-R1 了!

据 DeepSeek 称,全新的 DeepSeek-V3-0324 在数学、代码能力等方面超过 GPT-4.5 和 Claude-Sonnet-3.7。

DeepSeek 重大更新,是时候告别 DeepSeek-R1 了!

我翻了下 huggingface 上的说明,新版本 V3 模型在中文写作能力上向 DeepSeek-R1 做了对齐,优化了中长篇写作能力;优化了中文搜索能力,提供了更强的报告分析和更详细的输出。

无论是 huggingface 还是推特,都是好评如潮,现在新版本 V3 模型已经在 huggingface 登顶!
DeepSeek 重大更新,是时候告别 DeepSeek-R1 了!

其实从 DeepSeek-V3-0324 的名字看,就知道这个模型是 3 月 24 号就发布了。

我昨天下午也拿这个模型测试了下写作、搜索、代码等功能,从结果来看,新版本 V3 模型和之前一样,也隐藏了思维链,但回答比 DeepSeek-R1 更好更快。

所以建议不复杂的推理任务,就不要开启“深度思考(R1)” 了,只开启“联网搜索”,直接使用新版本的 V3 模型,立刻享受速度更加流畅、效果全面提升的对话体验。
DeepSeek 重大更新,是时候告别 DeepSeek-R1 了!

为了方便直接感受,我贴一下测试对比。

以昨天讨论的 “未来 10 年内适合普通人的赚钱方向”为例,新版本 V3 模型给出的答案如下:
DeepSeek 重大更新,是时候告别 DeepSeek-R1 了!

对比 DeepSeek-R1 的答案,新版本 V3 模型无论是排版、详细程度还是深入程度都更优秀。

再看文本生成能力,以写小说为例,如下:

DeepSeek 重大更新,是时候告别 DeepSeek-R1 了!

相对于之前 DeepSeek-R1 生成的文本,新版本 V3 模型生成的内容更长、上下文更连贯,不仅逻辑缜密,还能将现代知识和古代真实人物结合起来,并且还给出了后续的故事线索走向提示。

据我说知,现在很多写小说的人都在借助 Claude 3.7 Sonnet 写,看看现在 DeepSeek 新版本 V3 模型的文本水准,不知道 Claude 3.7 Sonnet 还香么?

短短的一个需求,根本不需要啥提示词,能得到这么一大段文字,我单方面说句新 V3 模型是目前中文写作的“地表最强”模型不过分吧!

再看看代码能力。

有网友(@flavioAd)发了个新版本 V3 模型和 DeepSeek-R1 的编程比较视频,比我自己测试的更加直观,就借过来一用,如下。

视频中 DeepSeek-R1 生成的效果和我以前测试时的效果差不过,很多细节如重力因素并没有考虑到,而现在 DeepSeek-V3-0324 的效果就非常逼真了。

虽然官方称代码水平高于 Claude 3.7 Sonnet,但我感觉还是有点小差距,并没有 DeepSeek 官方吹的那么强。

毕竟上一个吹代码能力暴打 Claude 3.5 Sonnet 的 Grok3,跑下来也没那么强不是么。

不过考虑到 Claude 3.7 Sonnet 的价格,再看看 DeepSeek V3 的价格,就算水平差一点,也无所谓了。

如果你想在 Cherry Studio 等软件中使用 DeepSeek-V3-0324,那么除了 DeepSeek 官方 API,还可以使用 OpenRouter 提供的免费 deepseek-chat-v3-0324,具体的配置过程就不多说了,有兴趣的话翻以前的文章就行了。

DeepSeek 重大更新,是时候告别 DeepSeek-R1 了!

一直以来,DeepSeek 都在超越自己的路上奋力前行,不仅开源,还物美廉价,但相比老美的 4 大巨头你追我赶,希望国内其他几家大语言模型厂商再加把油吧,国内苦老美的大模型久矣!

真期待 DeepSeek-R2 快点出来啊。

正文完
 0
管理员
版权声明:本站原创文章,由 管理员 于2025-03-26发表,共计1350字。
转载说明:除特殊说明外本站文章皆由 CC-4.0 协议发布,转载请注明出处。
评论(没有评论)