共计 1350 个字符,预计需要花费 4 分钟才能阅读完成。
DeepSeek 昨晚发文正式推出 DeepSeek-V3-0324,各方面能力都得到大幅增强!
据 DeepSeek 称,全新的 DeepSeek-V3-0324 在数学、代码能力等方面超过 GPT-4.5 和 Claude-Sonnet-3.7。
我翻了下 huggingface 上的说明,新版本 V3 模型在中文写作能力上向 DeepSeek-R1 做了对齐,优化了中长篇写作能力;优化了中文搜索能力,提供了更强的报告分析和更详细的输出。
无论是 huggingface 还是推特,都是好评如潮,现在新版本 V3 模型已经在 huggingface 登顶!
其实从 DeepSeek-V3-0324 的名字看,就知道这个模型是 3 月 24 号就发布了。
我昨天下午也拿这个模型测试了下写作、搜索、代码等功能,从结果来看,新版本 V3 模型和之前一样,也隐藏了思维链,但回答比 DeepSeek-R1 更好更快。
所以建议不复杂的推理任务,就不要开启“深度思考(R1)” 了,只开启“联网搜索”,直接使用新版本的 V3 模型,立刻享受速度更加流畅、效果全面提升的对话体验。
为了方便直接感受,我贴一下测试对比。
以昨天讨论的 “未来 10 年内适合普通人的赚钱方向”为例,新版本 V3 模型给出的答案如下:
对比 DeepSeek-R1 的答案,新版本 V3 模型无论是排版、详细程度还是深入程度都更优秀。
再看文本生成能力,以写小说为例,如下:
相对于之前 DeepSeek-R1 生成的文本,新版本 V3 模型生成的内容更长、上下文更连贯,不仅逻辑缜密,还能将现代知识和古代真实人物结合起来,并且还给出了后续的故事线索走向提示。
据我说知,现在很多写小说的人都在借助 Claude 3.7 Sonnet 写,看看现在 DeepSeek 新版本 V3 模型的文本水准,不知道 Claude 3.7 Sonnet 还香么?
短短的一个需求,根本不需要啥提示词,能得到这么一大段文字,我单方面说句新 V3 模型是目前中文写作的“地表最强”模型不过分吧!
再看看代码能力。
有网友(@flavioAd)发了个新版本 V3 模型和 DeepSeek-R1 的编程比较视频,比我自己测试的更加直观,就借过来一用,如下。
视频中 DeepSeek-R1 生成的效果和我以前测试时的效果差不过,很多细节如重力因素并没有考虑到,而现在 DeepSeek-V3-0324 的效果就非常逼真了。
虽然官方称代码水平高于 Claude 3.7 Sonnet,但我感觉还是有点小差距,并没有 DeepSeek 官方吹的那么强。
毕竟上一个吹代码能力暴打 Claude 3.5 Sonnet 的 Grok3,跑下来也没那么强不是么。
不过考虑到 Claude 3.7 Sonnet 的价格,再看看 DeepSeek V3 的价格,就算水平差一点,也无所谓了。
如果你想在 Cherry Studio 等软件中使用 DeepSeek-V3-0324,那么除了 DeepSeek 官方 API,还可以使用 OpenRouter 提供的免费 deepseek-chat-v3-0324,具体的配置过程就不多说了,有兴趣的话翻以前的文章就行了。
一直以来,DeepSeek 都在超越自己的路上奋力前行,不仅开源,还物美廉价,但相比老美的 4 大巨头你追我赶,希望国内其他几家大语言模型厂商再加把油吧,国内苦老美的大模型久矣!
真期待 DeepSeek-R2 快点出来啊。