我服了,阿里不会是 AI 界的汪峰吧!

48次阅读
没有评论

共计 1233 个字符,预计需要花费 4 分钟才能阅读完成。

说到汪峰,你的第一反应是什么?

是不是和我一样,最先反应过来的是“他永远上不了头条” 🤣。

这事确实邪乎,百度百科甚至有多个关于汪峰的词条,比如“帮汪峰上头条”。。

我服了,阿里不会是 AI 界的汪峰吧!

巧的是,我发现阿里的 Qwen 也一直上不了头条。

从阿里发布通义千问的第一天起,它似乎就一直生活在其他 AI 巨头的影子下。

今年一月份,好不容易弄出性能超过 DeepSeek-V3、对标 GPT-4o 和 Llama-3.1 的 Qwen 2.5-Max,结果 DeepSeek 又发布了 R1!马上又快到春节了,只能咬咬牙在初一发布了。。

上周马斯克发布 Grok3,吸足了睛,这两天好不容易热度降下去一点,想着对标 DeepSeek-R1 的 QwQ-Max-Preview 应该能有个头条了吧。

结果在发布 QwQ-Max-Preview 的前一天,Anthropic 又发布了 Claude 3.7 Sonnet,主打的就是高级推理能力!

我已经看过好多人发文称 Claude 3.7 Sonnet 生成 SVG 图多牛、编程多牛,却没见一个人吹使用 QwQ-Max-Preview 的感受如何如何。

阿里大模型的风头再次被盖过。。。

我服了,阿里不会是 AI 界的汪峰吧!

真 AI 届汪峰~

那么汪峰老师,哦不, Qwen-Max-Preview 的水平到底怎么样呢?

我们直接用前两天测试 Grok3 的例子试下 QwQ-Max-Preview 的水平吧。

首先打开 Qwen ,然后点击“深度思考”开启 QwQ-Max-Preview 开始测试。

我服了,阿里不会是 AI 界的汪峰吧!

Qwen 推理能力#

看看推理能力。

问题:为什么我爸妈结婚的时候没邀请我参加婚礼?

QwQ-Max-Preview 的回答如下。

我服了,阿里不会是 AI 界的汪峰吧!

结果和 DeepSeek-R1 差不多,考虑的很周全。

Qwen 搜索能力#

再开启“联网搜索”测试它的搜索能力。

问题:这几天马斯克发文称美国有 300 多岁还在领社保的老人,整理整个事情的来龙去脉,并用时间线的方式展示出来。

QwQ-Max-Preview 回答如下。

我服了,阿里不会是 AI 界的汪峰吧!

你觉得这个结果怎么样?

只看事情经过的话,QwQ-Max-Preview 介绍了大概情况,很有个很严重的问题,它的时间全是错的!

这让我对整个回答产生了怀疑。。

我看了下 QwQ-Max-Preview 引用的资料,也是这几天的资料,没搞懂为啥它回答中的时间整整晚了一年。

排除时间这个问题的话,QwQ-Max-Preview 的搜索质量和 DeepSeek-R1 差不多,离 Grok3 还有些差距。

Qwen 代码能力#

再看生成代码能力。

编写一个 p5.js 脚本,模拟 100 个彩色小球在一个球体内部弹跳。每个小球都应留下一条逐渐消失的轨迹,显示其最近的路径。容器球体应缓慢旋转。请确保实现适当的碰撞检测,使小球保持在球体内部。

效果并没有 DeepSeek-R1 好,然后我又让 QwQ-Max-Preview 写个贪吃蛇小游戏。

用 HTML 写个带积分功能的贪吃蛇代码。

这次看起来还行。

不过和 DeepSeek-R1 一样,QwQ-Max-Preview 也不支持识别图片和语音。

这么说来,QwQ-Max-Preview 是晚了一个月的 DeepSeek-R1??

你怎么看?

正文完
 0
管理员
版权声明:本站原创文章,由 管理员 于2025-02-26发表,共计1233字。
转载说明:除特殊说明外本站文章皆由 CC-4.0 协议发布,转载请注明出处。
评论(没有评论)