无论你是什么圈子的,关不关心科技,相信你近两周耳朵里一定被一个叫DeepSeek的AI灌满了。
从DeepSeek V3到底有多强,到美国破防。
从美股大跌,到国家之间的网络大战。
关于DeepSeek的评价,在国内自媒体的追捧下,已经接近魔幻。
DeepSeek到底怎么样
关于DeepSeek到底怎么样,Mark给出的评价是:能力一般,但性价比高,属于AI界的拼多多
下面是红薯上,我和一个美国IP的网友关于DeepSeek的还算理性的争吵:

我说了一个非常简单的推理题:“昨天的明天是明天的什么?”我经常用这个问题测试大模型的基础推理能力。

这里,网友给出了截图:

很明显,他用来证明DeepSeek回答正确的截图,恰恰暴露了DeepSeek的最大缺点:“稳定性”

最后,我也成功说服了他。
注意,我说这些话时,DeepSeek刚发布了V3模型,还没有R1,所以我说的推理能力不行,说的是V3,R1的推理能力确实提升了很多。
但其稳定性,还是达不到商业化的水准。
澄清:开头我说DeepSeek性价比不如gpt-4o-mini,确实有个人情绪在里面,因为作为一个AI重度用户,在DeepSeek刚开放的第一天,我就成为了DeepSeek的忠实用户,在近一年,DeepSeek更是成为了我的主力模型。直到V3版本发布,性能没有提升多少(注意我说的V3,不是R1),但是价格翻了4倍,这直接导致我使用AI的成本大幅提升,所以说了气话。DeepSeek V3其实应该对标gpt-4o,而不是4o-mini,所以价格还是便宜的。
DeepSeek为什么能火
最近DeepSeek在全球爆火,自媒体更是把他吹成了全球最强模型。
这其实是一些不懂AI的营销号在跟风吹捧。
其实DeepSeek之所以能在全球爆火,根本原因如下:
- 以557.6万美元的训练成本,就达到了比肩gpt-4o的水准: 这是关键,这代表了美国对中国AI科技的封锁失败了,也是英伟达股价崩盘的主要原因
- 开源: OpenAI在到处哭穷,订阅费用甚至要从20美元涨到200美元/月,折合人民币每月1450元,别说我们,赚美元的人也用不起了,而DeepSeek一波开源,让所有人都能用得起推理模型了
- 爽文剧情: 有钱大反派(OpenAI)各种败人品,然后被穷小伙(DeepSeek)不经意间,轻而易举的打败了,而且穷小伙(DeepSeek)还免费给老百姓发福利(开源),这不就是现在爆火的短剧的现实版吗,这个拿来做自媒体文案去发,效果不要太好。
中立的评价
- DeepSeek仍然是现在性价比最高的模型
- DeepSeek只有文本强,其训练成本低,也是因为他只支持文本,而OpenAI、国内的字节跳动、阿里巴巴训练的,都叫“多模态”模型,支持图片、声音、视频,其训练成本当然高。
- 国内综合能力最强的模型,仍然是字节跳动的豆包,稳定性也能达到商业化使用的水平
- DeepSeek V3的推理能力不如阿里巴巴的qwen2.5(也是新发布的开源模型,没什么热度,但是很强,可以在阿里百炼平台免费试用)
- DeepSeek R1的推理能力可能超越qwen2.5,但是网站被攻击了,我现在没法测试,等节后恢复了,我第一时间放出测评结果
最后
我虽然没有使劲儿吹DeepSeek,但是我仍然很看好DeepSeek,从他上线第一天我就在用,而且在未来很长一段时间,DeepSeek仍然会是我的主力模型。
物极必反,DeepSeek现在已经吃到了爆火的亏,希望大家理性追捧。
祝DeepSeek越来越好!
