无论你是什么圈子的,关不关心科技,相信你近两周耳朵里一定被一个叫DeepSeek的AI灌满了。

从DeepSeek V3到底有多强,到美国破防。
从美股大跌,到国家之间的网络大战。

关于DeepSeek的评价,在国内自媒体的追捧下,已经接近魔幻。

DeepSeek到底怎么样

关于DeepSeek到底怎么样,Mark给出的评价是:能力一般,但性价比高,属于AI界的拼多多

下面是红薯上,我和一个美国IP的网友关于DeepSeek的还算理性的争吵:


我说了一个非常简单的推理题:“昨天的明天是明天的什么?”我经常用这个问题测试大模型的基础推理能力。
 


这里,网友给出了截图:
 

很明显,他用来证明DeepSeek回答正确的截图,恰恰暴露了DeepSeek的最大缺点:“稳定性”

最后,我也成功说服了他。

注意,我说这些话时,DeepSeek刚发布了V3模型,还没有R1,所以我说的推理能力不行,说的是V3,R1的推理能力确实提升了很多。
但其稳定性,还是达不到商业化的水准。


澄清:开头我说DeepSeek性价比不如gpt-4o-mini,确实有个人情绪在里面,因为作为一个AI重度用户,在DeepSeek刚开放的第一天,我就成为了DeepSeek的忠实用户,在近一年,DeepSeek更是成为了我的主力模型。直到V3版本发布,性能没有提升多少(注意我说的V3,不是R1),但是价格翻了4倍,这直接导致我使用AI的成本大幅提升,所以说了气话。DeepSeek V3其实应该对标gpt-4o,而不是4o-mini,所以价格还是便宜的。

DeepSeek为什么能火

最近DeepSeek在全球爆火,自媒体更是把他吹成了全球最强模型。
这其实是一些不懂AI的营销号在跟风吹捧。

其实DeepSeek之所以能在全球爆火,根本原因如下:

  1. 以557.6万美元的训练成本,就达到了比肩gpt-4o的水准: 这是关键,这代表了美国对中国AI科技的封锁失败了,也是英伟达股价崩盘的主要原因
  2. 开源: OpenAI在到处哭穷,订阅费用甚至要从20美元涨到200美元/月,折合人民币每月1450元,别说我们,赚美元的人也用不起了,而DeepSeek一波开源,让所有人都能用得起推理模型了
  3. 爽文剧情: 有钱大反派(OpenAI)各种败人品,然后被穷小伙(DeepSeek)不经意间,轻而易举的打败了,而且穷小伙(DeepSeek)还免费给老百姓发福利(开源),这不就是现在爆火的短剧的现实版吗,这个拿来做自媒体文案去发,效果不要太好。

中立的评价

  1. DeepSeek仍然是现在性价比最高的模型
  2. DeepSeek只有文本强,其训练成本低,也是因为他只支持文本,而OpenAI、国内的字节跳动、阿里巴巴训练的,都叫“多模态”模型,支持图片、声音、视频,其训练成本当然高。
  3. 国内综合能力最强的模型,仍然是字节跳动的豆包,稳定性也能达到商业化使用的水平
  4. DeepSeek V3的推理能力不如阿里巴巴的qwen2.5(也是新发布的开源模型,没什么热度,但是很强,可以在阿里百炼平台免费试用)
  5. DeepSeek R1的推理能力可能超越qwen2.5,但是网站被攻击了,我现在没法测试,等节后恢复了,我第一时间放出测评结果

最后

我虽然没有使劲儿吹DeepSeek,但是我仍然很看好DeepSeek,从他上线第一天我就在用,而且在未来很长一段时间,DeepSeek仍然会是我的主力模型。

物极必反,DeepSeek现在已经吃到了爆火的亏,希望大家理性追捧。

祝DeepSeek越来越好!

0
0