编者按:

我是晗啸,达特茅斯学院本科经济和历史在读,同时也是AI创业公司“晓留学”的联合创始人。

我并不是在去年12月Chat GPT Pro 刚发布时就订阅的,因为我和身边的同学、同事都觉得这个套餐实在是太贵了!在Pro 版本发售之前,Plus套餐已经可以完美满足日常所需,而晓留学的企业级场景也都通过“随用随付”的api方案完成。

我们听说这个新玩意以后就当作是像川普要推出的“金卡”一样,像是玩笑。

不过,随着Pro套餐的功能日趋丰富,以及我对于Pro套餐专属的“gpt-4o-pro-preview”模型日渐好奇,我最终还是忍痛斥金拿下了这个套餐,写下本文,以飨读者。


从Plus到Pro

尽管付了200美金/月,我还是不觉得open ai以后能盈利……

从Plus 套餐切换到Pro套餐是非常容易的,如果你已经绑定了银行卡信息,只要在订阅界面切换至Pro套餐就可以。切换过程中相对比较人性化的是:OpenAI会根据你当前Plus订阅周期的剩余会员时间折算成美元金额,然后抵扣一部分Pro套餐的费用。我的订阅周期剩下时间还有十来天,所以就折算了10美金左右。

这个折算后的抵扣倒算是有点良心

就这样,不需要任何验证码,没有任何优惠,没有任何特殊动效,您就已经成为了尊贵的OpenAI Chat GPT Pro用户!

功能一览

套餐名称通用模型推理模型Sora额外功能
Free

GPT‑4o mini (无限)

GPT‑4o (极少额度)

o3‑mini (极少额度)没有

网页搜索

使用GPTs

DALLE

(极少额度)

Plus

GPT‑4o mini (无限)

GPT‑4o (充足额度)

GPT-4.5 (极少额度)

o3‑mini

o3‑mini‑high 

o1

(充足额度)

要排队

网页搜索

创建GPTs

DALLE

深度思考

实时语音对话

创建任务

Pro

GPT‑4o mini (无限)

GPT‑4o (无限)

GPT-4.5 (无限)

o3‑mini (无限)

o3‑mini‑high (无限)

o1 (无限)

o1 pro(充足额度)

 

很快

网页搜索

创建GPTs

DALLE

深度思考

实时语音对话

创建任务

Operator

上表粗略整理了三种套餐的异同,可以说Pro套餐最大的特点就是“无限使用”“优先使用”。然而,我个人认为,大多数人其实是完全没有必要奔着”无限使用“去买Pro套餐的,因为如果真的用量很大的话,可以自己创建一个组织,用OpenAI Playground 随用随付的方式使用。在实际情况中,200美金真的可以生成很多内容了…… 

以我司实际情况为例:一个产品经理测试一个智能体一周,使用模型包括o3-mini、o1、4o等,大约要消耗1000万个token左右,约等于上传和生成了800万个英文单词,这才消耗了大概200美金多一点。实在是很难想象个人用户在什么场景下能用这么多?

因此,如果个人用户想要买Pro套餐,最合理的情况是您看中了这个套餐能够“优先使用”的功能。当然,目前也非常少,最主要的三个是:

  • 深度推理模型o1 pro的足额使用(一周180次左右发送)
  • 视频生成模型Sora的无限且优先使用
  • 实验版Operator

我来逐个详细介绍我的体验。

o1 Pro: 忠诚,可靠

在我的理解中,o1 Pro并不是一个独立的模型,而是一种“满血版”的o1模型。两者之间最大的差异是o1可以使用更多的算力、更大的知识库、更长的上下文,以及更长的响应时间,从而在理论上输出更加优质的文本。不幸的是,作为一个学社科的,我暂时还没有什么复杂的数学问题供o1 Pro解决,平时写论文用的统计学方法也都太过基础,完全没有必要用人工智能来解决。因此,我并不能非常好地真正测试o1 Pro的“推理能力”,我在这里的分享,也纯粹是基于o1 pro”文本处理“能力的体验。

所谓的文本处理任务包括:

  • 概括、总结、转述、扩写文本
  • 识别并整理文本结构、脉络
  • 信息搜集和整理
  • 创作文本
首次触发不能使用搜索功能,但是对话以后可以使用

通过上图的功能描述,我们可以感觉到o1 pro在开通了deep research的功能后,就像是一个勤奋的本科RA(研究助理):可以忠诚地帮助教授搜集公开信息、撰写文献综述,甚至可以偶尔提出几个有意思的研究方向。这个功能也很像才刚刚参加工作的咨询顾问 (Strategic Management Consultant):明明什么都不懂但却可以快速了解一个行业、一个话题并且生成一个能让客户(也许)满意的报告。

我最满意的地方是在开始生成研究报告之前,o1 pro会首先跟你再次确认研究的方向和研究方法。这是非常重要的,因为o1 pro的生成速度非常慢,如果不确定好研究方向的话,要等到好几分钟以后才能纠正。

用了整整7分钟生成

我的问题是:

Give a scientific estimate of Yuval Harari's net worth

请科学地估算历史学家Yuval Harari的身价是多少

o1 Pro 请求我确认并澄清任务要求:

Are you looking for an estimate of Yuval Harari’s net worth based on publicly available information, such as book sales, speaking fees, and other revenue sources? Let me know if you’d like a breakdown of how the estimate is calculated.

请问您是否寻求用公开数据估算Yuval Harari身价呢?请让我知道您是否需要一个细致的计算清单。

我确认了任务以后,o1 Pro就花了7分钟生成了一份详细的报告,这是我自2022年使用大语言模型以来,等得最长的一次。如果大家想要看看具体的测试的效果,欢迎找到这个对话

报告很长,大家如果想读的话请点击上面的链接

总体来说,我的体验是如果我们仅仅把o1 pro当作一个研究助理的话,他的最大特质就是“勤奋”“忠诚”。在这次对话中,他几乎没有输出任何超出我原本任务要求范围内的文字,并且在数据计算中没有犯任何原则性错误。在计算Yuval Harari的图书销售额时,o1 pro在找了十数个在线图书销售网站,爬取了很多的数据。我认为这对于社科研究是有价值的,尤其考虑到许多(包括我在内)本科生的统计和计算机能力都普遍薄弱,光是爬取网络数据可能都要花上好几天。然而,生成的报告给我的总体感觉是“无功无过”,没有什么让人感到特别惊讶的地方,文字也朴素简单,像是非常合格的wikipedia式文字。

如果后续有时间,我希望可以再多测试一些o1 pro的数理逻辑和文献检索能力跟各位分享,无奈刚上手几天,还没有来得及。

我司的测试团队这几天也用上了o1 pro。根据我们的产品经理反馈,用了o1 pro以后,生成出来的文本确实比o1 和4.5都要好一些,但是响应速度实在是太慢了!导致大大影响了用户体验,无奈只能暂时放弃使用。

Sora: 雷声大,雨点小

Sora这个名字似乎源于日语“天空”

在本文截稿的2025年3月下旬,Sora已经不是Pro和Enterprise版本用户的专属功能了,Plus版本用户可以在排队的情况下有限地体验Sora,而Pro和Enterprise用户可以享受优先生成的特权。

自从去年早早官宣到今年发布以后,Sora给我的感觉一直是个“雷声大雨点小”的产品。尽管Sora的发布引起了很多媒体和投资人的高度关注,早期使用的门槛(排队和付费)让这个模型在社媒上的曝光度和公众的期待稍微有些不匹配。

目前,Pro套餐的用户可以最多同时生成4个版本的20秒1080p视频,可玩性是比较强的,但是距离一个“世界模拟器”还是差太远了。比起现在一些国产模型和开源模型动辄可以生成好几分钟的长视频,20秒的限制让Sora的实际使用场景非常有限。根据我个人的使用场景来讲,Sora更多像是一个玩具。

各位可以看看这个例子。

提示词:

The Monk by the Sea by Casper David Friedrich, but the monk stands up in peace and prays toward the sea

弗雷德里希的《海边僧侣》,但是僧人站起来面朝大海祈祷。

Sora生成的视频确实有一种故事感

Operator: 完全不成熟的产品

Operator解决了一种不存在的需求

Operator实际上是OpenAI产品战略中非常重要的一环,但很可惜,他目前既不好用,方向似乎也不够明确

我们现在日常工作学习中能接触到的AI工具大多数都是以LLM(Large Language Model)为底座的生成式模型,也就是说,这些模型几乎只能“生成内容”,而不可以“采取行动”。 随着GPT-4的推出,LLM开始可以搜索、画图、输出表格甚至编写程序,但是其本质仍然是完成用户输入的“指令”。

Operator的本质是一种让LLM自己给自己和系统生成指令的尝试。比如,Operator可以帮助用户订餐厅、定酒店、找机票等琐事,甚至在美国的用户还是可以用Operator点外卖。这种尝试的意义实际上非常大,因为这可以让LLM真正地向一个“个人助手”的方向发展。然而,就目前OpenAI为我们呈现的产品而言,这个愿景还远远没有实现。

提示词 Prompt:

Find the cheapest flight ticket from Shanghai to Beijing

找到从上海去北京最便宜的飞机票

没有卡住,他就是太慢了……

在这个场景里,我主要碰到的问题有:

  1. 搜索实在太慢,比我使用超慢的50MB宽带的搜索速度还要慢。
  2. 没有与用户进一步明确任务要求。我的问题是找“从上海到北京最便宜的机票”,而Operator却没有进一步询问,“什么时候的机票”,或者“单程还是往返”这些较为跟进。

更令人匪夷所思的是,碰到查询信息需要登录的时候(比如查看uber一辆车从JFK开到法拉盛要多少钱),Operator显得完全束手无策,卡在原地好几十秒以后才能反应过来。然而,即使反应过来,Operator也不会要求用户输入他们的登录信息,而只是尝试换别的网站搜索。不幸的是,几乎所有的网站查打车费都需要登录才行……

Operator 查打车费花了11分钟

总而言之,Operator是一个很具革命性的概念,但不是一个好产品。这看起来更像是一个给投资人看的demo,而不是一个值得为其付费的正式产品。目前Operator主打的几个应用场景也并没有让我感到AI的参与产生了任何对于用户行为的改变。期待OpenAI对Operator进行更多的工程调优!

总结:太贵了

OpenAI没有透露Pro套餐自发布3个多月以来获得了多少用户。

Best Broker在今年1月份的一份报告中认为目前OpenAI的付费订阅用户中大约只有1万人订阅了Pro套餐。可即使有10万人订阅Pro套餐,OpenAI每月的获利也不过是2000万美金左右,和自其创始以来的获得巨额投资相比简直杯水车薪。

不过OpenAI的盈利与否和用户无关。我从个人用户的角度来讲,暂时很难找到有什么不得不订阅Pro套餐的理由。同时从一个企业级用户的角度来说,o1 Pro模型每上传100万个token的价格高达150美金,每生成100万个token的价格高达600美金,我们自己的产品几乎不可能在这么高的token成本下盈利。

o1 pro的api调用成本相当于一次问答就要烧掉两个月腾讯会员的费用,目前我们国内的软件付费生态还没有办法支撑这么贵的底座。

模型上传 1M tokens生成 1M tokens
o1 Pro150$600$
Deepseek-reasoner0.55$2.19$

o1 pro在各方面的性能表现确实很出色,比DeepSeek要好,但是贵太多了:上传和生成均为DeepSeek的274倍

太贵了。