引子
最近LLM方向的大新闻真的是一个接一个,每天都有新的花样。就在今天,anthropic突然毫无征兆的发布了Claude2。有关Claude的基本情况,大家看我这篇文章《Claude:无需魔法、完全没费、GPT3.5的最佳国内替代「一文说清」》。这里我直接说Claude2到底更新了些啥。
说个有趣的巧合,在Claude2发布的这天,ChatGPT挂了!持续了大概一天的时间,只有付费用户可以登录,免费用户无法使用。真是精准的给Claude2输送了一批用户~
更新要点
本次发布的Claude主要更新了以下几个方面:
- 上下文进一步扩展至200k。Claude前面的100k本来就已经是目前上下文的王者了,这次更是再接再厉,直接把上下文扩充到了200k。目前Claude2已经是长文档处理的最佳选择了,没有之一,甚至超越了GPT-4。不过唯一遗憾的是200k的版本目前还没有实装。但是,100k的版本已经放开使用了,只需要访问https://claude.ai/即可。
- 开放访问。重大利好,之前只能用slack才能访问8k版本的Claude,要使用100k版本更是得订阅POE的会员。但是,现在Claude2已经对美国和英国地区的用户完全放开了。也就是说,只要能够熟练的使用魔法,升级版本的Claude-100k已经可以无限使用了。我已经体验过了,效果相当不错,后面具体介绍。
- 整体性能提升。根据官方发布的《Model Card and Evaluations for Claude Models》,Claude2的各项基础能力都得到了提升。尤其是在输出有害信息方面,Claude本来就是第一梯队的,和ChatGPT各擅胜场。这次提升后甚至有可能直接超越ChatGPT。但是这方面测试比较复杂,我们还是等后续的具体测试。但是,性能提升是实打实的。
- 中文能力大幅度提升。准确的说是大幅提升了非英语的能力。但是我关心和测试的就是中文能力,目前体会下来感觉提升很大,以前的那种翻译感基本没有了。个人体验中文能力基本和GPT3.5类似。
- 功能齐备。在Claude2的聊天界面上,直接就可以上传PDF、TXT、CSV等文件,也不需要申请插件啥的,使用非常方便。在聊天界面直接复制长文本还会自动转换成TXT,非常方便。
实测体验
对于有魔法的用户,直接登录https://claude.ai/使用即可,记得节点要选美国或者英国。注册非常简单,这里就不赘述了。直接上体验效果。
首先,我是把这篇Anthropic介绍Claude2的官方文章《Claude 2》全文复制,然后黏贴到了对话框。这里有个细节,Claude2直接把长文本转换成了TXT文件,我点一下就可以看到文档内容,然后聊天界面又非常整洁,用户体验拉满。我让总结下文章,Claude2的回复如下图:
总体还是可以的,个人体验持平GPT3.5。接着,为了测试下Claude2的长上下文能力,我直接把它官方的模型介绍PDF给它送进去了。我用word测了下,这个文档一共5708个字,Claude的回复如下:
这里回复的水平应该是基本持平GPT3.5的,但是:第一,GPT3.5无法处理这么长的文本,GPT4都不行;第二,Claude2的处理速度很快,比GPT4使用PDF插件要快的多,效果我个人感觉也更好。
最后,我让Claude2处理了一个股票数据CSV文件,虽然它暂时还办法像ChatGPT的代码解释器一样给出可视化分析,但是明显其读数据的能力还是很强的,分析的全部正确。
总结
平心而论,Claude2已经成为了市面上唯一可以和ChatGPT做直接对比的产品,也是唯一一个在某个方面(上下文长度)完爆ChatGPT,且其他能力也没差太多的产品。如果你有处理超长文本或者需要进行类似写小说、玩角色扮演游戏这种需要超长上下文的任务的需求的话,Claude2目前已经超越了GPT4,成为了最佳选择。
博览AI的奥秘,博学AI的知识,博交AI的朋友,我是博而不士,欢迎加入我的AI探索之旅。关注我,一起玩转AI。
