大语言模型发展日渐成熟,除了 GPT、Claude 等闭源模型,在《本地大模型之路(一):大模型的是什么、为什么以及怎么选》一文中,作者还介绍了当前成熟的开源大模型等内容。它们大多数都有对应的 App 基于这些模型为用户提供服务,像是通义、Perplexity、ChatGPT 等。
很多应用也被加上大语言模型的能力,其中有一些让我感觉是「为了 AI 而加上 AI」,不如直接使用 ChatGPT 或者 GPT 市场内的智能体;还有一些让我眼前一亮,是我自己用 ChatGPT 做不到的。这篇文章,我将介绍多个目前完全免费的应用,它们利用大语言模型的能力,以及友好的交互,为用户带来个性化的 AI 体验。
Ash:全天候 AI 心理健康咨询师
数字心理健康干预措施我在很早之前就使用过,2021 年澳门大学和上海纽约大学推出过一款以插画叙事为主要方式的心理健康干预应用程序「一步步」,当时是属于研究阶段,每周还会有志愿者进行电话回访。但「一步步」的表现是不尽如人意的,它更像一个心理辅导资源站,用户被动接受调整自身心理状态的信息。
在文章《从平台到 Chatbot,互联网心理干预服务一览》中,作者简单概括了情绪日记、冥想助眠、认知训练和 Chatbot 等服务。而在 ChatGPT 问世之后,基于其出色的大语言模型,我们通过 Prompt 可以让它扮演各种各样的角色,心理咨询师就是其中一个。但是,与 ChatGPT 不同的是,Ash 由专业的心理健康团队参与设计,它会记得所有的对话,为每次的对话生成总结,记录你每天的状态,以及提供个性化的通知。
- 基于专业心理支持方法,提供自然有价值的聊天。
- 免费使用,无需账户注册,注重隐私保护。
- 生成详细对话总结,方便回顾自我状态。
作为一个 AI 咨询师,无论是我们打字还是语音跟他对话,最重要的仍然是,它如何回复你。如果你有接受过现场的心理咨询服务,不会问问题以及不会回复的心理辅导员,会让咨询者非常无所适从。例如像「为什么不」或「你为什么要这样」等问题是最没用的,因为如果知道原因,就无需寻求帮助了。
Ash 的回复做的非常好,它永远会从关注情绪出发,但感受到情绪也是一种能力,并非每个人都能准确表达自己的感受,而这时 Ash 也能引导我们说出更多的经历帮助它判断。在每次的聊天之前,Ash 都会先让你完成三次深呼吸,然后描述你当下的感受是什么。
除了「懂你」的聊天,Ash 还会在每一次的对话结束为用户生成丰富的见解。如下图所示,Ash 会总结对话的内容,以及回忆用户在聊天中提到的重要内容,为这些内容生成亮点,同时给出下次聊天可能会探讨的问题。这些见解,让我真切的感受到 Ash 是一个深思熟虑的倾听者,也让我更清楚自己面临的挑战和已做出的改变。
总之,与官网介绍的一样,Ash 始终从关注你的情绪出发,使用认知行为疗法(CBT)、辩证行为疗法(DBT)和接纳承诺疗法(ACT )等心理学方法来帮助你自己找到共处的方式和改变的力气;它是一个回应更加自然,处理问题更加有策略的「真正」心理辅导员。
此外,Ash 是完全免费使用的,这意味着我们可以不受限的与它进行对话,且 Ash 能记住所有会话的聊天内容,而不需要我们重复解释。在隐私政策上,Ash 甚至是不需要创建账户的,即不需要使用邮箱或者手机号码等可追踪的身份 ID 进行注册使用,用户可以一直保持匿名状态。而关于对话内容,Ash 称将对话历史记录存储在用户设备上,录音会发送到其服务器和模型进行转录、处理和生成响应,然后立即删除。
Ash 目前支持 iOS 和 Android 平台,完全免费使用,且无任何内购项目。遗憾的是,Ash 只能用英语表达他自己,所以用户只能使用英语与他交流。但是,和使用 ChatGPT 的聊天不显示双方的转录文字不同,Ash 在对话的时候,会同步显示其回应文字稿,一定程度上缓解了对英语听力的要求。 如果你在学习英语,用口语化的英文尝试去表达自己的情绪和感受,以及分享自己每天做了一些什么事情,我认为和 Ash 的聊天能帮助你更好地学习英语。我在和他聊天的时候,说的句子基本上都是不怎么讲究语法结构的,但是他都能听得懂我想要表达什么,而这也促进了我更多地去表达自己。
Particle:由 AI 驱动的新闻平台
获取新闻信息的方式以及多种多样,抛开各大社交媒体还有新闻平台网页以及应用等,还有 RSS 和 Newsletter 等,他们都需要自己去选择该接收哪些信息,并且都是固定的单一媒体平台且很难真正利用到 AI,AI 在其中基本上都是根据特定一篇新闻报导生成摘要。而 Particle 利用 OpenAI、 Cohere,以及 Anthropic 的大语言模型,为用户带来了全新的新闻阅读体验,具体如下。
- 将内容总结为要点摘要以及其他摘要样式
- 确定文章的主题以及哪些文章是关于同一话题并聚集在一起
- 回答用户的问题
- 识别有趣和相关的新闻引用
- 为「听新闻」中的音频体验提供支持
我曾经推荐过朋友使用 Artifact,它名字来源是 「articles」(文章)、「artificial intelligence」(人工智能)和 「fact」(事实)这几个词的混成词,是一个主打个性化社交的新闻聚合应用程序。Artifact 是完全免费使用的,2024 年初由于收益问题,和发展目标(Artifact 希望打造「文字版抖音」),团队表示市场机会并不足以支持继续以这种方式投资,宣布 Artifact 死亡。不过在同年四月,雅虎收购了 Artifact,并使用其背后的技术,推出了全新的雅虎 AI 驱动个性化新闻应用。
全新的 Yahoo News 和曾经的 Artifact 基本上是一样的,简单的页面,允许用户标记「诱饵标题」和选择感兴趣类目来个性化自己的新闻浏览,以及生成新闻 AI 摘要。但是 Yahoo News 仍然停留在以「阅读模式」打开单一媒体的新闻链接,为用户提供新闻内容和单一的 AI 摘要;同时,与 Artifact 相比,还带来了雅虎广告。
和 Yahoo News 最大的不同是,Particle 呈现新闻的方式是以新闻话题的方式,而不是原始的新闻报导,这很像现在微博热搜,再点击热搜话题之后会出现一段 AI 总结的话题详情。而为了确保 AI 生成的新闻摘要准确,Particle 使用人类和机器审核相结合的方法,将生成的摘要与源材料进行对比等方式。用户也可以在详情页面,浏览单个媒体的原文新闻报导,再次进行准确性检查。
此外,为了避免掉入信息茧房,Particle 不允许用户直接选择过滤某个媒体机构,以确保呈现多样化的视角。实现个性化可以通过选择单一新闻的喜欢/不喜欢、调整内置将近六十个新闻类别的偏好加减,点击新闻中高亮词语并选择关注,以及关注单个作者或者新闻媒体等方法来告诉 Particle 你想看到内容。而对于美国政治类新闻的报导,Particle 还提供了政治光谱,将发布了与主题相关的新闻媒体机构放在对应的倾向位置上,以查看更多关于从不同立场报道该故事的详细信息。
Particle 还有一个特别好的点,它允许用户自己对新闻的标题风格进行重写。大部分的新闻,往往是采用「震惊」式的标题,不给用户完整的故事;我们被信息包围着,无休止的滚动,耗掉时间和精力,却毫无收获;与此同时,我们的数据还要被收集用来卖广告。Particle 借助 AI 提供了讽刺、去极端化、简化、专业、诗意、Explain Like I'm 5(像对五岁小孩解释一样)共七种新闻摘要呈现方式。
目前 Particle 仅支持 iOS 系统,可以在美区 App Store 免费下载,没有额外内购费用;此外,Particle 表示也当下无计划引入付费项目。由于仅在美区提供,应用内新闻语言同样都是英文,如果你希望通过阅读新闻来学习英语,Particle 也将会是一个不错的选择。
ElevenReader:极致的 AI 音频生成器
ElevenReader 是一款由 AI 音频研究和部署公司 ElevenLabs 开发的文本转语音应用程序,它由 ElevenLabs 的上下文感知文本转语音(TTS)模型提供支持,为用户带来高质量的 AI 语音体验服务。在 Product Hunt 给出的 2024 年最值得尝试的 AI 软件中,Elevenlabs 位于最高评分下的第五名。
文字转语音服务似乎在大模型被普遍使用之前就已经很广泛,无论是微信读书里面的听书服务,视频剪辑软件里面文字配音,还是各种听书服务……包括现在微信公众号助手还允许作者录入自己的声音,让用户在使用「听全文」时可以听到作者朗读的音色。但是,与这些服务不同的是,ElevenReader 有以下特点:
- 无限制、任意的(导入文字、输入链接、上传 PDF 或 ePub、扫描文档等)文本转到高质量的逼真 AI 声音媒体或播客。
- 数十种自然的、人性化风格 AI 声音,以及支持 32 种不同语言。
- 内置丰富的免费英文有声书籍、Newsletter 和 博客文章等。
ElevenReader 的使用非常简单,我在日常的使用体验是我会到探索类别下,找到我感兴趣的话题,有时候是听有声书,有时候是听 Newsletter;ElevenReader 上也有相当多的独立作者,为读者提供了一些与主流不同的内容。如果你喜欢听播客,除了将用户输入的内容生成播客,ElevenReader 也支持将应用内部分书籍或者订阅转成播客,生成播客可以选择类似深度对话节目和一个 AI 主持人的新闻播报两种形式。此外,我也有找到一些我喜欢的英语文章,直接发送链接给它,ElevenReader 提供了丰富的声音选项,可以从年龄、性别、语言,甚至是用途来选择喜欢的声音。
ElevenReader 目前的缺点是对中文的支持有限,中文 AI 声音只有一个,而且朗读中文内容时,它的声音是比较外国人说中文的感觉,口音比较重。我也用它生成过中文播客,播客内容是比较符合我输入的原文的。但同样是是由于对中文支持有限,主持人的声音还是外国口音非常重;如果是其他语言,像英语、西语、法语、日语等,ElevenReader 生成的声音都很自然。
ElevenReader 提供了 iOS 和 Android 以及 Web 版本的支持,下载和使用 ElevenReader 是完全免费,团队表示计划最终推出包含会员项目的版本,但同时会保持一个慷慨的免费计划供非会员用户使用。ElevenReader 的 Web 版本有额度限制,免费计划的额度大约在 10 分钟左右,但是,在 App 内使用不会消耗网页使用的额度。
Luma 3D Capture:使用 AI 创建你的 3D 世界
AI 生成图片已经被广泛使用,但是生成 3D 物体似乎还比较少被使用。Luma 3D Capture 是一款通过 Luma AI,仅使用 iPhone 11 或更新机型,就能够创建令人难以置信的逼真 3D 的新应用。应用包含文字生成 3D 工具 Genie 和三维场景重建工具 Capture 两部分,用户可以使用 Luma Genie 模型生成各种各样的 3D 物体;使用 Luma Capture,用户不需要激光雷达或高级捕捉设备,就能像在 iPhone 15 Pro 上拍摄空间视频一样,创作自己的 3D 物体、场景等。
Luma 3D Capture 可以免费不限量的生成解析度高的 3D 物体,并且支持将文件下载为 .stl、.blend、.usdz 等七种文件格式,用户可以方便的导入 Blender、3ds Max、Unity、AR Quick Look 等 3D 引擎应用或网页。如下图我使用 Genie 生成的水獭(Luma 链接),可以直接下载为 stl 文件进行 3D 打印。
除了由文字生成 3D 物体,Luma AI 利用 NeRF(Neural Radiance Fields)和3DGS(3D Gaussian Splatting) 等场景重建方法,能将图片或视频转成 3D 内容。在 Luma 3D Capture 应用内,用户可以通过手机摄像头扫描创建 3D 物体以及场景,或者直接将图库内图片或视频上传到 Luma AI 转成 3D 场景。
在手机或网页上传图片需打包成压缩包,压缩包文件大小不能超过 5GB,压缩包内需要包含相同类型的图片格式。Luma AI 支持普通照片 .jpg .jpeg .png .gif .pgm .ppm .tga 7 中格式、.exr 的 HDR 图片、以及 .cr3 .dng 的 RAW 格式。而对上传视频的要求是不能使用 HDR 功能,且文件大小不超过 5GB。
无论是使用 Luma 3D Capture 进行拍摄还是上传视频,Luma 都建议通过绕圈的方式捕捉场景或物体,尽可能从三个高度进行环绕拍摄:手机在胸部高度平视前方,手机稍高于头部,略微向下指向场景中心,以及稳定捕捉以减少模糊。值得注意的是,Luma 通常需要较长的时间完成 3D 场景生成任务,以下是一个三维场景案例。和文字生成的 3D 模型一样,通过拍摄或上传影像生成的 3D 场景同样能导出为上述说明的文件格式。
除了 Luma 3D Capture,Luma AI 还提供了 Luma Dream Machine 应用,它不需要额外学习提示工程,Luma 与用户一起脑洞风暴,协作构思,快速创建个性化的图像和视频。在 Luma Dream Machine 应用内,用户可以生成图片、视频以及人物头像三种类型的多媒体文件;如下图由 Luma AI 生成的水獭读报视频(视频1,视频2)。关于更多 AI 生成视频的内容,《AI 视频爆发式更新- 近半年 13 个值得关注的闭源产品动向》这篇文章内总结了大部分的 AI 视频产品。
Luma 3D Capture 目前是完全免费下载和使用,没有内购项目;iOS 版没有上架国区 App Store,Android 则可前往 Google Play Store 安装使用。使用 Genie 生成 3D 物体可以在 Luma 网页上操作,但 3D 场景拍摄必须使用手机应用,在 Luma Capture 网页上仅支持上传文件以生成 3D 场景。
而 Luma Dream Machine iOS 版可在国区商店免费下载,Android 版暂未提供,不过在网页版也能体验全部服务,应用内提供了免费、轻量、加量和无限量四种方案;免费方案每月有 400 积分,大约可生成 100 张图片或 4 个视频。如果希望将生成的图片或视频用作商业目的,则必须开通加量,即 Plus 会员计划。两款应用 Android 版都可以在 Google Play Store 搜索下载。
Splix:由 AI 驱动的第二大脑
Splix 就像 ChatGPT,但针对您的个人知识库量身定制。您使用 Splix 并保存的信息越多,它就越能准确地提供您所需的内容。这使得它成为创建和发现新知识的终极工具。
Splix 给我第一眼的感觉是一个笔记工具,我能通过 Splix 创建笔记。在编辑页面,Splix 和 Notion 的风格很像,支持简单的 Markdown 语法和常见的快捷键编辑方式。但和常见的 AI 笔记工具不同,Splix 仅支持根据正文内容对标题进行改写,而无法在笔记内容中使用 AI 润色或生成等功能。
Splix 还是一个「稍后读」工具,在手机上读到有意思的内容,可以直接分享到 Splix 保存,它会抓取整个网页的内容,为保存的链接自动生成 AI 标签和总结标题。在手机上搜索,Splix 会根据保存的笔记或链接内容智能匹配对应的结果。
目前 App 的功能比较有限,上传图片等体验都不算太友好,且主要的 AI 功能暂未更新。而在网页版,Splix 又可以是一个 AI 搜索工具,像 Perplxity 一样 。在网络版,用户可以像其他 AI 聊天工具一样,与 Splix 进行对话,使用 Splix 进行搜索。此外,Splix 的优点是会根据保存的信息来进行回答。如下图所示,我只分享了少数派的文章链接到 Splix,但在向它提问时,它会自动从知识库中保存的链接抓取内容进行整理。
Splix 完全免费使用,应用仅提供 iOS 版本,可以在 App Store 免费下载且不包含任何应用内购项目;但在 Splix 服务条款中有写到会提供免费和付费版本,某些功能可能仅限于付费版本。
其他工具
上述介绍的五个应用目前都可在 App Store 免费下载且无任何内购项目。但大语言模型工具意味着持续对算力的消耗,即昂贵的 Token,免费将不会是这类应用的常态。为了能同步更新最先进的技术成果,大部分 AI 工具最后都会选择订阅制。它们个性化和专业的服务,也让用户不断增加对 AI 工具付费的意愿。下面这些工具都提供了免费和付费计划,它们正处在积极开发中,通过大语言模型的能力,致力于提供高效的 AI 体验。
3MinTop:3 分钟 AI 读书
3MinTop 是一款正在开发的 AI 阅读工具,目前仅提供网页版。3MinTop 利用 AI 智能总结和结构化思维导图以及深入对话问答,帮助用户用最轻松的方式在3分钟内掌握核心内容。此外,它还提供了丰富的数据可视化仪表盘,利用科学的数据驱动的学习激励机制,帮助用户轻松养成阅读习惯。
3MinTop 的免费版不支持自定义模型 API,提供 100 MB 上传存储空间,50 本数量限制,以及 10 万积分额度(一般书本文字较多,10 万积分消耗较快,不同模型积分消耗倍率不同,大约可支持 10 次总结/思维导图生成;目前提供了 Doubao-pro-128k 和 GLM 4 FlashX 两个免积分模型),有轻量版、标准版和高级版三类付费计划,具体内容可参阅官网。
Napkin:AI 生成可视化图表
Napkin 是一款文生图表工具,它能帮助用户将现有的文本内容转化为图表、场景和图像等视觉元素。使用 Napkin 非常简单,用户可以通过其内置的 AI 生成文字工具,提供概括的话题,Napkin 就会生成一篇对应的文档;此外,也可以像使用常见文本编辑器意愿自己输入或粘贴内容。创建文本之后,用户选择要生成图表的文字,点击图标按钮,Napkin 会生成多个样式的图表,包括思维导图、流程图、鱼骨图、饼图、脑图等等,都是色彩丰富、样式新颖的文本可视化案例。得到图表后,用户还可以在此基础上自由的对样式和文本进行编辑,并将它们以链接形式分享或导出为 .png、.pdf 或 .svg(作者表示「我们不支持 JPEG,因为 PNG 质量更高」)。
Napkin 提供免费计划,但在配额和自定义功能方面有一些限制;目前 Napkin 处于测试阶段,用户可以免费享受专业计划!Napkin 仅提供网页版,作者认为最佳的编辑体验是在桌面设备上,移动设备可使用浏览器进入网页查看。
KaChiKa:从生活中学习日语
KaChiKa 的功能非常简单,用户上传一张自己随手拍摄的图片,它会利用 AI 分析图片内容以生成多个单词。这些单词会显示在图片上对应的位置,单词标签可点击并带有例句和发音功能。目前 KaChiKa 正在积极开发中,作者表示将来会加上单词本、单词复习等功能。
KaChiKa 提供 iOS 和 Android 版本,由于服务器在海外,国区暂未上架;免费计划有图片上传数量限制。作者还制作了学英语的版本,同样的 UI 与功能设计,在 iOS 或 Android 应用商店搜索 KaChiKa En 即可体验。
最后
从心理健康、新闻资讯、文本转语音、文生 3D 到知识库和提高生产力,本文介绍了多款目前可免费使用的 AI 应用。它们充分利用大语言模型的优势,提供了通用模型工具如 ChatGPT 或相关自搭建智能体等无法实现的独特价值。
大语言模型的潜力无限,有将 AI 引入日记的心光,它利用本地 AI、个性化 AI 和大语言 AI 来主动回应用户的心声;以及此前为大家介绍过的 Paperlib,在大版本更新后也带来了论文的自动标签、总结以及和论文对话等功能;还有很多像是 AI 旅游规划助手、AI 稍后读、知晓项目库的 AI 代码编辑器等众多 AI 加持的 App。
未来 AI 的应用场景会更加广泛,而搭建智能体大部分时候需要学习复杂的提示词工程,或者框架知识。如果你对智能体感兴趣,可以参考这份精选的 AI 智能体框架、启动平台、工具、教程及资源列表以及精选的 AI 提示词。更多的 AI 工具可以参考 a16z 分析的当前最具影响力的前 100 个 AI 应用,也欢迎大家分享自己喜欢的 App+AI。
> 关注 少数派小红书,感受精彩数字生活 🍃
> 实用、好用的 正版软件,少数派为你呈现 🚀