Matrix 首页推荐 

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。

文章代表作者个人观点,少数派仅对标题和排版略作修改。


人脑每天产生 60000 个念头,你要吃什么样的特效药,才能快速捕捉并记录真正有价值的那 37 个?

为什么我们打字比手写快,但持续做一件小事的时候想到什么其他的,还是倾向于随手用纸笔而不是用键盘?

记录一个快速闪过的念头,人们一定会下意识地使用时间成本最低的方式。

—— 引自锤子科技介绍闪念胶囊功能

每次阅读这段介绍闪念胶囊功能的文字,我都感觉它直击痛点。在这个信息爆炸的时代,我们的大脑每天都在产生无数的想法,但如何在这些纷繁的思绪中捕捉到真正有价值的灵感,并将其及时记录下来,成为了一个普遍而迫切的需求。

在尝试了各种笔记应用后,我发现即便是 Obsidian 和 Logseq 这样强大的工具,在移动端的表现也难以真正满足随时随地、无压力记录的需求。而通过深入挖掘 iOS 的原生功能,结合当今蓬勃发展的大语言模型技术,则可以打造一个更加智能、高效的闪念捕捉系统。这个系统不仅能满足快速记录的需求,还能进一步提升内容的质量和可用性。

最终效果展示

想象以下场景:

你正在晨跑,突然想到一个价值 100 亿的创意。你只需要唤醒 Siri,说「捕捉闪念」然后口述你的想法,几秒钟后你的语音已被转为文字,经 AI 润色并整齐保存在今天的笔记中。

你在图书馆看书时,遇到一段值得记录的内容。轻点主屏幕上的快捷方式图标,快速输入文本。瞬间,这段文字被添加到同一个日期的笔记中,与你早晨的语音笔记并列。

晚上回顾一天的灵感时,所有的闪念都被智能地整理在一起,去除了冗余,保留了精华,为你的创意提供了清晰的脉络。

使用效果

这就是我们今天要实现的智能闪念胶囊指令——它综合了语音识别、文本输入、AI 处理和智能组织功能,真正做到了「无压力记录」和「高质量输出」。

为什么需要这个系统?

速度至上:正如闪念胶囊介绍所言,记录闪念的关键在于速度。我们的系统支持语音和快速文本输入,确保你能以最快的速度捕捉灵感。

AI 加持:通过集成大语言模型接口,系统能自动将你的语音转为文字,并进行智能润色。它不仅能去除那些「嗯嗯啊啊」的口癖,还能优化表达,让你的记录更加精炼和有条理。

本地优先:不依赖外部应用,利用好本地工具和信任的 API,大大降低了数据泄露的风险。

灵活多样:无论你是喜欢口述还是打字,是在运动中还是在安静的环境里,都能适应你的需求。

持续进化:作为一个基于快捷指令的记录方式,可以根据使用体验不断调整和优化,使之更贴合你的个人习惯。

所需工具

  • iPhone(运行最新版 iOS)
  • Apple 原生备忘录应用
  • Apple 系统原生快捷指令应用
  • Groq 提供的 Whisper API(用于语音转文本)1
  • DeepSeek 模型 API(用于文本润色)2

工作流程

  • 输入选择:可以选择语音输入或文本输入模式甚至直接将剪贴板中的内容黏贴进去。
  • 数据处理
    • 语音输入:通过 Whisper API 转换为文本。
    • 文本输入:直接接收用户输入的文本或剪贴板内容。
  • 内容优化:使用 DeepSeek API 对文本进行润色和改进,提升表达质量。
  • 自动归档:将处理后的内容保存到以当天日期为标题的备忘录中,形成有序的日志。
  • 用户反馈:操作完成后立即通知用户,确保操作的可见性,增强使用信心。

构建步骤

申请 API

Whisper API:前往 Groq 官网申请。选择 Groq 最大的原因是对于我们这种低频调用的场景语音识别的免费额度已经完全能够覆盖。

DeepSeek API:访问 DeepSeek 网站申请。选择 DeepSeek 的原因也在于其极高的性价比。

编写快捷命令

让我们一步步创建这个快捷指令:

  • 新建一个快捷指令,命名为「闪念笔记」
  • 添加一个菜单,提供「文字输入」、「语音录入」和「剪贴板」三个选项。

根据用户选择,设置响应的输入方式:

  • 文字输入:使用「要求输入」操作
  • Whisper:添加「录音」操作
  • 剪贴板

对于语音输入,添加调用 Whisper API 的脚本,将录音转换为文本:

无论输入方式如何,都将得到的文本内容发送给 DeepSeek API 进行润色:

设置 DeepSeek API 的调用参数,包括模型选择和提示词:

将润色后的文本写入备忘录,添加时间戳便于回溯:

把今天的想法记录在今天的备忘录,像日记一样通过日期来找寻。每天第一次记录时都会自动在「闪念笔记」这个文件夹下创建一个新的备忘录。

编写提示词

提示词是指导AI模型如何处理和优化文本的关键。以下是我现在正在使用的提示词:

作为一名中文写作改进助理,你的任务是改进所提供文本的拼写、语法、清晰、简洁和整体可读性,同时分解长句,减少重复,并提供改进建议。注意,如果原文中链接或者引用内容,请务必使用链接或引用的原始内容。
润色后的文本应该遵循以下约束:
1. 减少形容词的使用,尽可能删除「的」和「了」。
2. 中文、英文、数字之间加空格;数字与单位之间无需增加空格;全角标点与其他字符之间不加空格。
3. 链接前后增加空格以区分。
4. 不重复使用标点符号。
5. 中文使用直角引号「」以及『』。
6. 使用全角中文标点,数字使用半角字符。中文中出现英文部分,仍然使用中文标点。
7. 遇到完整的英文整句、特殊名词,其内容使用半角标点。
8. 专有名词使用正确的大小写,使用公认的缩写。
请只提供文本的更正版本,避免包括解释。

使用技巧

  • 快速启动:
    • 利用 iOS 的辅助功能,设置敲击背面两下或三下来触发快捷指令。
    • 将快捷指令添加到主屏幕或控制中心,实现一键启动。
  • 语音触发:设置自定义的 Siri 命令,如「嘿 Siri,捕捉闪念」来启动系统。
  • 情景模式:创建多个版本的提示词,适应不同场景,如「工作灵感」、「创意火花」等。
  • 定期回顾:每天查看和整理你的闪念,将它们转化为实际行动。

潜在问题及解决方案

API 限制:对于访问 Groq API 存在障碍的用户,我推荐使用系统自带的语音输入,对于短时间内的语音输入也能满足需要。

结语

虽然市面上已经有许多语音笔记应用,但我对于笔记内容的安全性总有一些疑虑。前一段时间,我所使用的语音笔记应用 VoiceNotes 爆出了严重的隐私泄露问题,所有用户的笔记都混杂在了一起,这更是让我对云端笔记的安全性打上了一个大大的问号。

选择使用快捷指令的方式来实现一个语音笔记功能,很大程度上也是为了让笔记留在本地,确保数据的安全性和隐私。

图片来自网络
图片来自网络

我希望这个快速记录想法的在未来能够无缝地融入到我们基于 Apple 原生备忘录的日常工作流中。通过将快速捕捉的想法直接存储在备忘录中,我们可以充分利用 Apple 生态系统的优势,实现从记录想法到深度整理的完整工作流程。

资源

这是已完成的闪念笔记捷径,只需要将 API Key 修改为自己申请的 Key 即可。

> 关注 少数派小红书,感受精彩数字生活 🍃

> 实用、好用的 正版软件,少数派为你呈现 🚀