见知录 Vol.001：语言是对世界的理解框架

本期概要：　
实践：「最小化提示词」原则
思考：语言是对世界的理解框架
好用：用 Claude 画各种封面、海报的提示词
有趣：Jiffy Reader，让网页阅读更快
推荐：Gemini 2.0 发布，适合日常对话使用
拾遗：Claude 词生卡设计深度分享

🎐 卷首语

早些时候和 @少楠在聊笔记方法和知识管理的看法，意识到阶段性回顾对于思考的必要性。
亦是受「产品沉思录」启发，记录所见所知，以见知之，是为「见知录」。

By 一泽Eze　

先推荐今年最感动的一首歌。LiSA 的《Hello world》，温柔且富有生命力，作为开篇再合适不过。　
今年有幸在 LiSA 亚巡 2024 上海站的现场，和全场观众一期合唱了这首歌，那种感动至今难忘。　

👋 写在 Vol.001 的开头：聊聊我和专栏定位

见知录是写给自己的阶段性反思，将记录我对“我想成为什么样的人”的探索，以及途中的所见所思。　

如果你是第一次看到我，你也可以通过我的个人主页，深入了解我做过的、正在做的事。　

从当下的优先级来看，我希望我能成为：　

AI 时代下，有“人情”味的创造者：多多关注“人”的需求，创造有人爱用的新应用。具体形式上，无论是 Prompt，还是更完善的产品形态，皆是如此。
不断学习、心存好奇的“真”人：世界很大，在不断变化，走在路上总会遇到新人、新事。持续学习并搞懂自己感兴趣的课题，既是与“退化为地球 Online 的 NPC”这事划清界限，长期来看也能增加抗风险的能力。
好产品经理：做出好产品一直是我的执念，甚至个性签名都是“做自己认同的内容，改变一小撮人的生活”。真的，做出自己认可的东西，还能产生价值和影响力，实在是太酷了。

为此，这个专栏也将多关注 AI、产品、知识管理、商业、哲学 领域，从我最近在做的事、在看的信息中，筛选值得回顾的部分进行整理，分享我的反思和收获。　

好了，就介绍到这里，让我们开始吧。　

🔦 实践：「最小化提示词」原则

1）从「输入-输出」视角设计 AI 产品

最近在探索 AI 产品设计的过程中，多次陷入了提示词的 workflow、template 的精雕细琢，最终却发现为了更好的 AI 效果，需要从用户输入与整体逻辑推倒重来的情况。　

AI 应用设计，应当花更多的精力去思考 AI 系统“输入-输出”的边界。　

“提供哪些 input 为 AI 所用，需要 AI 输出何种回应”，远比为 AI 灌入方法论、干预 AI 的决策过程更重要。　

AI 个人事务管理系统中，让 AI 基于用户的身份、年度 OKR、近期目标等信息进行动态优先级评分，远比人为设定的通用优先级打分规则，更能照顾真实的用户的最佳决策需要　　

其实大模型有着比人类更强的模式识别能力，更加擅长做关联思考、量化分析等系统二的思考。　

当我们提供足够丰富的上下文信息时，它能够自主发现信息之间的关联，形成比人工规则更细腻的决策依据。　

即使希望提升输出的质量，也应该先尝试优化输入环节的数据种类和质量，而不是补充复杂的方法论提示来约束模型行为。　

2）最小化提示词原则

同样的，在 AI DEMO 的提示词调试阶段，我会更主张优先尝试简练的提示词策略：定义清晰的输入和输出目标，看看 AI 的反应，而不是过度框定方法论。　

也就是优先定义“有什么、做什么”，而不是“怎么做”——把我们的提示词设计“最小化”。　

比如，提示 AI 它有什么信息可用，需要输出什么结果（PS：few-shot 技巧也是非常好的提示技巧）　

复杂规则的提示词更容易生成僵化、千篇一律的结果　

主要考虑点有三：　

输出目标的确定性：
- 在特定场景中，我们对输出的期望通常是稳定的
- 相比之下，“怎么做”路径可以更加灵活
“黑盒”模型能力的最大化：
- 实践表明，聪明的大模型能在高维嵌入空间自主建立更丰富的信息关联
- 比如，Claude AI 脱离人类 Prompt 的机械方法论后，反而能创作出更加优秀的文学作品
- 过度详细的方法论指导反而可能限制模型的发挥
模型迭代的适应性：
- 各家厂商的模型能力在持续提升，过度复杂的提示词可能面临与微调相似的版本适配问题——当模型基座升级后，之前精心设计的提示词反而限制了新版本模型能力的发挥。

待 DEMO 初具雏形后，为生产环境的用户体验，再逐步提升提示词的要求精细度，提升 AI 输出的稳定性。　

推荐阅读：　

Claude 共振式提示词 by 李继刚｜AI 自主创作优秀文学作品实践案例

🤔 思考：语言是对世界的理解框架

因为研究提示词设计，自然也会对「语言」的实质有所好奇。　

在读了《寻觅意义》的开篇“中西方文化差异的渊源”后，自己的理解也变得更加清晰：　

人类通过语言这套符号系统，为外部事物、知识概念贴标签，从而得以保存、传达信息
语言是对世界的理解框架
- 人类借助语言存储、回忆、传达过往的体验、情感、经验。这类似大模型的 Prompt，可以定向提升特定领域知识的输出概率
- 正如维特根斯坦的名言：“我的语言的界限意味着我的世界的界限”
  - 例如，提起“世界”一词，我们才能意识到自身存在于一个广阔的世界之中，其中有山川河流，人间百态；
  - 倘若没有“世界”这个语言概念，我们对环境的感知也将局限于狭小的周遭
- 如果失去语言，人就无法清晰地回忆起过往体验的细节与思考
同时，人以语言为家，每种语言传承着独特的群体智慧与集体文化
- 比如，汉语保存着中国人的群体文化、体验、情感、知识
  - 提起汉语的“家”，脑子里回想到的，必然是中国式的家庭关系
  - “缘分”是典型的中国文化特色的概念，很难在其他文化中找到一个能同时象征“宿命论、必然性与偶然性共存”的概念。所以外国人很难理解“有缘千里来相会”的“缘分”，因为他们的文化中缺乏类似的观念和表达方式
所以，不同母语者之间，不仅仅是语言的不同，更有着对世界的理解差异。而一种语言的消失，是对世界理解框架的消失

那么，基于统计关联进行思考的大语言模型 AI，是否能用特殊语种的词汇，创作更好的提示结果呢？　

推荐阅读：　

《寻觅意义》by 王德峰｜安顿我们的内心，追寻生活的意义

📝 立刻记下你的灵光和感动

原本这期想分享更多最近的阅读心得，但在整理回顾的时候，却发现难以重现初读时的触动与思考。　

人的每个想法，都不是对单一刺激的简单回应，而是个人知识、近期见闻、瞬时情绪共同触发的概率结果。　

正如胡塞尔所描述的“意识流”，我们的意识并非静态的容器，而是各种经验持续流动的过程，想法便在这种流动的交织中涌现。　

所以务必立即记下自己乍现的灵光与感动，一旦错失，便难以重觅。　

🙋 好用：用 Claude 画各种封面、海报的提示词

自从 Claude 3.5 sonnet 更新到新版后，增强了视觉理解与编程质量，词生卡效果已经完美进化到下一个 Level（当然，有时还是需要“抽卡”）　

用 Claude 画公众号封面

// 作者：一泽Eze
// 名称：公众号封面绘制
// 用途：根据文章内容绘制公众号封面
// 版本：v0.1
// 模型：Claude 3.5 sonnet new
请帮我设计公众号文章的封面，你可以先通读文章，提炼要义，思考适合用来做封面的灵感。
我希望你能巧妙运用 emoji、对话框等元素，运用 react ，制作出具有极佳设计感、文字不错乱、具有高级品牌感的公众号封面
## 以下是正文：
{{直接粘贴你的原文}}

效果示例：　

如果第 1 版效果一般，可以多尝试以下方法：　

通用改进提示词

你是超强的视觉设计师，请反思当前版本的问题，迭代并改进，要有高级感、品牌感

直接提出针对性意见，如：主题色改为浅色调、增加文字投影效果

用 Claude 画海报

// 作者：一泽Eze
// 名称：海报绘制
// 用途：绘制简单海报
// 版本：v0.1
// 模型：Claude 3.5 sonnet new
用 React 绘制可视化的海报，{{填写目的，如宣传预告}}
{{粘贴可供参考的文案、内容}}

如果需要调整海报内容，可给出具体提示，如白色底，浅绿色主题，轻微投影。　

用 Claude 绘制可视化概念图，用于 PPT 等插图场景

// 作者：一泽Eze
// 用途：生成可视化图片，辅助 PPT 等场景插图
// 版本：v1.0
// 模型：Claude 3.5 sonnet new
深入理解下面的内容，step by step 进行核心主旨分析、关键要素提取、逻辑结构分析，用 react 绘制可视化图
## 注意！
1）判断内容丰富度：如果内容要素过于简单，可根据正确的知识适度拓展内容要素
2）体现专业感、高端感
3）如无必要，必须用中文
4）不要点击交互
## 内容
{{需要表达的核心内容}}

浅色版示例：

深色版示例：

用 Claude 绘制微信 UI

总之，发挥脑洞，只要是网页、软件界面设计能做出的图片效果，只要没有专业要求，大部分都能靠 Claude AI 来实现了。　

如果你很想试试这种 AI 应用方式，我常用以下 2 种途径：　

Monica.im ：一个优秀的 AI 助手工具，付费后可使用 Claude 3.5 sonnet 、ChatGPT-4O 等顶级大模型（也是我目前最常用的 AI 对话助手；🔗 是我的邀请链接，如介意可自行搜索 Monica）
Claude.ai ：claude 官方原版，注册后可每日限额免费体验（但存在较高的封号风险）

也可以通过 Cursor、Windsurf 等 AI 编程产品，调用 Claude AI API，但不支持 Artifacts 这种即时预览的使用方式，需要单独保存代码文件后查看。　

不过好处是，可以用 MD、CSV 等格式的文件，存储提示词、更新记录和 AI 交互数据。　

🔦 有趣：Jiffy Reader - 让网页阅读更快

一个有意思的 Chrome 插件，动态修改网页文本样式，加粗每个单词的前半部分，引导眼睛快速浏览内容。
参考了仿生学设计，符合人类视觉认知特点：
- 我们的眼球运动并非连续的，而是通过"跳跃式扫视"来阅读；
- 大脑实际上并不需要看到每个单词的完整形态；
- 减少认知负担：突出关键部分，降低了大脑处理每个单词所需的努力；
- 引导注意力：字体的变化创造了视觉节奏，帮助维持阅读专注度。
ADHD 人群反馈效果显著。

Btw：AI 编程降低了独立开发门槛后，可以多试试解决这种有意思的小众需求　

🤖 推荐：谷歌推出 Gemini 2.0，多模态的极速对话新体验

上周，大厂们发布了很多新产品，我印象比较深的是谷歌推出的 Gemini 2.0。　

超快的响应速度，准确的多模态能力，支持实时视频语音，确实是全新的、令人期待的新发展。　

快的吓人的 Gemini 2.0 Flash：
- 输出速度极快：Gemini 2.0 Flash 的输出速度比鼠标滚屏速度还快，超越了人类普通阅读节奏，这带来了极佳的 AI 对话体验。
- 免费体验：现可通过 Gemini APP 和 AI Studio 免费体验，支持 API 调用。

务必亲自体验的多模态实时聊天模式

通过 AI Studio 的 Stream Realtime 功能，你可以和 Gemini 2.0 Flash 开展 3 种不同的高级聊天模式
视频聊天：让 AI 通过你的设备摄像头，看到你身边的环境。
共享屏幕：你可以就屏幕上的任何内容，和 AI 展开讨论，比如让它教你写文章、一起看视频、教你打游戏

一泽的体验反馈：　
Gemini 2.0 Flash 生成速度极快，多模态表现良好，并且支持 100w token 的超长上下文对话
不过在复杂逻辑问题、格式遵循性上，表现略逊 Claude 3.5 sonnet
推荐日常的普通对话任务使用

📥 拾遗

之前在特工宇宙、信通院的 AI 社区，直播分享了《Claude 词生卡提示词应用与创作方法》，补一下回顾链接：
- PPT 材料：P241007_Prompt 新玩法｜词生卡_特工宇宙线上分享密码：9&t25332
- 回放视频：https://meeting.tencent.com/crm/2apQ9gmK44

第一次试写周刊类型的内容，发现确实不容易。非常希望找我聊聊阅读感受、建议 🙋‍♂️　

欢迎通过微信：eze_is 和我交流～