本期概要: 

  • 实践:「最小化提示词」原则
  • 思考:语言是对世界的理解框架
  • 好用:用 Claude 画各种封面、海报的提示词
  • 有趣:Jiffy Reader,让网页阅读更快
  • 推荐:Gemini 2.0 发布,适合日常对话使用
  • 拾遗:Claude 词生卡设计深度分享
Image

🎐 卷首语

  • 早些时候和 @少楠 在聊笔记方法和知识管理的看法,意识到阶段性回顾对于思考的必要性。
  • 亦是受「产品沉思录」启发,记录所见所知,以见知之,是为「见知录」。

By 一泽Eze 


先推荐今年最感动的一首歌。LiSA 的《Hello world》,温柔且富有生命力,作为开篇再合适不过。 

今年有幸在 LiSA 亚巡 2024 上海站的现场,和全场观众一期合唱了这首歌,那种感动至今难忘。 

Image

👋 写在 Vol.001 的开头:聊聊我和专栏定位

见知录是写给自己的阶段性反思,将记录我对“我想成为什么样的人”的探索,以及途中的所见所思。 

如果你是第一次看到我,你也可以通过我的个人主页,深入了解我做过的、正在做的事。 

从当下的优先级来看,我希望我能成为: 

  • AI 时代下,有“人情”味的创造者:多多关注“人”的需求,创造有人爱用的新应用。具体形式上,无论是 Prompt,还是更完善的产品形态,皆是如此。
  • 不断学习、心存好奇的“真”人:世界很大,在不断变化,走在路上总会遇到新人、新事。持续学习并搞懂自己感兴趣的课题,既是与“退化为地球 Online 的 NPC”这事划清界限,长期来看也能增加抗风险的能力。
  • 好产品经理:做出好产品一直是我的执念,甚至个性签名都是“做自己认同的内容,改变一小撮人的生活”。真的,做出自己认可的东西,还能产生价值和影响力,实在是太酷了。

为此,这个专栏也将多关注 AI、产品、知识管理、商业、哲学 领域,从我最近在做的事、在看的信息中,筛选值得回顾的部分进行整理,分享我的反思和收获。 

 

好了,就介绍到这里,让我们开始吧。 


🔦 实践:「最小化提示词」原则

1)从「输入-输出」视角设计 AI 产品

最近在探索 AI 产品设计的过程中,多次陷入了提示词的 workflow、template 的精雕细琢,最终却发现为了更好的 AI 效果,需要从用户输入与整体逻辑推倒重来的情况。 

AI 应用设计,应当花更多的精力去思考 AI 系统“输入-输出”的边界。 

“提供哪些 input 为 AI 所用,需要 AI 输出何种回应”,远比为 AI 灌入方法论、干预 AI 的决策过程更重要。 

AI 个人事务管理系统中,让 AI 基于用户的身份、年度 OKR、近期目标等信息进行动态优先级评分,远比人为设定的通用优先级打分规则,更能照顾真实的用户的最佳决策需要  

其实大模型有着比人类更强的模式识别能力,更加擅长做关联思考、量化分析等系统二的思考。 

当我们提供足够丰富的上下文信息时,它能够自主发现信息之间的关联,形成比人工规则更细腻的决策依据。 

即使希望提升输出的质量,也应该先尝试优化输入环节的数据种类和质量,而不是补充复杂的方法论提示来约束模型行为。 

2)最小化提示词原则

同样的,在 AI DEMO 的提示词调试阶段,我会更主张优先尝试简练的提示词策略:定义清晰的输入和输出目标,看看 AI 的反应,而不是过度框定方法论。 

也就是优先定义“有什么、做什么”,而不是“怎么做”——把我们的提示词设计“最小化”。 

比如,提示 AI 它有什么信息可用,需要输出什么结果(PS:few-shot 技巧也是非常好的提示技巧) 

Image
Image

复杂规则的提示词更容易生成僵化、千篇一律的结果 

Image

 

主要考虑点有三: 

  • 输出目标的确定性:
    • 在特定场景中,我们对输出的期望通常是稳定的
    • 相比之下,“怎么做”路径可以更加灵活
  • “黑盒”模型能力的最大化:
    • 实践表明,聪明的大模型能在高维嵌入空间自主建立更丰富的信息关联
    • 比如,Claude AI 脱离人类 Prompt 的机械方法论后,反而能创作出更加优秀的文学作品
    • 过度详细的方法论指导反而可能限制模型的发挥
  • 模型迭代的适应性:
    • 各家厂商的模型能力在持续提升,过度复杂的提示词可能面临与微调相似的版本适配问题——当模型基座升级后,之前精心设计的提示词反而限制了新版本模型能力的发挥。

待 DEMO 初具雏形后,为生产环境的用户体验,再逐步提升提示词的要求精细度,提升 AI 输出的稳定性。 

 

推荐阅读: 


🤔 思考:语言是对世界的理解框架

因为研究提示词设计,自然也会对「语言」的实质有所好奇。 

在读了《寻觅意义》的开篇“中西方文化差异的渊源”后,自己的理解也变得更加清晰: 

  • 人类通过语言这套符号系统,为外部事物、知识概念贴标签,从而得以保存、传达信息
  • 语言是对世界的理解框架
    • 人类借助语言存储、回忆、传达过往的体验、情感、经验。这类似大模型的 Prompt,可以定向提升特定领域知识的输出概率
    • 正如维特根斯坦的名言:“我的语言的界限意味着我的世界的界限”
      • 例如,提起“世界”一词,我们才能意识到自身存在于一个广阔的世界之中,其中有山川河流,人间百态;
      • 倘若没有“世界”这个语言概念,我们对环境的感知也将局限于狭小的周遭
    • 如果失去语言,人就无法清晰地回忆起过往体验的细节与思考
  • 同时,人以语言为家,每种语言传承着独特的群体智慧与集体文化
    • 比如,汉语保存着中国人的群体文化、体验、情感、知识
      • 提起汉语的“家”,脑子里回想到的,必然是中国式的家庭关系
      • “缘分”是典型的中国文化特色的概念,很难在其他文化中找到一个能同时象征“宿命论、必然性与偶然性共存”的概念。所以外国人很难理解“有缘千里来相会”的“缘分”,因为他们的文化中缺乏类似的观念和表达方式
  • 所以,不同母语者之间,不仅仅是语言的不同,更有着对世界的理解差异。而一种语言的消失,是对世界理解框架的消失

那么,基于统计关联进行思考的大语言模型 AI,是否能用特殊语种的词汇,创作更好的提示结果呢? 

推荐阅读: 


📝 立刻记下你的灵光和感动

原本这期想分享更多最近的阅读心得,但在整理回顾的时候,却发现难以重现初读时的触动与思考。 

人的每个想法,都不是对单一刺激的简单回应,而是个人知识、近期见闻、瞬时情绪共同触发的概率结果。 

正如胡塞尔所描述的“意识流”,我们的意识并非静态的容器,而是各种经验持续流动的过程,想法便在这种流动的交织中涌现。 

所以务必立即记下自己乍现的灵光与感动,一旦错失,便难以重觅。 


🙋 好用:用 Claude 画各种封面、海报的提示词

自从 Claude 3.5 sonnet 更新到新版后,增强了视觉理解与编程质量,词生卡效果已经完美进化到下一个 Level(当然,有时还是需要“抽卡”) 

用 Claude 画公众号封面

// 作者:一泽Eze
// 名称:公众号封面绘制
// 用途:根据文章内容绘制公众号封面
// 版本:v0.1
// 模型:Claude 3.5 sonnet new
请帮我设计公众号文章的封面,你可以先通读文章,提炼要义,思考适合用来做封面的灵感。
我希望你能巧妙运用 emoji、对话框等元素,运用 react ,制作出具有极佳设计感、文字不错乱、具有高级品牌感的公众号封面
## 以下是正文:
{{直接粘贴你的原文}}

效果示例: 

Image

如果第 1 版效果一般,可以多尝试以下方法: 

  • 通用改进提示词
你是超强的视觉设计师,请反思当前版本的问题,迭代并改进,要有高级感、品牌感
  • 直接提出针对性意见,如:主题色改为浅色调、增加文字投影效果

用 Claude 画海报

// 作者:一泽Eze
// 名称:海报绘制
// 用途:绘制简单海报
// 版本:v0.1
// 模型:Claude 3.5 sonnet new
用 React 绘制可视化的海报,{{填写目的,如宣传预告}}
{{粘贴可供参考的文案、内容}}
Image

如果需要调整海报内容,可给出具体提示,如 白色底,浅绿色主题,轻微投影。 

Image

用 Claude 绘制可视化概念图,用于 PPT 等插图场景

// 作者:一泽Eze
// 用途:生成可视化图片,辅助 PPT 等场景插图
// 版本:v1.0
// 模型:Claude 3.5 sonnet new
深入理解下面的内容,step by step 进行核心主旨分析、关键要素提取、逻辑结构分析,用 react 绘制可视化图
## 注意!
1)判断内容丰富度:如果内容要素过于简单,可根据正确的知识适度拓展内容要素
2)体现专业感、高端感
3)如无必要,必须用中文
4)不要点击交互
## 内容
{{需要表达的核心内容}}
  • 浅色版示例:
Image
  • 深色版示例:
Image

用 Claude 绘制微信 UI

Image

总之,发挥脑洞,只要是网页、软件界面设计能做出的图片效果,只要没有专业要求,大部分都能靠 Claude AI 来实现了。 

 

如果你很想试试这种 AI 应用方式,我常用以下 2 种途径: 

  1. Monica.im :一个优秀的 AI 助手工具,付费后可使用 Claude 3.5 sonnet 、ChatGPT-4O 等顶级大模型(也是我目前最常用的 AI 对话助手;🔗 是我的邀请链接,如介意可自行搜索 Monica)
  2. Claude.ai :claude 官方原版,注册后可每日限额免费体验(但存在较高的封号风险)

也可以通过 Cursor、Windsurf 等 AI 编程产品,调用 Claude AI API,但不支持 Artifacts 这种即时预览的使用方式,需要单独保存代码文件后查看。 

不过好处是,可以用 MD、CSV 等格式的文件,存储提示词、更新记录和 AI 交互数据。 


🔦 有趣:Jiffy Reader - 让网页阅读更快

Image
  • 一个有意思的 Chrome 插件,动态修改网页文本样式,加粗每个单词的前半部分,引导眼睛快速浏览内容。
  • 参考了仿生学设计,符合人类视觉认知特点:
    • 我们的眼球运动并非连续的,而是通过"跳跃式扫视"来阅读;
    • 大脑实际上并不需要看到每个单词的完整形态;
    • 减少认知负担:突出关键部分,降低了大脑处理每个单词所需的努力;
    • 引导注意力:字体的变化创造了视觉节奏,帮助维持阅读专注度。
  • ADHD 人群反馈效果显著。
Image

Btw:AI 编程降低了独立开发门槛后,可以多试试解决这种有意思的小众需求 


🤖 推荐:谷歌推出 Gemini 2.0,多模态的极速对话新体验

上周,大厂们发布了很多新产品,我印象比较深的是谷歌推出的 Gemini 2.0。 

超快的响应速度,准确的多模态能力,支持实时视频语音,确实是全新的、令人期待的新发展。 

Image
  • 快的吓人的 Gemini 2.0 Flash:
    • 输出速度极快:Gemini 2.0 Flash 的输出速度比鼠标滚屏速度还快,超越了人类普通阅读节奏,这带来了极佳的 AI 对话体验。
    • 免费体验:现可通过 Gemini APP 和 AI Studio 免费体验,支持 API 调用。
Image
  • 务必亲自体验的多模态实时聊天模式
Image
  • 通过 AI Studio 的 Stream Realtime 功能,你可以和 Gemini 2.0 Flash 开展 3 种不同的高级聊天模式
  • 视频聊天:让 AI 通过你的设备摄像头,看到你身边的环境。
  • 共享屏幕:你可以就屏幕上的任何内容,和 AI 展开讨论,比如让它教你写文章、一起看视频、教你打游戏
Image

一泽的体验反馈: 

  • Gemini 2.0 Flash 生成速度极快,多模态表现良好,并且支持 100w token 的超长上下文对话
  • 不过在复杂逻辑问题、格式遵循性上,表现略逊 Claude 3.5 sonnet
  • 推荐日常的普通对话任务使用

📥 拾遗


第一次试写周刊类型的内容,发现确实不容易。非常希望找我聊聊阅读感受、建议 🙋‍♂️ 

欢迎通过微信:eze_is 和我交流~