看过我前一篇文章的大概知道,我懂点数码,上一次写文章是因为AI帮助我翻译了一本书,那已经是2023年的事情了,AI发展了3年,中间有两年我去做硬件生态的工作,机缘巧合下还研究上了Embodied AI,结识了一堆做具身智能的大佬,甚至还是某云发布会上上所有具身智能伙伴的连接点,但那两年是看得多做得少,用的也很表面,只是把它当作对话框在使用。
去年差不多是这个时间点,做了一份洞察报告,结合各行业技术应用的案例,我认为具身智能举例商业落地还尚远,但LLM+AI Agent 的应用已经就在眼前了,当时Haivivi和AI玩具也正在风口之上,找个机会遍开始从事AI2C的创业。巧得很,当时如果不在国内搞这个,就去中东搞出海,此时此刻回想皆有可能是命运的安排。
创业嘛,需要我干啥就干啥,充当项目经理从0到1做了一款AI硬件产品出来,这期间团队完全拥抱AI,我个人用的更多的还是对话流式的AI。
从 Apple Watch 录音是m4a格式,国内的豆包、元宝当时都不支持网页对话框传上去语音转文字,只有通过iPhone 分享给豆包语音转文字来做会议纪要,到后来发现Gemini 网页端支持m4a格式,开始频繁使用Gemini和豆包等做对比,最终发现还是Gemini牛逼,便一直使用至今。
我也用了朋友公司集合式的AI对话工具,里面支持很多大模型,有段时间也很中意 Grok,但最终还是被Gemini俘获走了。讲实话,我第一次尝试用AI做对话外的事情是做workflow,当时比较火的就是Dify和扣子了,刚好同事安装好了本地的Dify,还在本地部署了一些千问的模型,于是就用Dify来做workflow。
创业公司必须要经历的就是招人,当时我们要招各个岗位的人,很多人完全在我们的认知之外,比如AI算法工程师、硬件工程师、嵌入式工程师,我们跟HR沟通JD就够费劲的了,还要面试,简直了。当时我就想到了一套AI面试工作流,当时一是没想到别人肯定做了,而是也不知道Dify可以直接复用别人的工作流,于是就自己从头开始做,好在确实不难,遇到了一些不是问题的问题,当时脑子真的不知道咋就没想到遇到问题截图问AI助手就好了,现在回想起来真是太蠢了。
不过我做的面试工作流前面差强人意,在用了几次后不断去调整系统里的Prompt是有变得越来越好用,只可惜当时集团的网络和我们部门网络的问题,没有让这个流程继续优化下去,基本上是我个人在用。如果有其他人加入进来,不断的提优化和改进建议会更好用,成长为一个优秀的Skill也不是不可能的,放现在来看OpenClaw 就可以简单搞定我原来的流程了,Claude 创建Skill 就更简单了。
后续我做项目经理过程中,基本把所有的内容都交给了AI来做,包括写文档、做PPT、做需求分析、做竞品分析等等,AI都做得很好,甚至比我做得还好,这让我开始思考,AI到底能做些什么,AI不能做些什么,AI和人的关系到底是什么。尤其是当时我们还打算做AI陪伴类产品。
当然我除了做这个工作流外,其他工作完全是融入了Gemini网页端,每天上班就是打开对话框。后面经历项目计划分析、问题分析、问题回溯等,基本我的Gemini全都懂,尤其是费劲给Gem调好系统提示词之后越发觉得它好用。用Gemini做了产测整个流程的梳理和产测APP的Demo开发,觉得自己用的很好了,现在回头看,都是来时路。
此刻回想,当时我为什么没有用上Cursor呢?同事都买了富余的账号了,他部署模型和做其他事情应该都是Cursor直接办的。反思下来还是自己不够先进,应该多去学习和了解,当然这也可能是我与 Antigravity的缘分吧,如果不是Cowork,我应该也还没用上Claude,虽然我真的觉得他很牛,可是我已经深深的爱上了Antigravity。
前言够长了,总结起来,在用AI,但没有用好AI,直到我工作稍微没那么忙之后开始学习更多,打开了视野,才发现自己之前用的都是皮毛。3年前写那篇文章之后,我认识了一群热爱运动的网友们,这两年见他们比见身边一些老朋友还多,写这篇文章,我不知道会是什么样的收获,但我希望能传递出去“AI+”的无限可能。
还有余热的OpenClaw你用了吗?是不是发现最后还是得自己想明白怎么用最重要,不要陷入学习工具的怪圈。永远相信自己经历的一切都是价值的,让工具服务于我们现在的生活和工作。AI替代不了一个有独立思考能力的人,但AI可以替代一个没有独立思考能力的人。
不要去想,去干,干中学。
什么是 Vibe Coding?
几个月前,如果有人告诉我能零代码独立开发全栈微信小程序、原生 iOS 笔记应用和具有丝滑转场动效的独立网站,我只觉得离谱。现在这个想法变成了现实。起决定作用的是 Vibe Coding 工作流兴起,以及基于 Gemini/Claude等大模型以及对应的IDE编程工具。
这里记录了一个产品经理从写零散 Prompt 到掌握智能体架构体系的实践历程,献给由于技术门槛望而却步的人。我也不是一蹴而就,前面分享那么多是想说,我也不聪明,走了很多弯路,甚至跟AI交流都没有很高效。只要开始做了,一切便有可能了。
Vibe Coding 的核心只有一条:“想”大于“敲”。
感觉对了就跑。无需背诵语法,只要讲清楚需求,你就是主理人,甚至讲不清楚需求,让AI去尝试都行。AI 不再是代码补全器,你负责设计审美、拆解需求、统筹逻辑,AI 负责编码落地。
一副 Meta 眼镜与一场架构觉醒
Meta 眼镜出来的时候我可兴奋了,觉得AI+硬件的未来来了,本来打算在AK的店里买一副,后来想想实在是没啥用就作罢了,钱甚至都付了,我给取消订单了,后面便没有想过这事。
今年1月份,朋友从美国带回一副 Meta 智能眼镜。为了体验专属的 Meta AI,我找朋友帮忙搞定漂亮国区原生 Gmail 和相关平台账号,只有这样子我才算是用上了漂亮国的AI服务。
去年9月开始,我所在的 YoooTek 团队在内部订阅了搭载 Gemini Ultra 的开发平台。当时还只用了Gemini,因为账号问题尝试过Antigravity没有成功放弃了,这次账号好了,咸鱼帮助我实操了 Antigravity 智能系统。(顺带一提,我离职后前团队推出了全新产品 *YoooClaw*,也上架少数派众测了,值得关注。)
过年前大家都没什么心思工作的,我开始学习AI的方方面面,用上了NotebookLM,看了很多Antigravity的视频,决心用它来做我搁置已久的 Blowfish 为基础搭建的个人博客,尝试加上运动轨迹和铁三比赛记录。
想起来之前做这个数据同步都搞半天,那时候是用ChatGPT搞的,不是很顺利。我没有代码基础,前期包括现在都是全凭大白话指令推进。中间遇到很多问题,我全丢给 AI 去审阅 GitHub Actions 的 run_data_sync.yml 自动化文件。它不仅排除了环境异常,甚至主动重构了低效的数据拼接逻辑。
这一次尝试,对我来说最大的突破就是发现我真的可以啥都不懂,不要把 AI IDE工具当作开发工具,当作更专业的编程助手,和网页端 Gemini 聊天一样的。开发多了发现缺乏约束是初级阶段最大的问题。像素级复制现有代码很容易,任由 AI 自由发挥经常会导致死循环。此时系统运行效率低下,一个导航栏的统一问题我都能改两天,经常触发 Token 耗尽限制,是Antigravity送的那几个模型全部都消耗完的程度,执行也是要等半天。不管如何网站勉强上线后,我意识到工作流需要革新。
我开始思考,如果是优秀的程序员,他们是如何来高效用AI写代码的呢?感谢互联网,总有愿意分享的大神,也感谢Github有好多现成的可以拿来用。
过年期间我开始尝试搭建 Agent 和 Skills 系统,引入 OpenClaw,结合本地部署的 Whisper 模型配合 Proxy 处理个人数据。在OpenClaw很火的时候,我没有太去凑热闹,因为我深知只有掌握自己的数据,才能让AI产生价值,世界上没有两片完全相同的树叶,我的数据在世界上也找不到另一份完全相同的,别人做好的Skill也只能是做参考,要做定制化的改造。我开始重新捡起来写东西,写日志,自己构建基本的个人数据,参考现有的AI记忆系统来存储,这时候是Cowork发挥作用的时候了,他帮我整理了Obsidian里所有的MD文件,分门别类,生成了AI能读懂的记忆访问体系。
还是落到实处,这套体系在开发第二款产品:类 flomo 的 iOS 笔记 App 时产生质变。

我对 iOS 开发一窍不通。不知道怎么在 Xcode 里建项目,更不会用 Simulator 调试环境。但在实操中,截图成了沟通密码。遇到报错框选截图,AI 直接给补丁修复。开发网页时,它会拉起 Chrome 录屏辅助排查。也是在这个阶段,我接触了 MCP (Model Context Protocol) 概念,认识到系统架构设计和组件分离对 AI 执行效率的决定性作用。
我有了初步的想法之后开始跟Gemini进行交流,看我的Prompt是不是很简单,大白话?
“确定我第三方应用能集成苹果Siri的能力吗?”、“确定我第三方应用能集成苹果Siri的能力吗?”、“我生成的个人数据能接入notebooklm吗?或者其他大模型工具”、“我可以用Siri的能力来录音到我的app里,但我的数据是存在我的云端的,大模型可以自定义,是行的通的吗”、“根据聊天记录画一下技术架构图给我。”、“现在我计划是设备端采集数据后走openclaw来处理,并设计产品的长期记忆记忆系统。请根据这个更新一下架构图。”、“openclaw处理的时候,又可以封装成不同的skills,比如说会议纪要,比如说闪念整理,还有其他日常会用到的 skills,我可以有skill封装,也可以在开源社区里找新的skill。”
其实聊到第一个框架之后,我就让 Antigravity 动手写了代码,写完发现运行不起来,问AI才得知要装Xcode才能运行,当时的MVP是开发一个Apple Watch录音后自动存到iCloud里面,同步在iPhone上显示。下载好了Xcode发现该怎么创建项目就不会,朋友提醒我创建Watch应用会自带一个iOS应用才把项目创建好,正式开始动工。
我也搞不清楚里面的文件夹之间的关系,后面开发的多了,也就知道是什么情况了。开发很长时间我都是在电脑端运行的,用的是模拟器,我以为iOS开发就是用模拟器呢,不知道要什么阶段用真机,也不知道怎么把APP装在真机里面,哪怕见过那么多猪跑,也是头一回吃猪肉,Xcode没办法CLI控制,我只能遇到问题就截图问AI怎么弄,找一个界面操作有时候就是眼瞎找不到,Help里面搜关键词有些时候也抓瞎,好在只是浪费点时间最后都解决了。
当我开发的 suisuinian 装在我的手机上时,激动坏我了,装在手机上后就发现问题了,真机和模拟器区别是有的,之前设计的架构不适用了,我开始跟AI商量改架构,参考OpenClaw的工作方式,问了AI这么个问题“我现在还没有云端,我在本地安装了openclaw,我开发过程中怎么办呢?”,他读取了OpenClaw的文档告诉我怎么配置 Tailscale,成功的解决了手机和电脑沟通的问题。
中间改架构让AI写代码,优化,解决卡顿,搞了很久才把老架构的东西基本清理完,我的Agent们还是不够高效,好多问题还是我弄的多了发现了问题,直接锁定范围让他搞才搞定。
为了获取更强逻辑推理支撑,单纯的觉得Minimax蠢,我订阅了 Claude Pro,也是在朋友的安利下开始用Cowork替代OpenClaw。让两个AI互相监督为了开发赋能,顶级模型配合“架构组件外加业务 Skills”的工作流闭环,确立了这套 Vibe Coding 运作机制。
(现在已经将OpenClaw 改成用Hermes+ Mac端 LLM处理)
微信小程序深水区实战:高频使用的三大核心技能

不知道怎么就卷入了开发小程序这件事情里,我当然是有意愿的,想验证我摸索的这套工作流。便有了我和俱乐部队友协作重构了一套铁三俱乐部会员管理系统,包含管理员后台。这个从简单到复杂项目彻底检验了这套工作流的抗压能力以及AI之间友好的协作能力。
这里面最费时间的是视觉风格统一,我不喜欢用那些生成的UI交互页面再开发功能的开发流程,我喜欢的开发流程是,先把功能做出来,再去优化页面,Gemini也有设计前端页面的能力,用React来做交互页面,每次我都还挺满意的,估计是已经跟我交流太多知道我喜欢什么了,我再把这个页面风格发给 Antigravity 参考,基本能复制出来效果。
功能开发完,优化好一个页面,开始让AI自己写UI规范,再一句话告诉他,将所有页面按照这个UI规范刷新一遍,坐等就行了。真正的尝到了规范框架下AI开发的高效的甜头,做好一个功能然后放大。
想到什么功能就开发什么功能,边开发边测试,遇到问题截图扔给AI让他去解决,开发好几个功能想要收敛的时候让AI去梳理框架,是否优化的方向,再决定如何优化,然后继续开发。如果按老的开发逻辑,研发早把产品经理骂死了。
如果说这里面哪里不够高效,那就是微信小程序开发生态比较封闭,不便于 AI 自动操作:开发者工具容易在挂 Proxy 时断网,缺乏稳定自动化控制命令。不过也在开发过程中熟悉了不负责的云端开发平台,要自己新建数据库、函数罢了。
整个微信项目从一个耗时四小时堆叠的简单会员积分管理小程序,最终演化成包含活动管理和流程审批体系的闭合系统。支撑它底层运作的,是以下四个高频调用的技能核心:
1. 探路者:**plan-ceo-review** (CEO 视角审查)
面对复杂逻辑变动,机器极易给出无法自洽的闭环。处理大规模改版前,我必然先唤醒审查技能。它从创始人视角分析全栈的逻辑严密性,核对前后端接口逻辑映射,梳理需求死角,杜绝制造低质量玩具代码。
2. 重构排错:**investigate** (源码溯源调研)
在积分系统后台上线前,测试环境爆出 500 error: object null is not iterable。
我直接激活 investigate 进入追踪状态。它顺藤摸瓜检索脏数据生成路径,捕获出代码结构考虑不周留下的历史隐患。直奔根本原因生成行级重写补丁,结束了全网搜解决方案的历史。
3. 记录者:**document-release** (自动同步更新流)
人工撰写维护开发文档枯燥乏味。每一次完整开发周期走完,我会触发文档同步进程,由它解析增量变更内容,自动提取架构调整模块和新增的环境变量同步至主说明档中。保证多项目无缝切换管理,机器或人接管代码不再因为断层而重头梳理业务上下文。
以上你都不会也没关系,有现成的 Skill 可以给你用,你也可以在开发过程中发现你总有重复的工作要做,那就让AI给你开发一个 workflow 来解决。
| 维度 | Skill (原子能力) | Workflow (预设流程) | Agent (自主实体) |
|---|---|---|---|
| 本质 | 解决“能不能”做的问题 | 解决“按什么顺序”做的问题 | 解决“做什么、怎么做”的问题 |
| 灵活性 | 固定、单一 | 逻辑固定,分支可控 | 高度自主,能处理非预期情况 |
| 驱动方式 | 被动调用 | 程序化触发 | 目标驱动 (Goal-oriented) |
| 类比 | 螺丝刀 | 组装说明书 | 工程师 |
云端痛点与提审防坑
本地代码完美跑通远非开发终点。小程序业务上线审核机制极其严苛,存在诸多流程卡点漏洞。
最棘手的环节在于应对接口封锁及严格合规化审查要求。比如说在重做地址信息申请功能中,AI 调用原生 wx.chooseAddress 表单项由于命中平台位置访问门槛限制,造成前端进程假死,我也懒得去申请权限,直接让用户填一下地址也无伤大雅。
我基于业务视角直接发出处理动作:“删除违规阻断的原生组件,用标准文本框替换重塑表单请求逻辑,去掉弹窗权限拦截。”几秒后拦截点去除。
上线前的提审还需要报备精确的《隐私保护指引协议》及版本提审文案。指令给出明确依据:“分析提取当前所有依赖字段参数,对应官方规范文件编写协议说明和提审材料详情。”生成的规避性文件满足上线所需资质格式验证。一人独立运作即满足从编码设计到过审法务全部要素流转。
结语
回头审视这些由机器迭代出来的工程代码,最大的收益并不是掌握了编码,而是建立整套基于指令、模型与架构拆解系统化做产品的运作模式。
从早期的散装文本投喂测试,进化到拥有专属矩阵模块及适配具体项目特性的 .geminirules 开发约束。今天启动任何新系统工程建设,这些固化好的经验就如同外挂脑图,成为了不知疲倦运转的构建组件库。
技术壁垒被彻底填平,决定最终输出效果的唯有产品设计蓝图及底层想法。
如果你有一个小众的产品设想需要变现,苦于找不到合适的工程师参与,建议尝试动手自己实现。依托现有 AI 提效系统搭建闭环工作流,一人化身独立运作实体,试制成本无限趋近于零。
现在,随时开启你的创造流程。
这篇文章写好的比较早,3月就写好了,到今天其实我已经vibe coding了公司官网(带招聘管理和飞书联动)、继续优化了 suisuinian App、开发了一个进销存管理系统,我也基本不用 Antigravity 了,主力在用Codex、Claude。
也指导几位身边的朋友开始用上这几个工具,最难的是转变思维,立马让他们用上,用上之后自然不用多说,都说相见恨晚。
只有保持一直在路上才不慌,现在哪天 Token 没有用完就觉得很亏。
#VibeCoding #小程序开发 #少数派 #人工智能 #产品经理 #YoooClaw
