虽然说 vibe 没有最佳实践可言,每个人做事情的方式还是值得参考下,我在 vibe 的时候因为同时开几个项目,为了保持思路的连贯性,不同的项目做事情的顺序几乎保持一致,首先打开 /plan 模式和 cc 聊清楚所有背景:包括为什么做这个产品,目标用户是谁,产品主要的 user story 是什么。 一开始我们可能自己也不清楚自己要做什么,只有一个大概的想法,所以第一次的 plan 主要是让 cc 和我们有一个大致的共识,然后它会不断提问题以丰富我的想法,最后选择一个 mvp 方案给我们,把权限设定好之后让 cc 一次性去完成即可,它会拆分为 1-7 个阶段,然后全部自动执行。 在 mvp 的基础上最重要的是走通主要 user story 验证它的功能性,小 bug 可以暂时不管,验证成立之后,我会把之后要做的 bugfix 以及所有不重要的事情让他放到下一个迭代中去,具体迭代周期如何定义,这个看每个人的习惯,我觉得就算同样的提示词,它最后生成出的 md 文件中去记录迭代的 todo 也并非能做到可以 100% 一致,我们不需要太在乎这个。在这个时候,我会让他自己写一个 hooks 一旦判断这个 todo 文件被修改的时候就进行自动提交。方便之后我们回滚。 最后 mvp 完成所有主要任务,就是上线部署前的最后一步:品牌形象和 UI 的重新设计,这里为什么要放到最后来做,一个是这是一个几乎可以全自动的复杂任务,我一般让 Gemini 生成参考的 logo,单页网页和设计风格图片,再将设计风格对应的 html 下载到本地让 cc 自己参考,如果不要求特别细节,其实也可以直接复制粘贴网上已经存在的 design prompt,出来的效果大差不差,都非常好。 现在整个 UI/UX 的改版就像喝咖啡那么简单,实际上每到最后一步我就去客厅做其他事情了,cc 在这方面能做到从头到尾全部自动化,不太需要人工干涉。 最后是部署,用 vercel 和 next.js 的话也是全自动的,没什么需要操心的部分。在上线之前可以再打开一个 plan 模式让 cc 帮忙写法务文件,隐私条款什么的。是在不放心可以让 codex 来 review 下是否有显著的安全风险。
今天 vibe 尝试用说话代替打字,使用的是 spokenly 的 Mac 版和 iOS 版,这个 app 做了一个比较有意思的功能,就是你可以在其中设置自己的提示词把转录下来的文字拓展成新的文本,目前做的不是很复杂,所以它设计用来做润色。但这让我想到了,语音输入其实不应该是一个单向的过程,准确来说,在 vibe 时候我们不是在记录一个想法,而是计划并执行一系列的事项,所以我们更需要的是「对谈」 这个对谈指的不是瞎聊天或者自言自语,如果和 cc 协同工作,我希望它的 plan mode 是以这种方式帮我展开我的想法:它不着急帮我执行具体的事情,而是帮助我完整的思考在我希望完成的项目中存在的遗漏和潜在的问题,通过多次对谈,帮我建立起一个思维文档库,你可以把它理解成某种 plan with files/thoughts 只是采用语音的方式。 后来我又想到如果按照目前 ChatGPT 的对话模式,效率其实是很低的,因为关系到思维的拓展,阅读文字的速度远大于听,人类用语音输入,AI 用文字输出并拓展会是比较好的方式,也就是人说,AI 进行笔谈,同时语音提示并 standby 的方式会更加自然。 这样的产品形态看起来已经非常像生产力侧的 AI 助手了,现在各家模型的终端产品都各有优劣,人们在摸索中尝试找到一种最好的方法,也许没过几天,就会有类似的产品出现也说不定。