Appearance
如果要为工作流程提效,该如何下手?
确定 应用场景
System Prompt
软件开发,包括首次开发部署上线以及持续迭代
哪些地方在消耗时间?从 金字塔模型 可以看到,有三个地方会消耗时间:
- 拆解工作流程
- 完成单个模块
- 模块之间的交互
对于 软件开发 场景:
- 拆解工作流程
- 需求、设计、测试评审
- 系统设计、编写技术文档
- 完成单个模块
- 完成开发
- 完成测试
- 完成代码部署上线
- 模块之间的交互
- 前端与后端联调
- 前端与产品沟通需求
- 前端与 UI 沟通设计实现
- 前端与测试沟通测试细节
编程辅助应用 的应用场景变化:
- v0:2(组件编码实现) -> 2(项目编码实现)-> 2(项目编码实现)、3(部署上线)
- Cursor:2(编码实现) -> 1(需求分析与规划)、2(编码实现)
- Devin:1 2 3(整个 软件开发 金字塔模型)
选择原则
优先从 提效最明显 的环节下手
实战项目的选择逻辑:编码实现 下的 开发私有业务组件
确认 应用场景 后,接下来确认 工作模式。
确定 工作模式
两种工作模式:agent 与 workflow
如何区分 agent 与 workflow?看 1、3 由谁完成?
- workflow:遵循固定的处理流程,步骤是预先确定的
- agent:根据任务动态由大模型自主决定下一步行动,具有更强的自主性和适应性
workflow:
- v0
- Cursor Chat、Cursor Composer Normal
agent:
- Cursor Composer Agent
- Devin
大模型的三重约束
Q1:Devin 24 年初就问世了,为何一直到 24 年底之前都反响平平?
Q2:Cursor 为什么在 Claude 3.5 Sonnet 问世后获得了更多关注?
制约 AI 应用能力的三重约束:
- 模型理解能力
- 模型上下文长度
- 模型的私域知识储备
上下文长度是其中最重要的变量。
对于 软件开发 场景:
- 业务代码 = 私域知识,业务代码量增加 -> 私域知识增加
- 不管是 RAG 还是其他方式,私域知识会占据上下文长度
- 上下文长度越接近理论极限,理解能力衰减越快
在实战篇中我们会围绕 上下文长度 这个变量做很多优化。
A1:通过工程能力平衡三重约束
A2:Sonnet 比 4o 编码能力更强,突破了 可用性的临界点
AI 提效工作流程 决策步骤
- 工作流程按照 金字塔模型 拆分
- 选择金字塔中 性价比最高的环节 作为应用场景,确定工作模式
- 在 AI 三重约束 下持续迭代