LLM开发基础3-从需求到提交:一次开发任务的 Agent 流程
以一个 Tauri 桌面应用的数据库管理页面开发为案例,走通 Agent 从需求接收、项目理解、计划、执行、验证到人工审查的全流程。每个阶段讨论了 Agent 能做什么、容易在哪出错、需要开发者做什么。厘清 vibe coding 的适用边界:原型和 CRUD 可以 vibe,支付、权限、加密、数据库迁移、复杂并发和不可回滚操作必须走严谨工程。开发者角色从执行者变为定义目标、设置约束、审查输出和控制风险的决策者。
以一个 Tauri 桌面应用的数据库管理页面开发为案例,走通 Agent 从需求接收、项目理解、计划、执行、验证到人工审查的全流程。每个阶段讨论了 Agent 能做什么、容易在哪出错、需要开发者做什么。厘清 vibe coding 的适用边界:原型和 CRUD 可以 vibe,支付、权限、加密、数据库迁移、复杂并发和不可回滚操作必须走严谨工程。开发者角色从执行者变为定义目标、设置约束、审查输出和控制风险的决策者。
用一个三层框架帮助工程师理解大模型在软件开发中的应用。基模型层是发动机,只生成文本不执行 IO。中间层是传动系统,管理上下文、工具调用、协议和权限。应用层是驾驶舱,封装为 IDE 插件、CLI Agent 等产品形态。文章逐一梳理了 GPT-5.5、Claude Opus 4.8、Gemini 3.1、Qwen3.7-Max、Kimi K2.6、GLM-5.1 和 DeepSeek-V4 的官方信息,并讨论了跨层误解的常见来源和诊断方法。