LLM开发基础3-从需求到提交:一次开发任务的 Agent 流程
以一个 Tauri 桌面应用的数据库管理页面开发为案例,走通 Agent 从需求接收、项目理解、计划、执行、验证到人工审查的全流程。每个阶段讨论了 Agent 能做什么、容易在哪出错、需要开发者做什么。厘清 vibe coding 的适用边界:原型和 CRUD 可以 vibe,支付、权限、加密、数据库迁移、复杂并发和不可回滚操作必须走严谨工程。开发者角色从执行者变为定义目标、设置约束、审查输出和控制风险的决策者。
以一个 Tauri 桌面应用的数据库管理页面开发为案例,走通 Agent 从需求接收、项目理解、计划、执行、验证到人工审查的全流程。每个阶段讨论了 Agent 能做什么、容易在哪出错、需要开发者做什么。厘清 vibe coding 的适用边界:原型和 CRUD 可以 vibe,支付、权限、加密、数据库迁移、复杂并发和不可回滚操作必须走严谨工程。开发者角色从执行者变为定义目标、设置约束、审查输出和控制风险的决策者。
深入拆解开发 Agent 中间层的四个核心机制。上下文管理通过关键词检索、向量检索、结构化检索和混合检索解决模型能看到什么的问题,上下文组装和压缩决定信息呈现质量。工具调用通过 JSON Schema 定义、参数校验、超时处理、失败重试和审计日志让模型获得行动能力。MCP 协议标准化了工具接入但缺失权限模型。数据库连接需要默认只读、行数限制、脱敏、审批和凭据隔离等多层安全约束。权限和沙箱配置取决于项目风险等级,没有通用正确配置。
用一个三层框架帮助工程师理解大模型在软件开发中的应用。基模型层是发动机,只生成文本不执行 IO。中间层是传动系统,管理上下文、工具调用、协议和权限。应用层是驾驶舱,封装为 IDE 插件、CLI Agent 等产品形态。文章逐一梳理了 GPT-5.5、Claude Opus 4.8、Gemini 3.1、Qwen3.7-Max、Kimi K2.6、GLM-5.1 和 DeepSeek-V4 的官方信息,并讨论了跨层误解的常见来源和诊断方法。
本文指出直接套用人类分工设计 Agent 架构的局限性,提出以任务图、共享状态、调度策略、独立验证为核心的四层架构,给出多 Agent 拆分的工程判据,为构建稳定高效的 Agent 系统提供工程化思路。
分析OpenClaw等自治型代理面临的间接提示词注入隐患。由于推理层难以隔离外部不可信数据与系统级指令,攻击者可利用隐蔽文本诱导代理越权调用执行工具或污染持久化状态。防御策略需脱离单一的模型对齐,在架构层面重构信任边界。系统应综合部署输入数据封装、高危操作人工验证、容器化环境隔离、最小化细粒度权限分配与强制记录审计日志,以此限制控制流失陷后的基础破坏域。
本社团课程专为零基础新生设计,旨在揭开大模型的神秘面纱。我们将从核心原理出发,让你理解AI并非无所不能的“神”,而是一个有“脾气”的强大工具。课程将系统教授上下文管理、提示词工程(R-T-F-E公式)等实用技巧,并展示AI在编码、创意领域的应用。最终,你将学会如何根据任务需求,在众多开源与闭源模型中做出明智选择,成为一名高效、理性的AI使用者,真正将AI融入学习与工作流。
A waterfall model Agent simulation implementation based on LLM Agent, where different roles are played by LLM Agent respectively, and tasks are divided according to the stages of the waterfall model.
一种基于LLM Agent的瀑布模型Agent模拟实现方案,通过LLM Agent分别扮演不同角色,并按照瀑布模型的阶段划分任务
本文记录了一些自己常用的大模型提示词。