高德广告工程 AI Native 全流程提效实践

导读
**

本文介绍高德广告工程团队在 AI Native 研发、测试、运维和知识沉淀方向的阶段性实践。

我们的核心判断是：AI Native 不是“用 AI 写代码”，而是把研发体系设计成 AI 能持续参与、稳定执行、可验证、可复用、可进化的工程闭环。

围绕这一判断，我们把 Spec、知识、验收、执行状态、Skills 升级为与代码同等地位的工程产物，并通过广告 Harness、统一知识库、统一 SkillHub、Tool Gateway、Aone 沙箱和 Agent Team，逐步打通研发链、运维链和知识链。

当前，高德广告工程已经在 SDD、ATDD、垂类 Agent、Case 排查、巡检报警、Skills 建设等方向完成了一批真实探索；最近两周团队使用情况收集中，已覆盖 20+ 同学，并形成多条有效样本反馈，多数有效样本集中在 30%-60% 阶段性提效区间。与此同时，团队也暴露出知识库厚度不足、测试闭环不完整、长任务上下文丢失、复杂需求拆分不足、接口事实不可靠等问题。

这些问题反过来证明：AI Native 的核心不是换一个工具，而是补齐 Harness、知识库、测试验收、执行状态和治理闭环。

本文按“为什么、怎么做、做到哪儿”三层展开。

**一、为什么不是“用 AI 写代码”，而是研发体系升级
**

AI 在研发中的应用大致经历了三个阶段。

第一阶段是 Prompt Engineering，核心是让模型听懂人的意图。研发同学通过提示词让模型解释代码、生成代码、写单测、整理文档、辅助排查。这解决了很多局部效率问题，但很难承载复杂工程任务。

第二阶段是 Context Engineering，核心是让模型读到正确上下文。模型本身能力很强，但如果读不到业务规则、历史方案、接口事实、字段含义、上下游链路和测试口径，输出仍然不可靠。对广告工程来说，上下文质量往往直接决定 AI 产出质量。

第三阶段是 Harness Engineering，核心是让 AI 在有流程、有状态、有工具、有验收、有证据的工程环境中稳定工作。它关注的不只是模型怎么回答，而是任务如何启动、上下文如何注入、阶段如何推进、工具如何调用、测试如何反馈、结果如何归档、失败如何复盘。

所以我们对 AI Native 的理解是：

Prompt 解决局部表达问题，Context 解决事实供给问题，Harness 解决工程交付问题。

对高德广告工程来说，真正要解决的不是“某一段代码写得更快”，而是整个研发、运维、知识沉淀链路中的人工翻译、人工集成和人工兜底。

产品意图
  ↓
研发理解
  ↓
技术方案
  ↓
代码实现
  ↓
测试验证
  ↓
发布上线
  ↓
线上排查
  ↓
经验沉淀

每一步都可能发生信息丢失、口径偏差、重复沟通、上下文断裂和质量风险。AI 如果只停留在“帮我写代码”，最终会被卡在需求不清、知识缺失、测试不通、部署不通、上下文丢失和结果不可验证上。

这也是我们的基本判断：

模型能力决定上限，工程环境决定能不能稳定落地。

高德广告工程要解决的不是某一个单点 Agent 能力，也不是单纯的 Coding Agent，而是研发链、运维链、知识链如何通过 Agent Team 形成统一闭环。

链路	当前问题	建设目标
研发链	PRD、原型、行为 SPEC 等输入质量不稳定。需求到研发交付存在多次人工翻译。SDD、CR、测试、发布、归档没有完全闭环	建设从需求输入、Intake Gate、研发交付、CR / Review、测试验证、发布归档到知识沉淀的研发闭环
运维链	问题反馈、日志、告警、监控、Case、巡检等信号分散，排查依赖个人经验，故障复盘和处理经验沉淀不足	建设统一运维 Agent 与运维 Agent 矩阵，支撑单 Case 排查、告警诊断、日常运维、自动巡检、根因分析和处理建议
知识链	文档、代码、规则、历史案例、排查经验、测试证据分散，缺少适合 Agent 消费和复用的知识底座	建设以 K/S/T 为组织方式的广告知识底座，让研发、运维、评估知识可检索、可引用、可沉淀、可复用

因此，我们的目标不是让 AI 替代研发，而是重构人、AI、系统之间的分工：

人：定方向、定边界、做关键决策
AI：理解、生成、排查、执行、验证、沉淀
系统：提供知识、工具、状态、沙箱、审批、证据和评估

研发同学的工作重心会从“重复翻译和重复执行”，转向更高价值的判断：

维护业务 Spec
定义验收标准
评审 AI 产物
补充边界场景
建设知识库
沉淀 Skills
治理质量与风险

这不是工具升级，而是研发体系升级。

**二、实践路径：从点状探索到统一闭环
**

高德广告工程不是从零开始讲一个愿景，而是从一批真实场景出发，逐步把点状 AI 能力收敛为统一工程体系。

当前已经验证的基础能力包括：

SDD / gad-sdd-all 的真实项目验证
ATDD 测试流程与测试 MCP 对接
gad-sdd-all / gad-atdd-all / gaode-ad-rd-test 等 Skill 实践
Case 排查、巡检报警、品牌广告全链路排查等垂类 Agent 探索
UMA / TPP / Aone 等测试平台接入方向
知识库和 Skills 仓库的初步沉淀

当前正在收敛的统一能力是：

多 Skill 仓库 → 统一 SkillHub
零散知识文档 → K/S/T 知识底座
工具直连 → Tool Gateway
一次性 Agent 输出 → Trace / Artifact
经验总结 → Knowledge Delta
本地使用 → 平台 Runner + 任务入口
点状 Agent → Agent Team

这里需要强调一点：******当前平台 Runner 方向优先收敛到 OpenCode，但并不等于强制统一所有个人研发入口。******Claude Code 等个人研发入口仍然可以保留，长期原则是框架可替换、资产不可替代。

**三、核心思路：五类工程产物 + 一套统一基建
**

3.1 五类工程产物

整套体系的底层心智可以概括为一句话：

把 Spec、知识、验收、执行状态、Skills 都升级为与代码同等地位的工程产物。

类型	过去的状态	升级为工程产物后
Spec	PRD、钉钉文档、口头沟通，自然语言为主，前后容易矛盾	结构化 proposal / design / spec / tasks，带目标、非目标、影响范围、风险、验收标准
知识	散落在文档平台、代码仓库、个人经验和聊天记录中	统一知识库，支持分层索引、自动注入、证据引用、审核更新
验收	依赖人工 CR、灰度兜底、线上发现问题再修	ATDD、测试建议、编译部署、冒烟、Diff、性能、稳定性等反馈闭环
执行状态	Agent 会话断了就丢，跨窗口失忆，无法恢复	Harness 状态机、中间产物落盘、Trace、Artifact、Sidecar 记录
Skills	个人技巧、Prompt 片段、经验脚本	统一 SkillHub，可版本化、可评审、可分发、可复用

只有这些要素都变成工程产物，AI 才能稳定地在工程体系里运行。

否则，AI 只能靠临时上下文猜测；上下文一断、需求一复杂、知识一缺失，就会退化成“看起来很聪明，但不可控、不可复盘、不可规模化”。

3.2 一套统一基建

围绕五类工程产物，我们建设一套统一 AI Native 基建：

各模块分工如下：

这套体系的关键，不是把某个工具做强，而是把工具、知识、流程、状态和证据组织成完整闭环。

**四、广告 Harness：让 SDD 变成可机器校验的工作流
**

4.1 为什么需要广告自己的 Harness

通用 SDD / OpenSpec 能解决一部分问题，但广告工程的复杂性决定了我们不能只依赖通用骨架。

广告场景涉及召回、排序、出价、计费、客资、反作弊、投放平台等复杂链路。一个需求往往不是改一个接口，而是跨系统、跨数据、跨策略、跨测试、跨发布的综合变更。

如果 Spec 只是自然语言文档，AI 会在以下问题上失控：

需求是否完整？
哪些字段是硬约束？
哪些边界必须验收？
哪些业务规则不能破？
哪些测试必须跑？
哪些变更需要人工确认？
哪些知识需要回写？

因此，我们选择在通用 OpenSpec 风格工件之上，叠加广告工程自己的 Harness 约束：强类型 Spec、阶段门禁、ATDD、测试证据、知识沉淀和回流机制。

4.2 已验证出的核心机制

gad-sdd 的核心不是“生成一份设计文档”，而是把 SDD 变成可机器校验的工作流。

这类机制的价值在于：AI 不再是“根据当前上下文自由发挥”，而是在有门禁、有产物、有状态、有人工确认点的工程流程中工作。

4.3 状态机：解决 AI 长周期任务跑断问题

一次需求交付可以被抽象为六个阶段：

start：启动新需求
  ↓
spec：规格成文
  ↓
apply：编码实现
  ↓
test：ATDD 闭环
  ↓
archive：归档变更
  ↓
kb-flow：知识回流

任何阶段都可以触发 clarify 澄清子流程。

每个阶段都有四个关键要素：

进入门禁：什么条件满足才能进入
产物清单：必须落盘哪些中间文件
退出门禁：什么验证通过才能前进
状态记录：如何跨窗口恢复、复盘和归档

一线反馈中，“上下文记忆丢失”“大型项目时间周期长时，每次小改动都要重新总结”“思考时间过长”等问题非常典型。这正是 Harness Engineering 要解决的核心：模型的能力可以持续进化，但工程系统的状态、记忆、检查点必须由 Harness 提供。

4.4 Intake Gate：AI Native 研发链的入口闸口

复杂需求不能直接交给 Agent 写代码。研发链入口必须先做 Intake。

Intake Gate 要把 PRD、原型、行为 SPEC、验收口径、Non-Goals、上下游影响范围整理成可执行、可追踪、可确认的研发输入。

它负责：

需求完整度评估
业务目标识别
影响范围判断
缺失信息召回
澄清问题生成
需求拆分
Non-Goals 明确
优先级建议
准入 / 打回 / 待澄清判断

Intake 不是“可选增强”，而是进入 SDD 之前的必要闸口。

**五、ATDD：让测试从“事后动作”进入研发闭环
**

5.1 过去的问题

过去研发完成代码后，常见问题是：

编译失败后再回头找 AI 修
部署失败后再人工排查
测试问题发现后再重新对话
功能验证依赖人肉操作
Diff / 性能 / 稳定性测试与研发链割裂

这导致 AI 开发看似很快，但实际交付仍然卡在测试、验证、修复和回归阶段。

5.2 已经形成的研发测试协作方式

统一 ATDD 流程已经明确了研发侧和测试侧的协作方式：

研发侧：
输入 PRD / 方案设计 / 知识库 / 人工 Prompt
输出研发 Spec / 代码 CR / 测试建议 Spec
 
测试侧：
输入研发阶段产物 + PRD
输出编译结果 / 部署结果 / 功能 Case / Diff / 性能 / 稳定性测试结果

这说明测试不再是代码完成后的纯人工兜底，而是逐步进入 SDD 之后的研发闭环。

5.3 当前短板：测试闭环还没有完全打通

ATDD 方向已经跑起来，但还没有完全成熟。

一线反馈集中暴露出几类问题：

问题	表现
测试未充分使用	部分需求没有真正跑 test 阶段，或者测试耗时过长
部署 / 编译环境未完全打通	TPP、US 等场景存在自动部署、编译、功能测试不完整的问题
功能测试生成不足	需求对应的冒烟用例、定制化功能测试仍需要人工补齐
Diff / bug 修复未闭环	Diff 报告分析、bug 自动修复、复验流程仍需加强
测试进度感知弱	环境搭建后，编译 / Diff 阶段通知和状态感知能力不足

这些反馈说明，当前 ATDD 的重点不是再证明“能跑测试”，而是要把测试结果结构化回流到研发闭环里。

下一步要做的是：

测试失败结果结构化回流研发侧
测试证据纳入 Trace / Artifact
复验结果作为归档门禁
高频测试失败沉淀为 Knowledge Delta
环境适配矩阵补齐
功能测试 / 冒烟 / Diff 分析能力增强

这一步的关键价值是：AI 不仅要能写代码，还要对交付结果负责。

**六、运维链：从经验排查到证据化诊断
**

6.1 运维链已经有真实场景验证

运维和业务诊断方向已经有多个垂类 Agent 探索，包括 Case 排查、巡检报警、品牌广告全链路排查、客资助手等方向。

这些探索说明，AI 在运维链上已经不只是“问答”，而是开始进入真实问题排查、日志分析、业务诊断和处理建议场景。

6.2 运维链的关键认知

广告运维的难点不是“没有日志”或“没有监控”，而是信息分散且依赖经验串联。

一个线上问题往往需要同时看：

用户反馈
商家反馈
日志
指标
告警
链路拓扑
近期变更
Case 历史
配置
策略
代码

这适合 Agent Team 介入：工具负责提供事实，Agent 负责串联、解释、归因和生成建议。

6.3 运维 Agent 矩阵

下一步运维链不应只是一个问答机器人，而应形成 Agent 矩阵。

运维链必须坚持一个原则：

Agent 的结论不是事实源，日志、指标、变更、Case、巡检结果才是事实源。

Agent 负责做三件事：

找到应该查什么
把查到的事实串起来
给出诊断、影响范围、处理建议和治理项

最终产出应包括：

诊断结论
影响范围
证据链
根因分析
处理建议
稳定性治理项
Knowledge Delta

6.4 运维链的当前卡点

运维链的主要短板不是“没有 Agent”，而是事实链路还不够完整：

告警与业务场景关联不足
指标与链路拓扑关联不足
多次报警和投放策略调整之间缺少可被 AI 检索的关系
历史处理经验和 SOP 不完整
Case、变更、指标、配置之间没有统一事实图谱

这本质上是把运维领域的 K：事实知识 做扎实。只有把场景、指标、链路、变更和 Case 这些事实建成可被 AI 检索的网络，Agent 才能从“看起来在诊断”升级为“基于证据在诊断”。

**七、知识库与 SkillHub：效果上限和组织复利
**

7.1 知识库是当前效果上限的核心约束

AI 能不能做好研发任务，很大程度不取决于模型本身，而取决于它读到了什么上下文。

广告工程知识分散在多个系统里：

KBase
钉钉文档
Aone
代码仓库
历史 CR
故障复盘
个人经验
运维记录

团队使用反馈中，知识库不足是最集中的卡点之一：客资链路字段映射薄、历史方案缺失、离线任务链路缺统一维护、告警诊断无法关联业务场景和指标、接口事实不可靠等问题反复出现。

因此，统一知识库不是装饰项，而是 AI Native 效果上限的关键约束。

7.2 K/S/T：按知识用途组织，而不是按文档来源堆积

按 K/S/T 组织知识：

K/S/T 的价值在于：AI 不只是“搜文档”，而是知道当前任务需要事实、规范还是任务经验。

7.3 广告工程知识库：K/S/T + 5 层业务分层

K/S/T 是知识的用途分类，回答“这条知识用于什么”；5 层业务分层是知识的工程组织方式，回答“这条知识应该放在哪里、在哪个研发阶段被消费”。

两者并不是替代关系，而是互相支撑：

K/S/T：事实 / 规范 / 任务
5 层分层：语义 / 架构 / 服务 / 项目 / 运维

广告工程知识库当前采用 5 层结构：

AI 在处理任务时，不做全库 Dump，而是按照：

研发阶段
  ↓
优先读取层
  ↓
当前业务域
  ↓
L3 专题
  ↓
L4 叶子文档

逐层缩小上下文范围，确保拿到“最小正确上下文”。

例如：

研发阶段	优先读取层级
需求门禁	业务语义层、业务项目层
需求理解	业务语义层、业务架构层、业务项目层
方案设计	业务服务层、业务架构层、业务项目层
代码开发	业务服务层、业务项目层
测试闭环	业务服务层、业务项目层
线上运维	业务运维层、业务服务层、业务架构层

为了避免知识库变成“文档堆”，当前还配套建设了三类工程机制：

机制	实现方式	作用
写入门禁	文档模板发布前强制 Schema 校验	保证知识结构合规，避免低质量知识进入知识库
Case 反馈闭环	需求增强、架构拆解、运维事件等 Case 自动沉淀	将实战经验反哺知识库
Spec 同步	global_spec / service_spec 独立同步	保障全局规约和服务规约持续更新

这意味着，知识库不是静态文档仓库，而是研发链、运维链和知识链的共同底座。Spec、Case、排查结论和项目经验都会通过门禁和审核机制进入知识库，再反过来支撑下一次需求理解、方案设计、代码开发、测试闭环和运维诊断。

7.4 SkillHub：把团队经验变成可复用动作

Skill 不只是 Prompt，而是可执行的工程工作协议。

它要规定：

什么时候使用
需要哪些输入
允许调用哪些工具
禁止做什么
何时必须暂停
何时必须找人确认
必须生成哪些产物
完成标准是什么
失败如何处理
如何沉淀知识

统一 SkillHub 要沉淀的能力包括：

需求治理 Skill
SDD Skill
ATDD Skill
CR / Review Skill
测试触发 Skill
Case 排查 Skill
知识沉淀 Skill
发布检查 Skill
工具适配 Skill

当前已经有 gad-sdd-all、gad-atdd-all、gaode-ad-rd-test 等实践基础，已建设统一的广告工程 Skill 仓库 gaode-ad-skills，并逐步收敛为统一 SkillHub。

7.5 当前 Skills 全景

当前 gaode-ad-skills 已经沉淀出50+ Skill，展现出较丰富的能力雏形。这里不把数字包装成最终成果，而是作为“能力覆盖面”的阶段性说明。

类目	代表能力	解决的问题
研发流程	gad-sdd-all、gad-atdd-all、OpenSpec 相关 Skill	端到端研发工作流
产品输入治理	gad-product-intake、PRD enhancer	需求输入质量和准入
知识库	KB 检索、文档索引、知识发布	最小正确上下文
测试 / 部署	gaode-ad-rd-test、pre-push check、deployment check	测试与部署反馈
故障排查	ad-server troubleshooting、计费 / oCPC / 客资排障	运维诊断
配置查询	Diamond、Libra、A/B 实验查询	配置事实获取
代码审查	code-review、remote review	CR / MR 风险发现
元工具	skill 管理、skill 创建、聊天转 skill	SkillHub 生产效率

SkillHub 的长期目标不是“堆更多 Skill”，而是让团队经验可版本化、可评审、可复用、可评估。

**八、真实反馈闭环：典型案例、提效区间、真实卡点
**

高德广告不是在写概念，而是在用真实需求推动 Harness、知识库、Skills、测试和执行状态迭代。

8.1 三个典型场景

场景	AI 参与阶段	收益口径	暴露问题
品牌广告旧索引下线 / 配置清理	Intake / SDD / ATDD 全流程	从约 1 天压缩到约 0.5 天，完整跑通链路	测试阶段有少量 owner 跟进的小问题
openCreativeChain 迁移	知识库建设 / 方案设计 / 代码开发	主要收益在历史逻辑梳理、迁移方案生成和代码开发辅助，迁移周期明显缩短	长任务上下文、人工审核、部署链路仍需补齐
汇川 ADX 程序化接入	历史逻辑梳理 / 方案设计 / 代码开发	逻辑梳理阶段反馈约 50% 提效	ODPS / Flink / 脚本链路知识缺口大

这几个案例的共同点是：AI 在逻辑梳理、方案设计、代码生成、迁移辅助上效果明显；但越靠近复杂链路、测试部署、历史知识和跨系统事实，越依赖工程基建补齐。

8.2 提效区间：不要包装成统一指标

从最近两周团队样本看，多数有效反馈集中在 30%-60% 阶段性提效区间。这里必须强调：这是团队使用反馈，不是严格实验统计。它更适合表达为“阶段性体感和样本观察”，而不是全团队统一效率指标。

8.3 当前真实卡点与工程动作

真实卡点比成功故事更重要，因为它们指向下一阶段工程化建设方向。

真实反馈	暴露问题	对应工程动作
PRD 太大、上下文占用高	输入未结构化	Intake 增加需求拆分、Non-Goals、验收口径确认
HSF 接口被 AI 自行构造	接口事实缺失	建设接口事实库，Tool Gateway 提供可信接口查询
test 未使用或能力不足	验收链路弱	ATDD 补功能测试、冒烟、Diff 分析、复验闭环
TPP / US 无法自动部署编译	环境未打通	补仓库 / 环境适配矩阵
告警诊断无法关联指标	运维事实链路不足	建设场景-指标-链路-变更事实网络
上下文丢失、长任务慢	执行状态不可持续	Trace / Artifact / session 状态沉淀
AI 自行 git commit	行为约束不足	Skill 中明确禁止动作，关键动作必须人工确认
默认跑错 Skill 或旧流程	Skill 路由不稳定	SkillHub 统一路由、版本、触发条件和强制入口

真实反馈不是“负面信息”，而是工程化迭代的输入。

8.4 当前阶段的真实结论

更准确的阶段性结论是：

SDD 是当前最先跑通的主链路
ATDD / test 已打通，但需跟测试同学持续共建完善
知识库是效果上限的核心约束
Intake 是复杂需求进入 SDD 前的必要闸口
长任务状态和 Trace 是复杂需求能否交付的关键
运维 Agent 的核心不是自动给结论，而是证据化诊断

**九、下一阶段平台化方向：Agent Team 与可治理执行
**

9.1 从点状 Agent 到 Agent Team

下一阶段目标，是把研发链、运维链和知识链纳入统一 Agent Team 平台。

它围绕三条链建设：

研发链：需求输入 → Intake → SDD → ATDD → CR → 测试 → 发布 → 归档
运维链：信号 → 分流 → 排查 → 诊断 → 处理建议 → 治理项 → 回流
知识链：Artifact → Knowledge Delta → 审核 → K/S/T → 再注入

近期重点不是把 Agent 名字铺得很满，而是优先建设六类能力：

需求入口治理
研发交付
测试验证
运维诊断
知识沉淀
治理评估

每类能力都要有清晰的输入输出、工具权限、风险边界、证据要求和归档机制。

9.2 平台 Runner 与多 Harness 可替换

当前平台 Runner 方向优先收敛到 OpenCode，同时保留 Claude Code 等个人研发入口和回退路径；长期不绑定单一框架，真正沉淀的是广告工程自己的 Spec、知识库、Skills、测试门禁和 Trace / Artifact。

真正不可替换的是：

Spec 结构
SkillHub
知识库
Tool Gateway
Trace
Artifact
Knowledge Delta
验收标准
评估样本

也就是说：

框架可以换，资产不能丢。

这不是悲观主义，而是对模型和工具演进速度的清醒认知。只有这样，团队才能在每一次模型 / 框架升级中，把广告工程的能力顺着迁移过去，而不是从零开始。

9.3 执行治理：Tool Gateway、Trace、Knowledge Delta

第八章列出的具体工程动作，在 Agent Team 平台上需要通过 Tool Gateway、Trace、Artifact、Knowledge Delta 等治理能力落地。这里不展开成完整架构，只保留核心原则。

Tool Gateway 解决：

谁能调用工具
能调用什么工具
调用前是否需要审批
调用后如何审计
失败后如何降级

Trace / Artifact 解决：

AI 不是只给最终答案
每次执行必须能复盘过程
每个关键产物必须能归档
每次失败必须能定位阶段和原因

Knowledge Delta 解决：

Agent 不直接写正式知识库
先生成候选知识
带来源、证据、owner、置信度、有效期和冲突检查
审核后再进入 K/S/T

这些能力的目标是让 AI 从“能干活”升级为“可治理地干活”。

**十、下一步：从点状探索到统一平台
**

10.1 第一阶段：统一基建骨架形成（基本完成，持续完善）

目标是让团队在同一套基建上工作。

关键事项：

当前状态：
- gad-sdd 主链路已经具备真实需求验证基础
- 统一广告 Skill 仓库已建立
- K/S/T + 5 层知识库结构已经形成
- ATDD 测试链路已打通，仍需与测试同学持续完善
- Trace / Artifact / Knowledge Delta 正在向平台化能力收敛

完成标志：

中型以上需求中，gad-sdd 能稳定跑通主链路
主链路知识库内容覆盖度明显提升
ATDD 具备编译 / 部署 / 冒烟 / Diff 的基本门禁能力
每次任务都有可追踪 Trace 和可归档 Artifact

10.2 第二阶段：广告内部跨团队闭环（持续建设中）

目标是跨投放、引擎、计费、客资、平台、运维等团队形成协同。

关键事项：

总控 Agent 上线
复杂需求拆成多子 Agent 任务
跨 Agent 技术 Spec 和数据流转 Spec 前置
Mock Server 支持前置联调
任何子 Agent ATDD 失败都能精准定位
运维 Agent 矩阵覆盖核心场景

完成标志：

中型以上跨上下游需求，能够通过总控 Agent 拆解任务
研发、测试、运维结果能回到统一 Artifact / Knowledge Delta
跨团队需求不再主要依赖人肉同步上下文

10.3 第三阶段：跨组织端到端闭环

目标是打破工种壁垒，让产品、研发、测试、运维、平台围绕统一 AI Native 工程体系协作。

关键事项：

跨业务线 Agent 协同
跨端 MCP 与 Browser-use 接入
CodeWiki / LSP / 图谱能力增强
面向广告业务的评测集建设
AI 参与值班和告警 RCA
一键预案推荐，人最后确认

完成标志：

研发同学的工作重心从翻译需求、查历史、写重复代码、人工排查，实质性转向维护 Spec、评审 AI 产物、治理质量和沉淀知识

这一步的目标不是“减少人”，而是把人从重复翻译、重复编码、重复排查中释放出来，转向架构、质量、稳定性和工程创新。

**结语
**

高德广告工程的 AI Native 实践，不是一个“AI 已经完全接管研发”的故事，而是一个更真实、更有工程价值的过程：

我们已经跑通了一批点状能力，看到了 30%-60% 的阶段性提效，也清楚看到了知识、测试、状态、接口事实、复杂需求拆分上的瓶颈——我们正在把这些瓶颈反向沉淀为 Harness、知识库、SkillHub、Tool Gateway、Trace 和 Agent Team。

这正是 AI Native 从“个人效率工具”走向“组织工程能力”的关键路径。

最终目标不是让 AI 替代人，而是让人从重复翻译、重复编码、重复排查中释放出来，把精力投入到架构判断、边界定义、质量治理、业务创新和平台建设上。

一句话总结：

AI Native 的本质，不是让 AI 偶尔参与研发，而是把研发体系设计成 AI 能持续参与、稳定执行、可被验证、不断进化的工程闭环。

#Agent #广告工程 #研发体系 #高德 #高德技术

END

高德广告工程 AI Native 全流程提效实践

3.1 五类工程产物

3.2 一套统一基建

4.1 为什么需要广告自己的 Harness

4.2 已验证出的核心机制

4.3 状态机：解决 AI 长周期任务跑断问题

4.4 Intake Gate：AI Native 研发链的入口闸口

5.1 过去的问题

5.2 已经形成的研发测试协作方式

5.3 当前短板：测试闭环还没有完全打通

6.1 运维链已经有真实场景验证

6.2 运维链的关键认知

6.3 运维 Agent 矩阵

6.4 运维链的当前卡点

7.1 知识库是当前效果上限的核心约束

7.2 K/S/T：按知识用途组织，而不是按文档来源堆积

7.3 广告工程知识库：K/S/T + 5 层业务分层

7.4 SkillHub：把团队经验变成可复用动作

7.5 当前 Skills 全景

8.1 三个典型场景

8.2 提效区间：不要包装成统一指标

8.3 当前真实卡点与工程动作

8.4 当前阶段的真实结论

9.1 从点状 Agent 到 Agent Team

9.2 平台 Runner 与多 Harness 可替换

9.3 执行治理：Tool Gateway、Trace、Knowledge Delta

10.1 第一阶段：统一基建骨架形成（基本完成，持续完善）

10.2 第二阶段：广告内部跨团队闭环（持续建设中）

10.3 第三阶段：跨组织端到端闭环

相似文章推荐

评论 (0)