1 / 41
GitHub Copilot

GitHubCopilot

代码 AI 助手AI Agent 引擎

Scroll

议 程

五大议题 · 全景解读

01

场景与价值

  • 高价值应用场景
  • 部署哪些角色的 Agent?
  • 给谁用?三视角需求分析
  • 行业落地案例
02

架构与部署

  • 部署模式:集中 / BYOA / 混合
  • 必选组件与可选组件
  • 技术架构与 Azure 方案
  • 模型生态与企业集成
03

运营治理

  • Agent 生命周期管理
  • Skill 管理与治理
  • 指标与矩阵管理
  • 监控、日志与审计
04

安全治理

  • 真实安全事件分析
  • 攻击面与攻击向量
  • 10 大管控域映射
  • 预防层 + 检测响应层
05

成本分析

  • 典型场景的成本构成
  • 计费模式对比实测
  • 成本优化方案与案例
  • ROI 评估框架

OpenClaw 是什么

openclaw / openclaw
325K63KMIT
github.com/openclaw/openclaw

“The AI that actually does things.” — 在你自己的设备上运行,通过任何聊天工具与 AI Agent 交互,让 AI 终于碰得到你的数据

325K+
GitHub Stars
50+
Integrations
15+
Chat Platforms
MIT
Open Source
Supported Platforms
macOS
iOS
iPadOS
watchOS
Windows
Linux
Android
Raspberry Pi
15 Chat Providers
WhatsApp
Telegram
Discord
Slack
Signal
iMessage
Teams
Zalo
BlueBubbles
飞书
Matrix
Nostr
Nextcloud
Tlon
WebChat
Persistent Memory
记住偏好和上下文,持续个性化
Browser Control
浏览网页、填表单、抓取数据
Full System Access
文件读写 · Shell · 脚本 · 沙盒
Skills & Plugins
社区扩展 · ClawHub 生态
Evolution
WaRelay
2025 mid
v0
最初的 WhatsApp 转发网关
ClawdBot
2026.01.05
v1.x
龙虾吉祥物 "Clawd" 诞生,一夜爆火
MoltBot
2026.01.27
v2.x
Anthropic 商标问题,"Clawd" 太像 "Claude",被迫改名
OpenClaw
2026.01.29
v3.x
社区投票 → 正式定名 OpenClaw
!

它很强大,请务必做好隔离

OpenClaw 拥有完整的系统访问权限 文件读写Shell 执行浏览器操控跨平台远程调度

这意味着它能帮你做几乎任何事,但也意味着一旦失控,后果不可逆

请在沙盒、虚拟机或专用环境中运行,不要让 AI 直接触碰生产数据

沙盒隔离
最小权限原则
远离生产数据
人工审查输出
Part 01

场景与价值

企业部署 OpenClaw 的高价值场景、Agent 角色与用户群体

三视角需求行业场景企业案例

方案

企业级需求

OpenClaw 从玩具到生产,需要回答三个角色的问题

终端用户

「我只想让 AI 帮我干活,别让我学编程」

快速创建多技能 Agent

SOUL.md 一文定义人格与工作流

多通道统一体验

Teams / 微信 / Telegram 同一 Agent

SOP 沉淀为资产

SOP → Skill 分钟级转化,团队共享

数据安全放心用

per-user 会话隔离 + 密钥脱敏

IT / 安全团队

「别给我挖坑,出了事我背锅」

Agent 运行时隔离

Kata VM 硬件级沙箱,逃逸成本极高

全链路审计

Session .jsonl 完整记录每一轮对话与工具调用

统一模型管控

LiteLLM Proxy 统一路由 + 用量计费

弹性与成本可控

按需自动伸缩,空闲时资源自动回收

管理层

「投进去的钱,什么时候能看到回报」

可量化的生产力提升

合同审查 10x、客服效率 +60%

ROI 清晰可控

按用量付费,无前置许可,成本随业务线性增长

运营可观测

Application Insights + Sentinel 实时大盘

合规与风险管控

Entra ID 权限管控 + Purview DLP + 紧急熔断机制

→ 这些需求,Azure + Microsoft 安全生态可以一站式解决

场景

OpenClaw 高阶应用场景

普通 Agent 只有 大脑,OpenClaw 同时拥有 大脑 + 手 + 眼睛 ——在真实系统和应用完成任务,而非仅给出文本建议。

浏览器自动化

启动真实 Chromium,通过 Playwright 控制页面——登录 SSO/MFA 门户、操作多步骤表单、下载报表。

SSO/MFA 登录网页填单报表抓取

跨系统端到端编排

CRM 查客户 → 下载合同 → Excel 更新 → 导出 PDF → 上传系统。

CRM + ERP邮件 + 附件异构系统串联

遗留/内网系统自动化

老 Java Web、SAP GUI、Citrix——没有 API、没有文档。UI 即接口。

SAP GUICitrix内网系统

长时有状态任务

每天 9 点自动拉报表、20 分钟任务中途失败自动恢复。

Cron 定时失败恢复长期运行

人机混合协作

Agent 执行到关键步骤暂停等人确认,审批后继续。

审批流合规检查人工接管

RPA + LLM 数字员工

传统 RPA 的执行力 + LLM 的理解力。7×24 全天候。

财务对账IT 巡检客服全覆盖

案例

行业应用场景1 / 2

01电商行业

电商卖家智能助手平台

多 Agent 助手(销售/客服/运营),通过飞书/Slack 等渠道嵌入卖家日常工作流

Skill 构建从"编译型"变为"解释型",分钟级上线

per-tenant Pod 实现 SaaS 化隔离部署

02零售行业

智能客服与用户运营

WhatsApp/微信/Telegram 多渠道 7×24 客服,售前/订单/售后/会员全覆盖

客服响应效率大幅提升,跨渠道体验一致

运营团队自主扩展 Agent 能力,无需工程介入

03科技与软件

研发效能与代码质量管理

代码审查/测试自动化/DevOps Agent 联动,从发现问题到修复上线闭环

PR 审查周期显著缩短,研发人员专注高价值创新

线上错误自动修复能力大幅提升

04金融与保险

智能文档处理与合规审查

合同审查/合规检测/理赔处理 Agent,自动接收文件完成条款比对与风险标注

文档处理效率大幅提升,合规遗漏显著减少

自托管 Gateway 确保数据不出企业边界

05医疗健康

医疗知识助手与患者随访

临床知识/患者随访/健康数据 Agent,结合可穿戴设备进行异常预警

随访效率显著提升,医护文书工作大幅减少

Persistent Memory 记住患者病史,提供个性化服务

06制造业

智能制造与设备运维

设备监控/故障诊断/备件管理 Agent,IoT 告警自动分析并生成维修工单

故障响应速度大幅提升,非计划停机显著减少

工程师经验通过 SOP 转 Skill 沉淀为组织资产

07教育与科研

教学辅助与学术科研

学习辅导/课程管理/文献分析 Agent,批量批改并生成个性化反馈

批改效率显著提升,学生问题即时响应

OpenClaw-RL 持续从教学反馈中优化回答质量

08游戏行业

游戏社区运营与智能 NPC

社区运营/策划/NPC 人格 Agent,SOUL.md 定义 NPC 个性并持续进化

社区全天候多语言覆盖,玩家留存率显著提升

NPC 对话满意度通过 RL 持续提升,互动意愿增强

案例

行业应用场景2 / 2

09数字原生

全栈自动化运营与产品迭代

主控/Dev/Marketing/Business Agent 军团,手机单一入口操控全流程

个人效率倍增,等效多人团队产出

ClawHub 快速安装社区 Skill,即时扩展新能力

10内容营销

SEO 内容生产自动化流水线

热点搜集→关键词研究→撰文→配图→发布,Cron 每日自动执行全流水线

每日稳定产出高质量文章,曝光量大幅增长

小型团队拥有媲美大型内容团队的输出能力

11证券投研

财报解读与投资洞察

财报监控 Agent 自动跟踪、解读关键财务数据,即时推送投资洞察

财报发布后即时收到 AI 总结要点推送

分析师从数据搬运中释放,专注高价值判断

12汽车零售

AI 全权代理购车比价谈判

Agent 批量询价、多轮竞价谈判,并行管理多家经销商邮件往来

成交价显著低于标价,全程无需到店沟通

从「谈判顾问」升级为「自主谈判代理」

13旅游出行

多约束条件智能行程规划

综合预算/饮食/身体限制等多重约束,自动生成可执行行程方案

AI 方案贴合多重约束,大幅节省规划时间

Persistent Memory 记住偏好,下次规划更精准

14法律服务

批量合同审查与风险标注

批量 PDF 上传,Agent 自动解析全文、定位重要条款并标注风险点

大批量合同审查周期大幅缩短,效率倍增

统一标准逐条审查,不因疲劳漏掉关键问题

15智能家居 / IoT

全屋智能控制与自动化

连接 Home Assistant 全屋设备,语音/文字统一控制灯光、空调等

聊天界面统一控制全屋设备,告别多 App 切换

Raspberry Pi 轻量部署,快速上线

16区块链

智能合约审计与链上风控

自动审计 Solidity 合约,CertiK 式自动化漏洞扫描与链上交易监控

合约审计耗时大幅缩短,覆盖率显著提升

链上异常交易实时预警,DeFi 协议安全加固

演示

在线演示 · OpenClaw on Azure

用户视角
开发者 / 业务用户
1
注册账号
通过企业 SSO 或邀请链接完成注册
2
创建 OpenClaw 实例
选择模型、配置工具权限,一键部署专属 Agent
3
开始使用
在浏览器中与 AI Agent 交互,执行自动化任务
4
查看用量
实时查看 Token 消耗、任务历史和费用统计
管理员视角
IT 管理员 / 安全团队
1
管理用户
邀请成员、分配角色、设置权限边界
2
监控实例
总览所有 OpenClaw 实例的运行状态与资源使用
3
设置策略
配置 DLP 规则、用量配额、模型白名单
4
安全告警
查看 Defender / Sentinel 告警,一键响应处置

demo.openclaw-azure.org — 可直接体验完整的用户注册与管理流程

Part 02

架构与部署

部署模式选择、关键决策因素、必选与可选组件

部署模式技术架构Azure 方案模型生态

考量

部署 OpenClaw 关键决策点

安全与隔离

  • · Agent 运行时沙盒策略(VM / 容器 / Kata)
  • · 多租户数据隔离与访问控制
  • · 敏感信息脱敏与审计日志
  • · 紧急熔断与人工介入机制

成本与预算

  • · LLM Token 消耗量预估与管控
  • · 基础设施成本
  • · 按用量 vs 预留实例
  • · 分阶段投入与 ROI 评估

架构与扩展

  • · Gateway 高可用与负载均衡
  • · 2,000 并发 Agent 弹性伸缩
  • · 跨区域 / 混合云部署
  • · 微服务化 vs 单体部署选型

身份与治理

  • · Entra ID 统一身份 + RBAC
  • · Agent 按角色/部门权限边界
  • · Skill 审批发布流程
  • · 合规框架对接(GDPR/等保)

模型与生态

  • · 模型选型:性能/成本/合规权衡
  • · 私有部署 vs API 调用
  • · 多模型路由与 Fallback
  • · Skill 生态构建与复用

运维与可观测

  • · Agent 运行状态监控大盘
  • · 异常检测与自动告警
  • · Token 用量追踪与计费
  • · 灰度发布与回滚策略

技术

技术概览

架构

Chat 平台
15+
Teams · Slack · 微信
Gateway
核心引擎
AKS Pod (Kata VM)
AI 模型
LLM
Azure OpenAI + AI Foundry
工具 & Skills
20+
Azure Functions + Key Vault

Gateway 是唯一出入口 — 运行在 AKS 中,通过 Application Insights + Sentinel 全链路监控

核心能力

Skills 系统

自然语言 SKILL.md 教 AI 学新技能,写一次永久学会

Azure Repos + ClawHub

Memory 系统

Markdown 格式 · Git 管理 · 完全透明可控

Cosmos DB + Blob Storage

Heartbeat 自动化

~30分钟周期巡检,主会话运行,完整上下文

Azure Monitor 告警触发

Cron 定时任务

独立会话隔离执行,持久化,自然语言创建

Azure Functions Timer

OpenClaw Architecture

架构全图 — 点击放大

OpenClaw on Azure 安全多租户架构Entra IDWorkload Identity FederationWorkload IdentityAKS Private Cluster (Azure CNI + Cilium + Workload Identity)Azure API ManagementLLM Gateway · Rate LimitToken Metering · RoutingSubscription per tenantLLM APILLM ProvidersAzure OpenAI (GPT 系列)Azure AI Foundry (3P 模型)GitHub Copilot (GPT/Claude/Gemini)SaaS ProvidersGoogleGitHubSalesforceJira / SlackSaaS AuthTenant Pool (runc)Tenant AOpenClawDLP PluginSaaS Auth ProxyNetworkPolicy · CiliumKeyVault CSI · ManagedIdentityTenant BOpenClawDLP PluginSaaS Auth ProxyNetworkPolicy · CiliumKeyVault CSI · ManagedIdentityTenant COpenClawDLP PluginSaaS Auth ProxyNetworkPolicy · CiliumKeyVault CSI · ManagedIdentitySandbox Pool (Kata Containers — Hyper-V microVM)Tool Exec Pod (ephemeral) + sandbox-monitor PID 1Hardware VM boundary · No secrets · No SA tokenTool Execagent-warden-system namespaceAgent Warden Server (MCP) · K8s Operator (Reconciler)ReconcileAzure Key Vault(HSM) per-tenant + platformCosmos DB(Serverless) tenant reg. · auditLog Analytics+ Sentinel SIEMMicrosoft PurviewE5 DLP · processContent APIcross-tenant auth

方案

Azure 部署 · 深度融入 Microsoft 环境

OpenClaw 可以部署在任何地方 — 但在 Azure 上,你能获得更多

主动式助手
企业级安全
Microsoft 生态
多渠道接入

Teams

基于 M365 Agents SDK 原生接入。OID 级别按用户路由、自适应卡片审批——无需离开 Teams。

Outlook

电子邮件作为完整渠道——接收消息、整理收件箱并通过 Microsoft Graph 回复,与 Teams 和 Web Chat 同时运行。

Copilot

将编码和审查任务委托给 GitHub Copilot CLI。在后台运行,完成后通知——从您的 Copilot 订阅计费。

Claude

将任务直接委托给 Claude 作为一等工具。为研究、起草或审查生成范围化的 Claude 子 Agent。

Entra ID

一次登录。OIDC + PKCE、MSAL 令牌缓存、跨 Teams、Web Chat 和管理门户的按用户会话隔离。

Azure

OpenClaw Gateway 无状态部署到您的 Azure 租户。管理资源、DevOps 流水线、Application Insights 遥测——开箱即用。

GitHub

Issues、PR、代码搜索和仓库管理。结合 Copilot 委托,实现端到端 AI 辅助开发。

Microsoft+

代理连接 Microsoft 内部服务——M365 Agent、ICM、EngHub、Kusto。Entra ID 身份认证自动处理,以及更多 MCP 工具。

方案

Azure 生态 · 全模型覆盖

OpenClaw 通过 Azure API Management 统一代理,一套配置接入所有模型

Azure OpenAI Service

微软一方模型 · 按 Token / PTU 计费

  • GPT-5.4最新
  • GPT-5.4 Pro旗舰
  • GPT-5.4 mini / nano
  • GPT-5.3-Codex编程
  • GPT-5.2 / 5.1推理
  • 企业 SLA
  • 数据不出租户
  • Standard 按 Token 计费
  • PTU 预留吞吐(命中 Cache 不消耗用量

Azure AI Foundry

第三方模型 · Marketplace 计费

  • Claude Opus 4.6Anthropic
  • Claude Sonnet 4.6Anthropic
  • Claude Haiku 4.5Anthropic
  • Grok-4.1xAI
  • MiniMax-M2.5MiniMax
  • Kimi-K2Moonshot
  • GLM-5智谱
  • DeepSeek-V3.2DeepSeek
  • Serverless API · 无需管理基础设施
  • Azure Marketplace 按 Token 计费

GitHub Copilot

开发者平台 · 订阅制

  • GPT-5.4 / Pro / Mini / NanoOpenAI
  • GPT-5.3-CodexOpenAI
  • Claude Opus / Sonnet 4.6Anthropic
  • Claude Haiku 4.5Anthropic
  • Gemini 3.1 ProGoogle
  • Gemini 3 FlashGoogle
  • Business $19/月,含 300 Requests
  • Enterprise $39/月,含 1000 Requests
  • 超出部分均按 $0.04/request
Azure API Management统一路由 · 负载均衡 · 用量计费 · 模型降级
Part 03

运营治理

Agent 全生命周期治理:从创建到退役的企业级管控

生命周期Skill 管理指标矩阵监控审计

管理

① Agent 生命周期管理

定义
SOUL.md
测试
沙盒验证
发布
审批上线
运行
弹性伸缩
迭代/退役
版本管理
创建与定义
  • · SOUL.md 声明式定义 Agent 人格、职责、工作流
  • · 模板库:预置财务/HR/IT 等角色模板
  • · Git 版本控制:每次变更可追溯
部署与伸缩
  • · Per-tenant Pod 容器化隔离部署
  • · AKS HPA 自动伸缩 + KEDA 事件驱动
  • · 空闲 Agent 自动缩容至零,按需唤醒
迭代与退役
  • · 蓝绿/金丝雀部署策略,平滑切换
  • · Agent 使用率监控,低活跃自动告警
  • · 退役流程:数据归档 → 权限回收 → 下线

管理

② Agent Skill 管理与治理

Skill 创建与分发
  • · SKILL.md 自然语言定义,分钟级上线
  • · SOP → Skill 一键转化
  • · 企业内部 Skill 商店
  • · 跨团队 Skill 共享与复用
Skill 审批与安全
  • · 审批工作流:提交 → 安全扫描 → 审批 → 发布
  • · 供应链安全:限制安装源,锁定版本号
  • · ClawHub 第三方 Skill 白名单
  • · 权限分级
版本与依赖
  • · Git 版本管理,全程可追溯
  • · 依赖声明与冲突检测
  • · 灰度发布:按比例逐步推送
  • · 回滚机制:一键恢复
Skill 效能分析
  • · 调用频次、成功率、平均耗时
  • · Token 消耗归因:按 Skill 成本分摊
  • · 用户满意度反馈与评分
  • · 低效 Skill 识别与优化

管理

③ Agent 指标与矩阵管理

核心指标体系 (Metrics)

性能指标
  • · 响应时间 P50/P95/P99
  • · 任务完成率
  • · 工具调用成功率
  • · 并发处理能力
成本指标
  • · Token 用量/Agent/天
  • · 单次任务成本
  • · Cache 命中率
  • · 部门成本分摊
使用指标
  • · DAU/MAU 活跃度
  • · 用户满意度 CSAT
  • · Skill 使用热度
  • · 会话深度分布
安全指标
  • · 异常行为检测率
  • · 敏感数据接触次数
  • · 权限越界告警
  • · 审计覆盖率

矩阵管理 (Matrix)

按部门
Agent 归属与权限边界
按角色
RBAC 权限分级授权
按场景
业务线 Agent 资源配额
按区域
跨区合规与数据驻留
可视化大盘 — Application Insights + Power BI + Sentinel

管理

④ Agent 监控、日志与审计

全链路日志
  • · Session .jsonl 完整记录
  • · 工具调用链路追踪(Tool Call Trace)
  • · Prompt / Response 全量归档
  • · 结构化日志 → Log Analytics
实时监控
  • · Application Insights 性能指标
  • · Agent 健康度巡检(Heartbeat ~30min)
  • · 异常行为检测:工具调用频率突增
  • · Azure Monitor 告警规则
合规审计
  • · Microsoft Sentinel SIEM 集成
  • · 操作审计:谁在何时用了什么工具
  • · 敏感数据访问轨迹回溯
  • · 合规报告自动生成(GDPR/等保)
应急响应 Playbook
检测
Sentinel 自动识别
隔离
暂停 Agent 执行
修复
凭证轮换权限回收
复盘
根因分析策略加固
Part 04

安全治理

AI Agent 拥有完整系统权限,安全不是可选项

真实攻击事件攻击面分析安全控制威胁猎杀

附录

OpenClaw企业安全解决方案

从真实安全事件出发,系统拆解 OpenClaw Agent 面临的攻击面与风险,并逐一映射 Microsoft 安全产品矩阵的防护能力。

2

真实事件

4

攻击向量

6

安全控制

6

威胁猎杀

安全

从真实事件说起

邮件删除事件

OpenClaw 误解指令,批量删除邮件。用户发送 Stop 命令无法阻止 — 因为 Memory Compaction 丢失了上下文。不得不强制 Kill 进程。

来源:Twitter/X @summer_yue

恶意 Skill 供应链攻击

攻击者制作恶意 Skill,OpenClaw 自动调用并执行。木马程序被下载运行,目标:窃取用户凭证。ClawHub 不验证第三方内容。

来源:微信安全文章

攻击向量

CVE 漏洞利用

258+ 累计漏洞,高危低难度,RCE/路径遍历/访问控制

供应链攻击

Skills/扩展含恶意代码,>10% 比例,ClawHub 不验证

数据窃取

Token/证书/密码窃取,间接 Prompt 注入,会话劫持

安 全

事件 1 — 邮件删除失控

OpenClaw 无视用户指令,批量删除邮件,Stop 命令无法阻止Source: Twitter/X @summer_yue

① 失控

① 失控

OpenClaw 开始执行删除,用户发现异常

② 无法中断

② 无法中断

多次 STOP 无效,AI 继续循环删除

③ 事后反思

③ 事后反思

AI 承认违反规则,写入 MEMORY.md

Memory Compaction 丢失指令Stop 命令无法中断被迫 Kill 进程

安 全

事件 2 — 恶意 Skill 木马

攻击者精心构造恶意 Skill,被 OpenClaw 调用后自动下载并运行木马,目的是盗取用户密码。Source: 微信安全文章

恶意Skill上传
OpenClaw调用
木马下载执行
窃取用户凭证
Defender XDR 进程链

Defender XDR 进程链分析 — 点击查看大图

安 全

攻击者视角:攻击面分析

CVE 漏洞利用

· 自发布以来,累计发现 258 个漏洞

· 高危漏洞多,利用难度低

· 漏洞类型包括远程代码执行,文件路径遍历,访问控制类型漏洞

供应链攻击

· Skills,Extension 和 Plugin 包含恶意代码,比例超过 10%

· ClawHub 不会对第三方内容进行校验

· Self-hosted 主机缺乏终端安全检测

窃取敏感数据

· 执行过程中错误理解指令或越权执行指令

· 获取 Token,Certificate 或 Password

· 窃取用户信息,数据囤积和泄漏敏感数据

对模型攻击

· 在网页、邮件或文档中嵌入指令,发起 Indirect Prompt Injection

· 欺骗 Agent 将恶意指令写入内存中,实现对 session 的劫持

安 全

防御者视角:风险与安全能力

身份与权限的风险

终端或服务器的检测与响应

供应链风险的防御能力

网络访问的控制与隔离

敏感数据泄漏的预防能力

OpenClaw 运行的监控与响应

→ 接下来,逐一拆解每个控制域的具体措施与 Microsoft 方案

安全治理

10 大管控域 × Microsoft 安全产品映射

身份
专用身份
最小权限
短期令牌
管理员同意
Entra ID 条件访问
Defender for Cloud Apps OAuth 监控
终端与主机
Agent 主机视为高权限资产
测试/生产隔离
快速令牌吊销
Defender for Endpoint 统一防护
Defender XDR 跨信号关联
供应链
限制安装来源与发布者
版本固定
定期审查更新
Defender for Endpoint 可疑扩展检测
Intune 阻止未批准路径
网络访问
限制出站访问
仅允许业务必需目标
阻断高风险外部源
Defender for Endpoint Web 过滤
Azure NSG 网络隔离
Defender for Cloud 出站监控
Prompt 安全
防止 Prompt Injection
输入清洗与隔离
可信/不可信边界
Azure AI Content Safety
Prompt Shield 直接/间接注入检测
数据保护(输入)
降低敏感数据引入 Prompt 风险
限制 Agent 访问范围
Purview 敏感度标签
终端 DLP 阻止标记数据外传
数据保护(输出)
审核生成内容合规性
防止输出敏感信息与有害内容
AI Content Safety 幻觉/版权检测
Purview DLP 输出扫描
人机协同
敏感操作人工审批
human-in-the-loop
权限分级
Power Automate 审批流
Entra PIM 即时审批
限流与滥用
API 速率限制
异常模式检测
账户/Agent 级配额
Azure API Management 配额
Defender for Cloud Apps 异常检测
监控与运维
Agent 行为日志
异常工具使用告警
身份泄露应急响应
Defender XDR 威胁狩猎
Sentinel Playbooks 自动化响应

安 全

安全控制 · 预防层 + 检测响应层

事前防住 · 预防层
身份与权限
措施要求
  • Agent 使用专用身份
  • 最小权限 + 短期 Token
  • 高权限操作受控同意
Microsoft 方案
Entra ID
· Conditional Access
· Admin consent workflow
Defender for Cloud App
· OAuth 应用清单
· Consent drift 监控
终端设备防护
措施要求
  • Agent 宿主视为特权设备
  • 试点与生产环境分离
  • 快速隔离与令牌撤销
Microsoft 方案
Defender for Endpoint
· Agent 宿主 onboard + 设备组策略
Defender XDR
· 终端 + 身份 + 云事件关联分析
供应链安全
措施要求
  • 限制安装源和发布者
  • 锁定已批准 Skill 版本
  • 审查每次更新内容
Microsoft 方案
Defender for Endpoint
· 检测可疑扩展安装和远程工具
App Control
· 限制未批准路径和发布者
事中拦截 + 事后响应 · 检测响应层
网络访问控制
措施要求
  • 限制出站访问,仅允许已知目标
  • 阻止高风险外部数据源
Microsoft 方案
MDE Web Content Filtering
· 按设备组限制分类和访问
Azure Network / Defender for Cloud
· 出站行为监控 + 集中日志
敏感数据保护
措施要求
  • 减少敏感数据注入 Prompt
  • 减少 Agent 工具外泄数据
Microsoft 方案
Microsoft Purview
· 敏感度标签分类
· Endpoint DLP 审计/阻止标签数据流出
监控与响应
措施要求
  • 记录操作日志,异常工具调用告警
  • 准备 Agent 身份入侵应急 Playbook
Microsoft 方案
Defender XDR
· 威胁猎杀 + 事件关联分析
Microsoft Sentinel
· 深度留存 + 自动化响应
· 隔离/凭证轮换/取证
Part 05

成本分析

典型场景成本构成 · 计费模式对比 · 成本优化方案

TCO 分析成本优化ROI 评估

定价参考

模型 API · 官方列表价格

单位:USD / 百万 Token(MTok) · Cache Write = 缓存写入 · Cache Read = 缓存命中 · Copilot 倍率 = 每次请求消耗的 Premium Request 数量

模型厂商InputCache WriteCache ReadOutputCopilot 倍率
GPT-5.4OpenAI$2.50$1.25$15.00
GPT-5.4 ProOpenAI$30.00$15.00$180.00
GPT-5.4 miniOpenAI$0.75$0.375$4.500.33×
GPT-5.4 nanoOpenAI$0.20$0.10$1.25
GPT-5.3-CodexOpenAI$1.75$0.875$14.00
Claude Opus 4.6Anthropic$5.00$6.25$0.50$25.00
Claude Sonnet 4.6Anthropic$3.00$3.75$0.30$15.00
Claude Haiku 4.5Anthropic$1.00$1.25$0.10$5.000.33×
Grok-4.20 ⚠️xAI$2.00$0.20$6.00
Gemini 3.1 ProGoogle$2.00$0.20$12.00
Gemini 3 FlashGoogle$0.50$0.05$3.000.33×
🔥 Azure Fireworks 模型(Fireworks 官方 +10% Data Zone 加价)
DeepSeek-V3.2Fireworks$0.62$0.31$1.85
Kimi-K2Fireworks$0.66$0.11$3.30
MiniMax-M2.5Fireworks$0.33$0.03$1.32
GLM-5Fireworks$1.10$0.22$3.52
OpenAI Cache:自动缓存 · 无写入费 · 读取 50% input · Anthropic Cache:写入 1.25× input · 读取 0.1× input · Google/xAI:无写入费 · 读取 ~10-25% input · 2026-03

成本分析

同一件事 · 用对方法,成本直降 93%

实测任务:Azure Portal 创建 VM → 逐步截图 → 写入飞书文档
Token 计费 · Anthropic API 定价
$10.17$2.73$0.75
优化方法 ↓73% → 换小模型 ↓93%
场景 1 · 基线
Opus 4.6 · 暴力执行
飞书文档
模型Claude Opus 4.6
LLM 调用153
耗时20m 00s
Token 明细
Input (非缓存)99.9k
Output27.8k
Cache Write244k
Cache Read14.9M
Token 计费
$10.17
场景 2 · 优化方法
Opus 4.6 · 减少工具调用
飞书文档
模型Claude Opus 4.6
LLM 调用58
耗时7m 01s
Token 明细
Input (非缓存)60
Output21.6k
Cache Write171k
Cache Read2.7M
Token 计费
$2.73↓73%
场景 3 · 换小模型
Sonnet 4.6 · 更低单价
飞书文档
模型Claude Sonnet 4.6
LLM 调用23
耗时5m 10s
Token 明细
Input (非缓存)25
Output9,047
Cache Write67.4k
Cache Read1.19M
Token 计费
$0.75↓93%
基线问题
153 次调用 · 反复截图确认 · 每步等待 UI 响应 · Cache Read 14.9M 导致成本虚高
方法优化
直接 URL 导航 · 批量截图 · 一次性写入 markdown · 调用次数 ↓62%
模型选择
Opus → Sonnet · 单价低 3-5 倍 · 简单任务质量无差异 · 总成本再降 72%

成本分析

延伸 · 从应用到 Skill,成本优化前移

Application Owner
一个角色,双重职责
迭代应用本身
开发、部署、运维
业务逻辑迭代与 Bug 修复
封装为 REST API / GraphQL / CLI
认证、鉴权、Rate Limit
可观测性与 SLA 保障
输出 → API / CLI / SDK
维护专属 Skill
定义 Agent 如何调用应用
编写 SKILL.md 定义交互契约
选择最优模型(Haiku / Sonnet / Opus)
Prompt 工程 · 工具声明 · 上下文策略
成本监控与持续调优
输出 → SKILL.md(企业 Skill 商店)
OpenClaw Agent 通过 Skill 调用应用,使用者无需关心底层
End User · OpenClaw Agent
通过 Skill 与企业应用无缝交互
# OpenClaw Agent 使用 Skill:
OpenClaw → 加载 SKILL.md → 按 Skill 定义调用 应用 API/CLI

# 用户无需知道:
# - 后端用了哪个模型(Haiku? Sonnet? Opus?)
# - 调用了哪个 API 端点
# - 每次调用花了多少钱
# 这些全由 Application Owner 在 Skill 中决定
标准化入口
统一通过 Skill 交互
最优解
Owner 持续优化体验与成本
成本透明
模型选择权归应用 Owner
核心理念:成本优化是每个应用 Owner 的事
WhoOwner 最懂自己的应用,比平台更适合做成本决策
How哪些用 Haiku 就够,哪些上 Opus;实时 API 还是批量 CLI
Result这些决策封装进 Skill,使用者只享受最优结果

成本分析

计费模式验证 · Agent 链路只算 1 次 Request

测试模型:Claude Sonnet 4.6
测试环境:OpenClaw Agent (Ubuntu) + GitHub Copilot Business
核心发现:Agent 工具调用链不计入 Premium Request
一个用户任务触发 1 次用户请求 + N 次后续工具调用 → GitHub Copilot 只算 1 次 Premium Request
计费验证实测
通过 Copilot quota API 精确计算 premium_interactions.remaining
组别调用次数模式Premium 消耗
Group A10 次标准调用10
Group B10 次Agent 模式0
Group C1+9 次混合模式 (1次用户 + 9次Agent)1
Group D20 次Agent 模式0
对照组1 次标准调用1
Agent 模式 20 次调用 = 0 Premium · 混合模式 10 次调用 = 1 Premium
GitHub Copilot 套餐
Business
$19/月 · 含 300 Premium Requests
Enterprise
$39/月 · 含 1000 Premium Requests
超出部分$0.04 /request (Sonnet级)
模型 Request Multiplier
Claude Sonnet 4.6
1x$0.04
Claude Opus 4.6
3x$0.12
Claude Haiku 4.5
0.33x$0.013
GPT-4.1 / GPT-4o
0x免费
验证方法:每组测试前后通过 Copilot 官方 quota API 查询 premium_interactions.remaining,精确计算消耗
关键意义:对 OpenClaw Agent 平台,Request 计费模式不看 Token 数量,只看请求次数,37 万 token 的任务 = $0.04

成本分析

实测数据 · 10 轮代码审查 Token 明细

Claude Sonnet 4.6
10 个 Python 模块完整代码审查 · auth / database / routing / caching / logging 等
Token 总消耗
374,523 约 37 万
Input
302,923
Output
71,600
Cache Read
232,575
轮次任务InputOutputCache Read
1代码审查 (10 模块)2.8k1.1k
2安全修复 (auth + db)3.9k2.6k2.8k
3重构 (routing + caching)6.5k5.2k3.9k
4编写测试用例11.7k10.1k6.5k
5修复 (middleware + validation)21.8k8.4k11.7k
6编写集成测试30.3k12.8k21.8k
7FastAPI 应用集成43.1k9.9k30.3k
8Dockerfile + docker-compose53.0k6.5k43.1k
9CI/CD 流水线59.5k10.6k53.0k
10总结与迁移指南70.2k4.4k59.5k
合计302.9k71.6k232.6k
Context 累积效应:第 1 轮 Input 2,812 → 第 10 轮 70,174(25 倍增长),每轮新增上一轮 output + 新指令
Output 自然波动:从 1,065(简短审查意见)到 12,760(完整集成测试代码),反映真实使用场景
Cache 命中率:第 4 轮起 Cache Read 占 Input 比例稳定在 55-85%,有效降低重复 context 成本

成本分析

成本对比 · Token 计费 vs Request 计费

同一任务:10 轮代码审查 · Claude Sonnet 4.6
Token 计费是 Request 计费的 33.9 倍
$1.3548 vs $0.04 — 同样的任务,同样的模型
Anthropic Token 计费
按 Token 数量计费 · Sonnet 4.6 定价
成本明细
Non-cached Input70,348 tokens × $3.00/MTok
$0.2110
Cache Read232,575 tokens × $0.30/MTok
$0.0698
Output71,600 tokens × $15.00/MTok
$1.0740
Output 占总成本的 79%— Output 单价是 Input 的 5 倍
Token 计费总计$1.3548
GitHub Copilot Request 计费
按 Premium Request 次数计费
计费明细
Premium Requests 消耗1 次
Sonnet 4.6 Multiplier1x
单价$0.04 / request
37 万 token 的复杂任务100 token 的简单问答
计费完全一样:$0.04
Request 计费总计$0.04
Context 累积效应
第 1 轮 2.8K → 第 10 轮 70K,对话越长 Input 越贵。Request 计费始终 $0.04
Output 成本无法缓存
即使 Cache 大幅降低 Input 成本,Output ($15/MTok) 占 79% 且无法优化
Agent 场景天然适配
Agent 生成代码、配置等长文本,Output token 大。Request 计费不受影响

成本分析

日常使用推算 · 月度成本对比

基于实测:每任务 ~37 万 tokens · 每任务消耗 1 Premium Request
5 任务/天
轻度使用
Token 计费
$204/月
$6.8/天
Copilot
$6/月
$0.20/天
97%
节省
10 任务/天
中度使用
Token 计费
$405/月
$13.5/天
Copilot
$12/月
$0.40/天
97%
节省
20 任务/天
重度使用
Token 计费
$813/月
$27.1/天
Copilot
$24/月
$0.80/天
97%
节省
50 任务/天
极限使用
Token 计费
$2,031/月
$67.7/天
Copilot
$60/月
$2.00/天
97%
节省
重度使用 (20 任务/天)
$813vs$24 /月
即使 Business 套餐 ($19/月)
300 Premium Requests = 300 个 Agent 任务
等效 Token 成本
300 × $1.35 = $405 → 实际只需 $19
所有使用量级均节省 97% — Copilot Request 计费全面领先

成本分析

结论与建议

Token 计费的痛点
AI Agent 天然吃亏
1
Context 累积
Agent 每轮带完整对话历史,input 随轮次线性增长
2
Output 成本高昂
Agent 生成代码等长文本,output 单价是 input 的 5 倍
3
实测验证
10 轮对话 Input 25 倍增长(70K vs 2.8K),Output 占总成本 79%
Copilot 后端评估
维度评分说明
成本效益单次 $0.04,比 Token 计费便宜 34 倍
模型质量支持 Sonnet 4.6 / Opus 等 Premium 模型
Agent 适配Request 计费天然适配多轮工具调用
Context 限制Copilot 上 context window 为 200K(直连为 1M)
稳定性API 响应稳定,偶有 rate limit
Request 计费的优势
完美解决 Agent 场景
1
不看 Token 数量
只看请求次数,37 万 token 任务 = $0.04
2
Agent 链路 = 1 次
多轮工具调用链是一个完整交互,只算 1 次 Premium Request
3
成本可预测
无论任务复杂度如何,单次成本固定,便于预算规划
建议
对于使用 OpenClaw 作为 AI Agent 平台的用户,GitHub Copilot 的 Request 计费模式 是目前最具性价比的 LLM 后端。
~97%
同等任务成本节省
200K
Context Window(直连 1M)
唯一限制是 context window 从 1M 缩小到 200K,但对大多数 Agent 场景已经足够
数据基于 2026-03-27 实际 API 调用测试结果 · 完整测试报告

行动

从试点到规模化 · 落地路线图

Phase 1第 1-2 月

试点验证

  • 选择 1-2 个部门试点
  • 部署 50-100 个 Agent
  • 基础版架构 + 核心安全
  • 收集用户反馈与 ROI 数据
Phase 2第 3-4 月

扩展优化

  • 扩展至全公司 1,000 人
  • 升级至高级版安全架构
  • 建立 Skill 共享平台
  • 完善监控与运维体系
Phase 3第 5-6 月

规模化运营

  • 2,000 Agent 全面上线
  • 跨部门 Agent 协作流程
  • 内部 Skill 生态成熟
  • 持续优化成本与效能

立即行动

申请 Azure 试用环境,部署首个 OpenClaw 实例

深入评估

联合 Azure 团队进行 TCO 与安全架构评审

持续演进

加入 OpenClaw 社区,共建企业级最佳实践

现在的 AI 都这么强大了,

为什么还不让它碰生产环境

Think about it.

申请 POC

在你的 Azure 环境中试用 OpenClaw

技术交流

与我们的架构师深入讨论方案

了解更多

github.com/openclaw/openclaw