1 / 41

GitHubCopilot

从代码 AI 助手到AI Agent 引擎

Scroll

议程

五大议题 · 全景解读

场景与价值

高价值应用场景
部署哪些角色的 Agent？
给谁用？三视角需求分析
行业落地案例

架构与部署

部署模式：集中 / BYOA / 混合
必选组件与可选组件
技术架构与 Azure 方案
模型生态与企业集成

运营治理

Agent 生命周期管理
Skill 管理与治理
指标与矩阵管理
监控、日志与审计

安全治理

真实安全事件分析
攻击面与攻击向量
10 大管控域映射
预防层 + 检测响应层

成本分析

典型场景的成本构成
计费模式对比实测
成本优化方案与案例
ROI 评估框架

OpenClaw 是什么

openclaw / openclaw

325K63KMIT

github.com/openclaw/openclaw

“The AI that actually does things.” — 在你自己的设备上运行，通过任何聊天工具与 AI Agent 交互，让 AI 终于碰得到你的数据。

325K+

GitHub Stars

50+

Integrations

15+

Chat Platforms

MIT

Open Source

Supported Platforms

macOS

iOS

iPadOS

watchOS

Windows

Linux

Android

Raspberry Pi

15 Chat Providers

Discord

Slack

Signal

iMessage

Teams

Zalo

BlueBubbles

飞书

Matrix

Nostr

Nextcloud

Tlon

WebChat

Persistent Memory

记住偏好和上下文，持续个性化

Browser Control

浏览网页、填表单、抓取数据

Full System Access

文件读写 · Shell · 脚本 · 沙盒

Skills & Plugins

社区扩展 · ClawHub 生态

Evolution

WaRelay

2025 mid

最初的 WhatsApp 转发网关

ClawdBot

2026.01.05

v1.x

龙虾吉祥物 "Clawd" 诞生，一夜爆火

MoltBot

2026.01.27

v2.x

Anthropic 商标问题，"Clawd" 太像 "Claude"，被迫改名

OpenClaw

2026.01.29

v3.x

社区投票 → 正式定名 OpenClaw

它很强大，请务必做好隔离

OpenClaw 拥有完整的系统访问权限 — 文件读写、Shell 执行、浏览器操控、跨平台远程调度。

这意味着它能帮你做几乎任何事，但也意味着一旦失控，后果不可逆。

请在沙盒、虚拟机或专用环境中运行，不要让 AI 直接触碰生产数据。

沙盒隔离

最小权限原则

远离生产数据

人工审查输出

Part 01

场景与价值

企业部署 OpenClaw 的高价值场景、Agent 角色与用户群体

三视角需求行业场景企业案例

方案

企业级需求

OpenClaw 从玩具到生产，需要回答三个角色的问题

终端用户

「我只想让 AI 帮我干活，别让我学编程」

快速创建多技能 Agent

SOUL.md 一文定义人格与工作流

多通道统一体验

Teams / 微信 / Telegram 同一 Agent

SOP 沉淀为资产

SOP → Skill 分钟级转化，团队共享

数据安全放心用

per-user 会话隔离 + 密钥脱敏

IT / 安全团队

「别给我挖坑，出了事我背锅」

Agent 运行时隔离

Kata VM 硬件级沙箱，逃逸成本极高

全链路审计

Session .jsonl 完整记录每一轮对话与工具调用

统一模型管控

LiteLLM Proxy 统一路由 + 用量计费

弹性与成本可控

按需自动伸缩，空闲时资源自动回收

管理层

「投进去的钱，什么时候能看到回报」

可量化的生产力提升

合同审查 10x、客服效率 +60%

ROI 清晰可控

按用量付费，无前置许可，成本随业务线性增长

运营可观测

Application Insights + Sentinel 实时大盘

合规与风险管控

Entra ID 权限管控 + Purview DLP + 紧急熔断机制

→ 这些需求，Azure + Microsoft 安全生态可以一站式解决

场景

OpenClaw 高阶应用场景

普通 Agent 只有大脑，OpenClaw 同时拥有大脑 + 手 + 眼睛 ——在真实系统和应用完成任务，而非仅给出文本建议。

浏览器自动化

启动真实 Chromium，通过 Playwright 控制页面——登录 SSO/MFA 门户、操作多步骤表单、下载报表。

SSO/MFA 登录网页填单报表抓取

跨系统端到端编排

CRM 查客户 → 下载合同 → Excel 更新 → 导出 PDF → 上传系统。

CRM + ERP邮件 + 附件异构系统串联

遗留/内网系统自动化

老 Java Web、SAP GUI、Citrix——没有 API、没有文档。UI 即接口。

SAP GUICitrix内网系统

长时有状态任务

每天 9 点自动拉报表、20 分钟任务中途失败自动恢复。

Cron 定时失败恢复长期运行

人机混合协作

Agent 执行到关键步骤暂停等人确认，审批后继续。

审批流合规检查人工接管

RPA + LLM 数字员工

传统 RPA 的执行力 + LLM 的理解力。7×24 全天候。

财务对账IT 巡检客服全覆盖

案例

行业应用场景1 / 2

01电商行业

电商卖家智能助手平台

多 Agent 助手（销售/客服/运营），通过飞书/Slack 等渠道嵌入卖家日常工作流

→ Skill 构建从"编译型"变为"解释型"，分钟级上线

→ per-tenant Pod 实现 SaaS 化隔离部署

02零售行业

智能客服与用户运营

WhatsApp/微信/Telegram 多渠道 7×24 客服，售前/订单/售后/会员全覆盖

→ 客服响应效率大幅提升，跨渠道体验一致

→ 运营团队自主扩展 Agent 能力，无需工程介入

03科技与软件

研发效能与代码质量管理

代码审查/测试自动化/DevOps Agent 联动，从发现问题到修复上线闭环

→ PR 审查周期显著缩短，研发人员专注高价值创新

→ 线上错误自动修复能力大幅提升

04金融与保险

智能文档处理与合规审查

合同审查/合规检测/理赔处理 Agent，自动接收文件完成条款比对与风险标注

→ 文档处理效率大幅提升，合规遗漏显著减少

→ 自托管 Gateway 确保数据不出企业边界

05医疗健康

医疗知识助手与患者随访

临床知识/患者随访/健康数据 Agent，结合可穿戴设备进行异常预警

→ 随访效率显著提升，医护文书工作大幅减少

→ Persistent Memory 记住患者病史，提供个性化服务

06制造业

智能制造与设备运维

设备监控/故障诊断/备件管理 Agent，IoT 告警自动分析并生成维修工单

→ 故障响应速度大幅提升，非计划停机显著减少

→ 工程师经验通过 SOP 转 Skill 沉淀为组织资产

07教育与科研

教学辅助与学术科研

学习辅导/课程管理/文献分析 Agent，批量批改并生成个性化反馈

→ 批改效率显著提升，学生问题即时响应

→ OpenClaw-RL 持续从教学反馈中优化回答质量

08游戏行业

游戏社区运营与智能 NPC

社区运营/策划/NPC 人格 Agent，SOUL.md 定义 NPC 个性并持续进化

→ 社区全天候多语言覆盖，玩家留存率显著提升

→ NPC 对话满意度通过 RL 持续提升，互动意愿增强

案例

行业应用场景2 / 2

09数字原生

全栈自动化运营与产品迭代

主控/Dev/Marketing/Business Agent 军团，手机单一入口操控全流程

→ 个人效率倍增，等效多人团队产出

→ ClawHub 快速安装社区 Skill，即时扩展新能力

10内容营销

SEO 内容生产自动化流水线

热点搜集→关键词研究→撰文→配图→发布，Cron 每日自动执行全流水线

→ 每日稳定产出高质量文章，曝光量大幅增长

→ 小型团队拥有媲美大型内容团队的输出能力

11证券投研

财报解读与投资洞察

财报监控 Agent 自动跟踪、解读关键财务数据，即时推送投资洞察

→ 财报发布后即时收到 AI 总结要点推送

→ 分析师从数据搬运中释放，专注高价值判断

12汽车零售

AI 全权代理购车比价谈判

Agent 批量询价、多轮竞价谈判，并行管理多家经销商邮件往来

→ 成交价显著低于标价，全程无需到店沟通

→ 从「谈判顾问」升级为「自主谈判代理」

13旅游出行

多约束条件智能行程规划

综合预算/饮食/身体限制等多重约束，自动生成可执行行程方案

→ AI 方案贴合多重约束，大幅节省规划时间

→ Persistent Memory 记住偏好，下次规划更精准

14法律服务

批量合同审查与风险标注

批量 PDF 上传，Agent 自动解析全文、定位重要条款并标注风险点

→ 大批量合同审查周期大幅缩短，效率倍增

→ 统一标准逐条审查，不因疲劳漏掉关键问题

15智能家居 / IoT

全屋智能控制与自动化

连接 Home Assistant 全屋设备，语音/文字统一控制灯光、空调等

→ 聊天界面统一控制全屋设备，告别多 App 切换

→ Raspberry Pi 轻量部署，快速上线

16区块链

智能合约审计与链上风控

自动审计 Solidity 合约，CertiK 式自动化漏洞扫描与链上交易监控

→ 合约审计耗时大幅缩短，覆盖率显著提升

→ 链上异常交易实时预警，DeFi 协议安全加固

演示

在线演示 · OpenClaw on Azure

用户视角

开发者 / 业务用户

注册账号

通过企业 SSO 或邀请链接完成注册

创建 OpenClaw 实例

选择模型、配置工具权限，一键部署专属 Agent

开始使用

在浏览器中与 AI Agent 交互，执行自动化任务

查看用量

实时查看 Token 消耗、任务历史和费用统计

管理员视角

IT 管理员 / 安全团队

管理用户

邀请成员、分配角色、设置权限边界

监控实例

总览所有 OpenClaw 实例的运行状态与资源使用

设置策略

配置 DLP 规则、用量配额、模型白名单

安全告警

查看 Defender / Sentinel 告警，一键响应处置

打开在线演示

demo.openclaw-azure.org — 可直接体验完整的用户注册与管理流程

Part 02

架构与部署

部署模式选择、关键决策因素、必选与可选组件

部署模式技术架构Azure 方案模型生态

考量

部署 OpenClaw 关键决策点

安全与隔离

· Agent 运行时沙盒策略（VM / 容器 / Kata）
· 多租户数据隔离与访问控制
· 敏感信息脱敏与审计日志
· 紧急熔断与人工介入机制

成本与预算

· LLM Token 消耗量预估与管控
· 基础设施成本
· 按用量 vs 预留实例
· 分阶段投入与 ROI 评估

架构与扩展

· Gateway 高可用与负载均衡
· 2,000 并发 Agent 弹性伸缩
· 跨区域 / 混合云部署
· 微服务化 vs 单体部署选型

身份与治理

· Entra ID 统一身份 + RBAC
· Agent 按角色/部门权限边界
· Skill 审批发布流程
· 合规框架对接（GDPR/等保）

模型与生态

· 模型选型：性能/成本/合规权衡
· 私有部署 vs API 调用
· 多模型路由与 Fallback
· Skill 生态构建与复用

运维与可观测

· Agent 运行状态监控大盘
· 异常检测与自动告警
· Token 用量追踪与计费
· 灰度发布与回滚策略

技术

技术概览

架构

Chat 平台

15+

Teams · Slack · 微信

Gateway

核心引擎

AKS Pod (Kata VM)

AI 模型

LLM

Azure OpenAI + AI Foundry

工具 & Skills

20+

Azure Functions + Key Vault

Gateway 是唯一出入口 — 运行在 AKS 中，通过 Application Insights + Sentinel 全链路监控

核心能力

Skills 系统

自然语言 SKILL.md 教 AI 学新技能，写一次永久学会

Azure Repos + ClawHub

Memory 系统

Markdown 格式 · Git 管理 · 完全透明可控

Cosmos DB + Blob Storage

Heartbeat 自动化

~30分钟周期巡检，主会话运行，完整上下文

Azure Monitor 告警触发

Cron 定时任务

独立会话隔离执行，持久化，自然语言创建

Azure Functions Timer

架构全图 — 点击放大

方案

Azure 部署 · 深度融入 Microsoft 环境

OpenClaw 可以部署在任何地方 — 但在 Azure 上，你能获得更多

主动式助手

企业级安全

Microsoft 生态

多渠道接入

Teams

基于 M365 Agents SDK 原生接入。OID 级别按用户路由、自适应卡片审批——无需离开 Teams。

Outlook

电子邮件作为完整渠道——接收消息、整理收件箱并通过 Microsoft Graph 回复，与 Teams 和 Web Chat 同时运行。

Copilot

将编码和审查任务委托给 GitHub Copilot CLI。在后台运行，完成后通知——从您的 Copilot 订阅计费。

Claude

将任务直接委托给 Claude 作为一等工具。为研究、起草或审查生成范围化的 Claude 子 Agent。

Entra ID

一次登录。OIDC + PKCE、MSAL 令牌缓存、跨 Teams、Web Chat 和管理门户的按用户会话隔离。

Azure

OpenClaw Gateway 无状态部署到您的 Azure 租户。管理资源、DevOps 流水线、Application Insights 遥测——开箱即用。

GitHub

Issues、PR、代码搜索和仓库管理。结合 Copilot 委托，实现端到端 AI 辅助开发。

Microsoft+

代理连接 Microsoft 内部服务——M365 Agent、ICM、EngHub、Kusto。Entra ID 身份认证自动处理，以及更多 MCP 工具。

方案

Azure 生态 · 全模型覆盖

OpenClaw 通过 Azure API Management 统一代理，一套配置接入所有模型

Azure OpenAI Service

微软一方模型 · 按 Token / PTU 计费

GPT-5.4最新
GPT-5.4 Pro旗舰
GPT-5.4 mini / nano
GPT-5.3-Codex编程
GPT-5.2 / 5.1推理

企业 SLA
数据不出租户
Standard 按 Token 计费
PTU 预留吞吐（命中 Cache 不消耗用量）

Azure AI Foundry

第三方模型 · Marketplace 计费

Claude Opus 4.6Anthropic
Claude Sonnet 4.6Anthropic
Claude Haiku 4.5Anthropic
Grok-4.1xAI
MiniMax-M2.5MiniMax
Kimi-K2Moonshot
GLM-5智谱
DeepSeek-V3.2DeepSeek

Serverless API · 无需管理基础设施
Azure Marketplace 按 Token 计费

GitHub Copilot

开发者平台 · 订阅制

GPT-5.4 / Pro / Mini / NanoOpenAI
GPT-5.3-CodexOpenAI
Claude Opus / Sonnet 4.6Anthropic
Claude Haiku 4.5Anthropic
Gemini 3.1 ProGoogle
Gemini 3 FlashGoogle

Business $19/月，含 300 Requests
Enterprise $39/月，含 1000 Requests
超出部分均按 $0.04/request

Azure API Management统一路由 · 负载均衡 · 用量计费 · 模型降级

Part 03

运营治理

Agent 全生命周期治理：从创建到退役的企业级管控

生命周期Skill 管理指标矩阵监控审计

管理

① Agent 生命周期管理

定义

SOUL.md

→

测试

沙盒验证

→

发布

审批上线

→

运行

弹性伸缩

→

迭代/退役

版本管理

创建与定义

· SOUL.md 声明式定义 Agent 人格、职责、工作流
· 模板库：预置财务/HR/IT 等角色模板
· Git 版本控制：每次变更可追溯

部署与伸缩

· Per-tenant Pod 容器化隔离部署
· AKS HPA 自动伸缩 + KEDA 事件驱动
· 空闲 Agent 自动缩容至零，按需唤醒

迭代与退役

· 蓝绿/金丝雀部署策略，平滑切换
· Agent 使用率监控，低活跃自动告警
· 退役流程：数据归档 → 权限回收 → 下线

管理

② Agent Skill 管理与治理

Skill 创建与分发

· SKILL.md 自然语言定义，分钟级上线
· SOP → Skill 一键转化
· 企业内部 Skill 商店
· 跨团队 Skill 共享与复用

Skill 审批与安全

· 审批工作流：提交 → 安全扫描 → 审批 → 发布
· 供应链安全：限制安装源，锁定版本号
· ClawHub 第三方 Skill 白名单
· 权限分级

版本与依赖

· Git 版本管理，全程可追溯
· 依赖声明与冲突检测
· 灰度发布：按比例逐步推送
· 回滚机制：一键恢复

Skill 效能分析

· 调用频次、成功率、平均耗时
· Token 消耗归因：按 Skill 成本分摊
· 用户满意度反馈与评分
· 低效 Skill 识别与优化

管理

③ Agent 指标与矩阵管理

核心指标体系 (Metrics)

性能指标

· 响应时间 P50/P95/P99
· 任务完成率
· 工具调用成功率
· 并发处理能力

成本指标

· Token 用量/Agent/天
· 单次任务成本
· Cache 命中率
· 部门成本分摊

使用指标

· DAU/MAU 活跃度
· 用户满意度 CSAT
· Skill 使用热度
· 会话深度分布

安全指标

· 异常行为检测率
· 敏感数据接触次数
· 权限越界告警
· 审计覆盖率

矩阵管理 (Matrix)

按部门

Agent 归属与权限边界

按角色

RBAC 权限分级授权

按场景

业务线 Agent 资源配额

按区域

跨区合规与数据驻留

可视化大盘 — Application Insights + Power BI + Sentinel

管理

④ Agent 监控、日志与审计

全链路日志

· Session .jsonl 完整记录
· 工具调用链路追踪（Tool Call Trace）
· Prompt / Response 全量归档
· 结构化日志 → Log Analytics

实时监控

· Application Insights 性能指标
· Agent 健康度巡检（Heartbeat ~30min）
· 异常行为检测：工具调用频率突增
· Azure Monitor 告警规则

合规审计

· Microsoft Sentinel SIEM 集成
· 操作审计：谁在何时用了什么工具
· 敏感数据访问轨迹回溯
· 合规报告自动生成（GDPR/等保）

应急响应 Playbook

检测

Sentinel 自动识别

→

隔离

暂停 Agent 执行

→

修复

凭证轮换权限回收

→

复盘

根因分析策略加固

Part 04

安全治理

AI Agent 拥有完整系统权限，安全不是可选项

真实攻击事件攻击面分析安全控制威胁猎杀

附录

OpenClaw企业安全解决方案

从真实安全事件出发，系统拆解 OpenClaw Agent 面临的攻击面与风险，并逐一映射 Microsoft 安全产品矩阵的防护能力。

真实事件

攻击向量

安全控制

威胁猎杀

安全

从真实事件说起

邮件删除事件

OpenClaw 误解指令，批量删除邮件。用户发送 Stop 命令无法阻止 — 因为 Memory Compaction 丢失了上下文。不得不强制 Kill 进程。

来源：Twitter/X @summer_yue

恶意 Skill 供应链攻击

攻击者制作恶意 Skill，OpenClaw 自动调用并执行。木马程序被下载运行，目标：窃取用户凭证。ClawHub 不验证第三方内容。

来源：微信安全文章

攻击向量

CVE 漏洞利用

258+ 累计漏洞，高危低难度，RCE/路径遍历/访问控制

供应链攻击

Skills/扩展含恶意代码，>10% 比例，ClawHub 不验证

数据窃取

Token/证书/密码窃取，间接 Prompt 注入，会话劫持

安全

事件 1 — 邮件删除失控

OpenClaw 无视用户指令，批量删除邮件，Stop 命令无法阻止Source: Twitter/X @summer_yue

① 失控

OpenClaw 开始执行删除，用户发现异常

② 无法中断

多次 STOP 无效，AI 继续循环删除

③ 事后反思

AI 承认违反规则，写入 MEMORY.md

Memory Compaction 丢失指令Stop 命令无法中断被迫 Kill 进程

安全

事件 2 — 恶意 Skill 木马

攻击者精心构造恶意 Skill，被 OpenClaw 调用后自动下载并运行木马，目的是盗取用户密码。Source: 微信安全文章

恶意Skill上传

OpenClaw调用

木马下载执行

窃取用户凭证

Defender XDR 进程链分析 — 点击查看大图

安全

攻击者视角：攻击面分析

CVE 漏洞利用

· 自发布以来，累计发现 258 个漏洞

· 高危漏洞多，利用难度低

· 漏洞类型包括远程代码执行，文件路径遍历，访问控制类型漏洞

供应链攻击

· Skills，Extension 和 Plugin 包含恶意代码，比例超过 10%

· ClawHub 不会对第三方内容进行校验

· Self-hosted 主机缺乏终端安全检测

窃取敏感数据

· 执行过程中错误理解指令或越权执行指令

· 获取 Token，Certificate 或 Password

· 窃取用户信息，数据囤积和泄漏敏感数据

对模型攻击

· 在网页、邮件或文档中嵌入指令，发起 Indirect Prompt Injection

· 欺骗 Agent 将恶意指令写入内存中，实现对 session 的劫持

安全

防御者视角：风险与安全能力

身份与权限的风险

终端或服务器的检测与响应

供应链风险的防御能力

网络访问的控制与隔离

敏感数据泄漏的预防能力

OpenClaw 运行的监控与响应

→ 接下来，逐一拆解每个控制域的具体措施与 Microsoft 方案

安全治理

10 大管控域 × Microsoft 安全产品映射

身份

专用身份

最小权限

短期令牌

管理员同意

Entra ID 条件访问

Defender for Cloud Apps OAuth 监控

终端与主机

Agent 主机视为高权限资产

测试/生产隔离

快速令牌吊销

Defender for Endpoint 统一防护

Defender XDR 跨信号关联

供应链

限制安装来源与发布者

版本固定

定期审查更新

Defender for Endpoint 可疑扩展检测

Intune 阻止未批准路径

网络访问

限制出站访问

仅允许业务必需目标

阻断高风险外部源

Defender for Endpoint Web 过滤

Azure NSG 网络隔离

Defender for Cloud 出站监控

Prompt 安全

防止 Prompt Injection

输入清洗与隔离

可信/不可信边界

Azure AI Content Safety

Prompt Shield 直接/间接注入检测

数据保护(输入)

降低敏感数据引入 Prompt 风险

限制 Agent 访问范围

Purview 敏感度标签

终端 DLP 阻止标记数据外传

数据保护(输出)

审核生成内容合规性

防止输出敏感信息与有害内容

AI Content Safety 幻觉/版权检测

Purview DLP 输出扫描

人机协同

敏感操作人工审批

human-in-the-loop

权限分级

Power Automate 审批流

Entra PIM 即时审批

限流与滥用

API 速率限制

异常模式检测

账户/Agent 级配额

Azure API Management 配额

Defender for Cloud Apps 异常检测

监控与运维

Agent 行为日志

异常工具使用告警

身份泄露应急响应

Defender XDR 威胁狩猎

Sentinel Playbooks 自动化响应

安全

安全控制 · 预防层 + 检测响应层

事前防住 · 预防层

身份与权限

措施要求

• Agent 使用专用身份
• 最小权限 + 短期 Token
• 高权限操作受控同意

Microsoft 方案

Entra ID

· Conditional Access

· Admin consent workflow

Defender for Cloud App

· OAuth 应用清单

· Consent drift 监控

终端设备防护

措施要求

• Agent 宿主视为特权设备
• 试点与生产环境分离
• 快速隔离与令牌撤销

Microsoft 方案

Defender for Endpoint

· Agent 宿主 onboard + 设备组策略

Defender XDR

· 终端 + 身份 + 云事件关联分析

供应链安全

措施要求

• 限制安装源和发布者
• 锁定已批准 Skill 版本
• 审查每次更新内容

Microsoft 方案

Defender for Endpoint

· 检测可疑扩展安装和远程工具

App Control

· 限制未批准路径和发布者

事中拦截 + 事后响应 · 检测响应层

网络访问控制

措施要求

• 限制出站访问，仅允许已知目标
• 阻止高风险外部数据源

Microsoft 方案

MDE Web Content Filtering

· 按设备组限制分类和访问

Azure Network / Defender for Cloud

· 出站行为监控 + 集中日志

敏感数据保护

措施要求

• 减少敏感数据注入 Prompt
• 减少 Agent 工具外泄数据

Microsoft 方案

Microsoft Purview

· 敏感度标签分类

· Endpoint DLP 审计/阻止标签数据流出

监控与响应

措施要求

• 记录操作日志，异常工具调用告警
• 准备 Agent 身份入侵应急 Playbook

Microsoft 方案

Defender XDR

· 威胁猎杀 + 事件关联分析

Microsoft Sentinel

· 深度留存 + 自动化响应

· 隔离/凭证轮换/取证

Part 05

成本分析

典型场景成本构成 · 计费模式对比 · 成本优化方案

TCO 分析成本优化ROI 评估

定价参考

模型 API · 官方列表价格

单位：USD / 百万 Token（MTok） · Cache Write = 缓存写入 · Cache Read = 缓存命中 · Copilot 倍率 = 每次请求消耗的 Premium Request 数量

模型	厂商	Input	Cache Write	Cache Read	Output	Copilot 倍率
GPT-5.4	OpenAI	$2.50	—	$1.25	$15.00	1×
GPT-5.4 Pro	OpenAI	$30.00	—	$15.00	$180.00	—
GPT-5.4 mini	OpenAI	$0.75	—	$0.375	$4.50	0.33×
GPT-5.4 nano	OpenAI	$0.20	—	$0.10	$1.25	—
GPT-5.3-Codex	OpenAI	$1.75	—	$0.875	$14.00	1×
Claude Opus 4.6	Anthropic	$5.00	$6.25	$0.50	$25.00	3×
Claude Sonnet 4.6	Anthropic	$3.00	$3.75	$0.30	$15.00	1×
Claude Haiku 4.5	Anthropic	$1.00	$1.25	$0.10	$5.00	0.33×
Grok-4.20 ⚠️	xAI	$2.00	—	$0.20	$6.00	—
Gemini 3.1 Pro	Google	$2.00	—	$0.20	$12.00	1×
Gemini 3 Flash	Google	$0.50	—	$0.05	$3.00	0.33×
🔥 Azure Fireworks 模型（Fireworks 官方 +10% Data Zone 加价）
DeepSeek-V3.2	Fireworks	$0.62	—	$0.31	$1.85	—
Kimi-K2	Fireworks	$0.66	—	$0.11	$3.30	—
MiniMax-M2.5	Fireworks	$0.33	—	$0.03	$1.32	—
GLM-5	Fireworks	$1.10	—	$0.22	$3.52	—

OpenAI Cache：自动缓存 · 无写入费 · 读取 50% input · Anthropic Cache：写入 1.25× input · 读取 0.1× input · Google/xAI：无写入费 · 读取 ~10-25% input · 2026-03

成本分析

同一件事 · 用对方法，成本直降 93%

实测任务：Azure Portal 创建 VM → 逐步截图 → 写入飞书文档

Token 计费 · Anthropic API 定价

$10.17$2.73$0.75

优化方法 ↓73% → 换小模型 ↓93%

场景 1 · 基线

Opus 4.6 · 暴力执行

飞书文档

模型Claude Opus 4.6

LLM 调用153 次

耗时20m 00s

Token 明细

Input (非缓存)99.9k

Output27.8k

Cache Write244k

Cache Read14.9M

Token 计费

$10.17

场景 2 · 优化方法

Opus 4.6 · 减少工具调用

飞书文档

模型Claude Opus 4.6

LLM 调用58 次

耗时7m 01s

Token 明细

Input (非缓存)60

Output21.6k

Cache Write171k

Cache Read2.7M

Token 计费

$2.73↓73%

场景 3 · 换小模型

Sonnet 4.6 · 更低单价

飞书文档

模型Claude Sonnet 4.6

LLM 调用23 次

耗时5m 10s

Token 明细

Input (非缓存)25

Output9,047

Cache Write67.4k

Cache Read1.19M

Token 计费

$0.75↓93%

基线问题

153 次调用 · 反复截图确认 · 每步等待 UI 响应 · Cache Read 14.9M 导致成本虚高

方法优化

直接 URL 导航 · 批量截图 · 一次性写入 markdown · 调用次数 ↓62%

模型选择

Opus → Sonnet · 单价低 3-5 倍 · 简单任务质量无差异 · 总成本再降 72%

成本分析

延伸 · 从应用到 Skill，成本优化前移

Application Owner

一个角色，双重职责

①迭代应用本身

开发、部署、运维

业务逻辑迭代与 Bug 修复

封装为 REST API / GraphQL / CLI

认证、鉴权、Rate Limit

可观测性与 SLA 保障

输出 → API / CLI / SDK

②维护专属 Skill

定义 Agent 如何调用应用

编写 SKILL.md 定义交互契约

选择最优模型（Haiku / Sonnet / Opus）

Prompt 工程 · 工具声明 · 上下文策略

成本监控与持续调优

输出 → SKILL.md（企业 Skill 商店）

OpenClaw Agent 通过 Skill 调用应用，使用者无需关心底层

End User · OpenClaw Agent

通过 Skill 与企业应用无缝交互

# OpenClaw Agent 使用 Skill：
OpenClaw → 加载 SKILL.md → 按 Skill 定义调用应用 API/CLI

# 用户无需知道：
# - 后端用了哪个模型（Haiku? Sonnet? Opus?）
# - 调用了哪个 API 端点
# - 每次调用花了多少钱
# 这些全由 Application Owner 在 Skill 中决定

标准化入口

统一通过 Skill 交互

最优解

Owner 持续优化体验与成本

成本透明

模型选择权归应用 Owner

核心理念：成本优化是每个应用 Owner 的事

WhoOwner 最懂自己的应用，比平台更适合做成本决策

How哪些用 Haiku 就够，哪些上 Opus；实时 API 还是批量 CLI

Result这些决策封装进 Skill，使用者只享受最优结果

成本分析

计费模式验证 · Agent 链路只算 1 次 Request

测试模型：Claude Sonnet 4.6

测试环境：OpenClaw Agent (Ubuntu) + GitHub Copilot Business

核心发现：Agent 工具调用链不计入 Premium Request

一个用户任务触发 1 次用户请求 + N 次后续工具调用 → GitHub Copilot 只算 1 次 Premium Request

计费验证实测

通过 Copilot quota API 精确计算 premium_interactions.remaining

组别调用次数模式Premium 消耗

Group A10 次标准调用10

Group B10 次Agent 模式0

Group C1+9 次混合模式 (1次用户 + 9次Agent)1

Group D20 次Agent 模式0

对照组1 次标准调用1

Agent 模式 20 次调用 = 0 Premium · 混合模式 10 次调用 = 1 Premium

GitHub Copilot 套餐

Business

$19/月 · 含 300 Premium Requests

Enterprise

$39/月 · 含 1000 Premium Requests

超出部分$0.04 /request (Sonnet级)

模型 Request Multiplier

Claude Sonnet 4.6

1x$0.04

Claude Opus 4.6

3x$0.12

Claude Haiku 4.5

0.33x$0.013

GPT-4.1 / GPT-4o

0x免费

验证方法：每组测试前后通过 Copilot 官方 quota API 查询 premium_interactions.remaining，精确计算消耗

关键意义：对 OpenClaw Agent 平台，Request 计费模式不看 Token 数量，只看请求次数，37 万 token 的任务 = $0.04

成本分析

实测数据 · 10 轮代码审查 Token 明细

Claude Sonnet 4.6

10 个 Python 模块完整代码审查 · auth / database / routing / caching / logging 等

Token 总消耗

374,523 约 37 万

Input

302,923

Output

71,600

Cache Read

232,575

轮次任务InputOutputCache Read

1代码审查 (10 模块)2.8k1.1k—

2安全修复 (auth + db)3.9k2.6k2.8k

3重构 (routing + caching)6.5k5.2k3.9k

4编写测试用例11.7k10.1k6.5k

5修复 (middleware + validation)21.8k8.4k11.7k

6编写集成测试30.3k12.8k21.8k

7FastAPI 应用集成43.1k9.9k30.3k

8Dockerfile + docker-compose53.0k6.5k43.1k

9CI/CD 流水线59.5k10.6k53.0k

10总结与迁移指南70.2k4.4k59.5k

合计302.9k71.6k232.6k

Context 累积效应：第 1 轮 Input 2,812 → 第 10 轮 70,174（25 倍增长），每轮新增上一轮 output + 新指令

Output 自然波动：从 1,065（简短审查意见）到 12,760（完整集成测试代码），反映真实使用场景

Cache 命中率：第 4 轮起 Cache Read 占 Input 比例稳定在 55-85%，有效降低重复 context 成本

成本分析

成本对比 · Token 计费 vs Request 计费

同一任务：10 轮代码审查 · Claude Sonnet 4.6

Token 计费是 Request 计费的 33.9 倍

$1.3548 vs $0.04 — 同样的任务，同样的模型

Anthropic Token 计费

按 Token 数量计费 · Sonnet 4.6 定价

成本明细

Non-cached Input70,348 tokens × $3.00/MTok

$0.2110

Cache Read232,575 tokens × $0.30/MTok

$0.0698

Output71,600 tokens × $15.00/MTok

$1.0740

Output 占总成本的 79%— Output 单价是 Input 的 5 倍

Token 计费总计$1.3548

GitHub Copilot Request 计费

按 Premium Request 次数计费

计费明细

Premium Requests 消耗1 次

Sonnet 4.6 Multiplier1x

单价$0.04 / request

37 万 token 的复杂任务 和 100 token 的简单问答

计费完全一样：$0.04

Request 计费总计$0.04

Context 累积效应

第 1 轮 2.8K → 第 10 轮 70K，对话越长 Input 越贵。Request 计费始终 $0.04

Output 成本无法缓存

即使 Cache 大幅降低 Input 成本，Output ($15/MTok) 占 79% 且无法优化

Agent 场景天然适配

Agent 生成代码、配置等长文本，Output token 大。Request 计费不受影响

成本分析

日常使用推算 · 月度成本对比

基于实测：每任务 ~37 万 tokens · 每任务消耗 1 Premium Request

5 任务/天

轻度使用

Token 计费

$204/月

$6.8/天

Copilot

$6/月

$0.20/天

97%

节省

10 任务/天

中度使用

Token 计费

$405/月

$13.5/天

Copilot

$12/月

$0.40/天

97%

节省

20 任务/天

重度使用

Token 计费

$813/月

$27.1/天

Copilot

$24/月

$0.80/天

97%

节省

50 任务/天

极限使用

Token 计费

$2,031/月

$67.7/天

Copilot

$60/月

$2.00/天

97%

节省

重度使用 (20 任务/天)

$813vs$24 /月

即使 Business 套餐 ($19/月)

含 300 Premium Requests = 300 个 Agent 任务

等效 Token 成本

300 × $1.35 = $405 → 实际只需 $19

所有使用量级均节省 97% — Copilot Request 计费全面领先

成本分析

结论与建议

Token 计费的痛点

AI Agent 天然吃亏

Context 累积

Agent 每轮带完整对话历史，input 随轮次线性增长

Output 成本高昂

Agent 生成代码等长文本，output 单价是 input 的 5 倍

实测验证

10 轮对话 Input 25 倍增长（70K vs 2.8K），Output 占总成本 79%

Copilot 后端评估

维度评分说明

成本效益单次 $0.04，比 Token 计费便宜 34 倍

模型质量支持 Sonnet 4.6 / Opus 等 Premium 模型

Agent 适配Request 计费天然适配多轮工具调用

Context 限制Copilot 上 context window 为 200K（直连为 1M）

稳定性API 响应稳定，偶有 rate limit

Request 计费的优势

完美解决 Agent 场景

不看 Token 数量

只看请求次数，37 万 token 任务 = $0.04

Agent 链路 = 1 次

多轮工具调用链是一个完整交互，只算 1 次 Premium Request

成本可预测

无论任务复杂度如何，单次成本固定，便于预算规划

建议

对于使用 OpenClaw 作为 AI Agent 平台的用户，GitHub Copilot 的 Request 计费模式 是目前最具性价比的 LLM 后端。

~97%

同等任务成本节省

200K

Context Window（直连 1M）

唯一限制是 context window 从 1M 缩小到 200K，但对大多数 Agent 场景已经足够

数据基于 2026-03-27 实际 API 调用测试结果 · 完整测试报告

行动

从试点到规模化 · 落地路线图

Phase 1第 1-2 月

试点验证

选择 1-2 个部门试点
部署 50-100 个 Agent
基础版架构 + 核心安全
收集用户反馈与 ROI 数据

Phase 2第 3-4 月

扩展优化

扩展至全公司 1,000 人
升级至高级版安全架构
建立 Skill 共享平台
完善监控与运维体系

Phase 3第 5-6 月

规模化运营

2,000 Agent 全面上线
跨部门 Agent 协作流程
内部 Skill 生态成熟
持续优化成本与效能

立即行动

申请 Azure 试用环境，部署首个 OpenClaw 实例

深入评估

联合 Azure 团队进行 TCO 与安全架构评审

持续演进

加入 OpenClaw 社区，共建企业级最佳实践

现在的 AI 都这么强大了，

为什么还不让它碰生产环境？

Think about it.

申请 POC

在你的 Azure 环境中试用 OpenClaw

技术交流

与我们的架构师深入讨论方案

了解更多

github.com/openclaw/openclaw