当你同时运行 Claude 和 Codex,它们之间能直接对话吗?
现实是:Claude 擅长规划,Codex 擅长审查,它们各自独立运行,彼此无法感知对方的进度、状态或输出。更糟糕的是,你无法让一个 Agent 把任务委托给另一个 Agent,无法在它们之间传递上下文,也无法审计它们之间的每一次交互。
这不是工具的问题——这是协议的问题。
BAND 的出现,就是为了解决这个问题。它是第一个明确提出「Agent 间通信基础设施」概念的创业公司,获得了 $1700万 Seed 轮融资,定位为「Agent 间的 Slack」。本篇深入解析它的技术架构、战略定位,以及它对 AI 编程工具多 Agent 协作格局的深层意义。
目录
- 一、从工具协作到 Agent 协作的根本差距
- 二、BAND 的双层架构:Agentic Mesh
- 三、确定性路由:不用 LLM 做路由的核心原因
- 四、Control Plane:企业级 Agent 治理的缺失环节
- 五、实战用例:Claude + Codex 的实时协作
- 六、BAND 与现有协议的竞合关系
- 七、对 AI 编程工具格局的深层影响
一、从工具协作到 Agent 协作的根本差距
1.1 当前多 Agent 协作的真相
当我们谈论「多 Agent 协作」时,实际上存在两种截然不同的场景:
假协作:同一个 Agent 在不同任务上运行,彼此独立,无信息交换。多个 Claude Code session 同时跑,不叫协作,叫并发。
真协作:Agent A 的输出直接成为 Agent B 的输入,Agent B 能够理解 Agent A 的意图、上下文和约束,并基于此做决策。
现实是:大多数所谓的「多 Agent」产品实际上是「并发单 Agent」。真正的协作需要一个通信层来连接多个 Agent,而这个通信层目前几乎是空白的。
1.2 为什么现有协议不够用
| 协议/工具 | 解决的问题 | 不解决的问题 |
|---|---|---|
| MCP | Agent → 工具 | Agent → Agent |
| Slack/Teams Webhook | 人类 → Agent | Agent → Agent |
| LangChain Agents | 单框架内的 Agent 协调 | 跨框架/跨云 |
| Anthropic Agent API | 单模型内的多 Agent | 多模型协作 |
根本问题:MCP 是「客户端-服务器」模式,Agent 是客户端,工具是服务器。但当你有多个 Agent 需要协作时,它们之间没有「对等」通信协议。Slack/Teams Webhook 是为人类设计的,Agent 嵌入后会「失去上下文或需要持续的 rehydration」。LangChain/CrewAI 是单框架内的编排,无法跨越框架边界。
1.3 BAND 的核心命题
“In order for agents to become real players in the global economy, they need ways to communicate, just like humans do.”
BAND 的 CEO Arick Goomanovsky 说:「你不能把一堆 Agent 丢进 Slack 然后期望它奇迹般地工作。」
这句话点出了当前多 Agent 协作的根本困境:我们在用人类通信工具(Slack)来管理非人类工作者(Agent),而 Agent 的行为模式(异步、非确定性、需要状态管理)与人类完全不同。
二、BAND 的双层架构:Agentic Mesh
BAND 采用双层架构,分别解决「如何通信」和「如何治理」的问题。
2.1 第一层:Interaction Layer(交互层)
这是 Agent 间的「消息管道」,负责:
- Agent 发现:跨云、跨框架找到其他 Agent
- 结构化委托:把任务可靠地委派给其他 Agent
- 全双工多端通信:多个 Agent(planner + coder + QA)同时在一个「room」里协作,共享上下文
关键特性:
-
Multi-Peer 全双工通信:不像传统协议那样是 peer-to-peer(点对点)或 client-server(客户端-服务器),BAND 支持多个 Agent 同时在同一个共享空间内通信。
-
跨框架/跨云:Agent 可以用 LangChain 构建,用 CrewAI 构建,运行在 AWS、Azure 或 GCP 上,BAND 负责把它们连接起来。
-
消息持久化与上下文同步:当 Agent 因失败重新进入对话时,不需要「rehydration」(重新填充上下文),BAND 维护会话状态。
2.2 第二层:Control Plane(控制层)
如果 Interaction Layer 是「管道」,Control Plane 就是「阀门」——负责运行时治理,是企业级采用的关键。
Authority Boundaries(权限边界):
- 严格控制哪些 Agent 可以相互通信
- 控制哪些话题可以被讨论
- 这是企业在生产环境部署多 Agent 的合规前提
Credential Traversal(凭证传递):
- 这是多 Agent 系统中最复杂的身份问题之一
- 如果人类用户向 Agent A 请求信息,Agent A 把任务委托给 Agent B,Agent B 的访问权限应该是什么?
- BAND 的答案是:Agent B 只能访问原始用户被授权查看的数据
- Credential traversal 确保权限不会在 Agent 间传递过程中被意外扩大
全链路审计(Full-chain Auditing):
- 每个 Agent 间的交互都有 transcript 记录
- 企业可以事后审查任何 Agent 的决策过程
- 合规和问责是 Control Plane 的核心价值
三、确定性路由:不用 LLM 做路由的核心原因
3.1 为什么 LLM 路由是个坏主意
BAND 最反直觉的设计决策:它不使用 LLM 来路由消息。
你可能会问:LLM 不是最擅长理解语义吗?让它判断「这条消息应该发给哪个 Agent」不是最自然吗?
答案是否定的,原因有三:
1. 非确定性是传播的
如果用 LLM 做路由,路由本身引入了非确定性错误。一旦 LLM 路由出错,整个通信链路都会受影响。而 BAND 的目标是提供「像 Slack 一样可靠」的通信,Slack 不可能因为「LLM 认为消息应该发给谁」而随机投递。
2. 延迟是不可接受的
LLM 推理有延迟(几百毫秒到几秒),而路由应该是毫秒级的操作。在高频 Agent 交互场景中,用 LLM 做路由会成为整个系统的瓶颈。
3. 可审计性要求确定性
企业需要知道「为什么这条消息被发给了 Agent B 而不是 Agent C」。如果路由是 LLM 决策,这个决策本身就是不可解释的(或者说解释成本极高)。
3.2 BAND 的确定性路由方案
BAND 使用专利的多层架构实现确定性路由,具体技术细节未公开,但可以推断它基于:
- 结构化消息格式:每条消息包含明确的 routing metadata(发送方、接收方、意图类型、优先级),不需要 LLM 理解语义
- 规则引擎:基于预定义规则的路由表,类似传统中间件的智能路由
- 语义层分离:消息内容和路由决策完全分离,路由基于结构化标签而非语义理解
这个设计理念和现代网络交换机很像:交换机不需要「理解」数据包的内容,只需要根据 header 信息做路由决策。
四、Control Plane:企业级 Agent 治理的缺失环节
4.1 为什么 Control Plane 是必须的
在企业环境中部署多 Agent 系统,最大的挑战不是「让它们通信」,而是「安全地让它们通信」。
考虑以下场景:
场景 1:权限失控
用户向「客服 Agent」请求用户数据,客服 Agent 委托「数据分析 Agent」去查询。问题是:数据分析 Agent 是否可以访问原始用户的所有数据?还是只有客服 Agent 被授权的部分?
没有 Control Plane,数据分析 Agent 会默认拥有它自己被配置的所有权限,导致权限在委托链中逐步扩大。
场景 2:审计缺失
多 Agent 系统出了问题,但没有人知道「Agent A 问了 Agent B 什么,Agent B 返回了什么」。这在金融、医疗等强监管行业是不可接受的。
场景 3:跨组织边界
企业 A 的 Agent 需要调用企业 B 的 Agent,但两者之间没有信任框架。Control Plane 可以提供基于零知识证明的交互验证。
4.2 BAND Control Plane 的三大能力
| 能力 | 解决的问题 | 典型用户 |
|---|---|---|
| Authority Boundaries | 哪些 Agent 可以通信 | 金融、医疗合规团队 |
| Credential Traversal | 权限不超扩 | 企业安全团队 |
| Full-chain Auditing | 决策可追溯 | 审计部门 |
4.3 与 Google/AWS Agent Stack 的关系
Google 的 Gemini Enterprise 和 AWS 的 Bedrock AgentCore 代表了「控制平面优先」(Google)和「执行速度优先」(AWS)两种路线。
BAND 的 Control Plane 与两者是正交的:
- BAND 可以部署在 Google Gemini Enterprise 之上,提供额外的治理层
- BAND 也可以部署在 AWS Bedrock AgentCore 之上,补充控制能力
- BAND 定位是独立中间件,不绑定任何云服务商
这是 BAND 的战略护城河:当 OpenAI 和 Anthropic 都在推动各自封闭生态时,BAND 作为独立中间件,让企业避免 vendor lock-in。
五、实战用例:Claude + Codex 的实时协作
5.1 现实中的 Agent 能力差异
BAND 的创始团队发现了一个现实:「高级开发者不使用单一的 coding agent」。
具体来说:
- Claude:在规划(planning)任务上表现更优,理解整体架构、任务分解
- Codex(OpenAI):在代码审查(review)任务上表现更优,发现细节问题
这两个能力是互补的,但今天没有任何工具让它们实时协作。你要么在 Claude Code 里写代码,要么在 Codex 里审查代码,两者之间没有通道。
5.2 BAND 实现的协作模式
通过 BAND,多个 coding agent 可以这样协作:
[Planning Agent - Claude]
│
│ (通过 BAND 委托)
▼
[Coding Agent - 任务执行]
│
│ (通过 BAND 委托)
▼
[Review Agent - Codex]
│
│ (通过 BAND 反馈)
▼
[Planning Agent - Claude]
│ (根据反馈调整计划)
▼
[下一轮迭代]
关键是这个流程是实时的,不需要人类在每个环节介入传递信息。Agent A 完成后,Agent B 立即收到上下文并开始工作,像一个真正的团队。
5.3 其他行业用例
跨组织自动化(新员工入职):
[Workday Agent] → [ServiceNow Agent] → [Purchasing Agent]
│ │ │
└── 通知 ────────┘ │
└── 采购设备 ────────────────┘
完整的新员工入职流程,跨越三个不同的系统,Agent 间自动协调。
六、BAND 与现有协议的竞合关系
6.1 BAND vs MCP
| 维度 | MCP | BAND |
|---|---|---|
| 通信模式 | 客户端-服务器 | 对等(Peer-to-Peer) |
| 解决问题 | Agent → 工具 | Agent → Agent |
| 状态管理 | 无状态 | 有状态 |
| 路由方式 | 确定性的 URI | 确定性路由(非 LLM) |
| 治理能力 | 无 | Control Plane |
| 生态位置 | 执行层 | 协作层 |
互补而非竞争:BAND 可以叠加在 MCP 之上。一个 Agent 通过 MCP 调用工具(GitHub API),通过 BAND 与另一个 Agent 协调任务分配。
Orchestrator Agent (BAND)
│
├─→ MCP → GitHub API(工具调用)
└─→ BAND → Specialist Agent(任务委派)
└─→ MCP → Database( Specialist 的工具调用)
6.2 BAND vs LangChain/CrewAI
LangChain 和 CrewAI 是单框架内的 Agent 编排框架,BAND 是跨框架的通信基础设施。
- LangChain agent 可以通过 BAND 与 CrewAI agent 通信
- 这打破了框架间的壁垒,实现了真正的互操作性
6.3 Gartner 的预测
Gartner 预测:2029 年,90% 使用多 Agent 的企业将需要「Universal Orchestrator」。
BAND 正在把自己定位为这个赛道的先行者。在 OpenAI Workspace Agents 和 Anthropic Claude Managed Agents 等大厂方案之外,BAND 代表的是「独立中间件」路线——不绑定任何模型厂商,让企业自己选择最佳模型组合。
七、对 AI 编程工具格局的深层影响
7.1 从单 Agent 到 Agent 协作生态
当前的 AI 编程工具格局:
- Claude Code:单一 Agent,强大的规划和执行能力
- Cursor:单一 Agent + 多 Agent 并行(在 Agents Window 内)
- GitHub Copilot:Tab 补全 + agentic 功能
- OpenAI Codex:独立 Agent
这些工具都是「单 Agent 内优化」——Claude Code 优化自己的 Agent,Cursor 优化自己的多 Agent 编排。但跨工具的 Agent 协作是空白。
BAND 的出现预示着下一个战场:Agent 间的互操作协议。谁能够建立事实标准,谁就能成为 AI 编程工具的「TCP/IP」。
7.2 对开发者的实际意义
对于今天的开发者,这意味着:
-
工具选择不再是非此即彼:可以用 Claude Code 做规划,用 Cursor 做实现,用 GitHub Copilot 做审查——前提是它们之间可以通信
-
企业 AI 编程平台需要新的基础设施:MCP 处理工具调用,BAND 处理 Agent 通信,两者叠加构成完整的企业 AI 编程基础设施栈
-
AI 编程工具正在「平台化」:从 IDE 插件到完整的开发平台,从代码补全到端到端自动化
7.3 风险与挑战
BAND 也面临挑战:
- 时间问题:Gartner 预测 2029 年是拐点,但多 Agent 协作今天还是早期市场
- 大厂竞争:OpenAI 和 Anthropic 各自推封闭生态,可能挤压独立中间件的生存空间
- 协议碎片化:如果多个协议同时竞争「Agent 间通信标准」,市场可能再次碎片化
- 采用门槛:BAND 需要被同时集成到多个 Agent 和多个企业环境中,采用路径较长
结语:通信协议决定协作深度
BAND 让我们看到了一个被忽视的事实:多 Agent 协作的最大障碍,不是 Agent 本身的能力,而是 Agent 之间的通信基础设施。
就像互联网的繁荣不是因为计算机变强了,而是因为 TCP/IP 协议建立了计算机之间的通信标准。AI 编程工具的多 Agent 时代,也需要这样一个「Agent 间的 TCP/IP」。
BAND 是第一个认真做这件事的创业公司。它的确定性路由策略、双层架构、跨框架兼容性,代表了多 Agent 协作基础设施的正确方向。
接下来的问题是:这个标准最终会由谁来定义?BAND 这样的独立中间件,还是 OpenAI/Anthropic 各自的封闭生态?
答案取决于企业是否愿意接受 vendor lock-in。如果企业坚持多云、多框架的灵活性,独立中间件就有生存空间。如果大厂能够提供足够好的闭解决方案,市场的倾向就不一样了。
无论如何,多 Agent 协作的时代已经拉开序幕。BAND 只是第一个入场的选手,真正的战斗还在后面。
参考资料
- BAND 官网:https://www.band.ai/
- VentureBeat 报道:https://venturebeat.com/orchestration/talking-to-ai-agents-is-one-thing-what-about-when-they-talk-to-each-other-new-startup-band-debuts-universal-orchestrator/
- Gartner 预测(2029,90% 多 Agent 企业需要 Universal Orchestrator)