网站优化

网站优化

Products

当前位置:首页 > 网站优化 >

如何设计长运行多智能体的框架,遵循Harness Engineering最佳实践?

GG网络技术分享 2026-04-17 12:54 0


Harness Engineering 最佳实践:长运行多智能体的框架设计

这时,问题已经不再是Prompt Engineering,而开始进入Harness Engineering。 如果把模型比作 智能体的大脑 ,那么Agent Harness更像是它的飞控系统 + 黑匣子 + 地面管制台 + 测试台。Agent能不能跑起来,取决于模型;Agent能不能可控地跑、 稳定地跑、可审计地跑,取决于Harness,完善一下。。

什么是 Agent Harness?

一些术语 Agent Harness:围绕智能体施行过程构建的控制、 观测、评测与治理系统。 Harness Engineering:设计 实现、运维和演进Agent Harness的工程实践。 Execution Harness:关注工具施行、运行时、隔离与生命周期管理的部分。 Policy Harness:关注权限、预算、审批、风控和合规的部分。 Telemetry & Observability:监控指标,日志记录,跟踪链路等等,客观地说...。

传统权限模型的局限性

传统的软件系统通常采用的环境中运行良好。只是,智能体系统的特性——其权限范围。 何不... 这简直就像试图用马车来追高铁!

Harness Engineering:应对挑战的关键

Harness Engineering作为一门专注于构建可靠、 高效、平安的智能体系统的工程学科,正致力于解决这一挑战。它融合了软件工程、 平安工程、人工智能和系统理论的原则,为智能体权限的动态管理提供了理论框架和实践方法,抓到重点了。。

核心问题

本文将围绕以下核心问题展开讨论:

  • 如何设计一个能够适应不断变化的权限需求的Agent Harness?
  • 如何保证Agent在自主决策的一边,仍然符合平安策略和合规要求?
  • 如何有效地监控和审计Agent的行为,以便及时发现和处理潜在风险?
  • 呃...还有那个...额...对了!如何让我的AI小助理别老是帮我点外卖?!

文章浏览数据

简直了。 文章浏览阅读369次,点赞9次,收藏13次。

OpenAI 的工程实践

今年 2 月,OpenAI 在一篇题为“让 AI 更可靠”的博文中,了一项持续数月的工程实践。文章并不聚焦某个具体技术点,而是试图回答一个更基础的问题:当软件工程进入以智能体为中心的阶段,工程团队... 说实话,我觉得他们写得有点玄乎! **设计**决策的**框架**也必须同步演进,请大家务必...。

对智能体的友好度

Anthropic 的 Harness Design

概述

Prompt 工程 vs. Harness Engineering

特征Prompt 工程Harness 工程
关注点输入文本的设计整个 Agent 的施行环境与控制
复杂度相对较低较高
可维护性容易失效更具鲁棒性
适用场景简单任务复杂长期任务

最近的热议

关键词与摘要

对吧? 关键词描述AI Agent人工智能代理程序Harness Engineering代理程序控制与治理技术Agent管控对代理程序的监控与管理功能

什么是 Harness? 马具的比喻

我倾向于... 什么是 Harness?借用马具的隐喻 :大模型是一匹力大无穷但容易失控的 野马 ,而 Harness 就是包含缰绳 、 马鞍 、眼罩的 控制系统 。 一句话定义 Harness,就是 AI Agent 的 工作环境和规则手册 。Harness Engineering,就是设计这套环境 , 让 Agent 少犯错 、多干活 、干好活 。 这个概念由 Mitchell Hashimoto和 Viv在 2026 年初几乎一边提出 , 接着 OpenAI 、Anthropic 、Martin Fowler 等都在一周内密集发文响应 ,成为 AI 工程领域最热门的话题之一 。


提交需求或反馈

Demand feedback