编者按:本文来自微信公众号 刘润(ID:runliu-pub),作者:景九,编辑:歌平,创业邦经授权转载。
从去年年底开始,越来越多的人,开始研究“多Agent协作”。
2025年,Google推出A2A协议,让不同Agent用一套语言沟通。Anthropic的研究表示,多AI智能体团队,在复杂任务上的表现,较单体实现了90.2%的提升。2026年,OpenAI也发布了Symphony,用于编排Agent工作流。
我非常关注这件事。为此,还手搓了一个粗糙的AI系统,让AI主笔、AI研究员、AI编辑“吵架”,给内容团队写研究报告。
而最近,腾讯也在AI软件WorkBuddy里,上线了“专家团”功能,通过多Agent协作完成复杂任务。于是,听到消息,我也抓紧体验了一下。体验之后,感受非常强烈:
“个体崛起”的时代,可能真的要来了。
为什么?这得从一个词开始说起:马具工程(Harness Engineering)。
01马具工程:给AI这匹烈马,套上组织的缰绳
什么是马具工程?
从2023年开始,AI公司在发布大模型时,最先强调的永远是:参数多少,跑分多少。大家比的,是谁家模型更聪明。就像比谁家的马更强壮。
可有个问题,始终没有解决:这匹马,野性难驯。
具体来说,就是:它会不可避免地出现幻觉。
幻觉,就是一本正经地胡说八道。你问它论文出处,它可能会给你作者名、年份、期刊,但你真去查,会发现根本不存在。
为什么?
因为大模型的底层机制,是通过概率,猜下一个词。这是统计意义的智能,而非人类意义的理解。这种机制,就必然带来幻觉。而幻觉最可怕的,不是“错了”,是“错了,但自信”。以至于问它10次,它可能会给你10个信心满满的答案。
太吓人了。所以,想让它干活,就得让它更可靠。
怎么办?很多人想到了:把AI包装成Agent。
我给它明确身份、明确任务,甚至接上工具权限。然后,让它做财报分析师,让它做产品经理,让它做研究员。总可以了吧?
是,靠谱多了。可新的问题,也出现了。
因为,当规则开始冲突,AI就开始内耗。你要求才华横溢,它就事实不准。你要求事实为先,它又枯燥无味。最终,交给你一个面面俱到的平庸之作。
怎么办?问题,其实不在“马”,而在“马具”。
一匹好马,强壮有耐力,但野性难驯。你必须套上马具,才能驾驭它。今天的AI,就是一匹充满力量、但野性难驯的烈马。想让它真正发挥作用,需要一套:马具工程。
马具工程的本质,就是给AI这匹烈马,套上名为“组织”的缰绳。
这次,WorkBuddy推出的专家团,就是一个很具体的例子。它把原本抽象的方法论,变成了普通人可以直接使用的产品能力。所谓“专家团”,就是把不同分工的Agent,组织起来,解决复杂任务。看图。

一个Agent开发软件,容易逻辑混乱,改动频繁。让不同Agent,分别捋清产品,架构,开发,测试,最终,就大概率是一个直接可用的页面。

一个Agent处理财报,页数一多,就容易忽略数据。几个Agent,分别负责数据,风险,写报告,准确率就会大幅增加。
而当AI套上马具,很多之前实现不了的事情,就有了可能。
比如,对有繁杂流程的大公司来说,部门协作可以逐渐自动化。比如,对预算有限的小公司来说,可以拥有随叫随到的外包团队。对于想要自己销售、产品、交付的“一人公司”,这更是一支“千军万马”。
于是,个体崛起的可能,由此打开。
那怎么才能把“马具工程”用好?至少包括三个要点:
角色、规则、流程。
02角色:把任务分开执行,AI才能追求极致
什么是角色?
角色,不只是“职位名称”,还是一个Agent的能力清单。
比如,主笔Agent的能力清单,是:选题、写作、润色。不管风险控制,事实核查。比如,编辑Agent的能力清单,是:审核、把关、修改建议。它不管怎么写得好,只管怎么不出错。
为什么要这么干?
因为,要求越多,内耗越重。约束越全,产出越差。
如果你让一个Agent,同时扮演:才华横溢的主笔和谨小慎微的编辑。那才华就会和风险冲突,戏说会和严谨冲突。面对互相打架的规则,Agent只能产出60分的平庸报告。
那怎么办?把角色拆开。
让主笔一开始,就追求极致质量。这样,初稿就有80分的水准。在编辑身上,就定义好把关的能力,让文稿不出红线问题。最终呈现的稿子,既有80分的创造力,也有80分的稳定性。
举个例子。WorkBuddy里的“内容创作专家团”。
当我给了它一个“创作数码视频脚本”的任务,它没有直接写测评文案,而是先“组团”,拉起了三个完全不同的Agent。看图。

具体,是这么三个角色:
行业产品调研员,平台内容研究员,人文思考研究员。
行业产品,就只负责市场格局、真实体验,不用懂B站生态。人文思考,就只负责琢磨“AI眼镜是科技玩具,还是生活方式入口”一类的问题,不需要查市场数据。
最后,把他们的输出汇总,让另一个写作Agent,整理成了完整的脚本。看图。

有意思。它想的很细致,先是行业全景,再是真实体验,然后逐渐追问,由浅到深,最后还来了个哲学思考。整个逻辑链条很顺。再稍微修改,就基本可用了。
这就是多Agent协作的厉害之处。它不在于单个Agent多聪明,而在于调用多个Agent,打透专一任务,获得普通高手水平以上的交付结果。
一个Agent,当然也能研究AI眼镜,但很容易沿着单一路径,越想越窄。一旦你优先选“科技硬核”角度,后面就全是参数、芯片、续航。人文那一块,就不太容易进来了。
借助AI,一个人,第一次有了“像一支团队思考”的能力。
但角色一多,也会打架。主笔想有冲击力,编辑想不被读者质疑。顾问想有创新,风控又想保守。如果都按自己逻辑来,只会浪费大量token。
所以,你还需要设置:规则。
03规则:确定“把事干对”的标准,AI才能稳定产出
什么是规则?
规则,就是AI做事的标准。比如,什么不能做,什么是好答案。
比如,主笔Agent的规则,可能是:必须有认知差、必须走情绪动线、必须避开鸡汤套路。编辑Agent的规则,可能是:引用有出处、数据能追溯。
为什么要这么干?
同样5个人,在不同的团队,产出可能天差地别。因为一个团队,压根就没有“好文章”的标准。另一个团队,对好文章的标准,是:让人转发,有认知差,是读者好奇的话题……
规则,是岗位的标准。有了标准,AI才能保持产出稳定。
举个例子:WorkBuddy里的“法律咨询团”。
如果说有什么工种最需要规则,法律一定算一个。因为法律工作的核心,是:基于规则,做专业判断。法律建议,最怕感觉。感觉这条没事。感觉对方应该不会真这么干。一旦出了问题,代价巨大。
那,WorkBuddy如何解决法律问题?我试着问它:
我是一家AI落地的小咨询公司,帮企业把AI接进业务流程。我们最近接了个大单子,对方甩过来份标准合同,你帮我研究研究,要不要签?
过去,小老板最怕这种时刻。大公司甩来份合同,自己不够专业看不懂,找律师麻烦。硬着头皮签,又怕踩坑。
好。WorkBuddy,很快就开始干活了。

让我印象最深刻的,是它干活的“专业”程度。
比如,它不会一上来就告诉你能签不能签。它先采集信息。
为什么?因为信息不完整,不能下结论。
于是,负责案情采集的方助理,先定了一个信息清单。你让我研究合同?行。那我得先搞清楚,付款条款怎么说,知识产权、交付验收、保密条款……

接着,它开始花大力气,研究法律依据。
为什么?因为所有判断,必须有依据。
我说这条危险,不是因为“我觉得危险”。而是因为它可能对应哪条法规。所以,你就能看到,周法官在吭哧吭哧地挨个查阅具体条款。很多条款,文本只是原则。法院怎么理解怎么判,也很重要。所以,沈判官就发力,找之前的类似判例。

好了。大概半小时,他们就完成了最终的咨询报告。

我点开一看,嚯。挺像那么回事的。而让我惊喜的是,它并不是简单地说这条有危险,而是说清楚了,它对我这家小公司为什么危险。
比如,质量保证条款苛刻。这对刚起步的小公司,可能是毁灭性打击。因为验收标准模糊,完全由甲方主观判断,决定给不给项目款。所以,很有可能活干了,但钱拿不到。
发现没?
让AI变专业的,不是模型更聪明,而是规则更清楚。
信息不完整,不能下结论。没有法律依据,不能乱给建议。看法条不够,得看现实判例。建议,得对客户真正有用。这就是规则。
但有了规则,也还不足够。因为规则,毕竟不会自己执行。如果信息还没采集完,法条还没查完,就开始写最终报告,也会翻车。
所以,光知道“什么叫对”还不够。你还得知道:谁先干,谁后干。
这就是:流程。
04流程:让AI,循环逼近正确答案
什么是流程?
流程,就是把复杂任务拆成接力赛。
因为复杂任务,不是一口气做完的,本就是一环扣一环。给建议,需要先等信息采集。写报告,要先等判例研究。没有流程,大家就会凭猜测开工。前面的信息稍有变化,后面全部推倒重来。
但只是机械交棒,还不够。因为高质量的产出,核心来自:挑战。
团队之所以比单兵更强,不是因为人多。是因为不同的人,会从不同角度不停挑刺。好产品,是产品、研发、测试,多轮沟通修改出来的。好文章,是作者、编辑、研究员,反复推敲润色出来的。
所以流程,还应该是一张让AI吵架的路线图。
好的AI协作系统,不只是安排好“谁先干、谁后干”。还要设计好,谁来挑战谁。让不同Agent,用各自最擅长的能力,互相校正,循环往复,才能让产出逼近高质量。
举个例子。WorkBuddy里的“软件开发团队”。
如果说有什么工作,最依赖流程。软件开发,一定算一个。
总不能产品经理还没把需求讲明白,工程师已经开始写代码。也不能代码还没写完,测试先开始报Bug。这么干的结果,是所有人拼命返工。
于是,我打开聊天框提问:
我是一个AI提效咨询公司的创业者。每天有很多潜在客户咨询,但大量沟通都重复低效。帮我开发个网页,完成前期客户筛选和初步沟通。
这是很多小公司和超级个体都头疼的事:来咨询的人太多、太杂。有人只想白嫖建议,有人都没想清楚要解决什么问题。一个个聊下去,真正客户,反而没时间交付了。
怎么办?经过几次交互,WorkBuddy很快就领会了需求。
它建议,不做展示型官网,而是做一个客户初筛系统。让客户了解服务内容,再通过引导问答,初步判断他适合什么业务。

嗯,有道理。那就开始吧。
前边几步,中规中矩。产品经理,把业务描述翻成了产品定义。架构师,也拍板了技术方案。工程师,一口气完成了代码。
真正让我感到惊讶的,是接下来这步:它居然自己找出了Bug。
工程师写完代码之后,测试工程师,居然真的发现了问题。推荐算法,在最后一个对话节点出错,推荐异常。看图。

找出来之后,还没完。测试把流程打回,工程师重新上线,修复Bug,再交给测试验收。最后给到我的,是已经Debug完成的代码。
这就是流程。流程,是一条让AI团队循环工作,从而逼近正确答案的路径。

所以,它最终交给我的,不是一个粗糙的、点开就运行失败的Demo,而是一个真的可以跑的MVP。整个页面打开,大概长这样。

而当你点击免费咨询,它就真的会跳转对话。只需要引导,做一些选择,你就能快速完成这次售前咨询。

真不错。一个非技术背景的小老板,可能就这样,真的拿到了一个可以上线的售前网站。
过去,你想把一个业务想法变成产品。哪怕有AI帮忙,你至少也得学一点AI编程。但今天,这层门槛,可能也开始消失了。
我不由得感慨,这个世界,变化实在太快。
因为前段时间,我还说:拉开AI编程应用差距的,是你的Debug能力。但到了今天,初级Bug,可能已经不会出现到你面前了。
最后的话
过去两年,很多人一直讲:AI会重塑很多行业。
但坦白说,这对大多数普通创业者、普通管理者、普通职场人来说,基本没什么感觉。因为你打开AI对话框,输入几句话,它返回一段文字,跟“重塑”距离实在太远。
但今天,不太一样。WorkBuddy,确实让我感受到了“重塑”。
比如,面对一份大公司合同时,“要不要签”的无助感,突然有了一份专业详实的报告,供你参考。比如,是想做一个客户咨询系统时,那种“找外包贵、自己不会”的两难,突然变成了一句话就能跑通的MVP。
而重塑的底层逻辑,不是AI更聪明了,是AI能组织工作了。
过去几十年,组织的故事,是大公司的故事。一个商业机会要被抓住,必须先有一支团队。而一支团队,又必须先有一家公司去养它。
个体,是组织的附属品。
但今天的AI,让另一种可能浮现了出来。一个人,也可以拥有一支团队。一个人,也可以完成整个组织才能完成的事。
个体,开始拥有组织的能力了。
当组织能力不再是大公司专属,个体崛起,就只剩时间问题。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。










