“个体崛起”的时代，可能真要来了

今天 10:50

这个世界，变化实在太快。

编者按：本文来自微信公众号刘润（ID：runliu-pub），作者：景九，编辑：歌平，创业邦经授权转载。

从去年年底开始，越来越多的人，开始研究“多Agent协作”。

2025年，Google推出A2A协议，让不同Agent用一套语言沟通。Anthropic的研究表示，多AI智能体团队，在复杂任务上的表现，较单体实现了90.2%的提升。2026年，OpenAI也发布了Symphony，用于编排Agent工作流。

我非常关注这件事。为此，还手搓了一个粗糙的AI系统，让AI主笔、AI研究员、AI编辑“吵架”，给内容团队写研究报告。

而最近，腾讯也在AI软件WorkBuddy里，上线了“专家团”功能，通过多Agent协作完成复杂任务。于是，听到消息，我也抓紧体验了一下。体验之后，感受非常强烈：

“个体崛起”的时代，可能真的要来了。

为什么？这得从一个词开始说起：马具工程（Harness Engineering）。

01马具工程：给AI这匹烈马，套上组织的缰绳

什么是马具工程？

从2023年开始，AI公司在发布大模型时，最先强调的永远是：参数多少，跑分多少。大家比的，是谁家模型更聪明。就像比谁家的马更强壮。

可有个问题，始终没有解决：这匹马，野性难驯。

具体来说，就是：它会不可避免地出现幻觉。

幻觉，就是一本正经地胡说八道。你问它论文出处，它可能会给你作者名、年份、期刊，但你真去查，会发现根本不存在。

为什么？

因为大模型的底层机制，是通过概率，猜下一个词。这是统计意义的智能，而非人类意义的理解。这种机制，就必然带来幻觉。而幻觉最可怕的，不是“错了”，是“错了，但自信”。以至于问它10次，它可能会给你10个信心满满的答案。

太吓人了。所以，想让它干活，就得让它更可靠。

怎么办？很多人想到了：把AI包装成Agent。

我给它明确身份、明确任务，甚至接上工具权限。然后，让它做财报分析师，让它做产品经理，让它做研究员。总可以了吧？

是，靠谱多了。可新的问题，也出现了。

因为，当规则开始冲突，AI就开始内耗。你要求才华横溢，它就事实不准。你要求事实为先，它又枯燥无味。最终，交给你一个面面俱到的平庸之作。

怎么办？问题，其实不在“马”，而在“马具”。

一匹好马，强壮有耐力，但野性难驯。你必须套上马具，才能驾驭它。今天的AI，就是一匹充满力量、但野性难驯的烈马。想让它真正发挥作用，需要一套：马具工程。

马具工程的本质，就是给AI这匹烈马，套上名为“组织”的缰绳。

这次，WorkBuddy推出的专家团，就是一个很具体的例子。它把原本抽象的方法论，变成了普通人可以直接使用的产品能力。所谓“专家团”，就是把不同分工的Agent，组织起来，解决复杂任务。看图。

一个Agent开发软件，容易逻辑混乱，改动频繁。让不同Agent，分别捋清产品，架构，开发，测试，最终，就大概率是一个直接可用的页面。

一个Agent处理财报，页数一多，就容易忽略数据。几个Agent，分别负责数据，风险，写报告，准确率就会大幅增加。

而当AI套上马具，很多之前实现不了的事情，就有了可能。

比如，对有繁杂流程的大公司来说，部门协作可以逐渐自动化。比如，对预算有限的小公司来说，可以拥有随叫随到的外包团队。对于想要自己销售、产品、交付的“一人公司”，这更是一支“千军万马”。

于是，个体崛起的可能，由此打开。

那怎么才能把“马具工程”用好？至少包括三个要点：

角色、规则、流程。

02角色：把任务分开执行，AI才能追求极致

什么是角色？

角色，不只是“职位名称”，还是一个Agent的能力清单。

比如，主笔Agent的能力清单，是：选题、写作、润色。不管风险控制，事实核查。比如，编辑Agent的能力清单，是：审核、把关、修改建议。它不管怎么写得好，只管怎么不出错。

为什么要这么干？

因为，要求越多，内耗越重。约束越全，产出越差。

如果你让一个Agent，同时扮演：才华横溢的主笔和谨小慎微的编辑。那才华就会和风险冲突，戏说会和严谨冲突。面对互相打架的规则，Agent只能产出60分的平庸报告。

那怎么办？把角色拆开。

让主笔一开始，就追求极致质量。这样，初稿就有80分的水准。在编辑身上，就定义好把关的能力，让文稿不出红线问题。最终呈现的稿子，既有80分的创造力，也有80分的稳定性。

举个例子。WorkBuddy里的“内容创作专家团”。

当我给了它一个“创作数码视频脚本”的任务，它没有直接写测评文案，而是先“组团”，拉起了三个完全不同的Agent。看图。

具体，是这么三个角色：

行业产品调研员，平台内容研究员，人文思考研究员。

行业产品，就只负责市场格局、真实体验，不用懂B站生态。人文思考，就只负责琢磨“AI眼镜是科技玩具，还是生活方式入口”一类的问题，不需要查市场数据。

最后，把他们的输出汇总，让另一个写作Agent，整理成了完整的脚本。看图。

有意思。它想的很细致，先是行业全景，再是真实体验，然后逐渐追问，由浅到深，最后还来了个哲学思考。整个逻辑链条很顺。再稍微修改，就基本可用了。

这就是多Agent协作的厉害之处。它不在于单个Agent多聪明，而在于调用多个Agent，打透专一任务，获得普通高手水平以上的交付结果。

一个Agent，当然也能研究AI眼镜，但很容易沿着单一路径，越想越窄。一旦你优先选“科技硬核”角度，后面就全是参数、芯片、续航。人文那一块，就不太容易进来了。

借助AI，一个人，第一次有了“像一支团队思考”的能力。

但角色一多，也会打架。主笔想有冲击力，编辑想不被读者质疑。顾问想有创新，风控又想保守。如果都按自己逻辑来，只会浪费大量token。

所以，你还需要设置：规则。

03规则：确定“把事干对”的标准，AI才能稳定产出

什么是规则？

规则，就是AI做事的标准。比如，什么不能做，什么是好答案。

比如，主笔Agent的规则，可能是：必须有认知差、必须走情绪动线、必须避开鸡汤套路。编辑Agent的规则，可能是：引用有出处、数据能追溯。

为什么要这么干？

同样5个人，在不同的团队，产出可能天差地别。因为一个团队，压根就没有“好文章”的标准。另一个团队，对好文章的标准，是：让人转发，有认知差，是读者好奇的话题……

规则，是岗位的标准。有了标准，AI才能保持产出稳定。

举个例子：WorkBuddy里的“法律咨询团”。

如果说有什么工种最需要规则，法律一定算一个。因为法律工作的核心，是：基于规则，做专业判断。法律建议，最怕感觉。感觉这条没事。感觉对方应该不会真这么干。一旦出了问题，代价巨大。

那，WorkBuddy如何解决法律问题？我试着问它：

我是一家AI落地的小咨询公司，帮企业把AI接进业务流程。我们最近接了个大单子，对方甩过来份标准合同，你帮我研究研究，要不要签？

过去，小老板最怕这种时刻。大公司甩来份合同，自己不够专业看不懂，找律师麻烦。硬着头皮签，又怕踩坑。

好。WorkBuddy，很快就开始干活了。

让我印象最深刻的，是它干活的“专业”程度。

比如，它不会一上来就告诉你能签不能签。它先采集信息。

为什么？因为信息不完整，不能下结论。

于是，负责案情采集的方助理，先定了一个信息清单。你让我研究合同？行。那我得先搞清楚，付款条款怎么说，知识产权、交付验收、保密条款……

接着，它开始花大力气，研究法律依据。

为什么？因为所有判断，必须有依据。

我说这条危险，不是因为“我觉得危险”。而是因为它可能对应哪条法规。所以，你就能看到，周法官在吭哧吭哧地挨个查阅具体条款。很多条款，文本只是原则。法院怎么理解怎么判，也很重要。所以，沈判官就发力，找之前的类似判例。

好了。大概半小时，他们就完成了最终的咨询报告。

我点开一看，嚯。挺像那么回事的。而让我惊喜的是，它并不是简单地说这条有危险，而是说清楚了，它对我这家小公司为什么危险。

比如，质量保证条款苛刻。这对刚起步的小公司，可能是毁灭性打击。因为验收标准模糊，完全由甲方主观判断，决定给不给项目款。所以，很有可能活干了，但钱拿不到。

发现没？

让AI变专业的，不是模型更聪明，而是规则更清楚。

信息不完整，不能下结论。没有法律依据，不能乱给建议。看法条不够，得看现实判例。建议，得对客户真正有用。这就是规则。

但有了规则，也还不足够。因为规则，毕竟不会自己执行。如果信息还没采集完，法条还没查完，就开始写最终报告，也会翻车。

所以，光知道“什么叫对”还不够。你还得知道：谁先干，谁后干。

这就是：流程。

04流程：让AI，循环逼近正确答案

什么是流程？

流程，就是把复杂任务拆成接力赛。

因为复杂任务，不是一口气做完的，本就是一环扣一环。给建议，需要先等信息采集。写报告，要先等判例研究。没有流程，大家就会凭猜测开工。前面的信息稍有变化，后面全部推倒重来。

但只是机械交棒，还不够。因为高质量的产出，核心来自：挑战。

团队之所以比单兵更强，不是因为人多。是因为不同的人，会从不同角度不停挑刺。好产品，是产品、研发、测试，多轮沟通修改出来的。好文章，是作者、编辑、研究员，反复推敲润色出来的。

所以流程，还应该是一张让AI吵架的路线图。

好的AI协作系统，不只是安排好“谁先干、谁后干”。还要设计好，谁来挑战谁。让不同Agent，用各自最擅长的能力，互相校正，循环往复，才能让产出逼近高质量。

举个例子。WorkBuddy里的“软件开发团队”。

如果说有什么工作，最依赖流程。软件开发，一定算一个。

总不能产品经理还没把需求讲明白，工程师已经开始写代码。也不能代码还没写完，测试先开始报Bug。这么干的结果，是所有人拼命返工。

于是，我打开聊天框提问：

我是一个AI提效咨询公司的创业者。每天有很多潜在客户咨询，但大量沟通都重复低效。帮我开发个网页，完成前期客户筛选和初步沟通。

这是很多小公司和超级个体都头疼的事：来咨询的人太多、太杂。有人只想白嫖建议，有人都没想清楚要解决什么问题。一个个聊下去，真正客户，反而没时间交付了。

怎么办？经过几次交互，WorkBuddy很快就领会了需求。

它建议，不做展示型官网，而是做一个客户初筛系统。让客户了解服务内容，再通过引导问答，初步判断他适合什么业务。

嗯，有道理。那就开始吧。

前边几步，中规中矩。产品经理，把业务描述翻成了产品定义。架构师，也拍板了技术方案。工程师，一口气完成了代码。

真正让我感到惊讶的，是接下来这步：它居然自己找出了Bug。

工程师写完代码之后，测试工程师，居然真的发现了问题。推荐算法，在最后一个对话节点出错，推荐异常。看图。

找出来之后，还没完。测试把流程打回，工程师重新上线，修复Bug，再交给测试验收。最后给到我的，是已经Debug完成的代码。

这就是流程。流程，是一条让AI团队循环工作，从而逼近正确答案的路径。

所以，它最终交给我的，不是一个粗糙的、点开就运行失败的Demo，而是一个真的可以跑的MVP。整个页面打开，大概长这样。

而当你点击免费咨询，它就真的会跳转对话。只需要引导，做一些选择，你就能快速完成这次售前咨询。

真不错。一个非技术背景的小老板，可能就这样，真的拿到了一个可以上线的售前网站。

过去，你想把一个业务想法变成产品。哪怕有AI帮忙，你至少也得学一点AI编程。但今天，这层门槛，可能也开始消失了。

我不由得感慨，这个世界，变化实在太快。

因为前段时间，我还说：拉开AI编程应用差距的，是你的Debug能力。但到了今天，初级Bug，可能已经不会出现到你面前了。

最后的话

过去两年，很多人一直讲：AI会重塑很多行业。

但坦白说，这对大多数普通创业者、普通管理者、普通职场人来说，基本没什么感觉。因为你打开AI对话框，输入几句话，它返回一段文字，跟“重塑”距离实在太远。

但今天，不太一样。WorkBuddy，确实让我感受到了“重塑”。

比如，面对一份大公司合同时，“要不要签”的无助感，突然有了一份专业详实的报告，供你参考。比如，是想做一个客户咨询系统时，那种“找外包贵、自己不会”的两难，突然变成了一句话就能跑通的MVP。

而重塑的底层逻辑，不是AI更聪明了，是AI能组织工作了。

过去几十年，组织的故事，是大公司的故事。一个商业机会要被抓住，必须先有一支团队。而一支团队，又必须先有一家公司去养它。

个体，是组织的附属品。

但今天的AI，让另一种可能浮现了出来。一个人，也可以拥有一支团队。一个人，也可以完成整个组织才能完成的事。

个体，开始拥有组织的能力了。

当组织能力不再是大公司专属，个体崛起，就只剩时间问题。

本文为专栏作者授权创业邦发表，版权归原作者所有。文章系作者个人观点，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系editor@cyzone.cn。

刘润

关于我们

订阅服务

特别推荐

法律相关

爱奇清科（北京）信息科技有限公司地址：北京市朝阳区利泽西街东湖国际中心A座9层 | 网络文化经营许可证（京网文[2018]2153-213号）

违法和不良信息举报电话：010-53391121 举报邮箱：db@cyzone.cn

京公网安备 11010502035114号

营业执照出版物经营许可证

反馈

联系我们

推荐订阅