三小時(shí)復(fù)現(xiàn)Manus,開(kāi)源的OpenManus帶來(lái)哪些啟示?
作者:呂倩
凌晨三點(diǎn)敲完代碼,次日早上八點(diǎn)新增三十多個(gè)好友申請(qǐng),在開(kāi)源社區(qū)GitHub上迅速收獲7000多顆星星——Manus爆紅不足三日,隸屬于國(guó)內(nèi)AI Agent初創(chuàng)公司DeepWisdom(深度賦智)的MetaGPT 團(tuán)隊(duì),就進(jìn)行了產(chǎn)品復(fù)刻,并將產(chǎn)品Open Manus上傳至開(kāi)源社區(qū)。
第一財(cái)經(jīng)記者對(duì)話MetaGPT團(tuán)隊(duì),試圖理清此次技術(shù)復(fù)刻的底層邏輯,以及行業(yè)喧囂背后的意義。這一過(guò)程既反映出產(chǎn)品功能復(fù)刻離不開(kāi)DeepWisdom公司具備的技術(shù)沉淀,也通過(guò)MetaGPT團(tuán)隊(duì)的視角肯定了Manus團(tuán)隊(duì)在規(guī)劃、后訓(xùn)練、交互方式等方面的投入。
在復(fù)刻過(guò)程中理解差異
早在2023年,MetaGPT團(tuán)隊(duì)開(kāi)始研究多智能體框架,并在GitHub上開(kāi)源相關(guān)代碼,獲得了社區(qū)的廣泛關(guān)注。2024年10月,團(tuán)隊(duì)開(kāi)始探索Agent的規(guī)劃能力和工具使用能力,提出Data Interpreter等工作。
Manus火了之后,MetaGPTAI算法研究員向勁宇與MetaGPT算法研究員梁新兵討論:是否可以直接做一個(gè)開(kāi)源版本。
在具體產(chǎn)品屬性上,OpenManus是類Manus的多智能體框架,為開(kāi)發(fā)者提供了快速上手和定制化開(kāi)發(fā)的平臺(tái),但向勁宇也不忘提醒:目前OpenManus是demo級(jí)(演示版本),暫時(shí)還沒(méi)有GALA benchmark評(píng)測(cè)結(jié)果,效果可能一般。后續(xù)團(tuán)隊(duì)會(huì)進(jìn)一步投入DeepResearch方向與SWE(軟件工程)代碼方向。
此前Manus披露在GALA Benchmark評(píng)測(cè)中達(dá)到當(dāng)前最優(yōu)水平(SOTA),超越OpenAI的Deep Research等競(jìng)品。
向勁宇推測(cè),Manus團(tuán)隊(duì)本身實(shí)現(xiàn)了非常復(fù)雜的規(guī)劃與后訓(xùn)練,才能夠如同其demo提供良好的產(chǎn)品交互。Manus面臨效果不理想時(shí)的問(wèn)題也是行業(yè)性問(wèn)題,OpenManus暫時(shí)也沒(méi)有達(dá)到非常強(qiáng)的效果。
對(duì)于三小時(shí)便能夠復(fù)刻“爆品”Manus,梁新兵對(duì)第一財(cái)經(jīng)記者表示,本質(zhì)在于團(tuán)隊(duì)已儲(chǔ)備的技術(shù)積淀,且前兩個(gè)月前團(tuán)隊(duì)已經(jīng)在思考如何通過(guò)簡(jiǎn)單的、優(yōu)雅的形式,去呈現(xiàn)一個(gè)Agent形態(tài)。
從Manus與OpenManus對(duì)外披露的演示視頻來(lái)看,兩者均屬于AI Agent產(chǎn)品,采用Multi-Agent(多智能體)架構(gòu),能夠?qū)?fù)雜任務(wù)拆解為多個(gè)子任務(wù),并分配給不同的Agent(智能體)執(zhí)行。另外,兩者均具備工具鏈集成屬性,集成多種工具,如網(wǎng)絡(luò)搜索、代碼執(zhí)行、文件處理等,以增強(qiáng)智能體的功能。
相較而言,兩者最大差異在于OpenManus的開(kāi)源屬性。與Manus的技術(shù)架構(gòu)主要依靠使用者猜測(cè)不同,OpenManus產(chǎn)品團(tuán)隊(duì)直接在項(xiàng)目致謝中提及Claude廠商Anthropic去年上線的computer-use,YC投資的項(xiàng)目browser-use等。OpenManus作者張佳釔公開(kāi)總結(jié)產(chǎn)品成果結(jié)合了computer-use、基本的Agents,以及規(guī)劃能力。
多智能體將普及
與其關(guān)注Manus剛剛出圈時(shí)的諸多噱頭,不如將目光聚焦在Manus模式給行業(yè)發(fā)展帶來(lái)的啟示。
梁新兵認(rèn)為,Manus讓更多普通人了解到智能體為何物,放大了Multi-Agent這條路徑。
從發(fā)展歷史來(lái)看,Multi-Agent概念雛形最早可以追溯至20世紀(jì)80年代,分布式人工智能理念興起。2017年以后,隨著大型語(yǔ)言模型成熟,AI Agent應(yīng)用開(kāi)始從理論走向?qū)嶋H,例如AutoGPT 的出現(xiàn)標(biāo)志著AI Agent的雛形誕生。
2024年,微軟、谷歌、蘋果、OpenAI等廠商紛紛布局AI Agent市場(chǎng)。2025年1月,OpenAI發(fā)布首款A(yù)I Agent產(chǎn)品Operator,能夠執(zhí)行復(fù)雜操作,如編寫代碼、預(yù)訂旅行等,但目前僅提供給購(gòu)買每月200美元ChatGPT Pro服務(wù)方案的消費(fèi)者。直到國(guó)內(nèi)AI廠商Monica通過(guò)Manus,讓普通群眾第一次意識(shí)到Multi-Agent概念,MetaGPT的開(kāi)源產(chǎn)品進(jìn)一步揭開(kāi)其神秘面紗。
AIGCLINK發(fā)起人、行行AI合伙人占冰強(qiáng)對(duì)記者表示,Manus此類產(chǎn)品類型,之前MetaGPT團(tuán)隊(duì)已經(jīng)實(shí)現(xiàn)過(guò),也算是國(guó)內(nèi)首批投入智能體研發(fā)的團(tuán)隊(duì)之一。
MetaGPT NLP/Agent方向研究員洪思睿在交流中表示,目前的行業(yè)發(fā)展?fàn)顟B(tài)中,通過(guò)大模型或Agent去做工具的使用,已經(jīng)不再新奇。隨著大家對(duì)具體產(chǎn)品與技術(shù)的關(guān)注越來(lái)越多,行業(yè)的技術(shù)難點(diǎn)在于:當(dāng)很多相似的工具可解決同樣的問(wèn)題,如何讓Agent把決策做得更好。另外,如果使用過(guò)程中接入的不是比較標(biāo)準(zhǔn)的工具接口,工具參數(shù)也可能出錯(cuò),進(jìn)而導(dǎo)致工具的執(zhí)行效果不理想。
這樣的背景下,通過(guò)動(dòng)態(tài)路由技術(shù)優(yōu)化工具選擇與使用,通過(guò)知識(shí)增強(qiáng)與幻覺(jué)抑制提升決策可靠性,采用ReAct、Chain-of-Thought(CoT)或 Tree-of-Thoughts(ToT)等推理框架幫助 Agent 更清晰地展示決策過(guò)程,成為可選擇的解決措施。
MCP協(xié)議(Model Context Protocol,模型上下文協(xié)議)目前成為了業(yè)內(nèi)的主流選項(xiàng)。所謂MCP,是由Anthropic于2024年11月底推出的一種開(kāi)放標(biāo)準(zhǔn)協(xié)議,旨在統(tǒng)一大型語(yǔ)言模型(LLM)與外部數(shù)據(jù)源和工具之間的通信。它通過(guò)標(biāo)準(zhǔn)化接口,使LLM能夠安全、高效地訪問(wèn)外部資源,從而擴(kuò)展其功能。
占冰強(qiáng)對(duì)記者表示,MCP本身完全可兼容,主要看技術(shù)廠商是否愿意支持。目前海外主流廠商已逐步接入,尤其是在AI工具和開(kāi)發(fā)平臺(tái)領(lǐng)域,相信國(guó)內(nèi)廠商也會(huì)陸續(xù)跟進(jìn)。
本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書(shū)面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
[京B2-20230170] [京ICP備17012796號(hào)-1]
違法和不良信息舉報(bào)電話:18513525309 報(bào)料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn
Copyright ©2017-2025 jwview.com. All Rights Reserved
北京中新經(jīng)聞信息科技有限公司