三小時(shí)復(fù)現(xiàn)Manus，開(kāi)源的OpenManus帶來(lái)哪些啟示？

2025-03-09 08:31:06 第一財(cái)經(jīng)

　　三小時(shí)復(fù)現(xiàn)Manus，開(kāi)源的OpenManus帶來(lái)哪些啟示？

　　作者：呂倩

　　凌晨三點(diǎn)敲完代碼，次日早上八點(diǎn)新增三十多個(gè)好友申請(qǐng)，在開(kāi)源社區(qū)GitHub上迅速收獲7000多顆星星——Manus爆紅不足三日，隸屬于國(guó)內(nèi)AI Agent初創(chuàng)公司DeepWisdom(深度賦智)的MetaGPT 團(tuán)隊(duì)，就進(jìn)行了產(chǎn)品復(fù)刻，并將產(chǎn)品Open Manus上傳至開(kāi)源社區(qū)。

　　第一財(cái)經(jīng)記者對(duì)話MetaGPT團(tuán)隊(duì)，試圖理清此次技術(shù)復(fù)刻的底層邏輯，以及行業(yè)喧囂背后的意義。這一過(guò)程既反映出產(chǎn)品功能復(fù)刻離不開(kāi)DeepWisdom公司具備的技術(shù)沉淀，也通過(guò)MetaGPT團(tuán)隊(duì)的視角肯定了Manus團(tuán)隊(duì)在規(guī)劃、后訓(xùn)練、交互方式等方面的投入。

　　在復(fù)刻過(guò)程中理解差異

　　早在2023年，MetaGPT團(tuán)隊(duì)開(kāi)始研究多智能體框架，并在GitHub上開(kāi)源相關(guān)代碼，獲得了社區(qū)的廣泛關(guān)注。2024年10月，團(tuán)隊(duì)開(kāi)始探索Agent的規(guī)劃能力和工具使用能力，提出Data Interpreter等工作。

　　Manus火了之后，MetaGPTAI算法研究員向勁宇與MetaGPT算法研究員梁新兵討論：是否可以直接做一個(gè)開(kāi)源版本。

　　在具體產(chǎn)品屬性上，OpenManus是類Manus的多智能體框架，為開(kāi)發(fā)者提供了快速上手和定制化開(kāi)發(fā)的平臺(tái)，但向勁宇也不忘提醒：目前OpenManus是demo級(jí)(演示版本)，暫時(shí)還沒(méi)有GALA benchmark評(píng)測(cè)結(jié)果，效果可能一般。后續(xù)團(tuán)隊(duì)會(huì)進(jìn)一步投入DeepResearch方向與SWE(軟件工程)代碼方向。

　　此前Manus披露在GALA Benchmark評(píng)測(cè)中達(dá)到當(dāng)前最優(yōu)水平(SOTA)，超越OpenAI的Deep Research等競(jìng)品。

　　向勁宇推測(cè)，Manus團(tuán)隊(duì)本身實(shí)現(xiàn)了非常復(fù)雜的規(guī)劃與后訓(xùn)練，才能夠如同其demo提供良好的產(chǎn)品交互。Manus面臨效果不理想時(shí)的問(wèn)題也是行業(yè)性問(wèn)題，OpenManus暫時(shí)也沒(méi)有達(dá)到非常強(qiáng)的效果。

　　對(duì)于三小時(shí)便能夠復(fù)刻“爆品”Manus，梁新兵對(duì)第一財(cái)經(jīng)記者表示，本質(zhì)在于團(tuán)隊(duì)已儲(chǔ)備的技術(shù)積淀，且前兩個(gè)月前團(tuán)隊(duì)已經(jīng)在思考如何通過(guò)簡(jiǎn)單的、優(yōu)雅的形式，去呈現(xiàn)一個(gè)Agent形態(tài)。

　　從Manus與OpenManus對(duì)外披露的演示視頻來(lái)看，兩者均屬于AI Agent產(chǎn)品，采用Multi-Agent(多智能體)架構(gòu)，能夠?qū)?fù)雜任務(wù)拆解為多個(gè)子任務(wù)，并分配給不同的Agent(智能體)執(zhí)行。另外，兩者均具備工具鏈集成屬性，集成多種工具，如網(wǎng)絡(luò)搜索、代碼執(zhí)行、文件處理等，以增強(qiáng)智能體的功能。

　　相較而言，兩者最大差異在于OpenManus的開(kāi)源屬性。與Manus的技術(shù)架構(gòu)主要依靠使用者猜測(cè)不同，OpenManus產(chǎn)品團(tuán)隊(duì)直接在項(xiàng)目致謝中提及Claude廠商Anthropic去年上線的computer-use，YC投資的項(xiàng)目browser-use等。OpenManus作者張佳釔公開(kāi)總結(jié)產(chǎn)品成果結(jié)合了computer-use、基本的Agents，以及規(guī)劃能力。

　　多智能體將普及

　　與其關(guān)注Manus剛剛出圈時(shí)的諸多噱頭，不如將目光聚焦在Manus模式給行業(yè)發(fā)展帶來(lái)的啟示。

　　梁新兵認(rèn)為，Manus讓更多普通人了解到智能體為何物，放大了Multi-Agent這條路徑。

　　從發(fā)展歷史來(lái)看，Multi-Agent概念雛形最早可以追溯至20世紀(jì)80年代，分布式人工智能理念興起。2017年以后，隨著大型語(yǔ)言模型成熟，AI Agent應(yīng)用開(kāi)始從理論走向?qū)嶋H，例如AutoGPT 的出現(xiàn)標(biāo)志著AI Agent的雛形誕生。

　　2024年，微軟、谷歌、蘋果、OpenAI等廠商紛紛布局AI Agent市場(chǎng)。2025年1月，OpenAI發(fā)布首款A(yù)I Agent產(chǎn)品Operator，能夠執(zhí)行復(fù)雜操作，如編寫代碼、預(yù)訂旅行等，但目前僅提供給購(gòu)買每月200美元ChatGPT Pro服務(wù)方案的消費(fèi)者。直到國(guó)內(nèi)AI廠商Monica通過(guò)Manus，讓普通群眾第一次意識(shí)到Multi-Agent概念，MetaGPT的開(kāi)源產(chǎn)品進(jìn)一步揭開(kāi)其神秘面紗。

　　AIGCLINK發(fā)起人、行行AI合伙人占冰強(qiáng)對(duì)記者表示，Manus此類產(chǎn)品類型，之前MetaGPT團(tuán)隊(duì)已經(jīng)實(shí)現(xiàn)過(guò)，也算是國(guó)內(nèi)首批投入智能體研發(fā)的團(tuán)隊(duì)之一。

　　MetaGPT NLP/Agent方向研究員洪思睿在交流中表示，目前的行業(yè)發(fā)展?fàn)顟B(tài)中，通過(guò)大模型或Agent去做工具的使用，已經(jīng)不再新奇。隨著大家對(duì)具體產(chǎn)品與技術(shù)的關(guān)注越來(lái)越多，行業(yè)的技術(shù)難點(diǎn)在于：當(dāng)很多相似的工具可解決同樣的問(wèn)題，如何讓Agent把決策做得更好。另外，如果使用過(guò)程中接入的不是比較標(biāo)準(zhǔn)的工具接口，工具參數(shù)也可能出錯(cuò)，進(jìn)而導(dǎo)致工具的執(zhí)行效果不理想。

　　這樣的背景下，通過(guò)動(dòng)態(tài)路由技術(shù)優(yōu)化工具選擇與使用，通過(guò)知識(shí)增強(qiáng)與幻覺(jué)抑制提升決策可靠性，采用ReAct、Chain-of-Thought(CoT)或 Tree-of-Thoughts(ToT)等推理框架幫助 Agent 更清晰地展示決策過(guò)程，成為可選擇的解決措施。

　　MCP協(xié)議(Model Context Protocol，模型上下文協(xié)議)目前成為了業(yè)內(nèi)的主流選項(xiàng)。所謂MCP，是由Anthropic于2024年11月底推出的一種開(kāi)放標(biāo)準(zhǔn)協(xié)議，旨在統(tǒng)一大型語(yǔ)言模型(LLM)與外部數(shù)據(jù)源和工具之間的通信。它通過(guò)標(biāo)準(zhǔn)化接口，使LLM能夠安全、高效地訪問(wèn)外部資源，從而擴(kuò)展其功能。

　　占冰強(qiáng)對(duì)記者表示，MCP本身完全可兼容，主要看技術(shù)廠商是否愿意支持。目前海外主流廠商已逐步接入，尤其是在AI工具和開(kāi)發(fā)平臺(tái)領(lǐng)域，相信國(guó)內(nèi)廠商也會(huì)陸續(xù)跟進(jìn)。

來(lái)源：第一財(cái)經(jīng)

編輯：董文博

廣告等商務(wù)合作，請(qǐng)點(diǎn)擊這里

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人

中新經(jīng)緯版權(quán)所有，未經(jīng)書(shū)面授權(quán)，任何單位及個(gè)人不得轉(zhuǎn)載、摘編或以其它方式使用。

關(guān)注中新經(jīng)緯微信公眾號(hào)(微信搜索“中新經(jīng)緯”或“jwview”)，看更多精彩財(cái)經(jīng)資訊。

今日推薦