夠優(yōu)秀的專屬 infra,是 Agent 應(yīng)用生態(tài)持續(xù)繁榮的基石。
Agent 正在成為 AI 應(yīng)用的主流產(chǎn)品形式。作為 2025 年最受矚目的技術(shù)之一,全球 AI Agent 市場(chǎng)規(guī)模已突破 50 億美元,年增長(zhǎng)率高達(dá) 40%。相關(guān)數(shù)據(jù)統(tǒng)計(jì),過去 3 個(gè)月涌現(xiàn)的 Agent 產(chǎn)品,超過了去年全年的總和,2025 年可以稱為 Agent 元年。
繼 OpenAI 在 2 月發(fā)布 Agent 應(yīng)用 DeepResearch 引爆全球后,3 月發(fā)布的 manus 又為這股 Agent 熱潮添上了一把火,當(dāng)時(shí)它不但邀請(qǐng)碼一碼難求,之后更獲得 Benchmark 領(lǐng)投的 7500 萬美元的新融資。除了 manus,海外的垂直領(lǐng)域 Agent 公司也頻頻涌現(xiàn)高估值公司,例如編碼 Agent 公司 Cognition 估值即將突破 100 億美元,人力資源 Agent 公司 Mercor 也達(dá)到了 20 億美元估值。
在觀察到 Agent 的崛起以后,紅杉資本認(rèn)為,AI 下一階段的主角是 Agent。福布斯在評(píng)選 AI 50 榜單時(shí)也總結(jié)到:AI Agent 將全面超越聊天類 AI 應(yīng)用。
福布斯的理由是,聊天類應(yīng)用主要用于回答問題或根據(jù)指令生成內(nèi)容;而 Agent 的自動(dòng)化程度更高,可以完成完整的工作流程,直接交付高質(zhì)量結(jié)果。這使得 AI 不再只是「助手」,而升級(jí)成「執(zhí)行者」。
每一次軟件應(yīng)用范式的改變,都會(huì)推動(dòng)基礎(chǔ)設(shè)施(infra)的進(jìn)化,而基礎(chǔ)設(shè)施的改變,也會(huì)讓應(yīng)用的體驗(yàn)得以提升。
傳統(tǒng)的本地部署基礎(chǔ)設(shè)施,其高成本,低彈性的缺點(diǎn),促進(jìn)了云計(jì)算的誕生和成熟,而隨著云計(jì)算基礎(chǔ)設(shè)施越變?cè)胶茫痛呱巳f億美元規(guī)模的 SaaS 軟件行業(yè),其領(lǐng)頭羊 SalesForce 的市值,目前約為 2570 億美元。云計(jì)算作為基礎(chǔ)設(shè)施,也為淘寶天貓、抖音、YouTube 等用戶超億級(jí)別的互聯(lián)網(wǎng)應(yīng)用打好了地基,讓它們能發(fā)展壯大。
在 Agent 應(yīng)用開始爆發(fā)的同時(shí),與 Agent 使用的相關(guān)隱憂也在顯現(xiàn)。例如終端性能限制,AI 工具鏈配置麻煩,安全問題,長(zhǎng)期記憶問題等,若有一個(gè) Agent 專屬的基礎(chǔ)設(shè)施產(chǎn)品出現(xiàn),解決 Agent 使用面臨的一系列問題,將進(jìn)一步加速 Agent 的普及。
7 月 28 日,上海世界人工智能大會(huì) WAIC 上,阿里云正式推出了首款專為 AI Agent 打造的"超級(jí)大腦"——無影 AgentBay。它能突破本地部署的算力限制,提供專屬 Agent 運(yùn)行的沙箱環(huán)境,并為 Agent 配齊了 Browser、Code Space、Computer Use、Mobile Use、Memory 等 AI 工具,還具備視覺理解、自然語言控制、任務(wù)解析等多項(xiàng) AI 技能,僅需三行代碼即可接入,做到"拎包入住",讓 AI 開發(fā)者們徹底告別繁瑣的安裝和配置。
01
本地算力限制,安全性差,
Agent 的使用面臨 5 大痛點(diǎn)
利用 AI 的能力將工作流程自動(dòng)化,這類產(chǎn)品早已有之。在生成式 AI 出現(xiàn)之前,就有 RPA 類產(chǎn)品大行其道。但限于當(dāng)時(shí)的 AI 能力還較弱,RPA 只能將簡(jiǎn)單的單一工作流程自動(dòng)化,不具備真正的智能,不能解決復(fù)合化的復(fù)雜問題。
直到生成式 AI 出現(xiàn),各種真正具備的智能的 Agent 應(yīng)用出現(xiàn),人們才從 AI 自動(dòng)化中獲得了很好的效率提升。
Agent 本質(zhì)是一個(gè)能調(diào)用各種工具的 AI。例如 manus,它用提示詞控制 AI 模型,并編排了一個(gè)精巧的工作流(work flow),讓 AI 模型使用各種不同的工具,然后完成一個(gè)復(fù)雜的任務(wù)。
但是,無論是以 DeepResearch 為代表的研究類 Agent 應(yīng)用,還是 manus 這樣的通用 Agent 應(yīng)用,都是通過網(wǎng)頁或 App 的形式對(duì)終端的用戶提供。
這種提供方式,并不適合專業(yè)的 AI 開發(fā)者,AI 創(chuàng)業(yè)者和企業(yè)用戶。因?yàn)樗麄兊男枨笫亲?Agent 使用專有的數(shù)據(jù),無縫地嵌入到業(yè)務(wù)中,為業(yè)務(wù)持續(xù)提供價(jià)值。
商業(yè)化使用 Agent,首先遇到的就是終端性能,但當(dāng) 一個(gè)功能強(qiáng)大的 Agent 在用戶本地的終端運(yùn)行時(shí),會(huì)遇到各種各樣的問題。
首當(dāng)其沖的是 AI 推理的 算力限制。 如前文所述,Agent 本質(zhì)是一個(gè)能調(diào)用各種工具的 AI,它由一個(gè)能力強(qiáng)大的 AI 模型及一堆供它調(diào)用的工具鏈組成。運(yùn)行能力強(qiáng)大的 AI 模型,通常需要 AI 專用的算力,由 GPU 或 AI 專用芯片提供,幾乎沒有消費(fèi)級(jí)的 PC 或手機(jī)能部署高精度的大模型本體。因此,目前大量的 Agent 公司都采用了云端算力的方式,將模型的訓(xùn)練和推理都放在云端完成。
其次是執(zhí)行任務(wù)的算力。Agent 任務(wù)具有高并發(fā)、高算力需求的特點(diǎn),企業(yè)在本地部署了 Agent 后,當(dāng) Agent 支持的業(yè)務(wù)量開始快速增長(zhǎng)時(shí),馬上就需要更多算力,本地部署的速度跟不上;反過來,當(dāng)這個(gè)業(yè)務(wù)閑置時(shí),又沒有那么多算力需求,會(huì)對(duì)企業(yè)造成巨大資源浪費(fèi)。
根據(jù)阿里云無影事業(yè)部總裁張獻(xiàn)濤博士的觀察:manus 在初期是用本地服務(wù)器的虛擬機(jī)去做任務(wù),這也導(dǎo)致它在用戶大量涌入的時(shí)候,出現(xiàn)了性能不足、服務(wù)不穩(wěn)定的情況,一定程度上影響了初期口碑。如果 Mauns 的誕生晚三個(gè)月,這個(gè)問題很容易就能解決了。
其次是 AI 工具配置麻煩。 Agent 本質(zhì)是一個(gè)能調(diào)用各種工具的 AI,若不能調(diào)用工具,Agent 就很難具備解決復(fù)雜問題的能力。
例如,要搭建一個(gè)銷售類 Agent,它需要調(diào)用 CRM 獲取客戶信息,調(diào)用內(nèi)部的知識(shí)庫以備自動(dòng)向客戶介紹產(chǎn)品,還需要調(diào)用各種通訊工具以便直接觸及到客戶。
國(guó)內(nèi)各地已經(jīng)有不少的「智算中心」,可以初步緩解算力限制問題,但是這些「智算中心」卻只提供算力,不提供搭建 Agent 需要的各種工具鏈。
企業(yè)要定制與業(yè)務(wù)緊密耦合的 Agent,就需要自己搭建工具鏈。這是一個(gè)很復(fù)雜的工程,一方面需要很高的開發(fā)成本,另一方面,在 Agent 正式部署前,需要不短的開發(fā)時(shí)間,這反而會(huì)延緩企業(yè)的業(yè)務(wù)發(fā)展速度。
當(dāng)解決了算力限制和 AI 工具配置的問題后,專業(yè) AI 開發(fā)者和企業(yè)用戶馬上會(huì)遇到 第三個(gè)問題:權(quán)限沖突。
開發(fā)和部署 Agent 的目的,是將其嵌入到自己的業(yè)務(wù)中。而這個(gè)過程,除了要調(diào)用各種各樣的工具以外,還需要與業(yè)務(wù)中的各類軟件緊密配合。
以前文提到的銷售類 Agent 為例,當(dāng)它調(diào)用 CRM,內(nèi)部知識(shí)庫和對(duì)外通訊工具時(shí),不僅會(huì)占用本地計(jì)算資源,更麻煩的是,它會(huì)搶占人類員工的訪問和操作權(quán)限。當(dāng) Agent 不是與人類協(xié)同,而是互相內(nèi)耗時(shí),反而可能拉低整個(gè)團(tuán)隊(duì)的整體工作效率。
對(duì)于企業(yè)用戶,還有一個(gè)大問題,就是安全性差。 企業(yè)使用 Agent,本身的目的就是要增強(qiáng)自己的業(yè)務(wù),或者提高員工的效率,這勢(shì)必需要使用公司的內(nèi)部數(shù)據(jù)。但是 Agent 任務(wù)執(zhí)行是一個(gè)黑盒子,執(zhí)行過程對(duì)于用戶來說是不透明的,有可能對(duì)本地電腦文件系統(tǒng)進(jìn)行修改、刪減等操作,輕則留下垃圾文件造成系統(tǒng)臃腫,重則造成文件丟失或數(shù)據(jù)泄露。
更進(jìn)一步,其實(shí) Agent 在調(diào)用工具時(shí),本身就會(huì)有安全隱患。 據(jù)統(tǒng)計(jì),超過 43% 的 MCP(Model Context Protocol,調(diào)用 AI 工具的協(xié)議)服務(wù)節(jié)點(diǎn)存在未經(jīng)驗(yàn)證的 Shell 調(diào)用路徑,超過 83% 的部署存在 MCP 配置漏洞;88% 的 AI 組件部署根本沒啟用任何形式的防護(hù)機(jī)制。
還是回到那個(gè)銷售類 Agent,它是需要直接與外部客戶溝通和接觸的,若它的安全性無法保證,那么對(duì)于企業(yè)的業(yè)務(wù)和信譽(yù)都是重大打擊。
事實(shí)上,當(dāng)未來 Agent 的使用越來越普及,安全和信任的重要性,在 AI 時(shí)代比在互聯(lián)網(wǎng)時(shí)代更加重要。
當(dāng)真正把本地部署 Agent 用起來后, 企業(yè)還會(huì)面臨一個(gè)問題,就是 Agent 缺乏長(zhǎng)期記憶。 當(dāng)缺乏語義記憶和場(chǎng)景記憶,Agent 只能完成一次性的任務(wù),這會(huì)嚴(yán)重影響 Agent 在企業(yè)業(yè)務(wù)中的使用范圍。
當(dāng)企業(yè)用戶將 Agent 用到業(yè)務(wù)中時(shí),如果能為 Agent 賦予長(zhǎng)期記憶,那么 Agent 除了能夠完成多次任務(wù),企業(yè)還可以根據(jù)這些記憶迭代 Agent,讓它對(duì)業(yè)務(wù)或用戶的理解越來越深,在特定任務(wù)上的能力越來越強(qiáng)。
正如張獻(xiàn)濤博士所說,如果只是完成一個(gè)簡(jiǎn)單的任務(wù),可能不需要長(zhǎng)期記憶。但是如果把 Agent 定位成一個(gè)數(shù)字分身,或者數(shù)字員工,記憶能力,尤其是長(zhǎng)期記憶能力是必須要具備的。
02
Agent 專用 infra:
讓 Agent 安全、快速、低成本的部署,
為 Agent 提供集成 AI 工具鏈的沙箱環(huán)境
阿里云已在 AI 領(lǐng)域有豐富布局,涵蓋了模型,工具,開發(fā)者社區(qū),當(dāng)然也有自己的 Agent;例如他們開源了自主搜索 AI 智能體項(xiàng)目 WebAgent,用于提升 AI 在多步驟信息搜索領(lǐng)域的性能。
作為在 AI 領(lǐng)域布局最完整的廠商,再結(jié)合阿里云多年在云計(jì)算領(lǐng)域的積累,他們推出了 Agent infra 類產(chǎn)品 AgentBay。它扎根客戶的需求,解決了 Agent 使用中的各類痛點(diǎn)。
對(duì)于最緊要的算力限制痛點(diǎn), AgentBay 提供了來自云端的高彈性和高并發(fā)算力,它的高并發(fā)能力能夠達(dá)到百萬級(jí)別,滿足爆款 AI 應(yīng)用高增長(zhǎng)的算力需求,釋放本地算力限制。
而且它僅需三行代碼即可接入,做到"拎包入住",讓 AI 開發(fā)者們徹底告別繁瑣的安裝和配置。
對(duì)于 AI 工具配置麻煩和本地部署權(quán)限沖突這兩個(gè)問題 ,AgentBay 可在云端一鍵生成專屬 Agent 運(yùn)行的沙箱環(huán)境,保證 Agent 執(zhí)行對(duì)本地環(huán)境的零侵入,也就不存在占用本地計(jì)算資源,搶占人類員工的訪問和操作權(quán)限這些麻煩事。
而且,這些沙箱環(huán)境集成了 Browser、Code Space、Computer Use、Mobile Use、Memory 等 AI 工具,能夠執(zhí)行代碼運(yùn)行、網(wǎng)頁瀏覽、數(shù)據(jù)分析、程序開發(fā)、表格制作等基礎(chǔ)任務(wù),還具備視覺理解、自然語言控制、任務(wù)解析等多項(xiàng) AI 技能。
例如 Browser 這個(gè)工具,可以將云端瀏覽器自動(dòng)化,支持網(wǎng)頁爬取、自動(dòng)化測(cè)試、流程處理,幫助 AI Agent 獲得了獲取外部信息的能力。
Code Space 則是一個(gè)更關(guān)鍵的工具,它提供代碼運(yùn)行環(huán)境,支持多語言解釋器和開發(fā)工具鏈。有了 Code Space,Agent 可以自己寫代碼,按需生成自己在特定任務(wù)中需要的工具,然后再去調(diào)用,這樣的話,理論上它能夠完成任何企業(yè)需要的任務(wù)。
針對(duì) AI 安全性差的問題 ,阿里云此前就發(fā)布了 AI 云盾(Cloud Shield for AI)系列產(chǎn)品,提供模型應(yīng)用端到端的安全解決方案?,F(xiàn)在它將這些能力升級(jí)并集成到了 AgentBay 中。
AgentBay 能夠?yàn)?Agent 應(yīng)用提供多重安全防護(hù),包括:環(huán)境隔離,網(wǎng)絡(luò)隔離、文件系統(tǒng)隔離、資源限制、全量審計(jì)。它符合企業(yè)級(jí)安全標(biāo)準(zhǔn),支持 SOC2/HIPAA 合規(guī),能讓中小企業(yè)以低成本獲得軍工級(jí)安全能力。
對(duì)于企業(yè)級(jí)用戶在搭建跨多個(gè)部門和平臺(tái),完成復(fù)雜任務(wù)的 Agent 時(shí),AgentBay 提供了 Context 持久化云工作區(qū)。
Context 持久化云工作區(qū),既解決了 Agent 沒有長(zhǎng)期記憶的問題,又能支持不同部門的協(xié)作。
具體來說,它有自研的跨平臺(tái)數(shù)據(jù)漫游系統(tǒng),實(shí)現(xiàn)用戶數(shù)據(jù)、狀態(tài)甚至內(nèi)存級(jí)別的持久化。
此外,它支持會(huì)話間狀態(tài)保持,可動(dòng)態(tài)掛載給不同環(huán)境,支持按需加載和實(shí)時(shí)切換。
對(duì)于不同部門的協(xié)作,它支持免密登錄、歷史文件編輯、專屬知識(shí)等高階能力。
在 Context 持久化云工作區(qū)的支持下,企業(yè)用戶不但能夠讓 Agent 擁有長(zhǎng)期記憶,不斷迭代 Agent 的能力,還能搭建跨部門的,可解決復(fù)雜問題的 Agent,并支持不同部門的協(xié)作,共同使用和優(yōu)化這個(gè) Agent。
在解決了 Agent 使用的 5 大痛點(diǎn)之后,AgentBay 還為企業(yè)用戶提供了一些更周到并且影響深遠(yuǎn)的功能和服務(wù)。
例如,它同時(shí)兼容不同的操作系統(tǒng)平臺(tái),包括 Windows、Linux 和 Android。
對(duì)于 Windows,它提供云端 Windows 桌面環(huán)境,支持 Windows 應(yīng)用程序自動(dòng)化;對(duì)于 Linux,它提供云端 Linux 系統(tǒng)環(huán)境,支持命令行和系統(tǒng)工具;對(duì)于 Android,它有云端安卓環(huán)境,支持移動(dòng)應(yīng)用測(cè)試和流程自動(dòng)化。
這樣,無論是哪一個(gè)平臺(tái)的開發(fā)者,都能在自己熟悉的環(huán)境里開發(fā) Agent 應(yīng)用。而對(duì)于大企業(yè),他們的服務(wù)和應(yīng)用就可在 Windows、Linux、Android 等多個(gè)系統(tǒng)間無縫切換,這助力了 Agent 普及。
此外,AgentBay 積極擁抱開源,支持開發(fā)者共建生態(tài);而且它支持 MCP Server 自由定制與托管,開發(fā)者和企業(yè)可以共同構(gòu)建專屬 AgentBay 生態(tài)。
據(jù)張獻(xiàn)濤博士透露,自四月上旬發(fā)布了 AgentBay 的邀測(cè)后,不到三個(gè)月已有超過 1000 家客戶使用 AgentBay 打造自己的 Agent。一些頭部的 Agent 應(yīng)用廠商也在與阿里云合作對(duì)接。
03
足夠優(yōu)秀的專屬 infra,
是 Agent 應(yīng)用生態(tài)持續(xù)繁榮的基石
AI 領(lǐng)域現(xiàn)在最重要,也最繁榮的是整個(gè)技術(shù)棧的兩端:應(yīng)用和基礎(chǔ)設(shè)施。當(dāng)下的 AI 像極了移動(dòng)互聯(lián)網(wǎng)時(shí)代:當(dāng)時(shí)各類 App 層出不窮,促進(jìn) IT 基礎(chǔ)設(shè)施邁進(jìn)了云計(jì)算時(shí)代。
現(xiàn)在我們看到了 Agent 應(yīng)用端的繁榮,無論是大廠,還是創(chuàng)業(yè)公司,都在 Agent 應(yīng)用領(lǐng)域耕耘;無論是通用 Agent,專用 Agent,還是各種定制 Agent,創(chuàng)意天馬行空。
但是,應(yīng)用不是建立在空中樓閣上的,基礎(chǔ)設(shè)施的完善是應(yīng)用繁榮的基石,就像修好了高速公路和鐵路,才有物流和電商的繁榮;有了足夠的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,才能創(chuàng)造出淘寶天貓、抖音、優(yōu)酷;有了足夠多的充電樁,才有新能源車的爆發(fā)。Agent 應(yīng)用的繁榮和持續(xù)創(chuàng)新,需要足夠好的基礎(chǔ)設(shè)施來支撐。
阿里云不僅云服務(wù)在亞太地區(qū)占據(jù)最高的市場(chǎng)份額;根據(jù) IDC 的報(bào)告,它在中國(guó) AI 基礎(chǔ)設(shè)施市場(chǎng)獲得 23% 的市場(chǎng)份額,同樣排名第一。
AgentBay,不僅依托于阿里云深厚的云計(jì)算技術(shù)積累,而且基于對(duì)客戶需求的敏銳觀察打造,是支撐 Agent 應(yīng)用繁榮的基石中,最堅(jiān)實(shí)的一塊。