99国产精品久久久久久久成人,国产真实高潮太爽了,色婷婷婷丁香亚洲综合,欧美性做爰片k8,亚洲一区自拍高清亚洲精品

251天,訪談近百位從業(yè)者,關(guān)于大模型世界的 5 個(gè)現(xiàn)狀

摘要

訪談硅谷與中國(guó)近 100 位與大模型相關(guān)的創(chuàng)業(yè)者、投資人、大廠決策層后,5 個(gè)你需要了解的大模型世界觀。

 

文 |凌晨 段宛辰 黎詩(shī)韻 李源 衛(wèi)詩(shī)婕

編輯 |衛(wèi)詩(shī)婕

 

回看歷史總是充滿戲劇性。

2021 年 5 月,谷歌 I/O 大會(huì),一段由聊天機(jī)器人 LaMDA 扮演「冥王星」與人類對(duì)話的 Demo 被演示出來(lái),當(dāng)即博得現(xiàn)場(chǎng)的掌聲。此時(shí)距離谷歌定下「AI First」的目標(biāo)已經(jīng)過(guò)去六年,距離 OpenAI 震驚世界的 ChatGPT 發(fā)布還有將近 18 個(gè)月。

這個(gè)時(shí)候,谷歌仍是 AI 領(lǐng)域的先行者。但項(xiàng)目背后的兩位關(guān)鍵工程師,De Freitas 和 Shazeer 卻感到沮喪。

他們希望能夠?qū)ν庹故?LaMDA 進(jìn)入 Google 助手的案例,但多年來(lái),聊天機(jī)器人項(xiàng)目經(jīng)過(guò)多次審查,由于種種原因被禁止發(fā)布更廣泛的版本。

而此前一年,OpenAI 已經(jīng)公布了 1750 億參數(shù)的 GPT3,并開(kāi)放了 API 測(cè)試。谷歌卻因?yàn)楦鞣N「技術(shù)政治正確性」的風(fēng)險(xiǎn),遲遲不愿將對(duì)話模型的產(chǎn)品對(duì)外公開(kāi)。

De Freitas 、Shazeer 因此萌生去意,盡管 CEO Pichai 親自進(jìn)行挽留,但最終,兩人還是在 2021 年底離開(kāi)谷歌,創(chuàng)辦了 Character AI——目前 AI 大模型領(lǐng)域的獨(dú)角獸之一。

谷歌就這樣與引領(lǐng)變革的先發(fā)優(yōu)勢(shì)失之交臂。

后來(lái)的故事更加廣為流傳。2022 年底,ChatGPT 橫空出世,這不僅使 OpenAI 名聲大噪,更令其投資方微軟大殺四方,在 GPT-4 的加持下,微軟推出搜索產(chǎn)品 New Bing,劍指谷歌。不僅谷歌,整個(gè)硅谷乃至世界也都為之震動(dòng)。

轉(zhuǎn)眼 8 個(gè)月過(guò)去,大洋彼岸,OpenAI 帶來(lái)的驚異已過(guò),硅谷巨頭們已度過(guò)恐慌期,也在全新戰(zhàn)局中找到身位,創(chuàng)業(yè)公司前赴后繼,在中國(guó),百模大戰(zhàn)則又是另外一番景象。

技術(shù)商業(yè)快速變化的半年來(lái),業(yè)界關(guān)于大模型的認(rèn)知與共識(shí)也不斷更新,極客公園在與硅谷和中國(guó)近百位創(chuàng)業(yè)者、投資人、從業(yè)者交流后,總結(jié)出關(guān)于大模型創(chuàng)業(yè)的 5 個(gè)現(xiàn)狀,嘗試以此呈現(xiàn)一篇尚待驗(yàn)證的「大模型商業(yè)世界觀」。

谷歌的機(jī)遇錯(cuò)失與 OpenAI 的驚艷亮相實(shí)則提醒著我們——落后,先機(jī),時(shí)有交替。當(dāng)下的技術(shù)與商業(yè)演進(jìn)遠(yuǎn)未到終局,真正的變革甚至還未正式開(kāi)始。人們只需記住,創(chuàng)新可能隨時(shí)、隨地發(fā)生。

注:全文共 14573 字,閱讀預(yù)計(jì)需 30 分鐘左右。建議關(guān)注、收藏后觀看。

 

薛定諤的 OpenAI :所有人的英雄,也可能是所有人的敵人

當(dāng)中國(guó)創(chuàng)業(yè)圈還在將 OpenAI 視為硅谷新神時(shí),硅谷已經(jīng)悄悄開(kāi)始了對(duì) OpenAI 的祛魅。

盡管 OpenAI 實(shí)現(xiàn)了技術(shù)的突破、并且仍然是 AI 人才們趨之若鶩的地方——很多企業(yè)號(hào)稱要向 OpenAI 狙擊人才——而事實(shí)是,時(shí)至今日,OpenAI 的頂級(jí)技術(shù)人才依舊在「凈流入」。其對(duì) AGI 的信念和過(guò)去 8 年由愿景驅(qū)動(dòng)帶來(lái)的技術(shù)突破,使這家公司成為很多人眼里的英雄。

但英雄也要過(guò)日子。技術(shù)突破的下一步,是創(chuàng)造價(jià)值來(lái)創(chuàng)造商業(yè)循環(huán)。硅谷的爭(zhēng)議在于,OpenAI 真的能持續(xù)領(lǐng)先嗎?

多位硅谷創(chuàng)業(yè)者、從業(yè)者、投資人不約而同地向極客公園表達(dá)了消極的判斷。人們質(zhì)疑的是,就目前看來(lái), OpenAI 所呈現(xiàn)的商業(yè)模式存在隱憂——在「前 ChatGPT」的非共識(shí)階段,OpenAI 尚可以憑借少數(shù)人的信念贏得資源,而今 AGI 已成共識(shí),競(jìng)爭(zhēng)者眾,想要維持領(lǐng)先,挑戰(zhàn)與難度將直線上升。

如果把商業(yè)盈利模式統(tǒng)分為 toB 和 toC,前者 OpenAI 沒(méi)有 toB 基因,且勁敵當(dāng)前——在企服方面,OpenAI 的資方微軟是這個(gè)領(lǐng)域的王者,微軟系的企業(yè)聊天應(yīng)用市占率超 65%,旗下的 Teams 近年逐漸蠶食了明星公司 Slack 的市場(chǎng)。在 toB 領(lǐng)域,成立 48 年、跨越數(shù)次技術(shù)周期的微軟毫無(wú)疑問(wèn)比初創(chuàng)公司 OpenAI 積累更深。

而要想做 toB 生意,OpenAI 還面臨著中心化風(fēng)險(xiǎn)的質(zhì)疑。目前,OpenAI 面向企業(yè)所開(kāi)放的 API 模式,已經(jīng)吸引了一批客戶使用它——尤其是中小開(kāi)發(fā)者,它們無(wú)力獨(dú)立訓(xùn)練一個(gè)大模型,接入 GPT 系列的 API 成為極佳的選擇。剛剛躋身獨(dú)角獸的 Jasper.AI 就是其中最好的例子,通過(guò)接入 GPT3,Jsaper.AI 僅成立 18 個(gè)月就估值 15 億美金。

「但大家因此都不看好 Jasper.AI?!挂晃还韫戎髁骰鸬耐顿Y人告訴極客公園。私有數(shù)據(jù)是企業(yè)最重要的資產(chǎn),在目前,將私有數(shù)據(jù)接入中心化大模型首先面臨著合規(guī)與安全性的問(wèn)題——盡管 Sam Altman 在 5 月曾經(jīng)承諾,OpenAI 不會(huì)利用客戶使用 API 的數(shù)據(jù)進(jìn)行訓(xùn)練——但這既無(wú)法打消企業(yè)的疑慮,也無(wú)法獲得其信任。

「美國(guó)一些企業(yè)客戶普遍對(duì)用 OpenAI 比較擔(dān)憂?!惯@位投資人告訴我們,在企業(yè)眼中,OpenAI 最接近云時(shí)代的 AWS,但是大家又不會(huì)用面對(duì) AWS 的邏輯面對(duì)它?!缚蛻羝毡椴惶敢獍褦?shù)據(jù)和關(guān)鍵競(jìng)爭(zhēng)力交給 OpenAI,覺(jué)得會(huì)有風(fēng)險(xiǎn)」。即便 GPT 系列能夠以中心化的能力幫助垂類領(lǐng)域訓(xùn)出大模型,對(duì)客戶來(lái)說(shuō),憑此構(gòu)建的競(jìng)爭(zhēng)力也很危險(xiǎn)——這將是一種「吸星大法」:如果自己的數(shù)據(jù)和經(jīng)驗(yàn)最終也能為別人所調(diào)用,這將使行業(yè)領(lǐng)先者的競(jìng)爭(zhēng)壁壘下降。

而做 toC 呢?

看起來(lái),OpenAI 在 C 端擁有用戶優(yōu)勢(shì)。自其超級(jí)產(chǎn)品 ChatGPT 發(fā)布以來(lái),其月活一路攀升至 15 億,相比之下,Instagram 的月活也不過(guò) 20 億。不過(guò),巨大的月活卻未必能為 OpenAI 帶來(lái)數(shù)據(jù)飛輪效應(yīng)——「(通過(guò))用戶持續(xù)問(wèn)問(wèn)題來(lái)做(大模型的)training,數(shù)據(jù)價(jià)值不大。」一位創(chuàng)業(yè)者指出。

值得注意的是,自 6 月開(kāi)始,ChatGPT 的月活首次出現(xiàn)下滑。人們對(duì)此的推測(cè)包括:

  • 因?yàn)閷?duì)科技的新鮮感已經(jīng)下降——實(shí)際上 ChatGPT 的訪問(wèn)量增長(zhǎng)一直在下滑,5 月環(huán)比僅有 2.8%。

  • 學(xué)生放假導(dǎo)致學(xué)生使用量降低;

  • 以及一個(gè)更為嚴(yán)重的猜測(cè),ChatGPT 的回答質(zhì)量下降導(dǎo)致使用量下降——GPT-4 剛剛推出的時(shí)候,速度較慢而回答質(zhì)量較高,而幾周前的一次更新,有用戶反饋其回答速度增強(qiáng),但質(zhì)量有了可感的下降。

更重要的是,包括 Google 、Meta、蘋果等在內(nèi)的巨頭也將圍繞 toC 產(chǎn)品進(jìn)行發(fā)力。比如 Google 已經(jīng)重新整合了 Brain 和 Deepmind 兩個(gè)內(nèi)部團(tuán)隊(duì)以求在技術(shù)上壓制 OpenAI 的優(yōu)勢(shì)?!敢郧罢叩某笥脩粢?guī)模,一旦巨頭推出免費(fèi)產(chǎn)品,則可能沖擊 OpenAI 現(xiàn)有的訂閱收入?!筄penAI 需始終維持住其技術(shù)壁壘,一旦技術(shù)壁壘被打破,則可能輕易被巨頭以價(jià)格優(yōu)勢(shì)發(fā)起攻擊。

今天的 OpenAI,就像薛定諤的貓,難以斷言它的前路是否明朗,可以確定的是,它將會(huì)在所有巨頭密切監(jiān)視的范圍之內(nèi)。

 

最頂級(jí)的公司各選山頭,但目標(biāo)上殊途同歸

那么,硅谷的巨頭們?cè)谧鍪裁矗?/p>

極客公園與大量硅谷從業(yè)者交流后發(fā)現(xiàn),與 ChatGPT 初亮相時(shí)相比,硅谷巨頭公司的恐慌期已經(jīng)基本結(jié)束。這些商場(chǎng)老將們迅速確立了自己的山頭,并加速技術(shù)的推演,以防守好自己擅長(zhǎng)的象限,確保自己不會(huì)被顛覆。

他們一致的做法是,沿著自身已有的優(yōu)勢(shì)進(jìn)行擴(kuò)展布局,尋找大模型能為之助力、甚至可能發(fā)生顛覆式創(chuàng)新的方向,一方面加固自己的業(yè)務(wù)優(yōu)勢(shì),防范對(duì)手的突然襲擊;另一方面也為可能出現(xiàn)的新戰(zhàn)場(chǎng)埋下先手。

極客公園創(chuàng)始人兼 CEO 張鵬在不久前引發(fā)眾多關(guān)注的 AGI Playground 大會(huì)演講中,曾經(jīng)講解了這樣一個(gè)觀察。

從一個(gè)公司的價(jià)值評(píng)估角度來(lái)看,如果以服務(wù)方式帶來(lái)的邊際成本高低為橫軸(X 軸),以服務(wù)對(duì)象多少為縱軸(Y 軸)、并以平均客戶價(jià)值(客單價(jià)、ARPU值等的高低)為空間軸(Z 軸)來(lái)建立一個(gè)價(jià)值坐標(biāo)系,則會(huì)發(fā)現(xiàn),硅谷巨頭們各有各的山頭要守衛(wèi),但又有統(tǒng)一的發(fā)展趨勢(shì)逐漸確立。

邊際成本低,服務(wù)對(duì)象多、而平均客戶價(jià)值高,這三個(gè)核心能力占據(jù)兩點(diǎn)以上,往往才能自占據(jù)商業(yè)世界的最高價(jià)值。

目前,傳統(tǒng)巨頭在大模型領(lǐng)域的技術(shù)投入普遍都是在積極防御,只有微軟和英偉達(dá)在非常積極地推動(dòng)向應(yīng)用中的落地。

而目前硅谷影響力最大的新生代企業(yè),如 OpenAI、Midjounery、Character.AI 等公司,則是明顯利用了大模型技術(shù)能力,迅速打破「低邊際成本、大用戶量、高度個(gè)性化服務(wù)價(jià)值」的不可能三角——顯然,這也是 AGI 技術(shù)變革的意義:用更低的邊際成本服務(wù)更多客戶,并交付更個(gè)性化的價(jià)值,進(jìn)而獲得更高的平均用戶價(jià)值。

「目前,所有的巨頭都會(huì)努力跟上這波變革,也努力守住自己在價(jià)值地圖中的位置。而新興的企業(yè)努力的目標(biāo),則是無(wú)論你從哪個(gè)象限的位置出發(fā),都盡可能地去追求用 AGI 技術(shù)向你所在的象限,甚至是突破原有象限的向右上移動(dòng),并盡力追求更高的平均客戶價(jià)值?!箯堸i在演講中說(shuō)。

在這樣的大趨勢(shì)下,我們不妨看看硅谷巨頭們目前的狀態(tài)和決策:

 

  • 蘋果:不靠譜就不冒險(xiǎn),堅(jiān)持 toC 固基業(yè)

作為曾被寄望能實(shí)現(xiàn)電影《Her》中場(chǎng)景的蘋果,盡管今天仍未能實(shí)現(xiàn)如此深刻的人機(jī)交互,但這家向來(lái)秉承長(zhǎng)期主義的公司不會(huì)放棄——相比于通用大模型,蘋果的策略選擇基于自身的基業(yè),堅(jiān)定在 to C & 標(biāo)準(zhǔn)化的方向。

蘋果希望 AI 模型最終能在終端硬件上運(yùn)行——這需要讓模型能夠在算力較弱的環(huán)境下運(yùn)行,目前還無(wú)法達(dá)到。它對(duì) AI 的運(yùn)用也更為務(wù)實(shí):今年轟動(dòng)一時(shí)的 Vision Pro 中,蘋果利用 AI 技術(shù),使佩戴者在 FaceTime 視頻時(shí)能夠有全方位的虛擬化身。在 WWDC 上,蘋果還展示出了 autocorrect 功能,通過(guò)讓一個(gè) Transformer 架構(gòu)下的大語(yǔ)言模型在手機(jī)上運(yùn)行,以修改用戶的錯(cuò)字、并更好地預(yù)測(cè)用戶的語(yǔ)言習(xí)慣。

如果說(shuō) Vision Pro 是蘋果押注的下一代數(shù)字終端,新終端帶來(lái)新的數(shù)字內(nèi)容需求,在終端上運(yùn)行大模型則是實(shí)現(xiàn)終端內(nèi)容的技術(shù)前提。

在用大模型研發(fā) to C 產(chǎn)品上,蘋果尚未制定明確的戰(zhàn)略。這也顯示了蘋果在終端產(chǎn)品上的謹(jǐn)慎。

已經(jīng)有消息表示,蘋果在開(kāi)發(fā)新一代人工智能技術(shù):蘋果去年搭建了機(jī)器學(xué)習(xí)開(kāi)發(fā)的 Ajax 框架,并基于其構(gòu)建了類聊天機(jī)器人 AppleGPT。但是這一技術(shù)目前只被要求服務(wù)于內(nèi)部員工,比如給 AppleCare 工作人員提供支持,以更好地幫助客戶處理問(wèn)題。

蒂姆 · 庫(kù)克在 5 月份的財(cái)報(bào)電話會(huì)議上談到當(dāng)前的人工智能技術(shù)時(shí)表示,還有許多問(wèn)題需要解決。正如蘋果給到了 Vision Pro 充足的耐心,對(duì)于 AI 大模型如何進(jìn)入產(chǎn)品,目前看起來(lái)也同樣充滿耐心。

 

  • Meta:以 Llama 打造下一代「安卓」,損人且利己

社交網(wǎng)絡(luò)出身的 Meta 仍然在朝著它打出的概念——元宇宙進(jìn)發(fā)。

如果將大模型視作為下一代計(jì)算平臺(tái),Meta 正以開(kāi)源的方式挑戰(zhàn) OpenAI,目的是要成為應(yīng)用生長(zhǎng)的土壤。開(kāi)放 Llama2 商業(yè)許可,并與微軟 Azure 合作對(duì)外提供服務(wù)、與高通合作推進(jìn)在終端運(yùn)行 Llama2,這一系列動(dòng)作讓 Meta 的戰(zhàn)略布局更加明顯。通過(guò)云服務(wù),模型服務(wù)能夠向 B 端方案滲透,通過(guò)與高通合作,又能夠促進(jìn)基于終端的應(yīng)用開(kāi)發(fā)。

而在新技術(shù)提升已有業(yè)務(wù)效果上,Meta 也動(dòng)作迅速。6 月,扎克伯克宣布了全平臺(tái)產(chǎn)品整合生成式 AI 技術(shù)。此前,幫助廣告商生成文案、測(cè)試廣告效果的 AI 生成服務(wù) AI Sandbox 已經(jīng)上線,這將直接服務(wù)于 Meta 營(yíng)收核心的廣告業(yè)務(wù)。

看起來(lái),Meta 走在提供標(biāo)準(zhǔn)化模型能力的路徑上,試圖在 toB 和 toC 領(lǐng)域兩頭開(kāi)花。從其目前困境來(lái)看,不難理解背后原因——Meta 已有的超級(jí)應(yīng)用 Facebook 并不能構(gòu)成真正的護(hù)城河,從元宇宙開(kāi)始,Meta 已經(jīng)在思考布局下一代計(jì)算平臺(tái) VR 頭顯,但是創(chuàng)造一代全新計(jì)算平臺(tái)及生態(tài)的挑戰(zhàn)巨大,并且進(jìn)度上低于預(yù)期。

大模型給了 Meta 新的希望。比如在技術(shù)上 Text to Image(文轉(zhuǎn)圖)發(fā)展很快,來(lái)自硅谷的大廠技術(shù)專家們普遍認(rèn)為 Text to 3D(文轉(zhuǎn) 3D)的能力會(huì)很快速地增長(zhǎng)——這有助于 Meta 的元宇宙生態(tài)。

因此,Meta 通過(guò) Llama 來(lái)提供開(kāi)源的能力,既可以擊碎其他巨頭的技術(shù)獨(dú)占價(jià)值,也能促進(jìn)大模型技術(shù)更快地被運(yùn)用到自己的現(xiàn)有業(yè)務(wù)和元宇宙生態(tài),是一石三鳥的好機(jī)會(huì)。

 

  • 亞馬遜:持續(xù)領(lǐng)跑云服務(wù),CEO 親自掛帥「最具野心的 AI 項(xiàng)目」

亞馬遜是另一個(gè)一度被外界質(zhì)疑落后于 AI 變革的巨頭,但最新消息顯示,它正在奮起直追。

2 月,亞馬遜推出了自家的開(kāi)源大模型 mm-cot,盡管在模型架構(gòu)上,創(chuàng)新地提出了包含視覺(jué)特征的思維鏈,但在層出不窮的開(kāi)源模型社區(qū),并沒(méi)有引起太大水花。而截至發(fā)稿前,據(jù)外媒 Insider 最新報(bào)道稱,亞馬遜 CEO Andy Jassy 目前正親自帶隊(duì),該團(tuán)隊(duì)負(fù)責(zé)開(kāi)發(fā)該公司最具野心的 AI 項(xiàng)目。

作為云服務(wù)的領(lǐng)跑者,占有 48.9% 市場(chǎng)份額的亞馬遜在 B 端有著絕對(duì)的客戶優(yōu)勢(shì)。因此,圍繞 B 端,自 4 月以來(lái),亞馬遜推出了大模型服務(wù) Amazon Bedrock,其中既包括自研的大模型,也與 AI21 Labs、Anthropic、Stability AI 等基礎(chǔ)模型提供商廣泛合作,助力企業(yè)輕松靈活構(gòu)建生成式 AI 應(yīng)用,降低所有開(kāi)發(fā)者的使用門檻。

此外,為了抑制和解決 AI「一本正經(jīng)地胡說(shuō)八道」,亞馬遜還打造了 Amazon Titan 基礎(chǔ)大模型,它可以識(shí)別和刪除客戶提交給定制模型的數(shù)據(jù)中的有害內(nèi)容,過(guò)濾模型中不當(dāng)內(nèi)容的輸出結(jié)果。

同時(shí),亞馬遜業(yè)務(wù)的根本——提供算力,仍然是大模型時(shí)代的「剛需」。

即使在大模型時(shí)代技術(shù)棧會(huì)發(fā)生變化,云服務(wù)依舊是計(jì)算的底層支撐,AWS 需要更好地嵌入新的技術(shù)棧。而新繁榮的模型工具層,諸如 DataBricks、BentoML 等都會(huì)選擇和云平臺(tái)合作,分享收益。

4 月,亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)宣布與 Stability AI 和 Hugging Face 等人工智能公司建立合作伙伴關(guān)系,這將允許其他公司使用亞馬遜的基礎(chǔ)設(shè)施來(lái)構(gòu)建人工智能產(chǎn)品。此外,AWS 還投資 1 億美元建立 AWS 生成式 AI 創(chuàng)新中心(AWS Generative AI Innovation Center),該中心將把客戶與公司的人工智能和機(jī)器學(xué)習(xí)專家聯(lián)系起來(lái)。他們將幫助醫(yī)療保健、金融服務(wù)和制造業(yè)的一系列客戶使用新技術(shù)構(gòu)建定制應(yīng)用程序。

而在 AI 領(lǐng)域深耕 20 年的亞馬遜,目前看來(lái)其野心并不甘落于微軟和谷歌之后,也不甘心只坐守 B 端優(yōu)勢(shì)與成果。在 B 端之外,亞馬遜似乎也在發(fā)力 C 端;同時(shí),除了去中心化地提供模型能力賦能,亞馬遜也在打造中心化的大模型——這也是 Andy Jassy 親自掛帥的目的。

 

  • 微軟:手握王牌,B 可攻、C 可守

作為 OpenAI 的投資方,借前者的技術(shù)能力與影響力,微軟在 B 端和 C 端都極早開(kāi)始布局——在 B 端,微軟獲得了布局云平臺(tái)新技術(shù)棧的先機(jī),同時(shí)將來(lái)自 OpenAI、Meta 的模型接入云服務(wù),以期切走云市場(chǎng)更大的蛋糕。而在 C 端,微軟則開(kāi)始打造前端產(chǎn)品、用大模型做 Copilot :如在自身的強(qiáng)勢(shì)產(chǎn)品 Office 365 中上線 AI 的新功能、將 OpenAI 的大模型接入 Bing 搜索中,發(fā)布 New Bing 產(chǎn)品,成為第一批大模型成熟產(chǎn)品的典型。

B 端與 C 端的雙線推進(jìn),不僅鞏固了微軟原有的 toB 優(yōu)勢(shì),同時(shí)也加固自己的壁壘以防他人顛覆。

此外,在更底層的硬件層面,微軟也對(duì) AWS 等云服務(wù)廠商發(fā)起了攻擊。在更底層的硬件層面,微軟也從 2019 年在內(nèi)部開(kāi)始研發(fā)代號(hào)為「雅典娜」的 AI 芯片,這些芯片正式為訓(xùn)練大語(yǔ)言模型等軟件而設(shè)計(jì),同時(shí)可支持推理,為基于大模型的軟件提供算力。初代產(chǎn)品基于 5 納米工藝,微軟也已規(guī)劃了未來(lái)幾代芯片產(chǎn)品。

據(jù)了解,微軟依舊在擴(kuò)大數(shù)據(jù)中心、采買芯片,能夠看出,為了延伸目前自身的優(yōu)勢(shì),微軟做了充分的技術(shù)布局,但挑戰(zhàn)在于,接下來(lái)能否在市場(chǎng)化上得到驗(yàn)證。

最新截止 6 月 30 日的第四季度財(cái)報(bào)顯示,截至 6 月底,Azure OpenAI 擁有 1.1 萬(wàn)用戶,和 5 月末的 0.45 萬(wàn)相比出現(xiàn)大幅增長(zhǎng)。智能云業(yè)務(wù)營(yíng)收盡管在上漲,但較上一季度增速在放緩。此外,微軟在 7 月中旬,將 Microsoft 365 Copilot 的價(jià)格設(shè)定為每月每戶 30 美元,這被視為增加收入的方式。

目前看來(lái),微軟不僅牢牢守住了自身的產(chǎn)品壁壘,也為自己開(kāi)拓了全新的賽道和利潤(rùn)來(lái)源。但能否守住大模型時(shí)代的先發(fā)優(yōu)勢(shì),有待進(jìn)一步商業(yè)化驗(yàn)證。

 

  • 谷歌 :不能被低估的巨頭,奮起直追防閃擊

ChatGPT 橫空出世后,微軟立即與 ChatGPT 聯(lián)手推出 New Bing——因?yàn)閾?dān)心 GPT4 加持的 New Bing 將動(dòng)搖谷歌搜索引擎的根基,Google 選擇在 2 月份倉(cāng)促應(yīng)戰(zhàn)——發(fā)布 Bard,給外界留下了大亂陣腳的印象,也影響到了人才的流出和資本市場(chǎng)的信心。

然而最新的二季度財(cái)報(bào)顯示的超預(yù)期增長(zhǎng),加之此前 I/O 大會(huì)上所展示的全面技術(shù)布局,又成功讓外界對(duì)其重拾信心。

這似乎也印證了,在已存在的市場(chǎng),想利用范式革命顛覆當(dāng)下的巨頭,沒(méi)那么容易。

早在 2015 年,Google 就定下了 AI First 的目標(biāo)。但因內(nèi)部原因,錯(cuò)過(guò)了引領(lǐng)生成式 AI 的機(jī)會(huì)。Bard 之后,谷歌將背后的支持模型從輕量級(jí)的對(duì)話模型 LamDA 換成了 Google 自研的 PaLM 模型。今年 5 月,Google 發(fā)布了升級(jí)版的 PaLM2 模型,并一次性在包括 Gmail,Google Maps 等多個(gè)產(chǎn)品中添加了生成式 AI 帶來(lái)的新功能,在 C 端標(biāo)準(zhǔn)化產(chǎn)品方面十分積極。其中,最吸引外界關(guān)注的是兩項(xiàng):PaLM2 能夠在端側(cè)運(yùn)行的輕量級(jí)版本 Gecko,以及正在研發(fā)中的 Gemini 多模態(tài)模型。

當(dāng)然,谷歌在 C 端擁有的強(qiáng)勢(shì)基因,這項(xiàng)優(yōu)勢(shì)也被認(rèn)為可能掣肘其在 B 端的探索——事實(shí)上,谷歌也將在 B 端發(fā)力:除了谷歌 TPU 外,新增基于英偉達(dá) H100 的 A3 AI 超算,以及面向企業(yè)的 AI 平臺(tái) vertex AI。

對(duì)谷歌而言,當(dāng)下的局勢(shì)無(wú)疑是危險(xiǎn)的。在大模型時(shí)代,搜索這個(gè)領(lǐng)域必將被許多對(duì)手涉足,身為搜索巨頭,谷歌隨時(shí)可能被狙擊,做好防守是它的死門。

極客公園了解到,經(jīng)過(guò)年初的慌亂,巨頭已經(jīng)平靜下來(lái),開(kāi)始了自己的動(dòng)作。4 月,谷歌將 Deep Mind 與 Google Brain 合并重組為 Google DeepMind,由堅(jiān)信 AGI 的 DeepMind 聯(lián)合創(chuàng)始人 Demis Hassabis 擔(dān)任部門領(lǐng)導(dǎo),原 Google Brain 負(fù)責(zé)人 Jeff Dean 出任谷歌首席科學(xué)家——這樣的架構(gòu)調(diào)整不僅可以進(jìn)一步聚集資源,更可以窺見(jiàn)谷歌追趕的決心。

合并后的 Google DeepMind 以及 Google Research,目標(biāo)是攻克多個(gè)人工智能關(guān)鍵項(xiàng)目,其中第一個(gè)即為多模態(tài)模型。有消息傳出,谷歌正在用 Youtube 的視頻數(shù)據(jù)訓(xùn)練 Gemini。鑒于大模型的下一個(gè)關(guān)鍵技術(shù)將是多模態(tài),這增加了谷歌是否會(huì)領(lǐng)先的猜測(cè)。

畢竟,谷歌擁有 30 億級(jí)用戶,在一年幾百億美金收入的前提下,也擁有強(qiáng)大的技術(shù)能力——這使得它即便反應(yīng)不足夠快,但只要在技術(shù)上不落后,也能利用規(guī)模優(yōu)勢(shì)守住自己的安全城池。

縱觀巨頭的商業(yè)布局,極客公園經(jīng)廣泛交流后總結(jié)出幾個(gè)結(jié)論:

  • 巨頭間的恐慌期已經(jīng)結(jié)束,紛紛重新瞄準(zhǔn)了自己的目標(biāo),核心是維持自己在產(chǎn)業(yè)的最高位,同時(shí),如果有機(jī)會(huì)對(duì)競(jìng)爭(zhēng)對(duì)手進(jìn)行攻擊,自然也不會(huì)錯(cuò)過(guò)。
  • 在大模型這波范式革命前,理論上,任意一家成熟公司利用好大模型則可能具備對(duì)巨頭發(fā)起閃擊戰(zhàn)的能力,而任何一個(gè)巨頭如果不能快速行動(dòng),將大模型融入產(chǎn)品,則面臨著被降維偷襲的風(fēng)險(xiǎn)——如微軟搜索之于谷歌搜索,微軟云服務(wù)之于亞馬遜云服務(wù)。大模型帶來(lái)的可能性廣闊而未知,此前確立的商業(yè)邊界會(huì)重新模糊。
  • 巨頭訓(xùn)練自己的中心化大模型的目的,與 OpenAI 所常常談到的「達(dá)到 AGI」不同,其戰(zhàn)略意義更多出于防守。除了業(yè)務(wù)與 Chatbox(聊天機(jī)器人)強(qiáng)相關(guān)的 Google,各家未必強(qiáng)求訓(xùn)練出一個(gè)世界頂尖的 ChatGPT 形態(tài)的產(chǎn)品,更在意的是使用大模型防守自己的業(yè)務(wù),具備反閃擊戰(zhàn)的能力。
  • 但由于技術(shù)尚在發(fā)展中,想利用大模型發(fā)起閃擊戰(zhàn)顛覆對(duì)手,或者用大模型本身規(guī)模化獲益,也遠(yuǎn)沒(méi)有想象中容易:微軟自今年 2 月份推出 New Bing 后,曾一度被認(rèn)為流量增長(zhǎng)超過(guò)了谷歌,但 4 月以來(lái),有報(bào)告顯示,必應(yīng)的搜索份額不升反降,截止 7 月,谷歌搜索的地位并沒(méi)有被撼動(dòng)的趨勢(shì)。而一位計(jì)劃用大模型服務(wù) toB 領(lǐng)域的創(chuàng)業(yè)者告訴極客公園,巨頭想用大模型提供標(biāo)準(zhǔn)化服務(wù),也一定程度會(huì)陷入激烈競(jìng)爭(zhēng):以他所在的 SaaS 公司為例,其后臺(tái)接入多個(gè)大模型(語(yǔ)言模型、翻譯模型等)——OpenAI、Google、開(kāi)源模型等,「讓他們卷價(jià)格和性能去吧」,這位創(chuàng)業(yè)者這樣說(shuō)道。
  • 此外,大模型時(shí)代的硅谷,「Brain Drain(人才流失)is very real」。多個(gè)從業(yè)者告訴極客公園。無(wú)論從歷史還是當(dāng)下,任何巨頭不能使用大模型構(gòu)建出有競(jìng)爭(zhēng)力的業(yè)務(wù),頂級(jí)的 AI 工程師就會(huì)很快流失。早在 2022 年,因?yàn)?Meta 專注于元宇宙概念,曾被曝出多個(gè)資深 AI 專家跳槽,倫敦分部幾乎全部垮掉。OpenAI 早期更是從 Google 挖走了一百多人來(lái)擴(kuò)展業(yè)務(wù)。而離開(kāi)一家公司的頂級(jí) AI 程序員,在短期內(nèi)基本不可能回流。
  • 最后,AGI 時(shí)代的云計(jì)算仍是絕對(duì)的巨頭賽場(chǎng)——云計(jì)算本身就是巨頭的生意,而訓(xùn)練大模型需要巨大的算力。正如同淘金熱下,掙錢的將是賣鏟子的人——大模型底層和應(yīng)用均有較高不確定的當(dāng)下,云廠商一定會(huì)從中獲得利潤(rùn),在當(dāng)下,如何提供「更優(yōu)質(zhì)的云服務(wù)」,比如用更低的算力優(yōu)化計(jì)算結(jié)果、滿足模型訓(xùn)練的需求與場(chǎng)景,將是巨大的優(yōu)勢(shì)。

 

中間層的繁榮,才能把應(yīng)用「抬進(jìn)」大模型時(shí)代

對(duì)于創(chuàng)業(yè)公司而言,一名硅谷創(chuàng)業(yè)者告訴我們,「美國(guó)現(xiàn)在是中間層在繁榮,已經(jīng)幾乎沒(méi)有新的創(chuàng)業(yè)者要做下一個(gè)OpenAI了?!?/span>

所謂中間層,是指要將大模型融合到應(yīng)用,中間所需的一系列工程能力、AI 能力,由此需求出發(fā),涌現(xiàn)出的一批「工具棧」——如開(kāi)發(fā)工具鏈(如 Langchain)、模型工具鏈(做數(shù)據(jù)標(biāo)注、向量數(shù)據(jù)庫(kù)、分布式訓(xùn)練等)。

「這類公司通常干的是苦活累活」,與此同時(shí),由于業(yè)務(wù)壁壘淺(不是完成技術(shù)的從 0 到 1,而是完成 1 到 100),「中間層」最易受到上下游(大模型和應(yīng)用)的擠壓——比如誕生于 2022 年 10 月的 LangChain,你可以將其理解為程序員的工具庫(kù),因其能夠幫助普通人(企業(yè))構(gòu)建大模型應(yīng)用,為他們提供過(guò)程中所需的工具組件和任務(wù)集(LangChain 封裝了大量 LLM 應(yīng)用開(kāi)發(fā)邏輯和工具),因而迅速崛起。但最近半年來(lái),眼看著大模型的能力一再進(jìn)化,并開(kāi)放了插件,LangChain 的價(jià)值也受到?jīng)_擊。

但極客公園在走訪美國(guó)硅谷調(diào)研后發(fā)現(xiàn),與年初投資人們的消極判斷不同,鑒于巨頭們都在入場(chǎng)中心化大模型,這為中間層提供了巨大的機(jī)遇,在海外,中間層正在蓬勃發(fā)展。

正如云計(jì)算時(shí)代,Snowflake(基于底層云計(jì)算構(gòu)建了它的數(shù)據(jù)庫(kù) PaaS 平臺(tái)) 和 AWS 相互成就一樣。大模型時(shí)代,中間層和底層算力平臺(tái)(及基礎(chǔ)大模型)也正在相互成就。這是因?yàn)樗懔ζ脚_(tái)的最終消費(fèi)者是應(yīng)用程序公司,而中間層的公司正在幫助做應(yīng)用的公司快速部署大模型,這進(jìn)一步增加了底層云計(jì)算資源的消耗。

換句話說(shuō),中間層的繁榮,直接決定了底層云計(jì)算的「管道」能開(kāi)多大,同時(shí)也是上層應(yīng)用生態(tài)得以百花齊放的條件。在硅谷,中間層的一批公司正站在各自不同生態(tài)位上,把應(yīng)用層「抬」進(jìn)大模型時(shí)代,在這過(guò)程中,中間層自身也捕獲了更大的價(jià)值。

他們是怎么做的?

 

Databricks 的信仰之躍:13 億美元收購(gòu) Mosaic,數(shù)據(jù)平臺(tái)搖身變?yōu)?/span>AI平臺(tái)

原本,數(shù)據(jù)領(lǐng)域的格局一經(jīng)確立、就難以松動(dòng):尤其是來(lái)自集中度高的行業(yè)客戶,極其注重其數(shù)據(jù)的安全性與私密性,以維持自身的競(jìng)爭(zhēng)壁壘。在海外,除了三大云廠商,Snowflake 和 Databricks 在數(shù)據(jù)領(lǐng)域做得最好。這樣的格局恒久穩(wěn)定,除非一次革命性的技術(shù)躍遷,否則,數(shù)據(jù)領(lǐng)域的客戶很難遷移——大模型時(shí)代帶來(lái)了這次機(jī)會(huì)。

Databricks 抓住了這次機(jī)會(huì)。

成立于 2016 年的 Databricks 本是一個(gè)數(shù)據(jù) + 人工智能的開(kāi)發(fā)平臺(tái),因其早期數(shù)據(jù)湖的主張和布局(數(shù)據(jù)湖對(duì) AI 能力要求更高),積累了一定 AI 能力。生成式 AI 爆火后,Databricks 通過(guò)一系列行動(dòng),迅速補(bǔ)上了大模型相關(guān)能力,這些行動(dòng)包括:收購(gòu) Okera(數(shù)據(jù)治理平臺(tái))、發(fā)布 Dolly 系列開(kāi)源模型、以及最重要的,以 13 億美金收購(gòu)開(kāi)源大模型企業(yè)平臺(tái) MosaicML。

13 美金的收購(gòu)象征了 Databricks 的決心。這家公司比對(duì)手們更早意識(shí)到,在集中度強(qiáng)的行業(yè),企業(yè)一定傾向于部署一個(gè)私有的大模型。

現(xiàn)在的 Databricks 不僅僅是一個(gè)數(shù)據(jù)倉(cāng)庫(kù),一個(gè)數(shù)據(jù)湖,還提供 AI 訓(xùn)練、模型管理等一整套服務(wù)。日前,他們發(fā)布了自然語(yǔ)言驅(qū)動(dòng)的數(shù)據(jù)訪問(wèn)工具——LakehouseIQ,宣布提供開(kāi)源 LLM 庫(kù)——Databricks Marketplace,以及 AutoML(一種自動(dòng)化機(jī)器學(xué)習(xí)技術(shù))能力——Lakehouse AI。

這些工具與服務(wù)意味著,企業(yè)或個(gè)人能夠更輕松地接入公司數(shù)據(jù),用自然語(yǔ)言就能進(jìn)行數(shù)據(jù)分析。

過(guò)去一個(gè)月,不少行業(yè)人士認(rèn)為,接下來(lái),數(shù)據(jù)或許是軟件公司利用大模型做出差異化最重要的因素——前提是算力成本的降低、開(kāi)源模型的進(jìn)步,以及模型部署服務(wù)的滲透。也因此,數(shù)據(jù)領(lǐng)域上下游的中間層公司,如 Databricks,將占據(jù)更重要的位置。

近日,Databricks 公布了一個(gè)數(shù)字:過(guò)去 30 天,在其平臺(tái)上訓(xùn)練 Transformer 模型的客戶超過(guò) 1500 家。這驗(yàn)證了在當(dāng)下,中間層公司所面對(duì)的蓬勃需求。

據(jù)極客公園了解,Databricks 的毛利率高達(dá)百分之六七十——一位大模型創(chuàng)業(yè)者指出,Databricks 通過(guò)購(gòu)買多家云廠商(微軟、AWS 等)的算力,并疊加自身的 AI 訓(xùn)練、模型管理、數(shù)據(jù)管理等服務(wù),以更高的價(jià)格打包出售,是其高利潤(rùn)的原因,「本質(zhì)上是賺算力的錢?!?/p>

而 Databricks 聯(lián)合創(chuàng)始人辛湜告訴極客公園,幫助客戶部署 AI 或者大模型的有很多,但數(shù)據(jù)平臺(tái)有天然的優(yōu)勢(shì)——「數(shù)據(jù)在這里」,AI 平臺(tái)首先要是一個(gè)數(shù)據(jù)平臺(tái),才可以長(zhǎng)久。

 

Scale AI:千金難買精標(biāo)數(shù)據(jù),效率為王

簡(jiǎn)單來(lái)說(shuō),收集、策劃和清洗數(shù)據(jù)集是模型生產(chǎn)中最大的挑戰(zhàn)。

大模型創(chuàng)業(yè)潮中,大多數(shù)企業(yè)在模型生產(chǎn)中花時(shí)間最多、花金錢最多、花精力最多,遇到困難最多的,是整理數(shù)據(jù),做數(shù)據(jù)的特征工程、特征轉(zhuǎn)化。

(圖注:據(jù) AI Infrastructure Alliance 在 2022 年的年度調(diào)查顯示,收集、策劃和清洗數(shù)據(jù)集是模型生產(chǎn)中最大的挑戰(zhàn)。)

如今數(shù)據(jù)領(lǐng)域風(fēng)頭最盛的 Scale AI 創(chuàng)立于 2016 年,最初主要為無(wú)人車提供數(shù)據(jù)標(biāo)注服務(wù),后來(lái)逐漸積累了包括電商、短視頻甚至政府機(jī)構(gòu)的客戶。過(guò)程中,它積累了 1000 人的科技管理團(tuán)隊(duì),幾十萬(wàn)來(lái)自全球的長(zhǎng)期外包人員和嚴(yán)格的驗(yàn)收體系。這些積累使得它在大模型時(shí)代快速轉(zhuǎn)身,為企業(yè)提供 RLHF 的微調(diào)業(yè)務(wù)。目前,硅谷頂尖的 AI 公司,包括 OpenAI,Cohere,Inflection AI 都是它的客戶。

2016 年,19 歲的華裔創(chuàng)始人 Alexandr Wang 已經(jīng)有了兩年工程師經(jīng)驗(yàn)。在硅谷的當(dāng)紅公司、美國(guó)知乎 Quora,他看到了硅谷科技大公司在和遠(yuǎn)程的外包人員合作上的效率痛點(diǎn),于是,大一的他從 MIT 輟學(xué)創(chuàng)立了 Scale AI。

傳統(tǒng)大廠做數(shù)據(jù)標(biāo)注時(shí),欠缺的并不是技術(shù),而更多的是對(duì)外包人員的即時(shí)反饋和管理。在數(shù)據(jù)量龐大的情況下,外包人員的數(shù)量會(huì)非常龐大,許多大廠會(huì)再找埃森哲這樣的公司去替它們管理外包人員。這在無(wú)形之中使得外包人員、提供數(shù)據(jù)標(biāo)注軟件的工程師、以及真正需要數(shù)據(jù)訓(xùn)練模型的算法工程師——三者之間的溝通不暢。企業(yè)支付的價(jià)格很高,但數(shù)據(jù)標(biāo)注質(zhì)量卻并不高。

Scale AI 的專長(zhǎng)是利用超規(guī)格的工程團(tuán)隊(duì)和高素質(zhì)的外包管理人員,解決數(shù)據(jù)標(biāo)注的效率和成本問(wèn)題。他們?cè)谌蛘心纪獍藛T進(jìn)行數(shù)據(jù)標(biāo)注,同時(shí)將總部設(shè)在硅谷,雇傭高質(zhì)量的硅谷工程師根據(jù)企業(yè)任務(wù)快速構(gòu)建新的數(shù)據(jù)標(biāo)注平臺(tái),再根據(jù)外包人員的反饋及時(shí)對(duì)平臺(tái)的功能做出調(diào)整。并通過(guò)全球化的招募系統(tǒng),將價(jià)格降到最低——相比于美國(guó)大廠為了保證反饋需要在國(guó)內(nèi)招人標(biāo)注,Scale AI 可以根據(jù)任務(wù)難度,將簡(jiǎn)單的任務(wù)分發(fā)給發(fā)展中國(guó)家的數(shù)據(jù)標(biāo)注員,同時(shí)只需支付當(dāng)?shù)氐淖畹凸べY。

這又是一家快速轉(zhuǎn)身抓住機(jī)會(huì)的公司。據(jù)極客公園了解,Scale AI 最初在 RLHF 方面并沒(méi)有太深的積累,但是通過(guò)過(guò)去數(shù)據(jù)標(biāo)注方面的積累和極強(qiáng)的工程能力,公司迅速開(kāi)發(fā)出了適合 RLHF 標(biāo)注的軟件。

借大模型的東風(fēng),Scale AI 預(yù)計(jì)今年業(yè)務(wù)將增長(zhǎng)一倍,據(jù)悉毛利在 60% 左右。今年初,首席執(zhí)行官 Alexandr Wang 在推特上表示,他預(yù)測(cè) AI 實(shí)驗(yàn)室很快就會(huì)在人類標(biāo)注數(shù)據(jù)上花費(fèi)與底層算力同等量級(jí)的數(shù)十億美元。

承接硅谷模型水平最高的客戶和擁有最高數(shù)據(jù)標(biāo)注吞吐量,利用這些優(yōu)勢(shì),Scale AI 進(jìn)一步提供了 Evaluation 和 api 服務(wù)。前者可以為訓(xùn)練模型的企業(yè)提供人工測(cè)試、給出客觀的建議;后者則可以讓企業(yè)自行接入模型,對(duì)模型進(jìn)行特定業(yè)務(wù)能力的測(cè)試。

自成立以來(lái),這家提供數(shù)據(jù)標(biāo)注服務(wù)的公司已經(jīng)經(jīng)歷了兩次大方向的調(diào)整,但只要數(shù)據(jù)時(shí)代不斷發(fā)展,永遠(yuǎn)會(huì)有新的長(zhǎng)尾數(shù)據(jù)需要數(shù)據(jù)標(biāo)注。這決定了這樣的公司將被持續(xù)需要。

 

Hugging Face 崛起:開(kāi)源、GPT4 的對(duì)手和百花齊放的企業(yè)模型

無(wú)論是期待拉平 OpenAI 的大模型能力,還是企業(yè)想擁有基于自己的數(shù)據(jù)精調(diào)大模型,開(kāi)源,都被寄予厚望——這導(dǎo)致了 Hugging Face 的崛起。

Hugging Face 是一個(gè)專門針對(duì)機(jī)器學(xué)習(xí)的開(kāi)源平臺(tái)和社區(qū),在當(dāng)下則被視為大模型領(lǐng)域的 Github。截止極客公園發(fā)稿前,Hugging Face 上擁有超過(guò) 27 萬(wàn)的模型,超過(guò)四萬(wàn)八千個(gè)數(shù)據(jù)集。而僅僅一個(gè)多月前,這個(gè)數(shù)據(jù)還是 21 萬(wàn)多個(gè)訓(xùn)練模型和三萬(wàn)八千個(gè)數(shù)據(jù)集。增長(zhǎng)速度十分驚人,其流行程度可見(jiàn)一斑。

成立之初,Hugging Face 只是一個(gè)做聊天機(jī)器人的創(chuàng)業(yè)公司,因?yàn)楣緲I(yè)務(wù)需要,一直關(guān)注 NLP 技術(shù)。Transformer 架構(gòu)剛剛出現(xiàn)時(shí),研究者想要接入大模型的成本很高,因?yàn)橐淮沃貙懛桨傅姆窒?/span>(Hugging Face 分享了自己將基于 tensorflow 實(shí)現(xiàn)的 BERT 模型用 pytorch 進(jìn)行了重寫的方案),Hugging Face 受到了極大的關(guān)注。此后,在 Github 中由 Hugging Face 創(chuàng)建的 Transformers 庫(kù)里,不斷有其他研究者在其中添加自己的開(kāi)源模型。很快,Transformers 庫(kù)很快成為 GitHub 增長(zhǎng)最快的項(xiàng)目,Hugging Face 也轉(zhuǎn)身開(kāi)始創(chuàng)建自己的開(kāi)源平臺(tái)。

Hugging Face 的中國(guó)區(qū)負(fù)責(zé)人王鐵震告訴極客公園,在技術(shù)上,Hugging Face 針對(duì) AI 的特點(diǎn)做了許多優(yōu)化,比 GitHub 更適合 AI。例如 :

  • Hugging Face 支持大文件的上傳。
  • 免費(fèi)提供 hosting,免費(fèi)提供全球 CDN 的 deliver。
  • 開(kāi)發(fā)者在 Hugging Face 平臺(tái)可以做版本控制以及開(kāi)源協(xié)作,可使用交互式的方式直接展示模型效果,還可以一鍵部署,快速將模型部署到亞馬遜云上使用起來(lái)。

文化上,Hugging Face 也做了許多細(xì)致的、ROI 并不高的工作,來(lái)培養(yǎng)開(kāi)源社區(qū)的氛圍。比如對(duì)第一次來(lái)貢獻(xiàn)代碼的開(kāi)發(fā)者進(jìn)行非常細(xì)致的輔導(dǎo)。

從早期主要思考如何幫助研究者快速部署模型,Hugging Face 逐步向工業(yè)界發(fā)展,開(kāi)始嘗試提供更多的工具,讓企業(yè)能夠更快速地用上一個(gè)學(xué)術(shù)界發(fā)布的新模型。

現(xiàn)在,通過(guò) Hugging Face,企業(yè)不但可以直接通過(guò) API 接入大模型的能力,也可以通過(guò)上傳自己的數(shù)據(jù),由 Hugging Face 在多種不同的模型和訓(xùn)練方法上,找到最適合企業(yè)的那一個(gè),直接訓(xùn)練一個(gè)屬于企業(yè)自己的大模型。

Hugging Face 沒(méi)有特別披露過(guò)它的營(yíng)收狀態(tài),但據(jù)福布斯披露,在 2022 年,Hugging Face 已接近盈虧平衡,擁有了英特爾、 eBay、輝瑞、彭博社等超過(guò)一千家客戶,2023 年乘上大模型浪潮,客戶只會(huì)更多。最新報(bào)道稱,Hugging Face 的估值可達(dá) 40 億美金。

除了為大公司提供高附加值的定制服務(wù),如果開(kāi)源大模型繼續(xù)發(fā)展,成為行業(yè)的主流,那么擁有幾十萬(wàn)個(gè)開(kāi)源大模型的 Hugging Face,也完全有能力為中小開(kāi)發(fā)者提供標(biāo)準(zhǔn)化的產(chǎn)品。

 

Moveworks:用 Copilot 再造「受大模型沖擊最大的」RPA 賽道

RPA(Robotic process automation),即機(jī)器人流程化自動(dòng)化,意為借由機(jī)器人和 AI,無(wú)需使用人員具備任何代碼知識(shí),通過(guò)拖拉拽,即可快速構(gòu)建一個(gè)「可自動(dòng)化執(zhí)行的流程」。

事實(shí)上,RPA 是無(wú)代碼的一種,顧名思義,這意味不需要寫代碼就可以運(yùn)行程序,約等于用自然語(yǔ)言進(jìn)行軟件交互,這正是大語(yǔ)言模型最擅長(zhǎng)的事情。因此,RPA 也被視為最容易被大模型顛覆的賽道。

過(guò)去,Moveworks 這一公司深耕于 RPA 賽道。2016 年,Moveworks 創(chuàng)始人意識(shí)到,AI聊天機(jī)器人的潛力,可以在沒(méi)有人工參與的情況下,解決很大一部分員工的支持問(wèn)題。聊天機(jī)器人背后的模型可以為員工提供自助服務(wù),以解決常見(jiàn)請(qǐng)求。

最初,Moveworks 解決了員工的 IT 支持問(wèn)題。2021 年 3 月后,Moveworks 擴(kuò)展了其員工服務(wù)平臺(tái),以解決涉及其他業(yè)務(wù)線的問(wèn)題,包括人力資源、財(cái)務(wù)和其他設(shè)施。Moveworks 還發(fā)布了一個(gè)內(nèi)部通信解決方案,允許公司領(lǐng)導(dǎo)向員工發(fā)送交互式信息。

員工與 Moveworks 聊天機(jī)器人交談,提交他們的請(qǐng)求,Moveworks 對(duì)其進(jìn)行分析,然后通過(guò)與其他軟件應(yīng)用程序的集成來(lái)解決這些請(qǐng)求,包括:打通企業(yè)級(jí)系統(tǒng)的 API 和本地服務(wù)部署的系統(tǒng)(agent),和打通知識(shí)庫(kù)系統(tǒng)。

在大模型到來(lái)后,這家公司也完成了快速升級(jí),從企業(yè)內(nèi)的聊天機(jī)器人發(fā)展為幫助企業(yè)客戶做 copilot,通過(guò)對(duì)話來(lái)連接人和軟件系統(tǒng)。「在未來(lái),公司的人力資源部可能變成模型資源部?!?/span>一位接近 Moveworks 的人士表示。這也為大模型時(shí)代的公司管理及雇傭、協(xié)作方式提出了新的想象。

 

Sambanova 的狂想:軟硬件全棧體系,挑戰(zhàn)英偉達(dá)!

硅谷的投資人覺(jué)得它的產(chǎn)品不錯(cuò),而創(chuàng)業(yè)者們覺(jué)得它是瘋子——成立于 2021 年的 Sambanova 充滿爭(zhēng)議。

原因在于,一家 500 人的公司既在做芯片、也在做模型,同時(shí)還要將模型部署到企業(yè)。號(hào)稱要提供全棧服務(wù)的 Sambanova 目前已經(jīng)募集了 6 輪共計(jì) 11 億美元融資,估值 51 億。最近一輪 6 融資為 6.76 億美元,于 2021 年 4 月由軟銀愿景基金 2 領(lǐng)投,淡馬錫和新加坡政府投資公司跟投。投資方還有英特爾資本、 GV (前谷歌風(fēng)投)、貝萊德基金等。

這家公司認(rèn)為,伴隨著人工智能崛起,需要與之匹配的新型計(jì)算系統(tǒng)。CPU 和 GPU 這樣傳統(tǒng)的馮·諾伊曼架構(gòu)處理器傾向于指令流(flow of instructions),而非數(shù)據(jù)流(flow of data)。在這樣的架構(gòu)中,人們難以控制緩存數(shù)據(jù)的位置,也就幾乎難以控制數(shù)據(jù)如何在系統(tǒng)中移動(dòng)。

為此,Sambanova 以軟件的視角重新定義硬件?!赶?GPT-3 這樣的大模型,需要串聯(lián)上千塊 GPU 進(jìn)行訓(xùn)練、運(yùn)行。」CEO Rodrigo Liang 說(shuō)過(guò),這帶來(lái)了企業(yè)使用大模型的門檻。這家公司的愿景是消除這種門檻——通過(guò)提供包括硬件設(shè)計(jì)、軟件構(gòu)建、模型預(yù)訓(xùn)練和部署在內(nèi)的服務(wù),減少企業(yè)使用 AI 模型的復(fù)雜度和人力投入。

公司的三位聯(lián)合創(chuàng)始人皆擁有出色的學(xué)術(shù)背景:其中兩位為斯坦福大學(xué)教授——Kunle Olukotun 是多核處理器設(shè)計(jì)的先驅(qū),另一位為機(jī)器學(xué)習(xí)教授 Christopher Ré。CEO Rodrigo Liang 此前為甲骨文公司的工程主管——這為其大膽愿景提供了幾分說(shuō)服力,畢竟,Sambanova 號(hào)稱將英偉達(dá)視為對(duì)手。

Sambanova 稱,在其全棧系統(tǒng)設(shè)備 SambaNova Suite 上部署企業(yè)模型的成本,與 Nividia+Azure 云服務(wù)的方案相比,僅是其 30 分之一。公司的目標(biāo)客戶是希望結(jié)合內(nèi)部數(shù)據(jù),定制千億級(jí)別規(guī)模參數(shù)以上的中大型企業(yè)和政府組織。目前,咨詢公司埃森哲已宣布成為其客戶,而更早之前,美國(guó)能源部的阿貢國(guó)家實(shí)驗(yàn)室 (ArgonneNationalLabs) 也是其早期客戶,購(gòu)買了其 DataScale 系統(tǒng)。

 

應(yīng)用層的窘境:熱度最高,但還未真正「起跑」

一場(chǎng)技術(shù)變革能夠真正抵達(dá)大眾,最終靠的是百花齊放的應(yīng)用。

在當(dāng)下,大模型應(yīng)用被寄予厚望。無(wú)論在海外還是國(guó)內(nèi),相較于基礎(chǔ)設(shè)施層、大模型層與中間層,應(yīng)用層的創(chuàng)業(yè)熱度是更高的——因?yàn)楹笳叩募夹g(shù)門檻沒(méi)有那么高,又直接面向用戶、容易拿到結(jié)果,對(duì)于創(chuàng)業(yè)者來(lái)說(shuō)更容易上手。

左圖為獲得融資的生成式 AI 初創(chuàng)公司數(shù)量排名,排名前四的都是應(yīng)用層,應(yīng)用層公司占比在 80% 左右。右圖為生成式 AI 初創(chuàng)公司的融資金額排名,應(yīng)用層的融資總額也高于中間層。來(lái)源:Newcomer

但,大模型應(yīng)用層的創(chuàng)業(yè)真的迎來(lái)了 iPhone 時(shí)刻嗎?(注:2007 年,iPhone 發(fā)布揭開(kāi)了智能手機(jī)的時(shí)代,2010 年,iPhone4 的發(fā)布和普及掀起了移動(dòng)互聯(lián)網(wǎng)應(yīng)用的浪潮。)

實(shí)際上,當(dāng)下大模型應(yīng)用的創(chuàng)新正面臨窘境。

應(yīng)用層的崛起需要倚賴穩(wěn)定的底座,以及豐富的中間層工具。但綠洲資本創(chuàng)始合伙人張津劍指出,相較于海外的很多 AI 應(yīng)用發(fā)展更早(如 AI 視頻獨(dú)角獸 Runway 成立于 2018 年、文案生成獨(dú)角獸 Jasper 創(chuàng)立于 2021 年),中國(guó)大模型和應(yīng)用層的發(fā)展幾乎是同步展開(kāi)的——從今年年初開(kāi)始,這意味著,應(yīng)用層發(fā)展所倚賴的條件仍不成熟。

按照跟大模型接入的深度,應(yīng)用層創(chuàng)業(yè)可以分為兩類:直接調(diào)用已有大模型(閉源模型 API 接口、開(kāi)源模型)的應(yīng)用、以及自建模型的應(yīng)用。

百川智能創(chuàng)始人、CEO 王小川告訴極客公園,自研大模型的每次訓(xùn)練成本跟訓(xùn)練 token 數(shù)和參數(shù)量相關(guān),在中國(guó),每 1 億參數(shù)對(duì)應(yīng)訓(xùn)練成本 1.5 到 3 萬(wàn)人民幣,一個(gè)千億級(jí)參數(shù)的模型訓(xùn)練單次訓(xùn)練成本預(yù)估在三千萬(wàn)至五千萬(wàn)人民幣。如果對(duì)于模型的能力有更高要求,比如追上 GPT4.0 的水平,單次訓(xùn)練投入超過(guò) 5 億人民幣。這樣的成本門檻就已將許多人攔在門外。但是,通常在訓(xùn)練之前還需要做大量的實(shí)驗(yàn)來(lái)確定訓(xùn)練所會(huì)采用的策略,外加人力及數(shù)據(jù)上的投入,一個(gè)效果好的模型的整體投入會(huì)是單次訓(xùn)練投入的 5-10 倍。

如果在可商用的開(kāi)源模型(如 Llama)上改,亦或是接入已有大模型,效率和效果也都未必令人滿意。且鑒于國(guó)內(nèi)大模型的能力較海外尚有差距,「大部分應(yīng)用層創(chuàng)業(yè)使用的是海外模型,產(chǎn)品直接落地在海外市場(chǎng)。」應(yīng)用層創(chuàng)業(yè)者王安屹告訴我們。

技術(shù)如果天天跳躍,只做一層「薄」的應(yīng)用是很容易被顛覆的——多名投資人表達(dá)了這樣的看法。大模型的迭代速度極快,底層的技術(shù)飛躍將很大程度限制應(yīng)用的發(fā)展。一個(gè)典型的例子是,在 GPT-4 發(fā)布后,輔助寫作的獨(dú)角獸 Grammarly 和 Jasper 的價(jià)值迅速被攤薄了。金沙江創(chuàng)投主管合伙人朱嘯虎曾認(rèn)為,「這兩家公司或?qū)⒑芸鞖w零,根本守不住?!?/p>

實(shí)際上,今天在中國(guó)要做一個(gè)基于大模型的超級(jí)應(yīng)用,甚至能產(chǎn)生商業(yè)正循環(huán)的應(yīng)用,對(duì)創(chuàng)業(yè)者的能力挑戰(zhàn)非常大。類似百川智能創(chuàng)始人王小川、出門問(wèn)問(wèn)李志飛等極少數(shù)人,目前能同時(shí)具備「自有模型技術(shù)建立——行業(yè)調(diào)優(yōu)——應(yīng)用生產(chǎn)」的全棧能力,有機(jī)會(huì)脫離國(guó)內(nèi)基礎(chǔ)大模型的發(fā)展進(jìn)度,開(kāi)始構(gòu)建直通應(yīng)用的完整競(jìng)爭(zhēng)力。而大部分在場(chǎng)景、交互、產(chǎn)品定義能力上有特點(diǎn)和優(yōu)勢(shì)的創(chuàng)業(yè)者,因?yàn)閲?guó)內(nèi)大模型本身的技術(shù)不成熟、產(chǎn)業(yè)鏈不健全,基本很難進(jìn)行「端到端」的探索實(shí)踐。

「恐懼和憂慮肯定是有的?!?/span>360 集團(tuán)副總裁梁志輝告訴極客公園,一旦大模型的能力迭代至另一境界,的確可能顛覆團(tuán)隊(duì)半年來(lái)的所有努力,「但真正的玩家必須在這時(shí)下場(chǎng),不管能不能贏,否則你連上牌桌的機(jī)會(huì)都沒(méi)有?!?/span>梁志輝說(shuō)。

極客公園創(chuàng)始人張鵬也提及發(fā)起這次 AGI Playground 大會(huì)的初衷:「join and play to earn the lead time(加入并參與,去贏得領(lǐng)先時(shí)間)」——在他看來(lái),AGI 的技術(shù)變革必然蘊(yùn)含巨大機(jī)遇,但當(dāng)下,大模型帶來(lái)的創(chuàng)業(yè)機(jī)會(huì)距離真正爆發(fā)還有一定時(shí)間,這時(shí)候無(wú)論創(chuàng)業(yè)者還是投資人,提前「下場(chǎng)」未必一擊中,但「參與」、「實(shí)踐」都是在為自己、或團(tuán)隊(duì)贏得「Lead time」,以便能在真正起跑時(shí)「Be ready」。

中美創(chuàng)業(yè)者的勇氣和心態(tài)有一定不同。」真格基金合伙人劉元提到。極客公園調(diào)研硅谷后也驗(yàn)證了這一點(diǎn),相較于中國(guó)創(chuàng)業(yè)者,美國(guó)的年輕團(tuán)隊(duì)更敢想、敢干——在硅谷,我們接觸到了一系列尚且「粗糙」的項(xiàng)目靈感:比如用 AI 做訓(xùn)犬的 copilot、亦或是人類的社交助手。這或許和硅谷的創(chuàng)業(yè)文化相關(guān),人們花更多時(shí)間思考差異化的價(jià)值,也更包容探索中的失敗。

盡管當(dāng)下應(yīng)用層創(chuàng)業(yè)受到諸多限制,但客觀上仍存在機(jī)會(huì):比如,雖然模型本身已經(jīng)具備了很多能力,但在一些需要更專業(yè)的數(shù)據(jù)體系支撐、對(duì)服務(wù)要求更高的場(chǎng)景中,模型的服務(wù)能力依然有限。

創(chuàng)業(yè)者王安屹指出,在 2G(政府)、2B(企業(yè))等場(chǎng)景,這些領(lǐng)域的數(shù)據(jù)獲取難度高,更容易形成壁壘。在國(guó)外,有專門做法律場(chǎng)景的 Harvey.ai 等公司。國(guó)內(nèi),也有創(chuàng)業(yè)公司主攻零售、醫(yī)療、營(yíng)銷等垂直場(chǎng)景——需要注意的是,在國(guó)內(nèi),數(shù)據(jù)化是當(dāng)下的首要挑戰(zhàn),「企業(yè)普遍存在數(shù)據(jù)散落在各地、且難以被提取等問(wèn)題,因此(產(chǎn)品)建立數(shù)據(jù)飛輪,可能要從幫助企業(yè)能更容易地收集數(shù)據(jù)開(kāi)始?!?/p>

此外,數(shù)據(jù)飛輪也能幫助應(yīng)用產(chǎn)品形成壁壘、避開(kāi)模型的能力邊界。對(duì)此,投資人 Kyle 指出,隨著大模型的每一次迭代,都有應(yīng)用層的產(chǎn)品被唱衰。但隨著時(shí)間推移,部分產(chǎn)品的表現(xiàn)依然很頑強(qiáng),收入、用戶等數(shù)據(jù)并沒(méi)有如預(yù)期下降。

再以文案生成器 Jasper.AI 為例,盡管一再被「唱衰」,但用戶反饋顯示,Jasper 的文案生成表現(xiàn)依然處于市場(chǎng)領(lǐng)先地位。創(chuàng)立兩年,Jasper 已經(jīng)積累了一定的用戶數(shù)據(jù),「這也是產(chǎn)品價(jià)值力的體現(xiàn)?!筀yle 認(rèn)為,這來(lái)自創(chuàng)始人較強(qiáng)的工程能力(更好地調(diào)用大模型)、對(duì)業(yè)務(wù)場(chǎng)景(B 端文案)的深刻理解、以及時(shí)間上的先發(fā)優(yōu)勢(shì)。

對(duì)于創(chuàng)業(yè)者而言,找到場(chǎng)景、拿到需求至關(guān)重要——「悲觀者往往正確,而樂(lè)觀者往往成功」,張津劍說(shuō),「最終能勝出的應(yīng)用層項(xiàng)目,一定是抓住一個(gè)確定的用戶需求,通過(guò)不斷的用戶反饋和數(shù)據(jù)積累,進(jìn)一步迭代產(chǎn)品,從而形成壁壘、避開(kāi)模型的能力邊界?!?/span>

 

中國(guó)大模型生態(tài)推演:巨頭是重要玩家,但不止是巨頭的游戲

在 ChatGPT 爆火后,國(guó)內(nèi)玩家們歷經(jīng)半年的狂熱,已逐步冷靜下來(lái)。據(jù)極客公園觀察,與年初相比,國(guó)內(nèi)的創(chuàng)業(yè)者、巨頭公司,其中不少人已放棄大模型軍備競(jìng)賽之路,而轉(zhuǎn)向更務(wù)實(shí)的思考——大模型最終如何落地?有怎樣的應(yīng)用價(jià)值?如何探索商業(yè)化?

經(jīng)過(guò) 7 月初在上海的 WAIC(世界人工智能大會(huì)),三十多家大模型「百模齊放」,擁有大模型本身已經(jīng)不再令人驚奇。從功能上而言,擁有文生文、文生圖、代碼 Copilot 能力的模型也不在少數(shù)。

但整體看來(lái),中美大模型的商業(yè)生態(tài)呈現(xiàn)出不同的氣候。

  • 從模型能力上而言,中國(guó)模型的能力大多處于初步可用、但不及 GPT3.5 的水平,開(kāi)源可商用的模型亦相對(duì)缺乏,這也一定程度上影響了工具層和應(yīng)用層創(chuàng)業(yè);
  • 從商業(yè)生態(tài)而言,美國(guó)已經(jīng)初步顯現(xiàn)模型層、中間工具層、應(yīng)用層的不同生態(tài)位。中間工具是圍繞定制、部署、使用而出現(xiàn)的一系列工具,例如模型托管平臺(tái)如 Hugging Face,模型實(shí)驗(yàn)管理工具平臺(tái) Weights&Biases,像 DataBricks、Snowflake 這樣的數(shù)據(jù)庫(kù)也在原有平臺(tái)上疊加模型相關(guān)的能力與產(chǎn)品,目的是讓企業(yè)級(jí)用戶在平臺(tái)上一站式使用數(shù)據(jù)定制化模型。而在中國(guó),大模型創(chuàng)業(yè)公司之外,獨(dú)立的工具層生態(tài)尚未成氣候,目前提供相關(guān)功能的主要是以大廠為代表的云平臺(tái),外加零星的創(chuàng)業(yè)公司。
  • 而在產(chǎn)業(yè)探索進(jìn)程上,中國(guó) C 端應(yīng)用尚未大規(guī)模放開(kāi),如百度、金山尚處于邀請(qǐng)碼內(nèi)測(cè)階段,知乎曾發(fā)布基于大模型的新功能,也處于內(nèi)測(cè)階段,行業(yè)仍在等待合規(guī)。B 端服務(wù)則處于混沌狀態(tài),一些行動(dòng)較快的模型創(chuàng)業(yè)公司嘗試為企業(yè)做定制化模型,處于積累案例經(jīng)驗(yàn)的階段,而企業(yè)需求與技術(shù)提供方之間存在溝通隔閡,則是更普遍存在的情況,更重要的是,中國(guó)行業(yè)的信息化數(shù)字化程度整體較為落后,這顯然會(huì)影響速度,但長(zhǎng)遠(yuǎn)來(lái)看,留給模型廠商的空間更大。

基于這些不同情況,現(xiàn)階段中國(guó)創(chuàng)業(yè)者在大模型領(lǐng)域,所要解決的主要任務(wù)亦不同。

在中國(guó),任何涉及 toC 的大模型服務(wù),合規(guī)先行是必然趨勢(shì),合規(guī)模型將會(huì)率先在市場(chǎng)上提供服務(wù),并在大規(guī)模 to C 的應(yīng)用場(chǎng)景上獲得先機(jī);模型質(zhì)量上,媲美 GPT3.5 的優(yōu)質(zhì)基礎(chǔ)模型依舊是訓(xùn)練目標(biāo)。而在訓(xùn)練過(guò)程中,由于算力整體有限,高效集中資源并使用,將更加重要。除了需要考慮算力的集中和分配,減少不必要算力消耗的訓(xùn)練技巧也將是重要的經(jīng)驗(yàn)。

極客公園了解到,有消息表示,隨著監(jiān)管明確,第一批合規(guī)模型放出是值得期待的。同時(shí)目前在 toB 領(lǐng)域的應(yīng)用上,實(shí)際上已沒(méi)有官方的合規(guī)要求,這將助推大模型落地企業(yè),也將推動(dòng)工具層和應(yīng)用層發(fā)展。

目前,模型公司紛紛宣布開(kāi)源模型可商用,極客公園了解到,在參數(shù)規(guī)模上,國(guó)內(nèi)的開(kāi)源可商用模型將穩(wěn)定在 13B (130 億)左右的規(guī)模。趨勢(shì)上,國(guó)內(nèi)少數(shù)有能力的創(chuàng)業(yè)公司將繼續(xù)訓(xùn)練更大規(guī)模的模型,并選擇閉源;也會(huì)有很大一部分企業(yè),則會(huì)根據(jù)需求訓(xùn)練模型,不以規(guī)模為絕對(duì)的追求,而是滿足業(yè)務(wù)探索需求。比如騰訊內(nèi)部自研了一批從十億到千億規(guī)模的模型,金山為了更好地響應(yīng)辦公文檔「WPS AI」的用戶需求,內(nèi)部也訓(xùn)練了小模型,作為接入的基礎(chǔ)模型能力補(bǔ)充。

另外,隨著應(yīng)用及場(chǎng)景拓展,模型輸出能力的方式將變得更受關(guān)注。按照模型能力輸出的方式,具體可以分為中心化和非中心化兩種方式。

中心化模式即企業(yè)調(diào)用通用大模型、或第三方行業(yè)垂直模型的 API 去構(gòu)建業(yè)務(wù)功能;非中心化模式則是指,企業(yè)根據(jù)使用場(chǎng)景和功能,用專有數(shù)據(jù)微調(diào)(Finetune)擁有一個(gè)甚至多個(gè)模型。這樣的專用模型甚至不必追求規(guī)模,可以相互協(xié)作解決問(wèn)題。業(yè)界普遍認(rèn)為,只需要在百億參數(shù)規(guī)模上進(jìn)行特定領(lǐng)域的知識(shí)增強(qiáng),便能夠在特定功能上達(dá)到比通用模型更加有效的效果。

極客公園在調(diào)研后認(rèn)為,在中國(guó)(美國(guó)也類似),第二種非中心化模式的市場(chǎng)占比將會(huì)更高。按照百川智能的創(chuàng)始人王小川的觀點(diǎn),「80% 的價(jià)值可能是蘊(yùn)含在非中心化的模型和服務(wù)里的」。實(shí)際上,像電商、社交、游戲等存在巨頭、集中化程度高的垂直領(lǐng)域,巨頭絕不會(huì)使用他人的模型來(lái)構(gòu)建業(yè)務(wù)。

背后的邏輯在于,在這些領(lǐng)域內(nèi),數(shù)據(jù)是關(guān)鍵性資產(chǎn),通用模型不具備服務(wù)某一領(lǐng)域的能力,接入數(shù)據(jù)后才具有專業(yè)能力,但所謂的行業(yè)模型一旦模型能力全行業(yè)共享后,意味著一定程度上競(jìng)爭(zhēng)壁壘的消弭,因此必然會(huì)形成各家在數(shù)據(jù)墻內(nèi)訓(xùn)練專用模型的形態(tài)。未來(lái),隨著模型支持業(yè)務(wù)的場(chǎng)景和功能變得豐富,模型群落將逐漸形成。

金山辦公是目前的典型案例,在測(cè)試階段,金山辦公已接入了 MiniMax、智譜、百度三家不同的基礎(chǔ)模型對(duì)外提供服務(wù),同時(shí)在一些簡(jiǎn)單的推理任務(wù)上,直接使用自研的小模型。

而在集中度不高的商業(yè)領(lǐng)域,或者非完全市場(chǎng)化的一些關(guān)鍵行業(yè),或許會(huì)出現(xiàn)一個(gè)領(lǐng)域模型以 API 服務(wù)多家的形式。華為發(fā)布盤古大模型時(shí),同時(shí)發(fā)布在政務(wù),金融,制造,礦山,氣象等垂直領(lǐng)域發(fā)布模型,便是這種布局思路。

此外,在中國(guó)未來(lái)的大模型體系里,巨頭仍然會(huì)是大模型商業(yè)世界的核心玩家。

中國(guó)尚沒(méi)有出現(xiàn) DataBricks、Hugging Face 這樣的模型工具平臺(tái),取而代之的是各大云廠商推出的服務(wù)與平臺(tái)。雖然對(duì)外宣傳的側(cè)重各有不同,但形式基本一致,以云平臺(tái)搭載多個(gè)模型提供服務(wù),其中包括第三方模型+自研模型。騰訊甚至在發(fā)布模型平臺(tái)之外,發(fā)布了作為中間層工具的向量數(shù)據(jù)庫(kù)產(chǎn)品。

最鮮明的是火山引擎,以 Maas 的形式在云上集結(jié)了多家大模型對(duì)外輸出服務(wù)。同時(shí)火山引擎提出,未來(lái)企業(yè)使用大模型會(huì)呈現(xiàn)「1+N」的模式。而火山引擎推出的「模型商店」,目的就是方便企業(yè)挑選合適的模型進(jìn)行組合。百度最早發(fā)布文心一言大模型,現(xiàn)在也已在百度上線第三方模型?;鹕揭?、騰訊雖然沒(méi)有官宣,但趨勢(shì)已經(jīng)形成:自研模型將會(huì)和第三方模型一起在云平臺(tái)上提供服務(wù)。

在今天,巨頭比任何公司都更警惕范式革命的降臨。因?yàn)?span style="font-weight: bold;">理論上,巨頭隨時(shí)可能被對(duì)手發(fā)起閃擊戰(zhàn)——一旦大模型能力注入產(chǎn)品提供顛覆性的價(jià)值,對(duì)于原有業(yè)務(wù)可能是巨大的沖擊。而經(jīng)歷移動(dòng)互聯(lián)網(wǎng)時(shí)代多年的積累,上一代互聯(lián)網(wǎng)平臺(tái)已經(jīng)呈現(xiàn)出生態(tài)位的復(fù)雜性。以阿里、騰訊、字節(jié)、百度為代表,它們既擁有現(xiàn)成的 to C 場(chǎng)景以及規(guī)模優(yōu)勢(shì),提供云平臺(tái)服務(wù)的同時(shí)也自研模型。當(dāng)自研模型能力注入原有場(chǎng)景后,toC 領(lǐng)域的邊界會(huì)重新模糊。由此也不難理解,為何巨頭無(wú)法承受錯(cuò)過(guò)大模型的代價(jià)。

復(fù)雜性亦體現(xiàn)在巨頭和生態(tài)的復(fù)雜競(jìng)合關(guān)系中。

在國(guó)內(nèi),巨頭們紛紛聚焦云業(yè)務(wù)與「模型商店」的模式:既以云業(yè)務(wù)「服務(wù)」其他第三方模型創(chuàng)業(yè)公司,同時(shí)也有自研模型、有可能會(huì)與創(chuàng)業(yè)公司的模型競(jìng)爭(zhēng)——這將帶來(lái)的復(fù)雜問(wèn)題是,無(wú)論是從技術(shù)上還是業(yè)務(wù)上,彼此的邊界如何明確。

以字節(jié)旗下的火山引擎為例,大模型領(lǐng)域的創(chuàng)業(yè)者如果用火山訓(xùn)練和部署了精調(diào)模型,歸屬權(quán)是否必須屬于火山云?而未來(lái)的創(chuàng)業(yè)公司,如果在火山云上為客戶提供 MaaS 服務(wù),由此所帶來(lái)的用戶數(shù)據(jù),與這家創(chuàng)業(yè)公司是否必須隔離開(kāi)(即創(chuàng)業(yè)公司無(wú)法接觸到所服務(wù)的客戶的數(shù)據(jù))?這些都是火山引擎曾經(jīng)與創(chuàng)業(yè)者們的分歧所在。

精調(diào)模型的歸屬問(wèn)題背后,也指向云平臺(tái)的擔(dān)心:創(chuàng)業(yè)者使用了云平臺(tái)的算力之后,直接打包走模型能力和所服務(wù)的客戶,于是云平臺(tái)僅僅扮演了「一次性服務(wù)」的角色,并未成為真正的 Maas 平臺(tái)。

而數(shù)據(jù)隔離背后的邏輯更為復(fù)雜。。首先,確實(shí)有安全性問(wèn)題,模型公司進(jìn)入,破壞了云平臺(tái)原有數(shù)據(jù)安全體系,需要有所隔離。其次,模型公司如果不斷接觸用戶數(shù)據(jù),極可能以客戶數(shù)據(jù)不斷增強(qiáng)自己的模型能力,這將形成模型公司與 MaaS 平臺(tái)關(guān)系的不平衡,會(huì)讓平臺(tái)角色退向算力供應(yīng)商,而非在生態(tài)中更上的站位。這種非本地部署的 MaaS 方式,也會(huì)帶來(lái)行業(yè)核心客戶的競(jìng)爭(zhēng)力流失,進(jìn)而破壞云平臺(tái)的存在根基。

盡管被動(dòng),但目前,創(chuàng)業(yè)者又很難離開(kāi)火山這樣的云平臺(tái)。不僅因?yàn)橥ㄟ^(guò)火山能夠找到模型的潛在客戶,更因?yàn)榛鹕綋碛兴懔?,且提供的服?wù)「很便宜」,「只有這里能訓(xùn)」。

另外在 MaaS 模式下,巨頭麾下的云平臺(tái)本身與其他提供模型的第三方企業(yè)是合作與上下游關(guān)系,但巨頭自研的模型,與第三方模型同樣作為選項(xiàng)進(jìn)入自家的「模型商店」,又會(huì)帶來(lái)一定的競(jìng)爭(zhēng)關(guān)系。長(zhǎng)遠(yuǎn)看來(lái),這樣的競(jìng)合也會(huì)成為影響生態(tài)的關(guān)鍵因素。

好在可以確定的是,豐富的生態(tài)中,絕不只有大模型這一個(gè)競(jìng)爭(zhēng)點(diǎn)。在國(guó)內(nèi),巨頭一定是最重要的玩家,但大模型絕不止是巨頭的游戲。

不少人認(rèn)為,巨頭無(wú)法對(duì)抗組織重力,「可能還不如小創(chuàng)業(yè)公司聚焦?!骨?span style="font-weight: bold;">在當(dāng)下宏觀環(huán)境中,國(guó)內(nèi)巨頭并不推崇無(wú)限擴(kuò)張,這為生態(tài)上下游的創(chuàng)業(yè)公司都留足了機(jī)會(huì)與空間。在此背景下,業(yè)內(nèi)人士認(rèn)為,「大廠的戰(zhàn)略投資部將重新變得重要,因?yàn)閬?lái)自技術(shù)的狙擊將隨時(shí)發(fā)生,戰(zhàn)投的使命是為公司探索未來(lái)。」

長(zhǎng)期而言,圍繞模型形成的生態(tài)和商業(yè)模式將成為競(jìng)爭(zhēng)壁壘。據(jù)極客公園觀察,國(guó)內(nèi)的大模型創(chuàng)業(yè)公司已經(jīng)在圍繞模型培育生態(tài),方式包括完善面向開(kāi)發(fā)者的工具和技術(shù)模塊,開(kāi)源版本及社區(qū)運(yùn)營(yíng)等。

一個(gè)企業(yè)用戶,是直接尋求模型企業(yè)的服務(wù),還是選擇云平臺(tái)方案,會(huì)受諸多因素影響,比如成本、方案便捷性、行業(yè)競(jìng)合關(guān)系、對(duì)模型自主的需求、自身技術(shù)實(shí)力等。而互聯(lián)網(wǎng)巨頭目前的業(yè)務(wù)格局,既會(huì)帶來(lái)快速滲透場(chǎng)景的優(yōu)勢(shì),又可能會(huì)因本身業(yè)務(wù)多重性帶來(lái)的競(jìng)合關(guān)系,存在一定牽制。

「百模大戰(zhàn)」在中國(guó)很可能不會(huì)持續(xù)太久,有關(guān)大模型本身的競(jìng)賽也將很快不再是產(chǎn)業(yè)的焦點(diǎn),誰(shuí)能率先提升中國(guó)大模型的能力到 GPT-3.5 甚至 4.0 的水平、誰(shuí)能在未來(lái)非中心化模型崛起的時(shí)代,「多快好省」地幫企業(yè)落地大模型構(gòu)建現(xiàn)實(shí)競(jìng)爭(zhēng)力、誰(shuí)能率先把大模型能力落到細(xì)分場(chǎng)景和產(chǎn)業(yè)形成顛覆性創(chuàng)新,將是下一個(gè)階段的核心看點(diǎn)。

 

最新文章

極客公園

用極客視角,追蹤你不可錯(cuò)過(guò)的科技圈.

極客之選

新鮮、有趣的硬件產(chǎn)品,第一時(shí)間為你呈現(xiàn)。

張鵬科技商業(yè)觀察

聊科技,談商業(yè)。